比较两个文件重复的记录
请教大侠们一个问题,假如有两个文本文件文件A,文件B. 文件A中有1000条记录,文件B中有100000条记录.文件B中的这100000条记录里有随机分布的200条是在文件A中的1000条里面出现的。现在想实现的是把文件B中的这200条找出来,放在文件B的最前面。请问有没有什么号的方法来实现。打算用DELPHI来实现,能给个思路就更好了。分只有这么多了,大虾们帮忙看下。
[解决办法]
如果B中所含A的行对顺序敏感,那么该问题就是"最长公共子序列问题",可用 DP 求解,时间耗费O(m*n),其中,m和 n是两个文件的行数;
如果B中所含A的行对顺序不敏感,那么该问题就是求两个集合的交集,可用 HASH 表,时间耗费O(m*n),其中,m和n是两个文件的行数.
算法均比较简单,在此从略.楼主若需要,跟个贴即可.:-)