经典指数          
原因
669
浏览数
0
收藏数
 

给两个文件,分别有100亿个query,我们只有1G内存,如何找到两个文件交集?分别给出精确 算法和近似算法?

     举报   纠错  
 
切换
1 个答案
精确算法:Hash分桶法 • 将两个文件中的query hash到N个小文件中,并标明query的来源 • 在各个小文件中找到重合的query • 将找到的重合query汇总 近似算法:BloomFilter
 
切换
撰写答案
扫描后移动端查看本题