经典指数          
原因
597
浏览数
0
收藏数
 

如何设计一个网页爬虫系统?

     举报   纠错  
 
切换
1 个答案
设计合理即可,实现思路:使用bfs算法进行网站爬取;使用master节点作为控制节点控制work 节点进行网站爬取;使用分布式队列做任务调度;使用key-value存储(如redis)做网页判重
 
切换
撰写答案
扫描后移动端查看本题