设计一个简单的网页抓取系统,目标是抓取z.baidu.com站点上的有价值网页。 1) 请设计基本模型,并做出简要说明。 请考虑如何获取网页、如何存储网页、如何判断网页的价值。。。。。。。。 2) 实际应用中,需要考虑哪些因素。
好开放的题目。。