第1742章 互联网这片星空,我们要摘最亮的那颗 (3/4)
有了明确的方向和详细的方法,进度快得惊人。
两周后,贾瀞雯正在办公室看财务报表,李明冲了进来。
“贾总!成了!”
他手里拿着一张打印纸,手指都在抖。
贾瀞雯站起来:“什么成了?”
“爬虫!基础版本的爬虫跑起来了!”李明把打印纸递给她,“这是日志,你看,已经抓取了三百多个网页!”
纸上是一行行的记录:
\\[XXXX-XX-XX 10:23:15\\] 开始抓取种子网站:neWS.XXX.COm
\\[XXXX-XX-XX 10:23:17\\] 发现链接:http:\/\/neWS.XXX.COm\/1.html
\\[XXXX-XX-XX 10:23:18\\] 抓取成功,大小:4.2KB
\\[XXXX-XX-XX 10:23:19\\] 发现链接:http:\/\/neWS.XXX.COm\/2.html
……
记录一直延续到最新一行:抓取网页总数:347。
贾瀞雯看着那串数字,手也开始抖。
“网页内容呢?”她问。
“都存在服务器上了。”李明眼睛发亮,“虽然现在只能存文本,图片还处理不了,但这是第一步!最关键的第一步!”
贾瀞雯放下纸,深深吸了口气。
“叫大家过来。”她说,“我们……庆祝一下。”
五分钟后,六个人挤在小小的会议室里。
桌上摆着几瓶可乐,是贾瀞雯刚才下楼买的。
“同志们。”贾瀞雯举起可乐瓶,“今天,我们抓到了第一批网页。
虽然只有三百多个,虽然还有很多问题要解决,但这是一个开始。”
她顿了顿,声音有些哽咽:“谢谢大家。
谢谢你们的努力。”
李明举起瓶子:“谢谢贾总,谢谢陈总给我们这个机会。”
张涛说:“这才刚开始。
接下来要做索引,要写分词,要搞排名算法……路还长着呢。”
“但至少,”王磊笑着说,“我们知道路怎么走了。”
可乐瓶碰在一起,发出清脆的响声。
那天晚上,贾瀞雯给陈浩打电话。
电话接通时,她能听到陈浩那边有风声,像是在室外。
“浩哥,我们成了。”她说,“爬虫抓到了第一批网页,三百多个。”
电话那头安静了几秒。
<
本章未完,请点击下一页继续阅读