2013-01-18 20:12:25.0|分类: struts源码分析|浏览量: 1352
查询高考的信息,我们长浏览的数据:高校的信息,每年每个省市的批次分数线,专业的简介,高校的录取分数等等。需要大量的数据,可是数据不可能人工输入啊?如果是人工的话,连想都不敢想啊,类似活人啊 。 对这样的数据,只能实行拿来主义,这就是要抓取数据。 首先整理高校的基本信息:例如高校的名称,地址,特色看,简介,网址等等。 开始寻找猎物啊?百度一下,“高校信息”,“全国大学的信息”等等。看看有没有好的网站,已经把这些工作做了呢?如果这样就省事多了。 最后新浪教育给了我一个惊喜啊!数据整理的不错,不愧是大公司啊,有实力啊! 浏览其中的网页,注重连接,jsp代码,查看一下他们的规律,好为我下一步抓取做好准备啊! |