数据上传时间。
⑥ET。这个可谓后起之秀,比较好用,制订规则也简单灵活,但有的地方还不成熟。支持的系统还不多,不过潜力很大,新出的模拟提交,基本上绝大部分类型的采集都可做了。
以上是采集工具的介绍,哪种好用要看各位的偏好了。
采集用到的工具还包括抓包分析工具,如sniffer,wsockexpert等,
ASP的采集器。。。。
源代码分析工具,对于地址隐藏的网页用遨游自带的viewpage也挺好, 好象火车头.附带的新的源代码分析工具放出来了,对一些难采集的网站可以试试。
一般大家喜欢用000/xp自带的记事本查看源代码,建议升级到vistia的记事本,支持繁体和框架,绝对好用
更深一步的还要学习破解ajax,就里就不介绍了。 第三个方面我讲采集数据的加工。数据采集来固然可以直接发布到网上去,但经过加工效果会更好。 数据的加工包括去掉别人的广告,换上自己的广告,过滤掉一些外站的链接
数据格式的简繁转换及编码转换
网站优化SEO处理等等 这里要注意的问题是别人广告一定要过滤干净,否则自己得不到广告费,别人的GG帐户也不安全,反而也害了别人。 还有SEO处理不要过份,适可而止,否则只会起反作用。 更高层次的采集是把采集内容变成自己的原创,这个需要高手自编程序对数据进行处理
目前为止还没见过这样的工具,不过有《疯狂作文》这样的软件出来,相信也不是做不到。
第四个方面是后续维护。 这个后续维护也可以翻陈出新,把已采集的数据进行再加工,添加新的关键字,新瓶也可以装旧酒。 通过我对几十个客户的采集教程,谈下我的体会。 采集内容要关注一定热度的内容, 比如QQ空间、QQ表情这些流量是很猛的, 还有私服发布站、游戏类型的网站, 有针对性群体的网站也比较好做。