| 加入桌面 | 手机?/a> | 无图?/a>
 
当前位置: 首页 » 知识 » 数据采集器 » 正文

SS采集器

已解决 悬赏分:5 - 解决时间 2008-06-04 10:27
那位高人帮我弄下采集器 SupeSite 6.0Final 上面自带的SS采集器 配置我不会弄 那个高人帮我下 一定加QQ7993602
62 次关注     提问者: 键就一个字  
  支持(0)  |   反对(0) 最佳答案
首先简单说一下制作采集器的基本原理和思路:1、确定您要采集哪个页面的新闻,将这些页面的地址填入到“索引页面url地址(图4和5)”;2、确定在这些页面您要采集的内容区域,因为不是一个网页所有的内容都要采集回来,而是采集一个网页的一部分内容,所以您必须告诉程序您要采集的区域,也就是“列表区域识别规则”;(图4和5)3、第2步确定区域之后,还要告诉程序您要采集的文章链接,也就是“文章链接url识别规则”。(图4和5)4、现在已经确定了大的采集框架,接下来要告诉程序在一个文章页面,文章的标题,文章的来源和作者分别是什么。然后就是一篇文章内容的范围,也就是说一个文章页面内,真正您需要采集的范围,就是“文章内容识别规则”。最后设置分页的区域和分页的链接地址。(图6)。5、以上4个步骤已经确定了采集的范围,如果您需要过滤标题和内容,请根据您的要求设置“内容页面整理设置”。以上几个步骤确定范围都是通过查看页面源码,进行设置的,截取的方法需要一些经验,练习2--3次就可以领悟到了新浪博主:快乐简单丰富努力给在百度用户的好友们服务,一起努力快乐,简单生活,创造我们丰富的明天!!!
[我来评论]   回答者: 黄元之   2008-06-10 14:22   


[ 知识搜索 ]  [ ]  [ 告诉好友 ]  [ 打印本文 ]  [ 关闭窗口 ]

 
问题搜索
     
相关问题
等待您来回答
 
 
Powered by 0512IT
购物车(0)    站内信(0)     新对话(0)