中文  |  English
Red Flag Software
----News
红旗首页> 新闻中心 > 今日红旗
可自动采集网站内容的软件面市
发布时间:2000年09月22日

    近日,北京网景时代网络技术有限公司(www.webcate.net)推出了面向商业网站的内容采集软件—―Webcate CPS(Content Parsing System),中文名称“摘星”内容采集系统。   

    该软件是一个实时站点内容采集系统,它用于对Internet上某个特定领域(如商品价格信息、MP3信息、招聘信息或新闻)的所有站点进行内容分析和分类整理,以得到该特定领域的绝大部分内容。和网页提取或者搜索引擎不同,该软件可以直接深入到站点及其网页的所有内容,将网页中的有效数据提取出来,并保持数据之间的逻辑关系,例如,对一个做在线零售的站点,“摘星”可以将其所有正在出售商品的分类、名称、价格、商品介绍及付款方式全部提取出来,即使商品的详细介绍和商品的价格不在同一个页面,“摘星”也能正确地对应每个商品和它的详细介绍。   

    “摘星”内容采集系统可以为需要该领域内容的用户提供一个全面、单一的检索数据库。部署了“摘星”内容采集系统的网站可以向它的用户提供一个或者几个特定领域的独特的“一站式”内容检索服务,以提高站点的访问质量,并吸引对该领域感兴趣的用户经常来使用,甚至只使用“摘星”系统查找该领域的信息资讯。   

    “摘星”内容采集系统(Webcate CPS)的特点包括:*自动获取网站内容,无需被访问的网站作任何配合;*添加新的被搜索网站简单快速;*自动检测被搜索页面的可用性并通知系统管理员,对暂时不可用的页面/网站进行重试;*获取内容的范围和频率完全可控;*为得到的内容自动保持原网站分类;*能够保持原网站内容之间的逻辑(引用)关系;*支持实时更新指定内容。   

    该软件可以运行在Sun/Solaris、Windows NT、Linux、HP UNIX等平台上,使用Oracle数据库。   

   

©北京红旗软件有限公司 2000-2015 | 网站备案序号:京ICP备05032410号  
 公司信息 |  招聘信息 |  联系我们 | 公司大事记 |  软硬件兼容列表 |  产品购买咨询