谷歌浏览器插件
订阅小程序
在清言上使用

基于网页标题的主题相关度算法的研究

COMPUTER CD SOFTWARE AND APPLICATIONS(2010)

引用 0|浏览1
暂无评分
摘要
首先,给出了主题爬虫的概念;然后介绍了主题相关度计算的两种模型;布尔模型和空间向量模型;通过对两种模型进行分析,提出了一种基于网页标题的空间向量模型主题相关度计算方法Relative.经过试验分析,该算法具有很好的实用性,基于该算法的主题爬虫系统能够在Web上爬取高度主题相关的网页,极大的提高了网络爬虫的效率.
更多
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要