Chrome Extension
WeChat Mini Program
Use on ChatGLM

一种融合本体和最小二乘支持向量机的主题爬行方法

Journal of Tianjing University of Science & Technology(2015)

Cited 1|Views1
No score
Abstract
针对现有的主题爬行方法存在收益率不高和不稳定的问题,融合本体和最小二乘支持向量机理论,提出一种主题爬行方法Ontology-LSSVM.该方法将本体作为抓取主题的背景知识表示,得到一组主题相关概念的集合,再将其在网页文本中出现的词频作为输入,构造一个主题相关度 LS-SVM 分类器,用于网页的分类.使用舆论热点的食品安全问题作为爬行主题领域,建立问题食品本体,进行实验.结果表明:在本实验条件下,本文方法相比基于 LS-SVM、基于本体和基于关键字的主题爬行,能够维持更高的收益率.
More
Translated text
Key words
ontology,LS-SVM,focused crawling,harvest rate,food safety
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined