基于交叉覆盖算法的中文文本分类

Jisuanji Gongcheng/Computer Engineering(2006)

引用 10|浏览3
暂无评分
摘要
基于向量空间模型的文本分类过程中遇到的最大问题就是以词为特征项的向量维数太大,需要进行特征选取,而交叉覆盖算法的输入集是n维欧式空间的点集,可以忽略维数的大小,从而最大程度上精确地表示文本,然后再进行分类,能够大大提高正确率.将交叉覆盖算法作为一种分类算法来进行中文文本分类,取得了不错的效果,在封闭测试中的准确率达到98.32%.
更多
查看译文
关键词
Alternative covering algorithm,Chinese information processing,Text categorization
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要