基于新的关键词提取方法的快速文本分类系统

Application Research of Computers(2006)

引用 21|浏览4
暂无评分
摘要
关键词的提取是进行计算机自动文本分类和其他文本数据挖掘应用的关键。系统从语言的词性角度考虑,对传统的最大匹配分词法进行了改进,提出一种基于动词、虚词和停用词三个较小词库的快速分词方法(FS),并利用TFIDF算法来筛选出关键词以完成将W eb文档进行快速有效分类的目的。实验表明,该方法在不影响分类准确率的情况下,分类的速度明显提高。
更多
查看译文
关键词
Web Text Classification,Keyword Extraction,Nature Language Processing,Computer Application
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要