Chrome Extension
WeChat Mini Program
Use on ChatGLM

基于均衡段落和分话题向量的新闻热点话题检测研究

Data Analysis and Knowledge Discovery(2020)

Cited 0|Views2
No score
Abstract
[目的]通过新闻热点话题检测技术提取热点新闻话题,减轻用户的新闻阅读压力.[方法]在TF-IDF方法基础上,通过均衡段落的位置加权方式(WTF-IDF)进行关键词提取;将K-means聚类作为基方法,在分层聚类中引入分话题向量完成话题聚类;提取标题高频词实现话题描述.[结果]WTF-IDF方法在关键词抽取数为3时与TF-IDF方法相比F1值提升5.4%;基于WTF-IDF与分话题向量的分层聚类与分层TF-IDF的K-means聚类相比准确提升3.1%.[局限]关键词抽取未考虑短语形式;分层聚类方法增加了算法时间复杂度.[结论]本文提出的关键词抽取和分层聚类方法可以改善新闻热点话题检测效果,话题描述得到的话题短语也达到一定的代表性与可读性.
More
Key words
news topics,equalized paragraph,sub-topic
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined