基于共享最近邻密度的演化数据流聚类算法

Journal of University of Science and Technology Beijing(2014)

Cited 0|Views1
No score
Abstract
现有的基于密度的数据流聚类算法难于发现密度不同的簇,难于区分由若干数据对象桥接的簇和离群点。本文提出了一种基于共享最近邻密度的演化数据流聚类算法。在此算法中,基于共享最近邻图定义了共享最近邻密度,结合数据对象被类似的最近邻对象包围的程度和被其周围对象需要的程度这两个环境因素,使聚类结果不受密度变化的影响。定义了数据对象的平均距离和簇密度,以识别离群点和簇间的桥接。设计了滑动窗口模型下数据流更新算法,维护共享最近邻图中簇的更新。理论分析和实验结果验证了算法的聚类效果和聚类质量。
More
Translated text
Key words
data streams,outliers,data mining,nearest neighbors,clustering algorithms
AI Read Science
Must-Reading Tree
Example
Generate MRT to find the research sequence of this paper
Chat Paper
Summary is being generated by the instructions you defined