不同类别非完整大数据中缺失数据填充算法

Science Technology and Engineering(2018)

引用 1|浏览4
暂无评分
摘要
针对目前缺失数据填充算法精度低、运行效率低、内存占用率大的特点,提出一种新的不同类别非完整大数据中缺失数据填充算法.通过2个定理阐述了缺失数据填充算法的原理,给出信息熵的计算过程.输入根据数据集构建的决策表和不同类别非完整大数据中缺失数据的最大值、最小值、填充步长.求出其他类指标和某类指标的相关性,得到数据集,求出权重系数;计算初始数据库的信息熵,通过相关理论或经验对缺失数据区间下限进行设定;用一个很小的区间数据取代缺失数据,根据给出的步长不断扩大区间范围,绘制出每一步信息熵状况,将其与初始数据库信息熵相比,实现缺失数据填充.实验结果表明,所提算法精度高、运行效率高、内存占用率低.
更多
查看译文
关键词
different categories,incomplete,big data,missing data,filling
AI 理解论文
溯源树
样例
生成溯源树,研究论文发展脉络
Chat Paper
正在生成论文摘要