当前位置:主页 > 经济论文 > 微观经济论文 >

数据开采的数据质量问题

发布时间:2018-05-17 20:16

  本文选题:数据开采 + 数据质量 ; 参考:《管理工程学报》2002年01期


【摘要】:数据质量是影响数据开采效果的重要因素 ,这个问题并未受到人们的充分重视。本文针对数据质量在数据开采中的地位 ,给出了数据质量评价的几个主要尺度。并且结合统计学和机器学习的理论 ,分析了解决数据质量的方法 ,强调提高数据质量的出发点在于控制数据源的质量。
[Abstract]:Data quality is an important factor affecting the effect of data mining, which has not been paid enough attention to. According to the status of data quality in data mining, this paper gives several main scales of data quality evaluation. Combined with the theory of statistics and machine learning, this paper analyzes the methods of data quality, and emphasizes that the starting point of improving data quality is to control the quality of data sources.
【作者单位】: 东南大学经管学院 合肥工业大学
【基金】:江苏省自然科学基金资助项目 ( 76 0 5 730 0 72 )
【分类号】:F222

【共引文献】

相关期刊论文 前10条

1 杨萍,杨明;基于VPRS的重要属性评价方法研究[J];安徽工程科技学院学报(自然科学版);2003年01期

2 林成龙,孙即祥;粗糙集理论在决策判断中的应用[J];电光与控制;2005年01期

3 李龙澍,程慧霞,卢冰原;基于凸Rough集的数据约简和规则发现研究[J];东南大学学报(自然科学版);2002年02期

4 许少华,赵万平,廖太平,鲁笛,李欣;一类模式识别及其在地层对比中的应用[J];大庆石油学院学报;2002年01期

5 叶东毅;Jelonek属性约简算法的一个改进[J];电子学报;2000年12期

6 叶东毅,陈昭炯;一个新的差别矩阵及其求核方法[J];电子学报;2002年07期

7 杨明,孙志挥;改进的差别矩阵及其求核方法[J];复旦学报(自然科学版);2004年05期

8 叶东毅;基于粗糙隶属函数的规则组合可信度计算与推理[J];福州大学学报(自然科学版);2002年03期

9 缑锦,叶东毅;基于概念格的求所有绝对属性约简的一个算法[J];福州大学学报(自然科学版);2002年03期

10 叶东毅,陈昭炯;不相容决策表属性约简计算的一个可辨识矩阵方法[J];福州大学学报(自然科学版);2005年01期

相关会议论文 前6条

1 游凤荷;游汛;;粗糙集的约简算法在涡流传感器设计中的应用[A];2007'湖北·武汉NDT学术年会论文集[C];2007年

2 张铮;苏旭武;张道德;陈学锋;;装载机故障诊断属性约简算法[A];湖北省机械工程学会青年分会2006年年会暨第2届机械学院院长(系主任)会议论文集(下)[C];2006年

3 李仁璞;黄道;高茂庭;;一种快速的决策规则抽取方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年

4 马翠;刘琼荪;周先东;;基于相对区分矩阵的遗传模拟退火属性约简算法[A];第九届中国青年信息与管理学者大会论文集[C];2007年

5 王丹;吴孟达;刘银山;;属性约简的一种简单算法[A];第12届全国模糊系统与模糊数学学术年会论文集[C];2004年

6 杨善林;刘业政;马溪骏;;基于β-δ_0粗糙集模型的属性约简算法[A];2003年中国管理科学学术会议论文集[C];2003年

相关博士学位论文 前10条

1 许志兴;粗集理论的若干技术及其应用研究[D];南京航空航天大学;2001年

2 刘沐宇;基于范例推理的边坡稳定性智能评价方法研究[D];武汉理工大学;2002年

3 何离庆;网络环境下的智能化农业信息平台研究[D];重庆大学;2002年

4 苏健;基于粗糙集的数据挖掘与决策支持方法研究[D];浙江大学;2002年

5 吴涛;构造性知识发现方法研究[D];安徽大学;2003年

6 张小刚;关联规则挖掘及其在复杂工业过程控制中的应用研究[D];湖南大学;2002年

7 赛英;粗糙集扩展模型及其在数据挖掘中的应用研究[D];中国人民解放军国防科学技术大学;2002年

8 赵军;基于粗集理论的KDD技术研究[D];重庆大学;2003年

9 许琦;粗糙集理论在旋转机械故障诊断技术上应用的研究[D];南京工业大学;2003年

10 谭天乐;基于粗糙集的过程建模、控制与故障诊断[D];浙江大学;2003年

相关硕士学位论文 前10条

1 邹先霞;基于C/S模式数据挖掘的研究及其在AEFS中的应用[D];华中师范大学;2001年

2 缑锦;基于概念格的属性约简算法及粗糙集在聚类分析中的应用探讨[D];福州大学;2002年

3 康胜武;基于粗集理论的属性处理方法和模糊规则提取及应用研究[D];厦门大学;2001年

4 仲维国;信息系统中粗糙集理论若干问题的研究[D];南京理工大学;2002年

5 张新霞;基于统计相关性的有趣关联规则的挖掘[D];武汉科技大学;2002年

6 孙巍巍;基于多指标群决策理论的股票预测系统研究[D];昆明理工大学;2002年

7 彭云;ARMRDB模型中的聚类分析和规则提取[D];江西师范大学;2002年

8 陈云化;基于粗糙集理论的增量算法的研究和应用[D];福州大学;2003年

9 赵士亮;粗糙集理论中若干问题的研究及应用[D];福州大学;2003年

10 刘成钢;基于粗糙集理论的不确定决策问题的研究与应用[D];南京航空航天大学;2003年

【相似文献】

相关期刊论文 前10条

1 葛萌萌;彭现美;王有刚;;住户调查样本选择及数据误差问题探讨[J];安徽农学通报(下半月刊);2011年16期

2 郑向群;张铁亮;姚秀荣;;我国农业资源环境信息统计的历史回顾与未来展望[J];农业环境与发展;2011年03期

3 刘虹;;浅析企业会计与统计在市场经济条件下的相互适应性[J];中国集体经济;2011年19期

4 ;[J];;年期

5 ;[J];;年期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相关会议论文 前4条

1 曹会平;;县级GDP核算工作面临的问题与思考[A];2005—2006山西省统计科研成果汇编[C];2006年

2 窦志达;耿爱莲;李文选;;关于缩小国家与地区GDP核算差异方法的思考[A];2005—2006山西省统计科研成果汇编[C];2006年

3 霍成义;莫琳;许加宏;;2006年1季度山东省银行家问卷调查分析报告[A];社会主义新农村建设与金融支持学术研讨会论文集[C];2006年

4 高新萍;;纵观经济普查全过程,浅谈基层普查的组织工作[A];北京市第十三次统计科学讨论会论文选编[C];2006年

相关重要报纸文章 前10条

1 ;国务院经普办数据质量抽查工作在浙辽陕顺次展开[N];中国信息报;2009年

2 高立业;临朐县严控经普登记数据质量[N];中国信息报;2009年

3 ;采取多种举措确保数据质量[N];郑州日报;2009年

4 李艳;华宁确保经普数据质量[N];玉溪日报;2009年

5 本报记者 赵晓赤;黑龙江扎实开展农村数据质量检查[N];中国信息报;2005年

6 海南省统计局局长 张恒;坚持依法统计 提高数据质量[N];中国信息报;2002年

7 本报记者 王布刚;视数据质量为生命[N];中国信息报;2003年

8 ;大连市“四四一”确保单位清查数据质量[N];中国信息报;2008年

9 ;按要求做好经普数据质量抽查工作[N];中国信息报;2009年

10 张新沙;提高数据质量的“五招”[N];中国信息报;2003年

相关硕士学位论文 前4条

1 黄丽莎;非国有经济统计指标体系与调查方法研究[D];东北林业大学;2007年

2 周光洪;基于国际可比性的我国GDP数据质量研究[D];湖南大学;2009年

3 渠田田;GDP数据质量的统计诊断[D];江苏大学;2010年

4 张敏敏;中国经济普查的数据挖掘方法研究[D];东北林业大学;2007年



本文编号:1902711

资料下载
论文发表

本文链接:https://www.wllwen.com/weiguanjingjilunwen/1902711.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户7097a***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com