基于柔性统计系统的港口企业多维度统计模式构建
【学位授予单位】:北京交通大学
【学位级别】:硕士
【学位授予年份】:2011
【分类号】:F552.3
【图文】:
根据数据质量问题产生在单数据源还是多数据源以及问题出在模式层还是实例层,文献[4】将数据质量问题分为四类:单数据源模式层问题、单数据源实例层问题、多数据源模式层问题以及多数据源实例层问题。图2.1展示了这种分类,并列出了每一类中典型的数据质量问题。老鑫嘿矍…一差的模式设计}唯一值参照完整性拼写错误重复数据冲突数据一尸l、2实例级问题数据输入错误或不完整7妙曰入据题原单数问﨑命名冲突结构冲突不一致的汇总入不一致的时间选择据源题数多问量数据质题问一图2.1数据质量问题分类 Figure2.1CategoriesofDataQualitylssues单数据源中出现的问题在多数据源中会变得更加严重。另外,模式层次上出现的数据质量问题也会在实例层次上有体现。模式层次上的数据质量问题包括糟糕的模式设计、完整性约束定义的缺失、多个数据源之间异质的数据模型、模式设计、命名冲突等。这部分数据质量问题可以通过改进模式设计、进行模式转化和集成等方式来解决。实例层次上的数据质量问题则在模式层次上不可见。(3)数据清洗目前,数据清洗没有一个统一的定义。文献【5]认为数据清理是一个消除数据中的错误和不一致,解决对象识别问题的过程。文献[6J将其定义为相似重复记录的合并和清理问题。狭义上的数据清洗特指在构建数据仓库和实施数据挖掘前对源数据进行处理,实现数据的准确性、一致性、完整性、唯一性、有效性和适时性以适应后续操作的过程。广义上的数据清洗则指所有情况下对脏数据进行处理来适应相应数据分析操作的过程。本文的研究基于企业的信息化建设,研究的重点问题是如何提升信息系统中的数据质量问题。故本文认为:凡是有助于提升管理信息系统中的数据质量问题?
数据清洗原理结构图
我国港口企业统计工作现状进行说明。下图中,图3.3是广州港集团信息系统组织结构图。广州港集团信息系统组织结构中,包含广州港集团生产业务管理系统、财务管理系统、港区地理信息系统、人力资源管理系统等12部分、112个业务管理子系统【州,分为集团级管理信息系统和子公司级管理信息系统。具有系统层次多、结构清晰、数据存储分散、业务
【相似文献】
相关期刊论文 前10条
1 高磊;;零部件数据处理平台研究[J];汽车零部件;2011年07期
2 吴勇灵;潘晓慧;杨洁;余长青;;基于MC-S20T180NO教室人数统计系统的设计与研究[J];佳木斯大学学报(自然科学版);2011年04期
3 潘巍;李战怀;聂艳明;陈群;;一种有效的多数据源RFID冗余数据清洗技术[J];西北工业大学学报;2011年03期
4 李红祥;方逊;;基于AIS的船舶交通流量统计方法研究[J];武汉理工大学学报(交通科学与工程版);2011年04期
5 张彦;李小明;张远;刘明帅;;基于组态软件的油泵实验台数据统计系统的设计[J];现代制造技术与装备;2011年04期
6 陈慧蕾;曹耀斐;;使用分布式数据整合平台解决信息孤岛问题的探讨[J];珠江水运;2010年06期
7 黄始坚;;完善企业统计制度 促进施工企业发展[J];企业科技与发展;2011年14期
8 吴华稳;王宇;龚利;;BOXI在铁路统计中的应用[J];铁路计算机应用;2011年08期
9 李京原;;车流监测及全程调流系统的研究和思考[J];中国铁路;2011年05期
10 刘少梅;;火电厂能源统计存在的问题及对策[J];中国新技术新产品;2011年17期
相关会议论文 前10条
1 俞荣华;郭志懋;田增平;周傲英;;一个可扩展的数据清洗系统[A];第十八届全国数据库学术会议论文集(技术报告篇)[C];2001年
2 蒋勇青;杨奕虹;杨贺;;论数据清洗对信息检索质量的影响及清洗方法[A];2011年中国索引学会年会暨成立二十周年庆典论文集[C];2011年
3 马昕;肖建东;范华勇;;综合统计系统在红钢的应用[A];中国计量协会冶金分会2011年会论文集[C];2011年
4 肖英治;陈红;;带数据清洗功能的数据预处理系统PW-ETL的设计与实现[A];第二十一届中国数据库学术会议论文集(研究报告篇)[C];2004年
5 李晓静;谷峪;吕雁飞;王艳秋;于戈;;基于动态事件概率模型的高效RFID数据清洗算法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
6 王妍;石鑫;宋宝燕;;基于伪事件的RFID数据清洗方法[A];第26届中国数据库学术会议论文集(B辑)[C];2009年
7 相文玺;宋杰;房强;丁辉;鲍玉斌;于戈;;一种面向科学数据的通用排重模型[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
8 倪志良;夏雨春;;计算机系统安全与计算机病毒防治的措施和策略[A];第六次全国计算机安全技术交流会论文集[C];1991年
9 唐广泉;;六西格玛管理在统计工作中的应用研究[A];第三届中国质量学术论坛论文集[C];2008年
10 刘艳伟;陈战友;赵慧娟;;ODBC技术在钢筋表自动生成与统计系统中的应用[A];交通土建及结构工程计算机应用学术研讨会论文集[C];2001年
相关重要报纸文章 前10条
1 本报记者 王青萍;统计系统贯彻落实科学发展观要重点做好四方面工作[N];中国信息报;2008年
2 记者 魏莹;全区统计系统考评组观摩考评我市统计工作[N];固原日报;2008年
3 王东明 记者 杨颖;鞍山统计系统获两项国家级荣誉[N];鞍山日报 ;2009年
4 徐维军 宋艳芝;市统计局荣获全国统计系统先进集体[N];承德日报;2009年
5 通讯员徐风华;州统计局荣获“全国统计系统先进集体”称号[N];昌吉日报;2009年
6 本报记者 王璐瑶;统计系统积极推进服务方式转变[N];贵州日报;2009年
7 张作亭;济南市统计系统文明机关创建活动再获佳绩[N];济南日报;2009年
8 记者 杨朝东;市统计局荣获全国统计系统先进集体称号[N];通辽日报;2009年
9 刘建国 荣康勃;我市统计系统以“三创新”落实“三促进”活动[N];咸阳日报;2009年
10 贾云霞;市统计局蝉联全国统计系统先进集体称号[N];长治日报;2009年
相关博士学位论文 前10条
1 常建龙;数据流聚类及电信数据流管理[D];复旦大学;2008年
2 郑向群;农产品产地污染综合知识挖掘系统的研究[D];天津大学;2009年
3 刘波;XML数据智能管理若干关键技术研究[D];中南大学;2008年
4 吴爱华;不一致数据的查询处理[D];复旦大学;2010年
5 李超锋;Web使用挖掘关键技术研究[D];华中科技大学;2007年
6 y囈黄
本文编号:2752953
本文链接:https://www.wllwen.com/jingjilunwen/jtysjj/2752953.html