网络文本信息聚类算法研究与应用.pdf下载
本文关键词:网络文本信息聚类算法研究与应用,由笔耕文化传播整理发布。
北京交通大学
硕士学位论文
网络文本信息聚类算法研究与应用
姓名:张树魁
申请学位级别:硕士
专业:通信与信息系统
指导教师:刘云
座机电话号码
中文摘要
摘要:随着计算机网络技术在全球范围内的迅速发展与普及,网络信息资源同趋
丰富且内容复杂多样,其中既有大量进步、健康的信息,也不乏反动、迷信的内
容。因此,如何对这样庞大的信息资源进行快速有效的检索分析,对网络舆论进
行准确的预测引导成为一个重要而迫切的研究课题。
于是,数据挖掘这门技术应运而生,它以数据库技术为基础,融合统计学、
机器学习、模糊学等多门学科的成果,研究如何从数据库中提取隐含的、未知的
有潜在应用价值的信息或模式。聚类分析在这项技术中占有重要的位置,它通过
比较数据的相似性和差异性将一个数据集合分割成几个称为类的子集,从而发现
数据信息的内在特征和分布规律。
本论文在系统回顾网络信息检索、数据挖掘和聚类算法应用研究现状的基础
上,总结了目前通用的聚类算法存在的问题,试图设计一种适用于中文网络文本
信息的聚类算法,并进而设计实现一个网络信息聚类系统。
本论文的研究内容和创新工作主要体现在以下几点:
1 分析了几种通用的聚类算法,包括基于划分、基于层次、基于密度、基
于网格和基于模型聚类算法,通过实验数据分析比较了几种算法的性能和优缺点,
分析了它们在网络信息聚类应用中的缺陷。
2 研究了中文网络信息聚类应用
本文关键词:网络文本信息聚类算法研究与应用,,由笔耕文化传播整理发布。
本文编号:105210
本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/105210.html