农村信用社信贷项目评审专家智能管理软件的设计与实现
发布时间:2020-12-31 14:57
文本自动聚类是指通过对大规模语料信息的分析,抽取出能够全面概括文本的特征词,根据文本间相似度计算,形成文本簇的一种方法。根据文本内容自动确定其所属类别。文本聚类技术的出现,使文档可以自动地按照内容进行关联和计算,符合人类对文档信息的管理需求。同时,作为信息过滤、信息检索、搜索引擎等领域的技术基础,文本聚类技术有着广泛的应用前景。农村信用社信贷项目评审专家智能管理软件,其原型来自于农村信用社征信系统。由于每年都有大量的审批文件审报,面对如此庞大的评审项目,评审专家的合理分配成为一项艰巨的任务。本文利用自然语言处理技术和聚类分析技术,将上报申请书进行分组管理,在评审项目专家分配的过程中,以组为单位进行评审推荐。采用以论文为媒介的自动推荐服务,其核心思想是通过评审专家发表的已有文件,对专家进行特征描述,从而使得系统具有了可计算的知识模型。本文以关键词抽取和文本聚类及相似度计算为核心技术,以采集互联网上的大规模相关数据为基础,建立了专家知识库和论文知识库。在此基础之上,通过对专家的同名消歧和专家关系网的建立,进一步使系统的正确性得到了保证。论文主要工作如下:1)针对专家推荐服务的具体需求,设计...
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
雅虎收购案聚类结果
[7]。如图 2-2 所示。图2-2 神经网络结构图输出层神经元构成一维或二维的结构,这个结构就确定了神经元在空间中的关系,输出神经元必须要与输入神经元连接。若输入为 n 维向量,则每个输出神经元对应一个 n 维权值向量 w。SOM 可以将数据的维度降低,转化成二维神经元,而且聚类得出的结果质量较高。但是 SOM 聚类的难点是确定输出节点的个数。若节点数多于类别数,则导致类别划分过细,最终导致聚类的结果质量较差。若节点个数少于类别数,则无法分辨究竟有哪些模式,原本为相似的类别被误分为一类。
17图3-4 网页内容如下图所示,可以观察到在网页地址中的查询地址,通过向爬虫程序当中注入地址(/library/Book_select.aspx?dbcatalog=中国学术文献网络出版总库&skind=&Type=FILE&Param=“)获得爬虫根据链接 URL,不断的根据数据进行遍历检索,直到将该库下的所有数据遍历检索完成。
【参考文献】:
期刊论文
[1]基于社会网络的跨文本同名消歧[J]. 陈晨,王厚峰. 中文信息学报. 2011(05)
[2]基于BBS热点主题发现的文本聚类方法[J]. 唐果,陈宏刚. 计算机工程. 2010(07)
[3]文本自动聚类技术研究[J]. 王伟. 情报杂志. 2009(02)
[4]双语知识库中关联实例的多策略提取机制[J]. 张桂平,姚天顺,尹宝生,蔡东风,宋彦. 中文信息学报. 2007(03)
[5]Web中文文本聚类研究及实现[J]. 杨学明. 现代图书情报技术. 2006(12)
[6]中文全文检索系统中实现主题词标引思路[J]. 吴春玉. 情报杂志. 2005(01)
[7]基于篇章理解的自动文摘研究[J]. 王建波,杜春玲,王开铸. 中文信息学报. 1995(03)
博士论文
[1]推荐系统中协同过滤算法若干问题的研究[D]. 张亮.北京邮电大学 2009
[2]基于神经网络和模糊逻辑的智能推荐系统研究[D]. 曹渝昆.重庆大学 2006
[3]聚类/分类理论研究及其在文本挖掘中的应用[D]. 卜东波.中国科学院研究生院(计算技术研究所) 2000
硕士论文
[1]数据挖掘在电子商务推荐系统中的应用与研究[D]. 卫华.西安科技大学 2013
[2]电子商务推荐系统核心技术研究[D]. 青海.北京工业大学 2009
[3]多文档关键词抽取技术的研究[D]. 杨洁.沈阳航空工业学院 2009
[4]基于项目特征模型的协同过滤推荐算法研究[D]. 庄永龙.南京理工大学 2008
本文编号:2949817
【文章来源】:电子科技大学四川省 211工程院校 985工程院校 教育部直属院校
【文章页数】:70 页
【学位级别】:硕士
【部分图文】:
雅虎收购案聚类结果
[7]。如图 2-2 所示。图2-2 神经网络结构图输出层神经元构成一维或二维的结构,这个结构就确定了神经元在空间中的关系,输出神经元必须要与输入神经元连接。若输入为 n 维向量,则每个输出神经元对应一个 n 维权值向量 w。SOM 可以将数据的维度降低,转化成二维神经元,而且聚类得出的结果质量较高。但是 SOM 聚类的难点是确定输出节点的个数。若节点数多于类别数,则导致类别划分过细,最终导致聚类的结果质量较差。若节点个数少于类别数,则无法分辨究竟有哪些模式,原本为相似的类别被误分为一类。
17图3-4 网页内容如下图所示,可以观察到在网页地址中的查询地址,通过向爬虫程序当中注入地址(/library/Book_select.aspx?dbcatalog=中国学术文献网络出版总库&skind=&Type=FILE&Param=“)获得爬虫根据链接 URL,不断的根据数据进行遍历检索,直到将该库下的所有数据遍历检索完成。
【参考文献】:
期刊论文
[1]基于社会网络的跨文本同名消歧[J]. 陈晨,王厚峰. 中文信息学报. 2011(05)
[2]基于BBS热点主题发现的文本聚类方法[J]. 唐果,陈宏刚. 计算机工程. 2010(07)
[3]文本自动聚类技术研究[J]. 王伟. 情报杂志. 2009(02)
[4]双语知识库中关联实例的多策略提取机制[J]. 张桂平,姚天顺,尹宝生,蔡东风,宋彦. 中文信息学报. 2007(03)
[5]Web中文文本聚类研究及实现[J]. 杨学明. 现代图书情报技术. 2006(12)
[6]中文全文检索系统中实现主题词标引思路[J]. 吴春玉. 情报杂志. 2005(01)
[7]基于篇章理解的自动文摘研究[J]. 王建波,杜春玲,王开铸. 中文信息学报. 1995(03)
博士论文
[1]推荐系统中协同过滤算法若干问题的研究[D]. 张亮.北京邮电大学 2009
[2]基于神经网络和模糊逻辑的智能推荐系统研究[D]. 曹渝昆.重庆大学 2006
[3]聚类/分类理论研究及其在文本挖掘中的应用[D]. 卜东波.中国科学院研究生院(计算技术研究所) 2000
硕士论文
[1]数据挖掘在电子商务推荐系统中的应用与研究[D]. 卫华.西安科技大学 2013
[2]电子商务推荐系统核心技术研究[D]. 青海.北京工业大学 2009
[3]多文档关键词抽取技术的研究[D]. 杨洁.沈阳航空工业学院 2009
[4]基于项目特征模型的协同过滤推荐算法研究[D]. 庄永龙.南京理工大学 2008
本文编号:2949817
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/2949817.html