当前位置:主页 > 科技论文 > 信息工程论文 >

《辽宁科技大学》2007年硕士论文

发布时间:2016-11-30 08:50

  本文关键词:中文信息检索中相关算法的研究,由笔耕文化传播整理发布。


《辽宁科技大学》 2007年

中文信息检索中相关算法的研究

薛静  

【摘要】:随着网络技术的发展,网络上电子可读文本的日益增加,呈指数膨胀的文本信息资源,使得如何准确有效地获取用户所需要的信息成为人们关注的热点,促进了文本处理领域的形成和发展。自动收集和整理所需要的各类信息成为信息产业面临新的挑战和新的发展契机,而信息检索技术是解决这些问题的关键。根据不同的应用背景和不同的使用目的,信息检索技术已经演化为信息检索、信息过滤、信息分类、文本摘要,和问题回答等方向。 由于信息主要是以文本形式表示,本文主要讨论中文文本检索和相关应用的处理技术。文本检索主要研究的对象是大规模、非结构化的真实文本,进行文本分类、文本检索、文本过滤和文本摘要等方面处理,,以满足用户的信息需求。 本文主要讨论的问题包括:提高文本检索效率的索引文件系统和提高系统精度的相关反馈技术等。 文本分类既可以作为独立应用系统,也可以作为检索系统的组件用以提高系统的效率。作者建议在检索系统中采用层次分类方法。

【关键词】:
【学位授予单位】:辽宁科技大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:TP391.3
【目录】:

  • 摘要4-5
  • Abstract5-8
  • 第一章 前言8-17
  • 1.1 文本检索的背景8
  • 1.2 信息检索的研究现状8-16
  • 1.2.1 概念模型11
  • 1.2.2 文件结构11-12
  • 1.2.3 查询操作12
  • 1.2.4 项操作12-13
  • 1.2.5 文献操作13
  • 1.2.6 信息检索系统的目标13-14
  • 1.2.7 信息检索系统的评估14-16
  • 1.3 本文的组织结构16-17
  • 第二章 信息检索模型17-27
  • 2.1 向量空间模型(Vector Space Model,VSM)17-22
  • 2.1.1 基本概念17-18
  • 2.1.2 项的选取18-20
  • 2.1.3 权重计算20-22
  • 2.2 布尔模型22-24
  • 2.3 概率模型24-26
  • 2.4 本章小结26-27
  • 第三章 检索系统的结构27-32
  • 3.1 一般流程27-28
  • 3.2 一个VSM系统的结构28-29
  • 3.3 本章小结29-32
  • 第四章 检索系统效率问题的研究32-47
  • 4.1 文献分类概述32-34
  • 4.2 层次分类方法34-39
  • 4.2.1 层次分类方法34-35
  • 4.2.2 类别层次35-36
  • 4.2.3 概念层次36
  • 4.2.4 特征向量的压缩方法36-38
  • 4.2.5 层次分类结果38-39
  • 4.3 倒排文件39-45
  • 4.3.1 B树40
  • 4.3.2 PAT树40-41
  • 4.3.3 利用有序数组实现倒排文件41-42
  • 4.3.4 快速倒排算法42-45
  • 4.4 本章小结45-47
  • 第五章 检索系统中的相关反馈47-54
  • 5.1 相关反馈47-48
  • 5.2 基本概念48-53
  • 5.3 结论53-54
  • 第六章 结束语54-57
  • 6.1 对于文本检索的认识54-55
  • 6.2 本文的主要工作55
  • 6.3 未来的工作55-57
  • 参考文献57-61
  • 致谢61
  • 下载全文 更多同类文献

    CAJ全文下载

    (如何获取全文? 欢迎:购买知网充值卡、在线充值、在线咨询)

    CAJViewer阅读器支持CAJ、PDF文件格式


    【相似文献】

    中国期刊全文数据库 前10条

    1 ;文本检索[J];计算机应用研究;1986年02期

    2 林鸿飞,战学刚,姚天顺;文本特征区域与文本过滤的匹配机制[J];计算机工程与应用;2000年07期

    3 张霞;于崇兰;;医学图像检索研究[J];医学信息;2010年07期

    4 曹冬林;林达真;;文本检索模型综述[J];心智与计算;2007年04期

    5 刘永泰;全文文本检索技术及其发展[J];中国信息导报;1998年04期

    6 乔冬梅;搜索引擎文本检索界面设计分析[J];图书情报知识;2003年06期

    7 刘永丹,曾海泉,李荣陆,胡运发;基于语义分析的倾向性文本过滤[J];通信学报;2004年07期

    8 王卫玲;赵秀丽;张燕红;王凤芹;;文本过滤中的特征选择[J];微计算机信息;2010年21期

    9 陆皓,徐伟;自然语言计算机情报检索的初探——一个自动文本检索原型系统[J];现代图书情报技术;1991年02期

    10 李斌;TREC-3:文本检索会议[J];管理科学文摘;1997年05期

    中国重要会议论文全文数据库 前10条

    1 黄萱菁;夏迎炬;吴立德;;基于向量空间模型的文本过滤系统[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年

    2 吴立德;黄萱菁;;文本检索会议简介[A];自然语言理解与机器翻译——全国第六届计算语言学联合学术会议论文集[C];2001年

    3 赵林;夏迎炬;黄萱菁;吴立德;;基于Winnow算法的文本过滤[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

    4 周水庚;胡江滔;胡运发;周傲英;;基于隐含语义索引的中文文本检索[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年

    5 付瑞吉;秦兵;刘挺;;面向音乐领域的文本检索与挖掘系统[A];第五届全国青年计算语言学研讨会论文集[C];2010年

    6 李振星;徐泽平;;基于兴趣模型的WEB信息预测采集过滤方法[A];第一届学生计算语言学研讨会论文集[C];2002年

    7 陈忆群;曹瑾音;印鉴;;查询扩展树:关系数据库中的文本检索[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年

    8 马春雷;;基于向量空间模型的中文文本检索研究[A];2007年河北省电子学会、河北省计算机学会、河北省自动化学会、河北省人工智能学会、河北省计算机辅助设计研究会、河北省软件行业协会联合学术年会论文集[C];2007年

    9 朱祥玉;侯德文;陈希;;基于双重评估函数的文本特征提取方法[A];山东省计算机学会2005年信息技术与信息化研讨会论文集(二)[C];2005年

    10 张敏;马亮;马少平;陈群秀;;TREC2002介绍及清华大学实验研究[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

    中国重要报纸全文数据库 前10条

    1 记者 龚杰;[N];计算机世界;2000年

    2 何清 史忠植 王伟;[N];计算机世界;2006年

    3 燕舞;[N];中华读书报;2008年

    4 ;[N];网络世界;2001年

    5 商报记者 江文兵;[N];北京现代商报;2005年

    6 记者 徐建华;[N];中国质量报;2010年

    7 记者 徐建华;[N];中国质量报;2010年

    8 严恒元;[N];经济日报;2002年

    9 汪玉凯;[N];中国高新技术产业导报;2003年

    10 记者 侯梅竹;[N];计算机世界;2004年

    中国博士学位论文全文数据库 前10条

    1 夏迎炬;文本过滤关键技术研究[D];复旦大学;2003年

    2 朱振方;基于微粒群和遗传优化的文本过滤关键技术研究[D];山东师范大学;2012年

    3 程军;基于统计的文本分类技术研究[D];中国科学院研究生院(文献情报中心);2003年

    4 刘永丹;文档数据库若干关键技术研究[D];复旦大学;2004年

    5 王鑫印;无结构和半结构信息检索相关技术研究[D];复旦大学;2007年

    6 史庆伟;基于小世界模型的P2P网络文本检索[D];天津大学;2008年

    7 胡佳妮;文本挖掘中若干关键问题的研究[D];北京邮电大学;2008年

    8 陈毅恒;文本检索结果聚类及类别标签抽取技术研究[D];哈尔滨工业大学;2010年

    9 赵玉茗;文本间语义相关性计算及其应用研究[D];哈尔滨工业大学;2009年

    10 王占一;Web文本挖掘中若干问题的研究[D];北京邮电大学;2012年

    中国硕士学位论文全文数据库 前10条

    1 张斌;基于主题的文本检索[D];北京邮电大学;2011年

    2 刘力;不良文本过滤系统的研究与实现[D];复旦大学;2011年

    3 周俊;一种不良文本过滤方法[D];电子科技大学;2012年

    4 周聚;基于网络信息审计的文本过滤的研究与实现[D];苏州大学;2010年

    5 邵建双;基于概念格的文本过滤系统的设计与实现[D];大连海事大学;2010年

    6 孙浩;基于主动学习的文本过滤系统的研究[D];北京邮电大学;2011年

    7 邹俊杰;受限域问答系统文本检索研究[D];昆明理工大学;2011年

    8 薛静;中文信息检索中相关算法的研究[D];辽宁科技大学;2007年

    9 李霞;文本过滤防火墙技术研究[D];北方工业大学;2011年

    10 汪前秀;基于改进的VSM的不良文本过滤模型研究[D];东北财经大学;2010年


      本文关键词:中文信息检索中相关算法的研究,由笔耕文化传播整理发布。



    本文编号:198878

    资料下载
    论文发表

    本文链接:https://www.wllwen.com/kejilunwen/xinxigongchenglunwen/198878.html


    Copyright(c)文论论文网All Rights Reserved | 网站地图 |

    版权申明:资料由用户88ef3***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com