经济新闻自动标引系统的研究
发布时间:2022-10-05 23:10
新闻是一种极其重要的信息资源,对新闻信息进行加工处理,使之机读化、数 字化将大大推动全社会的信息化进程。本论文对新闻信息的特点、利用价值和社会 影响力进行了深入的阐述和分析,并回顾了国内外文献自动标引技术的发展历史和 现状,分析了国内新闻数据库产品普遍存在的问题,提出了要满足新闻信息标引要 求,需要采用计算机自动标引。 为了实现新闻信息的自动标引,作者以新华社电讯稿(经贸类)为例,在分析、 综合国内外自动标引方法和技术的基础上,提出了基于多词表的综合抽词技术,即 避开现有汉语歧义切分中的一些技术难点,采用构建相关词表实现对新闻信息进行 自动抽词和标引。并详细介绍了各种词表的功能、构建和在标引中的具体应用,相 关词表包括:特例词表、停用词表、同义词表、关键词表、主题词表、自由词表、 人名机构表、分类主题词表和词素表等。设计了“特例词表处理——停用词表处理 ——抽词...
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
引 言
第一章 新闻信息自动标引研究概况
第一节 新闻信息及标引
第二节 国外新闻信息自动标引研究
第三节 国内新闻信息自动标引研究
第二章 词表及抽词技术研究
第一节 词表技术
第二节 抽词方法
第三章 自动赋词、赋号技术研究
第一节 汉语语词相似度研究
第二节 自动分类(赋号)研究
第四章 新华社电讯稿自动标引系统的设计
第一节 新华社电讯稿特点及处理内容的确定
第二节 标引实验系统设计
第三节 系统界面及使用
第五章 新华社电讯稿自动标引系统性能分析及评价
第一节 系统性能分析及评价
第二节 问题与不足
附录A 手工和自动标引结果比较
附录B 标引其它新闻信息实验
参考文献
后 记
【参考文献】:
期刊论文
[1]新闻信息数据库后控词表的设计和编制[J]. 侯汉清. 江苏图书馆学报. 2000(02)
[2]《军用主题词表》应用管理系统[J]. 赵建华,赵建国,杨肖宁,吴敏. 情报理论与实践. 1999(05)
[3]文档自动分类技术及其实现[J]. 邹涛,孙赛. 计算机系统应用. 1999(04)
[4]题名自动分类标引探讨[J]. 吴起立,李朝晖. 情报学报. 1999(01)
[5]一个中文文本自动分类数学模型[J]. 曹素青,曾伏虎,曹焕光. 情报学报. 1999(01)
[6]自动分类研究现状与展望[J]. 成颖,史九林. 情报学报. 1999(01)
[7]报纸文献是一种极为丰富而未被充分开发的信息源──关于发展报纸文献索引和数据库的思考[J]. 张琪玉. 图书馆杂志. 1999(02)
[8]新时代经验型计算机辅助标引系统设计[J]. 龚昌明,胡从玉,王海波. 情报理论与实践. 1999(01)
[9]国际互联网:新闻媒体新的会聚点——中国新闻媒体上网情况初探[J]. 孙宝传. 中国新闻科技. 1999(01)
[10]基于神经网络的汉语自动分词系统的设计与分析[J]. 尹锋. 情报学报. 1998(01)
本文编号:3686678
【文章页数】:67 页
【学位级别】:硕士
【文章目录】:
引 言
第一章 新闻信息自动标引研究概况
第一节 新闻信息及标引
第二节 国外新闻信息自动标引研究
第三节 国内新闻信息自动标引研究
第二章 词表及抽词技术研究
第一节 词表技术
第二节 抽词方法
第三章 自动赋词、赋号技术研究
第一节 汉语语词相似度研究
第二节 自动分类(赋号)研究
第四章 新华社电讯稿自动标引系统的设计
第一节 新华社电讯稿特点及处理内容的确定
第二节 标引实验系统设计
第三节 系统界面及使用
第五章 新华社电讯稿自动标引系统性能分析及评价
第一节 系统性能分析及评价
第二节 问题与不足
附录A 手工和自动标引结果比较
附录B 标引其它新闻信息实验
参考文献
后 记
【参考文献】:
期刊论文
[1]新闻信息数据库后控词表的设计和编制[J]. 侯汉清. 江苏图书馆学报. 2000(02)
[2]《军用主题词表》应用管理系统[J]. 赵建华,赵建国,杨肖宁,吴敏. 情报理论与实践. 1999(05)
[3]文档自动分类技术及其实现[J]. 邹涛,孙赛. 计算机系统应用. 1999(04)
[4]题名自动分类标引探讨[J]. 吴起立,李朝晖. 情报学报. 1999(01)
[5]一个中文文本自动分类数学模型[J]. 曹素青,曾伏虎,曹焕光. 情报学报. 1999(01)
[6]自动分类研究现状与展望[J]. 成颖,史九林. 情报学报. 1999(01)
[7]报纸文献是一种极为丰富而未被充分开发的信息源──关于发展报纸文献索引和数据库的思考[J]. 张琪玉. 图书馆杂志. 1999(02)
[8]新时代经验型计算机辅助标引系统设计[J]. 龚昌明,胡从玉,王海波. 情报理论与实践. 1999(01)
[9]国际互联网:新闻媒体新的会聚点——中国新闻媒体上网情况初探[J]. 孙宝传. 中国新闻科技. 1999(01)
[10]基于神经网络的汉语自动分词系统的设计与分析[J]. 尹锋. 情报学报. 1998(01)
本文编号:3686678
本文链接:https://www.wllwen.com/tushudanganlunwen/3686678.html