民国抗战史主题词表自动构建研究
发布时间:2021-08-29 17:14
针对民国文献资料开发利用的实际需求,以民国抗战史主题词表为例提出一套专题主题词表自动构建方案,用以组织民国资料信息并探索专题词表的构建技术。以《申报》为主要语料,通过实例给出民国抗战史主题词表构建关键技术解决方案,包括多种途径收集民国抗战史领域词汇,采用词频统计、同现分析等统计自然语言处理方法辅助编表专家确定词表收词范围和识别词汇之间的概念关系,并探讨了民国抗战史主题词表的宏观结构、收词范围和方法、存储与发布利用。运用自动化方法并辅以人工判定实现主题词表的构建,能够节省编表时间,降低编表负担和节约成本,便于词表维护,从而促进主题词表的应用和推广。
【文章来源】:图书馆杂志. 2020,39(08)北大核心CSSCI
【文章页数】:7 页
【部分图文】:
民国抗战史主题词表自动构建流程
主要相关关系
【参考文献】:
期刊论文
[1]民国文献目录编制沿革及其趋势[J]. 蔡迎春,段晓林. 图书馆论坛. 2017(08)
[2]基于术语释义分析获取叙词表词间关系[J]. 陈白雪,常春,王刘安. 图书情报工作. 2017(10)
[3]基于概念语义网络的词族挖掘研究[J]. 杜慧平. 图书情报工作. 2016(21)
[4]网络环境叙词表收词新来源刍议[J]. 鲍秀林,吴雯娜. 图书情报工作. 2011(14)
[5]网络环境下新型《汉语主题词表》的构建[J]. 曾建勋,常春,吴雯娜,宋培彦. 中国图书馆学报. 2011(04)
[6]叙词表编制标准的词间关系比较研究[J]. 王世清,常春. 情报理论与实践. 2010(08)
[7]基于文献标题词汇共现获取词间关系研究[J]. 常春,赖院根. 图书情报工作. 2009(08)
[8]电子政务主题词表自动构建研究[J]. 仲云云,侯汉清,杜慧平. 中国图书馆学报. 2008(03)
[9]基于词表和N-gram算法的新词识别实验[J]. 曹艳,杜慧平,刘竟,侯汉清. 情报科学. 2007(11)
[10]词表的自动丰富——从元数据中提取关键词及其定位[J]. 王军. 中文信息学报. 2005(06)
硕士论文
[1]面向信息检索的汉语同义词自动识别[D]. 陆勇.南京农业大学 2005
本文编号:3371052
【文章来源】:图书馆杂志. 2020,39(08)北大核心CSSCI
【文章页数】:7 页
【部分图文】:
民国抗战史主题词表自动构建流程
主要相关关系
【参考文献】:
期刊论文
[1]民国文献目录编制沿革及其趋势[J]. 蔡迎春,段晓林. 图书馆论坛. 2017(08)
[2]基于术语释义分析获取叙词表词间关系[J]. 陈白雪,常春,王刘安. 图书情报工作. 2017(10)
[3]基于概念语义网络的词族挖掘研究[J]. 杜慧平. 图书情报工作. 2016(21)
[4]网络环境叙词表收词新来源刍议[J]. 鲍秀林,吴雯娜. 图书情报工作. 2011(14)
[5]网络环境下新型《汉语主题词表》的构建[J]. 曾建勋,常春,吴雯娜,宋培彦. 中国图书馆学报. 2011(04)
[6]叙词表编制标准的词间关系比较研究[J]. 王世清,常春. 情报理论与实践. 2010(08)
[7]基于文献标题词汇共现获取词间关系研究[J]. 常春,赖院根. 图书情报工作. 2009(08)
[8]电子政务主题词表自动构建研究[J]. 仲云云,侯汉清,杜慧平. 中国图书馆学报. 2008(03)
[9]基于词表和N-gram算法的新词识别实验[J]. 曹艳,杜慧平,刘竟,侯汉清. 情报科学. 2007(11)
[10]词表的自动丰富——从元数据中提取关键词及其定位[J]. 王军. 中文信息学报. 2005(06)
硕士论文
[1]面向信息检索的汉语同义词自动识别[D]. 陆勇.南京农业大学 2005
本文编号:3371052
本文链接:https://www.wllwen.com/tushudanganlunwen/3371052.html