基于远监督的语义知识资源扩展研究
本文关键词:基于远监督的语义知识资源扩展研究
【摘要】:语义知识资源蕴含了深刻的语言学理论,是语言学知识和语言工程的重要接口。该文以形容词句法语义词典为研究对象,探索对语义知识资源自动扩展的方法。该文的目标是利用大规模语料库,扩展原有词典的词表及其对应的句法格式。具体方法是根据词的句法格式将词典的词分类,将待扩展的新词通过分类器映射到原有词典的词中,以此把词典扩展问题转化为多类分类问题。依据的原理是词典词和待扩展新词在大规模语料中句法结构的相似性。该文通过远监督的方法构造训练数据,避免大量的人工标注。训练过程结合了浅层机器学习方法和深度神经网络,取得了有意义的成果。实验结果显示,深度神经网络能够习得句法结构信息,有效提升匹配的准确率。
【作者单位】: 北京大学中文系;北京语言大学信息科学学院;
【关键词】: 资源扩展 远监督 语义知识资源
【基金】:教育部人文社会科学研究青年项目(16YJC740050) 中国博士后科学基金第60批面上项目(2016M600838) 国家社科基金重大招标项目(12&ZD175) 国家重点基础研究计划(973计划)(2014CB340502)
【分类号】:H146.3;TP391.1
【正文快照】: 1引言语义知识资源是在特定的语言学理论基础上,以词型(Type)为标注对象进行语言描写的语言工程实践的成果,是语言学理论和自然语言处理技术结合的重要手段。相比以词例(Token)为标注对象的语料库标注,语义知识资源库建设更为便捷,且对自然语料的覆盖面更大,对系统的可移植性
【参考文献】
中国期刊全文数据库 前4条
1 宋文杰;顾彦慧;周俊生;孙玉杰;严杰;曲维光;;多策略同义词获取方法研究[J];北京大学学报(自然科学版);2015年02期
2 袁毓林;李强;;怎样用物性结构知识解决“网球问题”?[J];中文信息学报;2014年05期
3 袁毓林;;基于生成词库论和论元结构理论的语义知识体系研究[J];中文信息学报;2013年06期
4 孙霞;董乐红;;基于监督学习的同义关系自动抽取方法[J];西北大学学报(自然科学版);2008年01期
【共引文献】
中国期刊全文数据库 前10条
1 卢达威;王星友;袁毓林;;基于远监督的语义知识资源扩展研究[J];中文信息学报;2016年06期
2 汪昌松;靳玮;;句法—音系接口视阈下的容纳句研究[J];语言教学与研究;2016年06期
3 李晓瑛;夏光辉;李丹亚;;主题标引文献的语义关系发现研究[J];现代图书情报技术;2016年Z1期
4 李强;袁毓林;;从生成词库论看名词的词典释义[J];辞书研究;2016年04期
5 吉益民;;“V+目的宾语”论略[J];汉语学报;2016年03期
6 李强;;生成词库理论研究述评[J];外国语(上海外国语大学学报);2016年03期
7 李强;;谓词隐含、物性角色和“NP1+的+NP2”结构[J];语言研究;2015年04期
8 李强;袁毓林;;名词词义描写和研究需要什么样的语义学知识?[J];中文信息学报;2015年05期
9 靳玮;乔晓东;刘耀;齐晓亚;;面向中国专利文献的零形回指消解规则研究[J];图书情报工作;2015年09期
10 李强;袁毓林;;服务于国际汉语教学的同义名词辨析查询系统建设[J];对外汉语研究;2014年02期
【二级参考文献】
中国期刊全文数据库 前9条
1 袁毓林;;基于生成词库论和论元结构理论的语义知识体系研究[J];中文信息学报;2013年06期
2 袁毓林;;语义资源建设的最新趋势和长远目标——通过映射对比、走向统一联合、实现自动推理[J];中文信息学报;2008年03期
3 袁毓林;;语义角色的精细等级及其在信息处理中的应用[J];中文信息学报;2007年04期
4 董乐红;耿国华;赵清;;基于模糊推理的青铜器鉴定专家系统[J];西北大学学报(自然科学版);2006年02期
5 张剑;李春平;;基于WordNet概念向量空间模型的文本分类[J];计算机工程与应用;2006年04期
6 袁毓林;信息抽取的语义知识资源研究[J];中文信息学报;2002年05期
7 俞士汶,朱学锋,王惠;《现代汉语语法信息词典》的新进展[J];中文信息学报;2001年01期
8 俞士汶,,朱学锋,王惠,张芸芸;现代汉语语法信息词典规格说明书[J];中文信息学报;1996年02期
9 陆勇;侯汉清;;基于模式匹配的汉语同义词自动识别[J];情报学报;2006年06期
【相似文献】
中国期刊全文数据库 前6条
1 李琼;李志;;基于语义知识的书读前后非分句语言片段识别[J];湖北社会科学;2010年03期
2 田占伟;张庆普;刘臣;;语义知识网络的结构分析与构建[J];情报理论与实践;2011年10期
3 彭玉海;关于语义知识和语义操作[J];外语学刊(黑龙江大学学报);1997年04期
4 金花,刘鹤龄,杨娅玲,莫雷;语义知识神经表征的fMRI研究:通道特异性或类别特异性?[J];心理学报;2005年02期
5 徐莉娜;;从译者失语看翻译教学的缺失环节[J];中国翻译;2012年02期
6 ;[J];;年期
中国重要会议论文全文数据库 前5条
1 宋炜;;语义知识获取与网络信息集成的分析[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
2 刘开瑛;由丽萍;;汉语框架语义知识库构建工程[A];中文信息处理前沿进展——中国中文信息学会二十五周年学术会议论文集[C];2006年
3 杨柳;何婷婷;涂新辉;;基于网络百科全书的中文关联语义知识获取[A];第五届全国青年计算语言学研讨会论文集[C];2010年
4 由丽萍;刘焘;刘开瑛;;信息处理用中文框架语义知识描述方法研究[A];民族语言文字信息技术研究——第十一届全国民族语言文字信息学术研讨会论文集[C];2007年
5 郝晓燕;刘伟;李茹;刘开瑛;;汉语框架语义知识库及软件描述体系[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
中国博士学位论文全文数据库 前1条
1 郭鸿志;多源语义知识库融合方法研究[D];哈尔滨工业大学;2011年
中国硕士学位论文全文数据库 前5条
1 李佳南;馆藏资源语义知识库及服务系统平台的构建研究[D];南京理工大学;2015年
2 崔磊;交互式开放语义知识库构建方法研究[D];哈尔滨工业大学;2010年
3 徐忠明;基于二元组合文法的语义知识库构建[D];山东大学;2008年
4 马德华;基于语义知识的监控执行模式设计与实现[D];吉林大学;2013年
5 刘焘;汉语框架语义知识库信息组织与表示方法研究[D];山西大学;2007年
本文关键词:基于远监督的语义知识资源扩展研究
本文编号:514057
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/514057.html