基于URL的中文多语义名词在线语义标注
本文关键词:基于URL的中文多语义名词在线语义标注
更多相关文章: 语义标注 自然语言处理 中文多语义名词 URL分类器 文本聚类 热词
【摘要】:中文语义标注在自然语言处理领域有广泛的应用,其目的在于挖掘并标注出中文多语义名词的多个语义。提出一种新颖的语义标注算法,通过在线URL分类目录,构建得到URL分类器。借助于URL分类器,对搜索引擎返回的多语义名词的搜索结果(包括网页URL及摘要)进行分类,得到多语义名词的初始语义分类结果。对初始语义分类结果按其网页摘要聚类,提取聚类特征后得到多语义词的语义标注结果。该算法利用基于URL的网页分类方法,能在线对中文多语义名词进行语义标注。实验结果证明,该语义标注算法可以取得70%的准确率及80%的召回率,适用于网络热词语义标注。
【作者单位】: 华东师范大学计算机科学技术系;
【关键词】: 语义标注 自然语言处理 中文多语义名词 URL分类器 文本聚类 热词
【基金】:上海市国际科技合作基金资助项目(11530700300) 上海市科委科研基金资助项目“面向NGB的智能业务分析关键技术研究及系统研制”(12dz1500205)
【分类号】:TP391.1
【正文快照】: 1概述语义知识学习在人工智能领域中具有重要应用,一直以来都是自然语言处理研究中的热点问题。语义标注研究多语义词的语义信息获取,在相关度计算、查询扩展等领域得到广泛应用[1]。名词的多语义特征表现尤为明显,所以它是语义标注的研究重点。对于中文多语义名词,语义标注应
【参考文献】
中国期刊全文数据库 前2条
1 张宇;宋巍;刘挺;李生;;基于URL主题的查询分类方法[J];计算机研究与发展;2012年06期
2 何婷婷;李芳;;基于主题模型的博客标签语义知识获取(英文)[J];中国通信;2012年03期
【共引文献】
中国期刊全文数据库 前2条
1 蒋宗礼;时福林;;基于链接关系的网页分类优化算法[J];计算机与现代化;2014年05期
2 王树西;夏增艳;;一种区分索引与信息的网页分类数学模型及证明[J];计算机科学;2014年S2期
中国重要会议论文全文数据库 前1条
1 Liu Na;Li Ming-xia;Lu Ying;Tang Xiao-jun;Wang Hai-wen;Xiao Peng;;Mixture of Topic Model for Multi-document Summarization[A];第26届中国控制与决策会议论文集[C];2014年
中国博士学位论文全文数据库 前1条
1 伍大勇;搜索引擎中命名实体查询处理相关技术研究[D];哈尔滨工业大学;2012年
中国硕士学位论文全文数据库 前4条
1 韩媛媛;热计量表物联网对象名解析服务系统的安全性研究[D];燕山大学;2012年
2 胡蓉;基于标签—主题模型的标签推荐研究[D];华中师范大学;2013年
3 陈水银;基于语义分析的文档排序方法研究[D];华中师范大学;2014年
4 宋嵩;基于URL分析的移动互联网用户分群[D];河北大学;2013年
【二级参考文献】
中国期刊全文数据库 前1条
1 张森;王斌;;Web检索查询意图分类技术综述[J];中文信息学报;2008年04期
【相似文献】
中国期刊全文数据库 前10条
1 韦娜;耿国华;周明全;;基于相关反馈的文物图像语义标注[J];西北大学学报(自然科学版);2008年03期
2 栾悉道;谢毓湘;韩志广;谭义红;陈治平;沈金荣;;基于概念分布的图像语义标注与检索[J];武汉理工大学学报;2009年18期
3 张捷;;图像语义标注[J];电脑开发与应用;2012年01期
4 孙君顶;杜娟;;图像自动语义标注技术综述[J];计算机系统应用;2012年07期
5 吴焕瑞;;图书领域的语义标注[J];无线互联科技;2013年03期
6 邱均平;牟楠;楼雯;赵蓉英;;国内外语义标注研究进展分析[J];情报理论与实践;2014年05期
7 李向阳,张亚非;基于语义标注的信息抽取[J];解放军理工大学学报(自然科学版);2004年04期
8 刘振;;社交媒体的语义标注应用现状研究[J];图书与情报;2013年05期
9 刘杰;杜军平;;基于潜在主题融合的跨媒体图像语义标注[J];电子学报;2014年05期
10 王传清;毕强;;数字图书馆自动化语义标注工具系统模型研究[J];现代图书情报技术;2014年06期
中国重要会议论文全文数据库 前10条
1 苗传江;刘智颖;;现代汉语语料的句子级语义标注[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
2 谢法奎;张全;袁毅;;基于HNC理论的语义标注语料库[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
3 张娜;李济洪;;基于语义标注的中文阅读理解语料库的建设[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
4 宋雨;郑怿;吴燕;;RDFa语义标注技术综述[A];2009全国计算机网络与通信学术会议论文集[C];2009年
5 鲍广宇;谭伟;吴亚宁;;机器兵力指挥控制语言的语义标注技术研究[A];2013第一届中国指挥控制大会论文集[C];2013年
6 马永腾;亢世勇;;非典型成员的语义标注策略和问题[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年
7 王浩然;徐建良;张巍;;一种XML元数据的自动语义标注方法[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年
8 袁柳;李战怀;陈世亮;;OntoWord:一种新的Web页面语义标注方法[A];第二十五届中国数据库学术会议论文集(二)[C];2008年
9 曾诚;李兵;何克清;;KMP算法在Web服务语义标注中的应用[A];2010年全国开放式分布与并行计算机学术会议论文集[C];2010年
10 周强;王俊俊;陈丽欧;;构建大规模的汉语事件知识库[A];中国计算语言学研究前沿进展(2009-2011)[C];2011年
中国博士学位论文全文数据库 前4条
1 米杨;基于顶级本体整合的医学领域语义标注研究[D];吉林大学;2012年
2 谢铭;关联数据和知识表示的自动语义标注技术[D];武汉大学;2012年
3 唐金辉;视频语义标注的若干问题研究[D];中国科学技术大学;2008年
4 荆涛;面向领域网页的语义标注若干问题研究[D];吉林大学;2011年
中国硕士学位论文全文数据库 前10条
1 丁长林;中医古籍文献语义标注技术的研究[D];沈阳航空航天大学;2013年
2 王国印;科技文献语义标注系统研究[D];华中科技大学;2009年
3 罗旋;基于复句领域本体的语义标注方法研究[D];华中师范大学;2006年
4 丁蓉;自动语义标注方法研究[D];兰州理工大学;2012年
5 王亚斌;基于本体的语义标注研究[D];兰州理工大学;2010年
6 于晓繁;基于本体和元数据的语义标注平台模型与系统架构研究[D];山东理工大学;2012年
7 张泓博;面向领域文档的自动语义标注方法研究[D];重庆大学;2012年
8 沙丽华;面向领域文档的语义标注方法研究[D];吉林大学;2009年
9 张磊;基于中文维基百科的全文语义标注系统[D];华中科技大学;2012年
10 施梦炜;基于本体面向三维场景的语义标注研究与应用[D];上海交通大学;2013年
,本文编号:1032795
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1032795.html