当前位置:主页 > 科技论文 > 软件论文 >

蕴含地理事件微博客消息的自动识别方法

发布时间:2017-09-26 01:32

  本文关键词:蕴含地理事件微博客消息的自动识别方法


  更多相关文章: 微博客 地理事件 事件文本识别 主题模型 词向量


【摘要】:微博客文本蕴含类型丰富的地理事件信息,能够弥补传统定点监测手段的不足,提高事件应急响应质量。然而,由于大规模标注语料的普遍匮乏,无法利用监督学习过程识别蕴含地理事件信息的微博客文本。为此,本文提出一种蕴含地理事件微博客消息的自动识别方法,通过快速获取的语料资源增强识别效果。该方法利用主题模型具有提取文档中主题集合的优势,通过主题过滤候选语料文本,实现地理事件语料的自动提取。同时,将分布式表达词向量模型引入事件相关性计算过程,借助词向量隐含的语义信息丰富微博客短文本的上下文内容,进一步增强事件消息的识别效果。通过以新浪微博为数据源开展的实验分析表明,本文提出的蕴含地理事件信息微博客消息识别方法,识别来自事件微博话题的消息文本的F-1值可达到71.41%,比经典的基于SVM模型的监督学习方法提高了10.79%。在模拟真实微博环境的500万微博客数据集上的识别准确率达到60%。
【作者单位】: 中国科学院地理科学与资源研究所资源与环境信息系统国家重点实验室;中国科学院大学;
【关键词】微博客 地理事件 事件文本识别 主题模型 词向量
【基金】:国家“863”计划课题(2013AA120305) 国家自然科学基金项目(41401460)
【分类号】:TP393.092;TP391.1
【正文快照】: 1引言文本[7]。对于内容自由度更高的开放文本,监督学习识别方法的效果更好,但监督学习方法需要足够近年来,随着智能终端和移动互联网的普及,的标注语料进行模型训练,大部分研究使用的语料位置服务应用不断增长,与空间位置密切相关的地主要来源于开放的测评语料[4,8]或人工标

【相似文献】

中国期刊全文数据库 前10条

1 温艳玲;;食品追溯系统自动识别方法研究——以猪肉食品为例[J];信息与电脑(理论版);2011年12期

2 刘惠娟;周源华;;地图中河流的自动识别方法[J];自动化学报;1993年04期

3 张仰森,徐波,曹元大,宗成庆;基于姓氏驱动的中国姓名自动识别方法[J];计算机工程与应用;2003年04期

4 唐慧君,王建军,罗秀娟,周泗忠;一种点阵码的自动识别方法[J];应用光学;2004年05期

5 秦海勤;徐可君;江龙平;;分形理论应用中无标度区自动识别方法[J];机械工程学报;2006年12期

6 游宏梁;张巍;沈钧毅;刘挺;;一种基于加权投票的术语自动识别方法[J];中文信息学报;2011年03期

7 周激流,何其超;人脸正面模式自动识别方法研究[J];四川大学学报(自然科学版);1993年01期

8 陈京德,季明松;非接触IC卡读写领域的一次技术创新——非接触IC卡多功能读写器[J];金卡工程;2003年05期

9 曾维亮;梁春生;李冉;皮亦鸣;;基于边缘最大匹配的印鉴自动识别方法[J];信息与电子工程;2006年05期

10 曾维亮;梁春生;李冉;;基于边缘最大匹配的印鉴自动识别方法[J];实验科学与技术;2006年S1期

中国重要会议论文全文数据库 前10条

1 郑家恒;杨晓岩;;英文译名自动识别方法研究[A];辉煌二十年——中国中文信息学会二十周年学术会议论文集[C];2001年

2 钟茂生;;基于词语形式标记的句际语义关系自动识别方法[A];第五届全国信息检索学术会议论文集[C];2009年

3 张巍;游宏梁;张吉才;;一种基于加权投票的术语自动识别方法[A];第六届全国信息检索学术会议论文集[C];2010年

4 黄行;江荻;;现代藏语判定动词句主宾语的自动识别方法[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

5 杜小毅;于濂;;基于联合特征的车标自动识别方法[A];第七届中国智能交通年会优秀论文集——智能交通技术[C];2012年

6 王宁;游志胜;潘薇;李贵俊;;一种护照编码自动识别方法[A];信号与信息处理技术第三届信号与信息处理全国联合学术会议论文集[C];2004年

7 尚英;;动词重叠形式的自动识别方法研究[A];第二届全国学生计算语言学研讨会论文集[C];2004年

8 刘旭花;孟祥增;刘俊晓;吴鹏飞;;一种基于知识库的图像对象自动识别方法[A];第十三届全国图象图形学学术会议论文集[C];2006年

9 王昆翔;韩加;徐勇;;关于人脸图象自动识别方法的研究[A];2001年中国智能自动化会议论文集(上册)[C];2001年

10 杨志华;齐东旭;江力;杨力华;;一种基于EMD分解的睡眠脑电图梭形波自动识别方法[A];第一届中国情感计算及智能交互学术会议论文集[C];2003年

中国硕士学位论文全文数据库 前10条

1 陈U,

本文编号:920761


资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/920761.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户24687***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com