用于警情信息分析的实体识别系统的研究与实现
【图文】:
可以认为利用深度学习解决问题的模式是“输入数据->邋深度学逡逑习模型->邋输出结果”。深度学习模型主要工作原理是在训练集上学习到非线性变逡逑换空间,那么就要求输入数据必须是数值化,可计算的。如图2-1所示,对于逡逑语音方面的任务而言,音频频谱序列向量是可以直接作为输入数据传递给计算逡逑机,在图像处理中,图片的像素向量也是可以直接作为输入数据传递给计算逡逑机。然而,在自然语言处理中,文本的字词没有天然的稠密表征方式,需要将逡逑文本的字词转换为像音频和图像一样具有表征含义且稠密的向量输入到计算机逡逑中。逡逑AUDIO逦IMAGES逦TEXT逡逑I邋/邋i邋I逡逑1邋?邋j邋?邋WI?邋Icy)邋?]逡逑iiL邋BA逦!漏逡逑Audio邋Spectrogram逦=n0t=逡逑DENSE逦DENSE逦SPARSE逡逑图2-1不同数据类型的表示方法逡逑不难发现,语言相对于声音和图像会显得更“高级”一点。在图像和语音逡逑领域,最基本的数据就是信号数据,通过这种低级且有效地数据组织方式,,能逡逑够很好的表征出数据原有的内涵,譬如在比较声音或者图片是否相似时,可以逡逑直接通过欧式距离的度量就能够得出结论。而语言作为一种人类文明的产物,逡逑其具有高度抽象的特征。不妨举个例子
w(t+2)逡逑图2-2邋CBOW模型示意图逡逑如图2-2所示,CBOW模型主要分为三层,分别是输入层、投影层和输出逡逑层。以“我在北邮打篮球”这句话为例,令上下文窗口大小K为2,并且假定逡逑当前关注的词语是“北邮”。输入层的输入w(t-2)、w(t-l)、w(t+l)、w(t+2)则分逡逑别对应“我”、“在”、“打”、“篮球”的词向量;投影层的主要任务是将上下文逡逑的词向量进行一个累加;输出层则需要预测当前的中心词为“北邮”。逡逑2)邋Skip-gram邋Model逡逑Skip-gram模型如图2-3所示,其模型原理和CBOW模型非常类似,可以逡逑简单的认为是将CBOW模型的输入与输出进行了倒置。Skip-gram的原理是通逡逑过某个词来预测其上下文的词的概率模型,目标为使得对数似然函数L最大化。逡逑L如式2-2所不,其中w代表当前词语,Context(w)代表当前词语上下文,\/代逡逑表语料中的词集合。逡逑L邋=邋^邋logp(context(w')\w)邋(2邋—邋2)逡逑WEV逡逑8逡逑
【学位授予单位】:北京邮电大学
【学位级别】:硕士
【学位授予年份】:2019
【分类号】:D631.1;TP18;TP391.1
【相似文献】
相关期刊论文 前10条
1 乌卫东;安艳梅;;信息分析的现状与发展趋势研究[J];内蒙古图书馆工作;2006年02期
2 ;2013年软课题与信息分析学术会议征文通知[J];竞争情报;2012年03期
3 梁秋春;;医学生信息分析能力培养探讨[J];情报探索;2013年04期
4 关雷;王春晓;;大学生信息分析素养现状与培育对策[J];高等农业教育;2013年04期
5 白彬;;浅析政治作战中信息分析功能的发挥[J];西安政治学院学报;2013年04期
6 ;沙勇忠教授新著《信息分析》出版[J];图书与情报;2010年02期
7 李佳佳;;基于开放数据和云计算的商业信息分析模式构建[J];图书情报工作网刊;2010年06期
8 王敏;许培扬;代涛;;卫生政策研究领域文献信息分析的初步研究[J];医学信息学杂志;2009年05期
9 范佳佳;高洁;;情报工作的核心定位与信息分析师的培养[J];情报资料工作;2006年03期
10 王胜利;信息分析研究的现状和发展策略[J];情报杂志;2003年11期
相关会议论文 前10条
1 杨旭;;试论工程交易数据信息分析[A];七省市第八届建筑市场与招标投标优秀论文集[C];2007年
2 李思一;;国内科技信息的跟踪与预测——科学决策的基础[A];第一届中国软科学学术年会论文集[C];1996年
3 阮承迈;赵金红;高姗;康琳;王景林;;细菌毒力岛和毒力基因信息分析软件PAI/TGAS设计和实现[A];第九届中国生物毒素学术研讨会论文摘要[C];2009年
4 李苹苹;;浅议信息分析在专卖市场监管中的作用[A];中国烟草学会2014年学术年会入选论文摘要汇编[C];2014年
5 王懿;;数据挖掘技术应用于体育信息分析[A];第八届全国体育科学大会论文摘要汇编(一)[C];2007年
6 陈铁勇;;大数据时代核科技信息工作的思考——从信息分析与研究谈起[A];中国核科学技术进展报告(第三卷)——中国核学会2013年学术年会论文集第10册(核情报分卷、核技术经济与管理现代化分卷)[C];2013年
7 赵俊娟;韩如成;宋卫平;;多功能虚拟声信息分析仪[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
8 王蔚林;李桂玲;;我国纳米材料绿色印刷制版技术专利信息分析和战略研究[A];2013年中华全国专利代理人协会年会暨第四届知识产权论坛论文汇编第四部分[C];2013年
9 关轶茹;张方;;药品价格舆情监测信息分析[A];2013年中国药学会药事管理专业委员会年会暨“医药安全与科学发展”学术论坛论文集(下册)[C];2013年
10 袁钟晓;;不确定系统中的可拓信息分析[A];第三届不确定系统年会论文集[C];2005年
相关重要报纸文章 前10条
1 河南范县农商银行 陈迟;在大数据时代看金融信息分析与共享[N];中华合作时报;2018年
2 本报通讯员 王舒天 何国强;借力大数据 织牢安全网[N];人民铁道;2017年
3 记者 张婷;公司深化停电信息分析到户试点应用[N];国家电网报;2017年
4 记者 赵兴武 通讯员 费文斌 唐荣军;南京研发使用审判信息分析研判系统软件[N];人民法院报;2012年
5 张兴旺;我国农业信息分析工作的意义、问题与方向[N];农民日报;2009年
6 本报记者 钟燕平;完善协同机制提升农业信息分析预警能力[N];农民日报;2009年
7 邓朝群 张正华;我市强化信访信息分析利用[N];内江日报;2015年
8 通讯员 王德宝;红山区公安分局强化信息分析 提升打防控效能[N];赤峰日报;2006年
9 张伟 特约记者 戴思文;重庆军地建立涉军信息分析研判机制[N];中国国防报;2015年
10 本报记者 刘磊;信息分析与利用成立业关键[N];法制生活报;2007年
相关博士学位论文 前5条
1 张勇;高混凝土重力坝建基岩体超前信息分析及优化研究[D];成都理工大学;2010年
2 王钧超;大数据时代产业经济信息分析及在宏观决策中的应用[D];中国地质大学(北京);2016年
3 卢洪涛;面向信息分析与预测的网络搜索关键词集中度和相关度研究[D];武汉大学;2013年
4 程文娟;基于文本挖掘的定向性信息分析研究[D];合肥工业大学;2012年
5 陈瑜;电影悬念的叙事分析[D];上海大学;2009年
相关硕士学位论文 前10条
1 郑文;用于警情信息分析的实体识别系统的研究与实现[D];北京邮电大学;2019年
2 胡文静;面向危机决策的公共危机信息分析[D];兰州大学;2009年
3 鲁恩铭;收益途径价值评估中企业信息分析体系构建与应用[D];云南大学;2016年
4 戴劲;证券信息分析中散户思维的逻辑理性探求[D];华中师范大学;2012年
5 董洁晶;基于产品信息分析的创新设计构思研究[D];江南大学;2005年
6 吴力强;公安情报信息分析技术研究与应用[D];湖南大学;2014年
7 辛丽苹;潮汕语言输入法及语言信息分析的研究[D];汕头大学;2006年
8 王燕飞;面向旅游企业的客户定向性信息分析的研究[D];合肥工业大学;2013年
9 王颖;酪氨酸电氧化的信息分析[D];河北师范大学;2004年
10 邵明;航空信息分析和查询系统的设计与实现[D];同济大学;2008年
本文编号:2668107
本文链接:https://www.wllwen.com/falvlunwen/fanzuizhian/2668107.html