面向Web新闻的事件多要素检索方法
本文关键词:面向Web新闻的事件多要素检索方法
更多相关文章: 事件多要素检索 Web新闻 事件检索模型 相关性计算
【摘要】:针对用户获取事件类信息的需求,在分析Web新闻特征、事件多要素检索特点的基础上,研究了面向Web新闻的事件多要素检索方法.首先,提出了面向Web新闻的事件多要素检索模型;然后,使用BNF(BackusNaur form)形式化定义了事件多要素查询项;最后,结合事件的动作要素、Web新闻标题的重要性及事件项与约束项之间的距离,提出了事件查询项与文档相关性的计算方法.设置了16个事件多要素查询项,基于Baidu搜索引擎对P@n指标进行了实验分析,所提方法得到的平均P@10结果为0.87,平均P@20结果为0.83.对16个事件查询主题,通过人工标注语料的方法对F-measure指标进行了实验分析,所提方法得到的平均F-measure为0.74.结果表明,所提方法对事件多要素的检索较为有效.
【作者单位】: 淮海工学院计算机工程学院;上海大学计算机工程与科学学院;
【关键词】: 事件多要素检索 Web新闻 事件检索模型 相关性计算
【基金】:国家自然科学基金(60975033)
【分类号】:TP391.3
【正文快照】: 由于现实中的事件在互联网上都有明显的反映,Web上存在着大量面向事件的新闻报道.借助搜索引擎从互联网上获取事件信息已经是用户的迫切需求.但是,由于互联网上的信息急剧膨胀,通用搜索引擎返回的结果往往量很大且查询不准确.用户在输入某些关键字后,得到的有用信息并不多,对
【参考文献】
中国期刊全文数据库 前6条
1 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
2 刘小明;樊孝忠;刘里;;融合事件信息的复杂问句分析方法[J];华南理工大学学报(自然科学版);2011年07期
3 王利;刘宗田;王燕华;廖涛;;基于内容相似度的网页正文提取[J];计算机工程;2010年06期
4 吴平博,陈群秀,马亮;基于事件框架的事件相关文档的智能检索研究[J];中文信息学报;2003年06期
5 杨尔弘;曾青青;李婷婷;;事件信息结构分析[J];中文信息学报;2012年03期
6 李林;王红;付宇;杨璇;王静;;民航突发事件应急案例语义检索方法研究[J];计算机工程与设计;2011年03期
【共引文献】
中国期刊全文数据库 前10条
1 王伟;赵东岩;赵伟;;中文新闻关键事件的主题句识别[J];北京大学学报(自然科学版);2011年05期
2 孙嘉;裴韬;龚玺;周成虎;;Web时空数据挖掘研究进展[J];地球科学进展;2011年04期
3 翟丹妮;黄卫东;;基于案例的应急决策支持方法研究[J];中国公共安全(学术版);2011年04期
4 仲兆满;刘宗田;周文;付剑锋;;基于事件的文本相似度计算[J];广西师范大学学报(自然科学版);2009年01期
5 夏天;;基于扩展标记树的网页正文抽取[J];广西师范大学学报(自然科学版);2011年01期
6 丁振凡;;基于Tika语义分析的文档标题提取研究[J];长沙大学学报;2012年05期
7 仲兆满;刘宗田;李存华;;事件本体模型及事件类排序[J];北京大学学报(自然科学版);2013年02期
8 赵正文;康耀红;;Web信息检索结构化排序函数与标引词加权技术[J];计算机工程与应用;2007年11期
9 周文;刘宗田;孔庆苹;;基于事件的知识处理研究综述[J];计算机科学;2008年02期
10 付剑锋;刘宗田;付雪峰;周文;仲兆满;;基于依存分析的事件识别[J];计算机科学;2009年11期
中国重要会议论文全文数据库 前3条
1 梁勇;张文;;网络舆情采集系统的设计[A];2011年全国通信安全学术会议论文集[C];2011年
2 吴平博;陈群秀;马亮;;基于时空分析的线索性事件的抽取与集成系统研究[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年
3 钟涛;陈群秀;;基于层式有限状态自动机的灾难事件抽取系统[A];第三届全国信息检索与内容安全学术会议论文集[C];2007年
中国博士学位论文全文数据库 前10条
1 仲兆满;事件本体及其在查询扩展中的应用[D];上海大学;2011年
2 单建芳;面向事件的文本表示研究[D];上海大学;2012年
3 周文;基于概念的若干知识表示模型及相关方法研究[D];上海大学;2007年
4 谭红叶;中文事件抽取关键技术研究[D];哈尔滨工业大学;2008年
5 孟和;无线内容下载平台中事件流处理应用研究[D];天津大学;2009年
6 付剑锋;面向事件的知识处理研究[D];上海大学;2010年
7 张明尧;基于事件链的语篇连贯研究[D];武汉大学;2013年
8 李雁妮;深网数据集成与挖掘关键问题的建模及算法研究[D];西安电子科技大学;2013年
9 陈洁;基于概念融合的网页筛选技术研究[D];北京邮电大学;2013年
10 张春菊;中文文本中事件时空与属性信息解析方法研究[D];南京师范大学;2013年
中国硕士学位论文全文数据库 前10条
1 秦宏宇;网络舆情热点发现相关技术研究[D];哈尔滨工程大学;2010年
2 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
3 李元乾;基于移动搜索用户关联的信息检索研究[D];北京交通大学;2010年
4 李琚彪;质检舆情监控系统中信息检索的研究[D];北京邮电大学;2011年
5 张晓宇;农业网站中垃圾网页过滤方法的研究[D];新疆大学;2011年
6 郭力;Web正文信息抽取与面向层次结构的分类技术研究[D];华南理工大学;2011年
7 张鹏飞;WEB挖掘技术在网络警情监控中的应用研究[D];华北电力大学;2011年
8 丁效;句子级中文事件抽取关键技术研究[D];哈尔滨工业大学;2011年
9 刘敏;嵌入式浏览器网页排版技术研究与实现[D];华中科技大学;2011年
10 林业;基于WEB的汉英双语语料获取研究[D];北京邮电大学;2012年
【二级参考文献】
中国期刊全文数据库 前10条
1 敖成龙,苏英,龚元明;基于相似度的复杂数据对象比较[J];北京理工大学学报;2003年05期
2 范士喜;王晓龙;王轩;张耀允;;面向真实环境的问句分析方法[J];电子学报;2010年05期
3 仲兆满;刘宗田;周文;付剑锋;;基于事件的文本相似度计算[J];广西师范大学学报(自然科学版);2009年01期
4 王琦,唐世渭,杨冬青,王腾蛟;基于DOM的网页主题信息自动提取[J];计算机研究与发展;2004年10期
5 黄都培;;基于本体的法律信息语义检索[J];计算机工程与应用;2008年28期
6 钱猛;刘忠;都业宏;姚莉;;使用本体和SWRL验证作战计划的方法[J];计算机工程与应用;2009年08期
7 刘宗田;黄美丽;周文;仲兆满;付剑锋;单建芳;智慧来;;面向事件的本体研究[J];计算机科学;2009年11期
8 姜吉发;一种事件信息抽取模式获取方法[J];计算机工程;2005年15期
9 黄健斌;姬红兵;孙鹤立;;Web网页中动态数据区域的识别与抽取[J];计算机工程;2007年11期
10 时达明;林鸿飞;杨志豪;;基于网页框架和规则的网页噪音去除方法[J];计算机工程;2007年19期
中国博士学位论文全文数据库 前1条
1 杨尔弘;突发事件信息提取研究[D];北京语言大学;2005年
中国硕士学位论文全文数据库 前1条
1 冯礼;基于事件框架的突发事件信息抽取[D];上海交通大学;2008年
【相似文献】
中国期刊全文数据库 前10条
1 刘友红,迟忠先,张绍武,韩杰;多介质图形数据库管理系统查询机制的设计与实现[J];大连理工大学学报;1992年03期
2 黄焕如;FOXPRO全屏幕编辑和查询的实用程序[J];现代计算机;1995年06期
3 陈伟巍,曹润生;彩色无纸记录调节系统的开发和应用[J];化工自动化及仪表;1999年03期
4 徐达,钟峻玮,傅强;本地网传输资料的计算机管理[J];江苏通信技术;1999年01期
5 张瑜,张翼翔,冷蔚;ToolBook开发工具在多媒体公交线路查询系统中的应用[J];微型电脑应用;1999年06期
6 崔国华,洪帆,付小青,胡伦骏;数据库系统中一种更安全的加密机制[J];华中理工大学学报;2000年07期
7 刘金江,刘永青;商城县高压电抄表计费系统[J];南都学坛;2000年06期
8 宗薇,董占球;聚簇索引在数据库查询中的重要作用[J];微机发展;2000年05期
9 卜胜贤,卢炎生,李鹰,孟爱国;基于Web的网上学生成绩查询系统的设计与实现[J];长沙电力学院学报(自然科学版);2002年03期
10 方建军;基于ObjectARX2000的公差自动查询和标注[J];机械设计与制造;2002年03期
中国重要会议论文全文数据库 前10条
1 袁桂生;钟金;;测绘资料管理系统的研究[A];2007'全国测绘科技信息交流会暨信息网成立30周年庆典论文集[C];2007年
2 殷丽;徐海华;吴海涛;;MySQL查询优化技术——索引[A];第八届工业仪表与自动化学术会议论文集[C];2007年
3 吴久双;;备品备件管理系统[A];黑龙江省通信学会学术年会论文集[C];2005年
4 董秀锋;何雄伟;杨立刚;赵洪秋;;检疫证明实行网络化管理的思路[A];河北省畜牧兽医科技创新论坛论文集[C];2007年
5 曲忠剑;王为睿;隋邦锤;;煤矿多媒体信息综合查询系统设计与应用[A];第十八届全国煤矿自动化学术年会中国煤炭学会自动化专业委员会学术会议论文集[C];2008年
6 陈莹;陈涛;张潜玉;张雪民;任轶;代翠贤;温燕;袁耀宁;陈成;;自动气象站资料查询分析系统[A];天气、气候与可持续发展——河南省气象学会2010年年会论文集[C];2010年
7 王佳蕊;李政禹;马淑身;陆文良;;国际化学品安全卡中文网站的建立与应用[A];第十届全国信息技术化工应用年会论文集[C];2005年
8 刘胜亚;;谈谈病案首页的计算机管理[A];新时期档案工作论文集[C];2005年
9 蔡姝婧;;用Java语言实现的日记本[A];Java技术及应用的进展——第八届中国Java技术及应用交流大会文集[C];2005年
10 顾泉佩;;应用中国知网查询论文审稿人的方法[A];学报编辑论丛(第十五集)[C];2007年
中国重要报纸全文数据库 前1条
1 记者 肖林江;浦发行大连分行 从细微处打造品牌银行[N];金融时报;2006年
中国博士学位论文全文数据库 前3条
1 雷向欣;XML索引和过滤查询若干关键技术研究[D];复旦大学;2005年
2 王晨;结构数据挖掘与处理的若干问题的研究[D];复旦大学;2005年
3 彭绍亮;无线传感器网络中高效传输技术研究[D];国防科学技术大学;2008年
中国硕士学位论文全文数据库 前10条
1 李晶;排舞音乐类型与动作要素的相关性研究[D];山西大学;2012年
2 刘亚斌;动作要素在体育教学中的应用性研究[D];内蒙古师范大学;2013年
3 冯立志;数字多功能电话录音系统研究与实现[D];华北电力大学(河北);2005年
4 魏建华;基于查询的虚拟酒店管理系统开发[D];广东工业大学;2005年
5 祁广宝;线材高速轧机油膜轴承承载状态与仿真测试系统开发[D];浙江大学;2005年
6 蒋红;吉旅信息管理系统[D];吉林大学;2005年
7 刘锐;物流管理系统[D];电子科技大学;2007年
8 周敏;黑龙江农业经济职业学院教学管理系统的设计与实现[D];吉林大学;2008年
9 徐雷洋;基于微博媒体的群体分析研究[D];哈尔滨工业大学;2012年
10 石旺来;面向城市空间信息的移动终端(PDA)关键技术开发与研究[D];华东师范大学;2005年
,本文编号:1020375
本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1020375.html