基于组合验证的Web页面抽取算法研究
本文选题:信息抽取 + 组合验证 ; 参考:《江西师范大学学报(自然科学版)》2013年02期
【摘要】:通过研究抽取算法的本质和抽取算法之间的关系,对抽取算法的互补性进行分析,提出了一种多算法组合验证机制,该机制能检测出抽取算法的错误,并通过结合动态阈值调整的方法,提高抽取算法的抽取准确率.
[Abstract]:By studying the nature of the extraction algorithm and the relationship between the extraction algorithm and the complementarity of the extraction algorithm, a multi-algorithm combination verification mechanism is proposed, which can detect the errors of the extraction algorithm. The extraction accuracy of the extraction algorithm is improved by combining the dynamic threshold adjustment method.
【作者单位】: 北京大学软件与微电子学院;中国科学院计算技术研究所;
【分类号】:TP393.092
【相似文献】
相关期刊论文 前10条
1 刘云峰;;一种基于标签路径聚类的文本信息抽取算法[J];计算机应用与软件;2010年11期
2 韩忠明;李文正;莫倩;;有效HTML文本信息抽取方法的研究[J];计算机应用研究;2008年12期
3 邓擘;郑彦宁;樊孝忠;;信息抽取中实体关系模式的可信度评估[J];情报理论与实践;2009年12期
4 王利鑫;耿焕同;孙凯;张茜;;基于自然语言处理的文本泄密自动检测技术[J];计算机工程与设计;2011年08期
5 陆科进,李新颖;基于Ontology的文本信息抽取[J];计算机应用研究;2003年07期
6 李向阳;苗壮;肖江;;无结构文本信息抽取综述[J];军事通信技术;2004年02期
7 贺令亚;柳佳刚;;基于Web的包装器技术的现状与发展[J];电脑开发与应用;2007年06期
8 张春明;;Web挖掘技术研究[J];廊坊师范学院学报(自然科学版);2008年05期
9 张岩;;基于本体的信息抽取技术研究[J];科技信息(学术研究);2008年36期
10 邹荣;;对垂直搜索技术的分析[J];福建电脑;2009年02期
相关会议论文 前10条
1 高建军;陈小宏;;凸集投影重建方法中的阈值集合模型设计研究[A];中国地球物理2010——中国地球物理学会第二十六届年会、中国地震学会第十三次学术大会论文集[C];2010年
2 安代志;张召辉;孙西战;颜培实;;温热环境与奶牛体温调节的昼夜差异[A];第十届全国家畜环境科学讨论会论文集[C];2006年
3 孔平;严广乐;;基于分形维数的二值化算法在车牌识别中的应用[A];第十一届全国非线性振动学术会议暨第八届全国非线性动力学和运动稳定性学术会议论文集[C];2007年
4 李华;程伟;;一种改进的小波模极大值检测与消噪算法[A];2009中国控制与决策会议论文集(3)[C];2009年
5 宋宇;张元平;周海军;;基于小波变换的图像去噪中两个关键问题研究[A];中国电子学会第十六届信息论学术年会论文集[C];2009年
6 钱奇;王琰;杨钢锋;张勤远;姜中宏;;碲酸盐玻璃飞秒激光刻写特性研究[A];中国硅酸盐学会特种玻璃分会第三届全国特种玻璃会议论文集[C];2007年
7 徐海卫;牛朝;周倩;;基于遗传算法的最大类间方差图像分割及实现[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
8 雷超阳;刘军华;杨爱莲;;一种利用人眼视觉特性的加权中值滤波算法[A];全国第19届计算机技术与应用(CACIS)学术会议论文集(上册)[C];2008年
9 冯志威;;一种基于平均队列改进的RED网络拥塞算法[A];2008全国第十三届自动化应用技术学术交流会论文集[C];2008年
10 郑康;;时变OFDM系统中参数化时域信道估计的改进[A];第十三届全国信号处理学术年会(CCSP-2007)论文集[C];2007年
相关重要报纸文章 前10条
1 史小敏;前景广阔的信息抽取技术[N];解放军报;2004年
2 赵 粮、吴丽辉;设定阈值打补丁[N];中国计算机报;2004年
3 小正;仅凭T值阈值不足以评估骨折危险[N];保健时报;2005年
4 彭芳;搜索也专业[N];中国计算机报;2004年
5 黄帝荣;为什么“第一”的事情反被忽视[N];人民日报;2009年
6 ;直肠内温度变化影响肠易激综合征患者内脏感觉阈值[N];中国医药报;2003年
7 本报记者 王翌;8848:优化EC流程[N];计算机世界;2004年
8 孙业要;唾液能查酒后驾车[N];中国质量报;2007年
9 周秋根;几种血压概念在临床的应用[N];中国中医药报;2004年
10 中国经济体制改革研究会首席法律顾问、中央国家机关政府采购中心顾问、北京市辽海律师事务所高级律师 谷辽海;GPA瞅准“大蛋糕”(下)[N];中国财经报;2007年
相关博士学位论文 前10条
1 唐小锋;阈值光电子—光离子符合速度成像及其应用研究[D];中国科学技术大学;2011年
2 刘亚清;开放式环境中的本体演化及其在信息抽取的应用研究[D];大连海事大学;2011年
3 刘娜;文本自动摘要和信息抽取方法及其应用研究[D];大连海事大学;2012年
4 李传席;基于本体的自适应Web信息抽取方法研究[D];中国科学技术大学;2012年
5 陈月玲;同步检测神经元在阈下含噪信号检测中的作用[D];兰州大学;2013年
6 李财莲;图像多尺度几何分析及去噪算法研究[D];国防科学技术大学;2011年
7 杨洁;模糊神经网络的学习收敛性与阈值可去性[D];大连理工大学;2006年
8 张奇;信息抽取中实体关系识别研究[D];中国科学技术大学;2010年
9 胡国平;基于超大规模问答对库和语音界面的非受限领域自动问答系统研究[D];中国科学技术大学;2007年
10 王莉萍;多维复合极值分布理论及其工程应用[D];中国海洋大学;2005年
相关硕士学位论文 前10条
1 金璐钰;基于框架的事件抽取关键技术研究[D];苏州大学;2010年
2 杨柱;基于DIV标签树的网页主题信息抽取方法[D];湖南大学;2010年
3 田红;表格信息抽取引擎的设计与实现[D];西北师范大学;2004年
4 杨文柱;基于领域知识和信息抽取的个性化Web查询系统[D];河北大学;2002年
5 张志强;Web信息抽取技术研究与基于Web service的实现[D];河北大学;2004年
6 陈兰;基于ontology的信息抽取系统的研究与实现[D];电子科技大学;2004年
7 孟令谦;基于ontology的中文信息抽取系统的研究与实现[D];电子科技大学;2004年
8 王花;Web信息抽取技术研究[D];西北农林科技大学;2010年
9 杨秀丽;基于网页内容分析的Web信息抽取技术及其应用[D];河北科技大学;2010年
10 廉成洋;基于树结构的Web信息抽取技术研究[D];南京航空航天大学;2010年
,本文编号:1924415
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1924415.html