当前位置:主页 > 科技论文 > 搜索引擎论文 >

基于LaTex的Web数学公式提取方法研究

发布时间:2017-11-28 14:25

  本文关键词:基于LaTex的Web数学公式提取方法研究


  更多相关文章: 数学公式 LaTex 查准率 查全率 主题爬虫 搜索引擎


【摘要】:数学论坛、Wiki等社会性网站对数学教育的影响日益增长,数学公式广泛存在这些网站中,如何对这些网站中的数学公式进行搜索,对学习和科研非常重要。数学公式提取是索引系统的前提和基础,文中主要研究LaTex格式的数学公式的提取方法,结合BNF表述方式,提出自动分析提取包含LaTex公式特征的方法。依据公式包含的特征,提出提取和过滤LaTex数学公式的方法规则。通过实验发现,该方法的查全率达到75%,查准率达到99%。
【作者单位】: 兰州大学信息科学与工程学院;
【基金】:国家自然科学基金项目(61003139,60903102) 教育部-英特尔信息技术专项科研基金(MOE-INTEL-11-03) 中央高校基本科研业务费专项资金(lzujbky-2013-39,lzujbky-2013-188,lzujbky-2013-187)资助
【分类号】:TP391.3
【正文快照】: 1引言随着计算机的不断普及,出现了互联网的高速发展和Web信息的爆炸式增长。用户如何从海量信息中查找所需要的信息,是搜索引擎解决的关键问题。目前,文本搜索引擎已较为成熟,从本地的文件搜索到互联网上信息的搜索,文本搜索已被用户广泛应用。数学是科学的工具,数学信息广泛

【参考文献】

中国期刊全文数据库 前4条

1 赵飞;周涛;张良;马鸣卉;刘金虎;余飞;查一龙;李睿琪;;维基百科研究综述[J];电子科技大学学报;2010年03期

2 崔林卫;苏伟;郭卫;李廉;;基于Nutch的Web数学公式提取[J];广西师范大学学报(自然科学版);2011年01期

3 聂俊;陈天莹;符红光;;基于Latex的互联网数学公式搜索引擎[J];计算机应用;2010年S2期

4 郑冬冬,赵朋朋,崔志明;Deep Web爬虫研究与设计[J];清华大学学报(自然科学版);2005年S1期

【共引文献】

中国期刊全文数据库 前10条

1 张丽敏;;垂直搜索引擎的主题爬虫策略[J];电脑知识与技术;2010年15期

2 孙立伟;何国辉;吴礼发;;网络爬虫技术的研究[J];电脑知识与技术;2010年15期

3 韩凌;丁其祥;;搜索引擎技术与高校图书馆建设[J];硅谷;2011年23期

4 杨思洛;邱均平;;基于中英维基百科的网络引文分布分析[J];国家图书馆学刊;2012年06期

5 陈方;谭爱平;成亚玲;文益民;;主题爬虫技术研究综述[J];湖南工业职业技术学院学报;2008年05期

6 张海粟;马大明;邓智龙;;基于维基百科的语义知识库及其构建方法研究[J];计算机应用研究;2011年08期

7 黄国涛;关彪;;一种电子服务系统的体系结构设计及其关键技术研究[J];中国制造业信息化;2012年01期

8 荣光;张化祥;;一种Deep Web爬虫的设计与实现[J];计算机与现代化;2009年03期

9 孟敬;刘寿强;;基于Deep Web Search技术的主题式爬虫模块研究与设计[J];科技导报;2011年21期

10 孙彬;王东;李娟;;基于XQuery的Deep Web搜索系统的设计与实现[J];科学技术与工程;2007年16期

中国重要会议论文全文数据库 前1条

1 卓小利;赵欣如;肖雯;方瑾;;基于Wiki技术的动物数字博物馆互动栏目的开发及应用[A];创意科技助力数字博物馆[C];2011年

中国博士学位论文全文数据库 前9条

1 田建伟;面向领域的高质量Deep Web数据集成技术研究[D];武汉大学;2010年

2 吴春明;Deep Web数据集成关键技术及其在农业领域的应用[D];西南大学;2011年

3 黄健斌;基于条件概率图模型的Deep Web数据抽取与集成研究[D];西安电子科技大学;2007年

4 张莹;基于语义的分布式服务与资源一体化发现方法研究[D];北京交通大学;2009年

5 张建武;面向Web应用的安全评测技术研究[D];北京邮电大学;2012年

6 田伟;模型驱动的web应用SQL注入安全漏洞渗透测试研究[D];南开大学;2012年

7 周学春;社会化媒介的价值、机制和治理策略研究[D];武汉大学;2013年

8 肖奎;维基百科大数据的知识挖掘与管理方法研究[D];武汉大学;2013年

9 王明军;基于Web的空间数据爬取与度量研究[D];武汉大学;2013年

中国硕士学位论文全文数据库 前10条

1 刘富江;网络数据源模式识别方法及策略研究[D];哈尔滨工程大学;2010年

2 马鸣卉;维基百科的网络结构及可信分析[D];电子科技大学;2010年

3 朱洪涛;垂直门户网站产品搜索系统的设计与实现[D];北京邮电大学;2010年

4 方鹏程;用户贡献内容质量评价研究[D];北京邮电大学;2011年

5 李蕊;基于网络爬虫技术的多源下载系统的设计与实现[D];北京邮电大学;2011年

6 李秀兰;基于结果模式的Deep Web语义标注研究[D];兰州理工大学;2011年

7 张智;基于本体的Deep Web数据源的分类研究[D];南京信息工程大学;2011年

8 赵思佳;基于规则引擎的个性化网页爬虫研究[D];中南大学;2010年

9 李欣荣;百度百科与谷歌开源社区比较研究[D];华南理工大学;2011年

10 朱桃;大众生产系统发展的动力机制研究[D];华南理工大学;2011年

【二级参考文献】

中国期刊全文数据库 前10条

1 白崇远;;《维基百科》的特性及影响[J];辞书研究;2009年02期

2 李楠楠;周涛;张宁;;人类动力学基本概念与实证分析[J];复杂系统与复杂性科学;2008年02期

3 翁晓霞,张骏,江源;网上教学中有关数学表达式输入问题解决途径的探讨[J];计算机工程;1999年09期

4 马玉春,宋瀚涛;Web中文文本分词技术研究[J];计算机应用;2004年04期

5 梁欣;;网络教学环境下数学公式解决方案比较[J];中国教育信息化;2007年14期

6 王小梅;;从传播学视角看Wiki的教育应用[J];软件导刊(教育技术);2008年09期

7 于嘉;网络时代的百科全书——维基百科[J];图书馆论坛;2005年04期

8 尹开国;;维基百科社群发展策略研究[J];图书情报知识;2007年03期

9 吴金闪,狄增如;从统计物理学看复杂网络研究[J];物理学进展;2004年01期

10 周涛,柏文洁,汪秉宏,刘之景,严钢;复杂网络研究概述[J];物理;2005年01期

中国硕士学位论文全文数据库 前1条

1 景珂;网络数学搜索中的数学查询语言与索引的研究[D];兰州大学;2009年

【相似文献】

中国期刊全文数据库 前10条

1 亮;;解决行距不等问题[J];电脑迷;2006年04期

2 卓佳;陈亚楠;;简单数学公式解析器的JAVA实现[J];华南金融电脑;2008年01期

3 潘大胜;;MathML在网络教学中的应用研究[J];赤峰学院学报(自然科学版);2008年09期

4 郝保水;;数学公式检索与匹配技术研究[J];大众科技;2011年05期

5 王磊;;教学互动系统的设计与实现[J];武汉船舶职业技术学院学报;2007年01期

6 李绪军;用WORD编辑数学公式的技巧[J];师范教育;2004年05期

7 赵红军;;用WPS2000打印歌曲[J];军营文化天地;2002年03期

8 邹洁;再谈用Office工具制作数学公式[J];电脑学习;2005年05期

9 黄啸波;华泽;;MathML技术及在数学公式自动评分中的应用[J];教育信息化;2005年15期

10 姜力;;基于MathML的WEB数学公式表示[J];齐齐哈尔大学学报;2006年06期

中国重要会议论文全文数据库 前10条

1 蔡川;苏伟;李冠宇;赵燕娟;李廉;;MathML编辑及显示技术研究[A];2006年全国理论计算机科学学术年会论文集[C];2006年

2 卢达;浦炜;谢铭培;;一种实时手写数学公式识别系统[A];2005全国自动化新技术学术交流会论文集(三)[C];2005年

3 肖敏;黄磊;刘迎建;;数学公式识别系统[A];第八届全国汉字识别学术会议论文集[C];2002年

4 王庆林;周东华;刘文;;Croos下垂问题的数学模型及验证[A];1996中国控制与决策学术年会论文集[C];1996年

5 刘世钊;;创新虚拟造型——“数学编织”和“数学根雕”[A];中国计算机图形学进展2008--第七届中国计算机图形学大会论文集[C];2008年

6 王学成;张长海;齐明;;以数组为核心的高级语言程序设计教学方法[A];2005全国计算机程序设计类课程教学研讨会论文集[C];2005年

7 吴川灵;;微机排版系统在学报工作中的应用[A];“新学科与编辑学”学术研讨会论文集[C];1989年

8 刘铁英;叶慧玲;;创建Word自定义样式及自定义工具栏[A];学报编辑论丛(第十四集)[C];2006年

9 缪纶;叶茂;;基于Java的Web统计图表引擎的设计与实现[A];水力学与水利信息学进展 2009[C];2009年

10 胡文忠;张芦;;微带器件CAD软件研究[A];1999年全国微波毫米波会议论文集(上册)[C];1999年

中国重要报纸全文数据库 前10条

1 张清;数学公式输入不求人[N];中国电脑教育报;2002年

2 杨振中;汉王发布手写公式[N];电子资讯时报;2006年

3 山东 吕立霞;一步一步学数学公式的输入[N];电脑报;2005年

4 朱建中;在《几何画板》中使用数学公式或符号[N];中国电脑教育报;2003年

5 刘同军;在《几何画板》中编辑数学公式[N];中国电脑教育报;2003年

6 张亚君;如何实现公式颜色的更改[N];中国电脑教育报;2007年

7 本报记者  陈丹;谁能读懂我的心[N];科技日报;2007年

8 说不得大师;WPS Office一步一步排试卷[N];电脑报;2001年

9 ;在线问答[N];中国电脑教育报;2002年

10 许中银;编辑数学试卷的 小技巧[N];中国电脑教育报;2004年

中国博士学位论文全文数据库 前6条

1 苏伟;基于Web的数学公式输入及可访问性关键问题研究[D];兰州大学;2010年

2 杨巨峰;联机手写化学公式处理关键问题研究[D];南开大学;2009年

3 张志伟;数学表达式数字化处理中关键技术的研究[D];中国科学技术大学;2007年

4 范志广;超高频射频识别(RFID)中的若干问题研究[D];浙江大学;2007年

5 李季平;基于数字图像处理的叶片三维大位移测量研究[D];南京航空航天大学;2009年

6 田学东;光学公式识别技术研究[D];河北大学;2007年

中国硕士学位论文全文数据库 前10条

1 徐旭明;在线手写数学公式识别的研究[D];淮北师范大学;2010年

2 吴丽红;印刷体数学公式特殊结构的分析与重构[D];河北大学;2009年

3 喻志强;印刷体数学公式识别的研究与实现[D];沈阳工业大学;2012年

4 郭志峰;中文扫描印刷体文档中数学公式的特征提取及定位[D];广西师范大学;2010年

5 崔键;印刷体数学公式中矩阵结构分析方法的研究[D];河北大学;2009年

6 崔林卫;Web数学公式提取方法的研究[D];兰州大学;2012年

7 刘志伟;数学搜索引擎研究[D];兰州大学;2011年

8 高歌;基于向量线段的数学公式中特殊字符的识别[D];复旦大学;2011年

9 吴明;WEB上数学公式表达技术研究[D];南京师范大学;2005年

10 唐亚伟;公式相似度算法及其在论文查重中的应用研究[D];渤海大学;2013年



本文编号:1234275

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/sousuoyinqinglunwen/1234275.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户07ddf***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com