一种面向e-Science环境的多领域Web文本特征抽取模型
本文关键词:一种面向e-Science环境的多领域Web文本特征抽取模型
更多相关文章: e-Science环境 特征发现 多领域数据模型 Web文本挖掘
【摘要】:传统领域信息抽取方法多依赖领域词典实现文本特征的发现,既不便于实验复现,也不易于其在多领域环境中移植与推广,严重制约了模型的应用范围.针对上述不足,提出一种适用于e-Science环境的多领域Web文本特征抽取模型(简称e-WTDE).该模型将无词典分词技术引入多领域文本特征发现过程,摆脱了对于领域词典的依赖;借助对领域主题及其具体事件中共性与个性特征的抽取与分类,模型动态追踪领域事件发生及其发展变化,并最终形成多个区域性数据中心;通过对各数据中心中领域知识的协同调度,有力提高了领域信息在全局范围内的利用效率.验证实验中分别对多领域特征抽取、主题特征动态追踪以及领域知识协同调度予以有效性验证,并进一步证明了模型的实用效果.
【作者单位】: 北京科技大学信息工程学院;中央民族大学信息工程学院;
【基金】:国家"十一五"科技支撑计划项目(2006BAK11B03)资助
【分类号】:TP391.1
【正文快照】: 1引言e-Science环境下多领域W eb文本特征抽取模型的建立旨在利用文本挖掘技术对互联网中海量、异构的W eb数据予以领域化分类,有效组织并合理利用W eb数据中的科学信息,建立领域科学数据e-Science服务平台.该平台将有效提高信息抽取模型在多领域环境下的可移植性、特征分类
【参考文献】
中国期刊全文数据库 前2条
1 李晓光;于戈;王大玲;鲍玉斌;;基于信息论的潜在概念获取与文本聚类[J];软件学报;2008年09期
2 黄德才;戚华春;钱能;;基于主题相似度模型的TS-PageRank算法[J];小型微型计算机系统;2007年03期
【共引文献】
中国期刊全文数据库 前10条
1 杜鹃;马莉;;信息论在数据挖掘领域中的应用[J];电脑知识与技术;2010年35期
2 徐超;周一民;沈磊;;一种面向隐含主题的上下文树核[J];电子与信息学报;2010年11期
3 张黎烁;李鑫;徐猛;;基于PageRank的网页主题相关性算法研究[J];光盘技术;2008年12期
4 何明;周军;李树友;;语义相似的PageRank改进算法[J];计算机工程与应用;2009年27期
5 李稚楹;杨武;谢治军;;PageRank算法研究综述[J];计算机科学;2011年S1期
6 丁岳伟;郭辉;;利用蚁群算法对PageRank算法的改进[J];计算机应用;2009年10期
7 黎孟雄;;Web教学资源自动搜索系统的研究与实现[J];青岛科技大学学报(自然科学版);2008年06期
8 吴湖;王永吉;王哲;王秀利;杜栓柱;;两阶段联合聚类协同过滤算法[J];软件学报;2010年05期
9 张翔;周明全;李智杰;董丽丽;;基于PageRank与Bagging的主题爬虫研究[J];计算机工程与设计;2010年14期
10 郭庆宝;贾代平;;融合反馈信息与内容相关度的PageRank改进算法[J];计算机工程与设计;2011年12期
中国博士学位论文全文数据库 前1条
1 刘兴林;中文词汇知识获取算法和语义计算研究及应用[D];华南理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 吕芳芳;基于查询扩展的垂直搜索研究[D];山东科技大学;2010年
2 贾晓倩;基于相似性的P2P网络资源发现策略研究[D];山东师范大学;2011年
3 丛帅;基于关键资源的网站分类研究[D];哈尔滨工业大学;2010年
4 张军波;短信文本的聚类方法研究[D];山西大学;2011年
5 郭庆宝;基于PageRank的搜索引擎优化方法研究[D];山东师范大学;2012年
6 吕克强;Web超链分析及其在搜索引擎中的应用研究[D];中国石油大学;2008年
7 张帆;档案数字化中两项关键技术的研究[D];华中科技大学;2007年
8 黄金晶;Web使用挖掘方法的研究与改进[D];苏州大学;2009年
9 姬彦利;Web结构挖掘算法研究[D];华中师范大学;2009年
10 张磊;基于聚类算法的中文自动文摘方法研究[D];厦门大学;2009年
【二级参考文献】
中国期刊全文数据库 前5条
1 王建勇,单松巍,雷鸣,谢正茂,李晓明;海量Web搜索引擎系统中用户行为的分布特征及其启示[J];中国科学E辑:技术科学;2001年04期
2 宫秀军,史忠植;基于Bayes潜在语义模型的半监督Web挖掘[J];软件学报;2002年08期
3 王晓宇,周傲英;万维网的链接结构分析及其应用综述[J];软件学报;2003年10期
4 宋聚平,王永成,尹中航,滕伟;对网页PageRank算法的改进[J];上海交通大学学报;2003年03期
5 戚华春,黄德才,郑月锋;具有时间反馈的PageRank改进算法[J];浙江工业大学学报;2005年03期
【相似文献】
中国期刊全文数据库 前10条
1 袁磊;张浩;陈静;陆剑峰;;基于领域本体的数据——知识转换模型研究[J];计算机工程与应用;2006年01期
2 王晓东;郭雷;方俊;;本体驱动的文本虚拟样本构造方法研究[J];计算机科学;2008年03期
3 莫富强;王浩;姚宏亮;俞奎;;基于领域知识的贝叶斯网络结构学习算法[J];计算机工程与应用;2008年16期
4 林晓强;常国岑;杨凡;燕海涛;;态势评估专家系统的知识库研究[J];火力与指挥控制;2008年07期
5 穆肃;;基于语义本体的远程教育领域知识特点及关系研究[J];现代远程教育研究;2010年03期
6 王海江,王波,江南;领域知识在遥感图象地类自动识别系统中的应用[J];计算机工程与应用;2001年22期
7 张丙奇;基于领域知识的个性化推荐算法研究[J];计算机工程;2005年21期
8 杨立,左春,王裕国;保险洪灾损失预测模型[J];计算机辅助设计与图形学学报;2005年11期
9 梁正友;;农务管理系统的软件体系结构研究[J];计算机工程与设计;2005年12期
10 刘震;邓苏;罗雪山;黄宏斌;;对等网环境下基于任务链的智能查询支持技术[J];计算机工程;2006年14期
中国重要会议论文全文数据库 前10条
1 裴利芳;;领域知识与自我解释策略间关系的实验研究[A];第八届全国心理学学术会议文摘选集[C];1997年
2 陈宇;王强;;聚类算法在Web文本挖掘中的应用研究[A];2009全国计算机网络与通信学术会议论文集[C];2009年
3 陈战伟;李晋宏;;领域知识在知识发现过程中的使用[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
4 武洪萍;周国祥;;Web文本挖掘研究[A];计算机技术与应用进展·2007——全国第18届计算机技术与应用(CACIS)学术会议论文集[C];2007年
5 张文凌;李晋宏;;应用领域知识的数据预处理方法的研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
6 彭怡;寇纲;;基于领域知识的数据挖掘理论框架研究[A];第三届(2008)中国管理学年会论文集[C];2008年
7 黄安强;张玲玲;陈全;王晓;;用于支撑智能知识发现的领域知识的表示和提取研究[A];第四届(2009)中国管理学年会——管理科学与工程分会场论文集[C];2009年
8 刘朝阳;;领域知识和数据结合的神经网络学习方法和应用[A];复杂巨系统理论·方法·应用——中国系统工程学会第八届学术年会论文集[C];1994年
9 李东林;迟呈英;战学刚;;一个改进的中文文本过滤系统的设计与实现[A];第二届全国信息检索与内容安全学术会议(NCIRCS-2005)论文集[C];2005年
10 刘兵;赵宏宇;李胜利;肖东昀;;装备指挥领域知识概念模型研究[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
中国重要报纸全文数据库 前10条
1 记者 方晓静 黄官国;交流生产技术经验 增进科技领域知识[N];中国食品质量报;2005年
2 傅爱平;数字化应用系统中的领域知识[N];中国社会科学院院报;2006年
3 奚启新;新制定的《国防专利条例》公布[N];人民日报;2004年
4 中国科学院计算技术研究所 黄瑞邋史忠植;加强知识的共享与重用[N];计算机世界;2007年
5 王寅生 张孔生;今年培养技师1.8万人[N];扬州日报;2006年
6 吕曼华;如何认清投资大势[N];经济视点报;2007年
7 邹大斌;行业应用软件开发需夯实基础[N];计算机世界;2007年
8 左春;让技术与业务对话[N];计算机世界;2007年
9 杨扬;挥洒青春为公司经营发展建功立业[N];人民邮电;2007年
10 中国科学技术信息研究所 梁战平;人文社会科学评价研究又创新天地[N];社会科学报;2007年
中国博士学位论文全文数据库 前10条
1 高田;基于领域知识的旅游突发事件状态评估与演化研究[D];北京邮电大学;2011年
2 杨立;基于领域知识的知识发现研究[D];中国科学院研究生院(软件研究所);2005年
3 尹世群;Web文本分类关键技术研究[D];西南大学;2008年
4 张裕鼎;问题解决策略迁移研究[D];华东师范大学;2008年
5 王萍;网络环境下的领域知识挖掘[D];华东师范大学;2010年
6 朱正祥;领域驱动知识发现方法研究[D];大连理工大学;2010年
7 李华;基于本体的应急领域知识表示与复用研究[D];天津大学;2008年
8 安文森;支持向量回归机理论及其工业应用研究[D];中国科学技术大学;2006年
9 朱恒民;领域知识制导的数据挖掘技术及其在中药提取中的应用[D];南京航空航天大学;2006年
10 邓中伟;面向交通服务的多源移动轨迹数据挖掘与多尺度居民活动的知识发现[D];华东师范大学;2012年
中国硕士学位论文全文数据库 前10条
1 苏亚萍;基于本体的领域知识建模研究[D];吉林大学;2007年
2 周循;基于领域知识的面向分类的属性泛化研究[D];合肥工业大学;2008年
3 张诚;基于领域知识的限定域中文问答系统研究[D];上海交通大学;2010年
4 马超;基于隐马尔科夫模型的足球视频典型事件检测[D];吉林大学;2005年
5 贾萌;基于领域知识的中文短信理解模型研究[D];大连理工大学;2006年
6 胡谢斐;基于多重关系领域知识的分类问题研究[D];合肥工业大学;2006年
7 朱志伟;基于有限状态机的体育视频比赛类型识别[D];吉林大学;2006年
8 莫富强;基于领域知识的贝叶斯网络学习研究[D];合肥工业大学;2008年
9 刘爱喜;基于领域知识的数据库模式匹配技术研究[D];哈尔滨工程大学;2009年
10 陈战伟;领域知识在辅助知识发现过程中的初始聚焦问题研究[D];北方工业大学;2008年
,本文编号:1245835
本文链接:https://www.wllwen.com/wenshubaike/mishujinen/1245835.html