当前位置:主页 > 论文百科 > 论文选题 >

基于语义的毕业论文题目相似性分析

发布时间:2017-08-09 10:32

  本文关键词:基于语义的毕业论文题目相似性分析


  更多相关文章: 语义 毕业论文题目 概率潜在语义分析 相似性分析


【摘要】:在统计计算机学科专业7年毕业论文题目的基础上,从语义的角度对毕业论文题目的相似性进行了分析,为论文题目的查重及归类提供依据.首先,对毕业论文题目进行分词以得到特征词汇,进而计算特征词的权重构成论文题目的向量表示;其次,使用PLSA方法对得到的题目向量进行语义提取;最后,对语义向量进行相似度比较得出论文题目的相似性.实验结果表明,与传统的VSM方法相比,从语义角度对论文题目进行相似性比较更加合理、有效.
【作者单位】: 延边大学工学院计算机科学与技术系;延边大学理学院地理系;
【关键词】语义 毕业论文题目 概率潜在语义分析 相似性分析
【基金】:延边大学科技发展计划项目(延大科合字(2011)第43号)
【分类号】:TP391.1
【正文快照】: 毕业论文是考察学生综合运用所学专业基础知识、独立分析、解决实际问题的一个重要手段,论文题目是学生在大学期间知识与能力的综合体现,因此论文题目的设定十分重要.对毕业论文题目的相似性进行检测,一方面有助于属于同一研究领域的学生相互合作,另一方面对题目的重复率检测

【参考文献】

中国期刊全文数据库 前3条

1 王细薇;樊兴华;赵军;;一种基于特征扩展的中文短文本分类方法[J];计算机应用;2009年03期

2 彭泽映;俞晓明;许洪波;刘春阳;;大规模短文本的不完全聚类[J];中文信息学报;2011年01期

3 路荣;项亮;刘明荣;杨青;;基于隐主题分析和文本聚类的微博客中新闻话题的发现[J];模式识别与人工智能;2012年03期

中国博士学位论文全文数据库 前1条

1 王永恒;海量短语信息挖掘技术的研究与实现[D];国防科学技术大学;2006年

中国硕士学位论文全文数据库 前3条

1 吴薇;大规模短文本的分类过滤方法研究[D];北京邮电大学;2007年

2 姜英杰;基于本体的短文本分类研究[D];东北师范大学;2010年

3 彭俊杰;中文短文本表示及分类的研究与实现[D];河南大学;2012年

【共引文献】

中国期刊全文数据库 前10条

1 张瑛;张娅婷;;动态文本会话抽取技术研究[J];电视技术;2011年11期

2 丁荩;涂浩;;微博感知突发重大新闻事件的研究与分析[J];广西大学学报(自然科学版);2011年S1期

3 王细薇;张凯;;一种改进的基于共现关系的短文本特征扩展算法研究[J];河南城建学院学报;2012年04期

4 王若冰;;基于统计分析的数据挖掘在工程造价管理中的应用[J];硅谷;2012年18期

5 王盛;樊兴华;陈现麟;;利用上下位关系的中文短文本分类[J];计算机应用;2010年03期

6 蔡月红;朱倩;孙萍;程显毅;;基于属性选择的半监督短文本分类算法[J];计算机应用;2010年04期

7 张剑峰;夏云庆;姚建民;;微博文本处理研究综述[J];中文信息学报;2012年04期

8 刘金岭;王新功;周泓;;基于手机短信信息流的热点事件识别[J];计算机应用与软件;2012年10期

9 杨天平;朱征宇;;使用概念描述的中文短文本分类算法[J];计算机应用;2012年12期

10 陈雪;梁永全;赵相彬;;改进的基于本体的Web信息抽取[J];计算机应用与软件;2013年07期

中国博士学位论文全文数据库 前4条

1 黄永文;中文产品评论挖掘关键技术研究[D];重庆大学;2009年

2 刘健;面向信息检索的文本信息组织关键技术研究[D];国防科学技术大学;2009年

3 王乐;短语消息聚类相关技术研究[D];国防科学技术大学;2008年

4 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年

中国硕士学位论文全文数据库 前10条

1 刘欣;手机短信语言使用状况与民众态度调查研究[D];沈阳师范大学;2011年

2 崔争艳;中文短文本分类的相关技术研究[D];河南大学;2011年

3 吕婷婷;统计和规则相结合的新闻网页分类系统的设计与实现[D];电子科技大学;2011年

4 蒋磊;面向产品评论的意见挖掘关键技术研究[D];哈尔滨工业大学;2010年

5 魏震方;网络导航服务中数据传输技术的方法研究[D];解放军信息工程大学;2009年

6 张静;基于微博的网络热点发现模型及平台研究[D];华中科技大学;2010年

7 邓光喜;面向主题的Web文档自动文摘生成方法研究[D];苏州大学;2011年

8 韩平平;基于本体的中文科技论文分类研究[D];东北师范大学;2011年

9 葛小培;专利地图的研究及其在生物医药领域中的应用[D];苏州大学;2010年

10 姜英杰;基于本体的短文本分类研究[D];东北师范大学;2010年

【二级参考文献】

中国期刊全文数据库 前10条

1 蒋溢;丁优;熊安萍;王化晶;;一种基于知网的词汇语义相似度改进计算方法[J];重庆邮电大学学报(自然科学版);2009年04期

2 吕学强,任飞亮,黄志丹,姚天顺;句子相似模型和最相似句子查找算法[J];东北大学学报;2003年06期

3 樊兴华;王鹏;;基于两步策略的中文短文本分类研究[J];大连海事大学学报;2008年03期

4 陈媛媛,彭新光;分类算法的分析与比较[J];电子产品可靠性与环境试验;2004年06期

5 朱礼军,陶兰,刘慧;领域本体中的概念相似度计算[J];华南理工大学学报(自然科学版);2004年S1期

6 王继成,潘金贵,张福炎;Web文本挖掘技术研究[J];计算机研究与发展;2000年05期

7 杨明,孙志挥,吉根林;快速挖掘全局频繁项目集[J];计算机研究与发展;2003年04期

8 王建会,王洪伟,申展,胡运发;一种实用高效的文本分类算法[J];计算机研究与发展;2005年01期

9 苏伟峰,李绍滋,李堂秋;一个基于概念的中文文本分类模型[J];计算机工程与应用;2002年06期

10 湛燕,陈昊,袁方,王熙照;基于中文文本分类的分词方法研究[J];计算机工程与应用;2003年23期

中国博士学位论文全文数据库 前8条

1 倪兴良;问答系统中的短文本聚类研究与应用[D];中国科学技术大学;2011年

2 温磊;基于有向项集图的关联规则挖掘算法研究与应用[D];天津大学;2004年

3 郭秀娟;基于关联规则数据挖掘算法的研究[D];吉林大学;2004年

4 龚才春;短文本语言计算的关键技术研究[D];中国科学院研究生院(计算技术研究所);2008年

5 何慧;WEB文本挖掘中关键问题的研究[D];北京邮电大学;2009年

6 章舜仲;文本分类中词共现关系的研究及其应用[D];南京理工大学;2010年

7 宋万鹏;短文本相似度计算在用户交互式问答系统中的应用[D];中国科学技术大学;2010年

8 李芳;文本挖掘若干关键技术研究[D];北京化工大学;2010年

中国硕士学位论文全文数据库 前3条

1 潘文锋;基于内容的垃圾邮件过滤研究[D];中国科学院研究生院(计算技术研究所);2004年

2 吴薇;大规模短文本的分类过滤方法研究[D];北京邮电大学;2007年

3 孔德冉;基于领域Ontology的Web信息抽取研究[D];东北师范大学;2009年

【相似文献】

中国期刊全文数据库 前10条

1 姚红玉;刘粤钳;;基于PLSA的智能学习支持系统[J];教育信息化;2005年15期

2 段守道;;机械零件的相似原理与成组技术[J];现代制造工程;1982年02期

3 李志先;刘爱萍;;基于PLSA模型的用户兴趣聚类算法研究[J];微计算机信息;2009年27期

4 张玉芳;朱俊;熊忠阳;;改进的概率潜在语义分析下的文本聚类算法[J];计算机应用;2011年03期

5 王奕;;基于概率潜在语义分析的中文文本分类研究[J];甘肃联合大学学报(自然科学版);2011年04期

6 康伟;;毕业(设计)论文题目审核及选题管理系统[J];辽宁科技大学学报;2009年03期

7 张培颖;;基于语义相似度的自动文摘评价方法[J];计算机工程与应用;2009年25期

8 吴金学;;基于概率潜在语义分析的文本聚类研究[J];青岛理工大学学报;2008年02期

9 俞辉;赵玉国;;基于LSA和PLSA的网页聚类算法研究[J];计算机系统应用;2008年04期

10 石晶;戴国忠;;基于PLSA模型的文本分割[J];计算机研究与发展;2007年02期

中国重要会议论文全文数据库 前7条

1 曹丹华;刘斌f:;吴裕斌;;基于DSP的快速钞币面值识别技术[A];大珩先生九十华诞文集暨中国光学学会2004年学术大会论文集[C];2004年

2 邓敏;李志林;陈晓勇;;GIS空间目标的广义Hausdorff距离模型[A];中国测绘学会第八次全国会员代表大会暨2005年综合性学术年会论文集[C];2005年

3 张建军;;中国生物多样性信息管理系统(CBIMS)总体设计及应用展望[A];2004中国科协学术年会第十一分会场论文集[C];2004年

4 蔡军;袁华鹏;陈金海;施伯乐;;一种基于相似性分析的聚类新算法:PDS算法[A];第十八届全国数据库学术会议论文集(研究报告篇)[C];2001年

5 程光耀;孙厚芳;慈建平;;基于PDM框架的CAPP集成系统研究[A];制造业与未来中国——2002年中国机械工程学会年会论文集[C];2002年

6 朱靖波;陈文亮;姚天顺;;面向TDT的主题相似性计算模型[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

7 任文艺;张淳民;;偏振干涉图像特征研究[A];2011西部光子学学术会议论文摘要集[C];2011年

中国重要报纸全文数据库 前1条

1 朱冬梅;企业情报门户系统的内核[N];计算机世界;2004年

中国博士学位论文全文数据库 前7条

1 彭士纯;基于多尺度分析的医学图像配准与融合方法研究[D];华中科技大学;2006年

2 钱剑飞;基于特征符号的程序理解研究[D];浙江大学;2006年

3 李杰;基于内容的图像检索方法研究[D];中国科学技术大学;2008年

4 李荣;生物信息数据挖掘若干关键问题研究与应用[D];复旦大学;2004年

5 马志强;蛋白质功能预测的非同源性计算方法研究[D];吉林大学;2009年

6 张柱金;DNA序列二维可视化研究[D];华中科技大学;2011年

7 丁虹;空间相似性理论与计算模型的研究[D];武汉大学;2004年

中国硕士学位论文全文数据库 前10条

1 林源;英文短文本相似性研究及在图书推荐中的应用[D];北京林业大学;2010年

2 伊怀彬;基于语义的图像多概念标注[D];苏州大学;2009年

3 陈传魁;机械产品相似性度量方法及其软件实现研究[D];合肥工业大学;2008年

4 单夫一;RNA二级结构图形表示法及相似性分析研究[D];湖南大学;2007年

5 张惜珍;DNA序列3D图形表示及进化树算法研究[D];湖南大学;2007年

6 刘芳;基于信息离散度的DNA序列相似性分析研究[D];湖南大学;2009年

7 阿地里江·阿不力米提;智能交通系统传感器技术的研究[D];大连理工大学;2009年

8 杨永强;基于相似性分析的时间序列数据挖掘研究[D];西南交通大学;2007年

9 宁力;搜索引擎中网页查重方法的研究[D];北京化工大学;2007年

10 曾诚;DNA序列分析及特征基因提取方法研究[D];湖南大学;2008年



本文编号:644841

资料下载
论文发表

本文链接:https://www.wllwen.com/wenshubaike/xswd/644841.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f87c4***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com