当前位置:主页 > 科技论文 > 软件论文 >

知识图谱中实体相似度计算研究

发布时间:2018-06-01 18:52

  本文选题:实体相似度 + 监督学习 ; 参考:《中文信息学报》2017年01期


【摘要】:实体相似度的计算有诸多应用,例如,电商平台的相似商品推荐,医疗疗效分析中的相似病人组等。在知识图谱的实体相似度计算中,给出了每个实体的属性值,并对部分实体进行相似度的标注,要求能得到其他实体之间的相似度。该文把该问题归结为监督学习问题,提出一种通用的实体相似度计算方法,通过清洗噪声数据,对数值、列表以及文本等不同数据类型进行预处理,使用SVM,Logistic回归等分类模型、Random Forest等集成学习模型以及排序学习模型进行建模,得到了较好的结果。
[Abstract]:There are many applications in the calculation of entity similarity, such as the similar commodity recommendation of e-commerce platform, the similar patient group in medical efficacy analysis and so on. In the computation of entity similarity of knowledge map, the attribute value of each entity is given, and some entities are labeled with similarity, which requires that the similarity between other entities can be obtained. In this paper, the problem is reduced to a supervised learning problem, and a general entity similarity calculation method is proposed, which preprocesses different data types, such as numerical value, list and text, by cleaning noise data. The integrated learning model such as Random Forest and the ranking learning model are used to model the model, and good results are obtained.
【作者单位】: 华东理工大学计算机科学与工程系;
【基金】:基金项目:心血管疾病与肿瘤疾病中西医临床大数据处理分析与应用研究(2015AA020107)
【分类号】:TP391

【参考文献】

相关期刊论文 前5条

1 薛咏;冯博琴;武艳芳;;ABox推理计算实体相似度[J];西安交通大学学报;2015年09期

2 刘杰;;一种基于自动特征权值的实体相似度计算方法[J];重庆科技学院学报(自然科学版);2014年03期

3 华秀丽;朱巧明;李培峰;;语义分析与词频统计相结合的中文文本相似度量方法研究[J];计算机应用研究;2012年03期

4 李荣;杨冬;刘磊;;基于本体的概念相似度计算方法研究[J];计算机研究与发展;2011年S3期

5 黄宏斌;刘志忠;张维明;邓苏;马丽丽;;基于层次本体模型(HOM)的语义相似度计算方法[J];系统工程与电子技术;2009年07期

【共引文献】

相关期刊论文 前10条

1 张庆梅;;针对舆情数据的去重算法[J];计算机系统应用;2017年05期

2 吴正;李少波;杨观赐;;基于向量空间的专利类比挖掘算法[J];科学技术与工程;2017年11期

3 李阳;高大启;;知识图谱中实体相似度计算研究[J];中文信息学报;2017年01期

4 郑玄;蒋锴;钱夔;徐俊瑜;;军事领域中概念抽取及其应用[J];指挥信息系统与技术;2016年04期

5 郑翠仙;孙文强;邓创兴;蒋廷耀;;基于IKAnalyzer及VSM的人大代表议案建议相似度计算[J];信息通信;2016年08期

6 李凯;李万龙;郑山红;张亚凤;;改进的多策略本体映射方法[J];吉林大学学报(信息科学版);2016年04期

7 臧芳;;本体概念间语义距离计算方法探索[J];计算机与网络;2016年10期

8 胡维华;鲍乾;李柯;;结合汉明距离及语义的文本相似度量方法研究[J];杭州电子科技大学学报(自然科学版);2016年03期

9 何升;邓伟林;肖体斌;;MOOC中基于二分图推荐的同伴互评系统优化[J];计算机应用研究;2016年05期

10 黄贤英;刘英涛;饶勤菲;;一种基于公共词块的英文短文本相似度算法[J];重庆理工大学学报(自然科学);2015年08期

【二级参考文献】

相关期刊论文 前10条

1 孙明;陆春生;徐秀星;李庆忠;彭朝晖;;一种基于SVM和AdaBoost的Web实体信息抽取方法[J];计算机应用与软件;2013年04期

2 周胜臣;瞿文婷;石英子;施询之;孙韵辰;;中文微博情感分析研究综述[J];计算机应用与软件;2013年03期

3 熊芳;黄宏斌;黄玉成;冯嵩;胡建中;;一种基于语义相似度的信息资源语义聚类算法[J];计算机工程与科学;2012年11期

4 董登辉;肖刚;张元鸣;陆佳炜;徐俊;;基于多粒度服务库的SOA参考模型及其应用[J];计算机应用与软件;2012年10期

5 赵海霞;李道申;刘勇;赵嘉诚;;一种Deep Web查询结果的实体抽取方法[J];计算机工程与应用;2012年36期

6 崔晓军;肖红宇;丁立新;;基于距离的自适应Web数据库记录匹配方法[J];武汉大学学报(理学版);2012年01期

7 齐玉东;闫晓斌;谢晓方;;基于LISA理论的概念模型相似度计算[J];计算机工程与应用;2012年03期

8 姜孟晋;周雅倩;黄萱菁;;基于同义实体扩展的冗余信息去重[J];中文信息学报;2012年01期

9 薛咏;冯博琴;刘卫涛;;扩展主题图本体融合策略与算法[J];西安交通大学学报;2011年10期

10 鲁慧民;冯博琴;李旭;;面向多源知识融合的扩展主题图相似性算法[J];西安交通大学学报;2010年02期

【相似文献】

相关期刊论文 前10条

1 王钧;赵曰利;;浙大中药指纹图谱相似度计算软件在烟用香精香料色谱分析中的引入应用[J];现代仪器;2007年03期

2 单建芳;刘宗田;周文;;事件相似度计算[J];小型微型计算机系统;2010年04期

3 刘文剑;郭宁;金天国;;制造资源本体的相似度计算模型[J];计算机集成制造系统;2010年11期

4 邸书灵;刘晓飞;李欢;;基于分词的语句相似度计算的改进[J];石家庄铁道大学学报(自然科学版);2011年04期

5 秦学勇;张润梅;;两级相似度计算在主观题机器阅卷中的应用[J];计算机工程;2012年11期

6 田卫东;强继朋;;基于问句类型的问句相似度计算[J];计算机应用研究;2014年04期

7 周凯波,冯珊,李锋;基于案例属性特征的相似度计算模型研究[J];武汉理工大学学报(信息与管理工程版);2003年01期

8 易丽萍,竹勇 ,雷小春;知网在词语相似度计算方面的应用[J];信息技术与信息化;2005年01期

9 廉站俊;吕学强;张玉杰;施水才;;基于句子相似度计算的信息抽取[J];现代图书情报技术;2007年06期

10 李伟;;中文语句相似度计算的方法初探[J];兰州工业高等专科学校学报;2009年04期

相关会议论文 前10条

1 刘磊;张桂平;蔡东风;季铎;;基于语义预测的双语术语相似度计算[A];第四届全国信息检索与内容安全学术会议论文集(上)[C];2008年

2 郭丽;蔡东风;季铎;白宇;;统计与语义相融合的词语相似度计算[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年

3 吴志雄;;不精确数据的相似度计算[A];逻辑学及其应用研究——第四届全国逻辑系统、智能科学与信息科学学术会议论文集[C];2008年

4 王凯;李绍稳;张友华;刘超;;缺值背景中的粗糙形式概念相似度计算理论与方法[A];中国农业工程学会电气信息与自动化专业委员会、中国电机工程学会农村电气化分会科技与教育专委会2010年学术年会论文摘要[C];2010年

5 陈立;宋自林;郑世明;张英;;基于本体的概念相似度计算研究[A];江苏省系统工程学会第十一届学术年会论文集[C];2009年

6 车万翔;刘挺;秦兵;李生;;面向双语句对检索的汉语句子相似度计算[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年

7 郭文宏;范学峰;;基于语义词典和本体知识的概念相似度计算[A];2008'中国信息技术与应用学术论坛论文集(二)[C];2008年

8 宋彦;张桂平;蔡东风;;基于N-gram的句子相似度计算技术[A];内容计算的研究与应用前沿——第九届全国计算语言学学术会议论文集[C];2007年

9 关毅;王晓龙;王强;;论系统相似的度量[A];全国第八届计算语言学联合学术会议(JSCL-2005)论文集[C];2005年

10 林民;宋柔;;基于结构描述的汉字字形相似度计算[A];第三届学生计算语言学研讨会论文集[C];2006年

相关重要报纸文章 前1条

1 海量智能计算技术研究中心 霍刚;新兴技术为互联网加速[N];计算机世界;2007年

相关博士学位论文 前4条

1 冯晓文;基于GPU的相似度计算关键技术研究[D];华中科技大学;2014年

2 王秀红;文本相似度计算核函数的构造及其在分布式信息检索中的应用研究[D];江苏大学;2012年

3 刘磊;概念内涵属性计算研究[D];上海交通大学;2011年

4 任磊;推荐系统关键技术研究[D];华东师范大学;2012年

相关硕士学位论文 前10条

1 梁韬;中文微博新词与热点话题发现技术研究[D];湖南工业大学;2015年

2 汪建成;汉越双语新闻话题分析方法研究[D];昆明理工大学;2015年

3 唐海燕;基于全文的教育资源检索模型研究[D];四川师范大学;2015年

4 舒佳根;中文实体链接研究[D];苏州大学;2015年

5 孔行;基于主题推荐的辅助写作系统[D];哈尔滨工业大学;2015年

6 孙润志;基于语义理解的文本相似度计算研究与实现[D];中国科学院研究生院(沈阳计算技术研究所);2015年

7 刘敏;基于词向量的句子相似度计算及其在基于实例的机器翻译中的应用[D];北京理工大学;2015年

8 康毅;面向客服的自动问答系统关键技术研究[D];东北大学;2014年

9 吴宇浩;南海档案数字化半自动校勘中的底本推荐探讨[D];南京大学;2015年

10 吐尔逊阿依·阿不来提;小学维吾尔语文教材中的单句相似度研究[D];新疆师范大学;2015年



本文编号:1965259

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/1965259.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户f17aa***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com