基于规则的机构名规范化研究
[Abstract]:[objective] to improve the reliability of data in scientific and technological evaluation based on massive data, To overcome the defects of similarity matching or frequency statistics in the standardization of institutional names. [methods] A mechanism name mapping algorithm based on low word surface similarity is proposed. The algorithm uses the strategy of combining rules and statistics to realize the mapping of multiple organization names to one organization entity, thus achieving the purpose of normalizing agency names. [results] the experimental results show that, The average F value of a rules-based algorithm is 55.50. It is higher than the other two technical strategies. [limitations] there are some shortcomings in the recognition of the mechanism names with low word surface similarity. [conclusion] the comprehensive performance of the institutional name criterion is better than the other two technical strategies, but the detection rate still needs to be improved.
【作者单位】: 南京农业大学信息科学技术学院;
【基金】:国家社会科学基金项目“基于社区发现的学术Web主题显著度研究”(项目编号:13CTQ031)的研究成果之一
【分类号】:G312
【参考文献】
相关期刊论文 前1条
1 胡万亭;杨燕;尹红风;贾真;刘利;;一种基于词频统计的组织机构名识别方法[J];计算机应用研究;2013年07期
相关硕士学位论文 前1条
1 吴建伟;面向Twitter信息的机构名消歧技术研究[D];哈尔滨工业大学;2012年
【共引文献】
相关期刊论文 前10条
1 师丽娟;左文革;袁永翠;;基于科学计量的我国农业院校国际科技合作研究——以中国农业大学为例[J];安徽农业科学;2011年21期
2 李国军;朱辉;韦秉兴;张家侠;邱海洪;韦绥概;;从文献计量学角度分析我国对家蚕毒性的研究[J];北方蚕业;2009年01期
3 次仁拉珍;叶鹰;;专利权人h指数研究[J];图书与情报;2009年06期
4 周英博;马景娣;叶鹰;;国际基础科学核心期刊h指数实证研究[J];大学图书馆学报;2009年02期
5 次仁拉珍;乐思诗;叶鹰;;世界百强企业h指数探析[J];大学图书馆学报;2009年02期
6 邱均平;曾倩;;我国图书情报学国际发文的计量分析[J];图书与情报;2013年01期
7 张磊;谢祥;朱佳鑫;;高校社会服务能力评价问题研究[J];东北大学学报(社会科学版);2013年05期
8 林卓玲;辜雪钿;;基于滞后效应的高校科技创新效率研究[J];长春理工大学学报(社会科学版);2015年01期
9 余丽;陆锋;张恒才;;网络文本蕴涵地理信息抽取:研究进展与展望[J];地球信息科学学报;2015年02期
10 孙慧;汤先忻;;医学类期刊h指数与影响因子、总被引频次的相关性研究[J];中国科技期刊研究;2009年03期
相关博士学位论文 前4条
1 谢亚兰;大学排名指标体系及影响研究[D];上海交通大学;2010年
2 钟镇;中国物理学研究绩效与发展特征的国际比较[D];大连理工大学;2011年
3 胡德华;生物医学类开放存取期刊学术质量评价及其评价体系研究[D];中南大学;2009年
4 周春雷;基于h指数的学术授信评价研究[D];武汉大学;2010年
相关硕士学位论文 前10条
1 周英博;国际基础科学领域核心期刊h指数分析研究[D];浙江大学;2008年
2 丁楠;基于CSSCI的文科学者h指数实证研究[D];浙江大学;2008年
3 次仁拉珍;专利权人h指数研究[D];浙江大学;2009年
4 张芳;AH指数的可行性及其应用研究[D];郑州大学;2009年
5 乐思诗;动态专利计量分析及企业竞争力测度研究[D];浙江大学;2010年
6 周志峰;多层面跨数据源h指数实证研究[D];浙江大学;2010年
7 谭双岸;多指标的h型指数研究[D];郑州大学;2012年
8 赵俊桥;大肠杆菌TA系统基因hipBA对生物膜的形成以及DNA释放的影响[D];山东大学;2012年
9 王会杰;评价科学成就的新指标-h指数的研究状况分析[D];河南师范大学;2014年
10 张瑜;基于语义的领域信息抽取系统[D];南京邮电大学;2014年
【二级参考文献】
相关期刊论文 前7条
1 黄德根;李泽中;万如;;基于SVM和CRF的双层模型中文机构名识别[J];大连理工大学学报;2010年05期
2 周俊生;戴新宇;尹存燕;陈家骏;;基于层叠条件随机场模型的中文机构名自动识别[J];电子学报;2006年05期
3 胡文博;都云程;吕学强;施水才;;基于多层条件随机场的中文命名实体识别[J];计算机工程与应用;2009年01期
4 向晓雯,史晓东,曾华琳;一个统计与规则相结合的中文命名实体识别系统[J];计算机应用;2005年10期
5 陈霄;刘慧;陈玉泉;;基于支持向量机方法的中文组织机构名的识别[J];计算机应用研究;2008年02期
6 张小衡,王玲玲;中文机构名称的识别与分析[J];中文信息学报;1997年04期
7 俞鸿魁;张华平;刘群;吕学强;施水才;;基于层叠隐马尔可夫模型的中文命名实体识别[J];通信学报;2006年02期
相关会议论文 前1条
1 雷静;;汉语机构名的构成模式[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
【相似文献】
相关会议论文 前5条
1 金朝;蒋宗礼;;中文机构名的识别讨论[A];2011高等职业教育电子信息类专业学术暨教学研讨会论文集[C];2011年
2 雷静;;汉语机构名的构成模式[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
3 雷静;张舵;冯霞;;基于构成模式的汉语机构名识别[A];第四届全国学生计算语言学研讨会会议论文集[C];2008年
4 计峰;高沫;邱锡鹏;黄萱菁;;中文机构名简称的自动生成研究[A];中国计算机语言学研究前沿进展(2007-2009)[C];2009年
5 吴雪军;朱靖波;王会珍;叶娜;张宇新;;Co-Training的机器学习方法在中文机构名识别中的应用[A];语言计算与基于内容的文本处理——全国第七届计算语言学联合学术会议论文集[C];2003年
相关重要报纸文章 前5条
1 ;《全国文化机构名址录》面世[N];中国文化报;2003年
2 马文;《全国文化机构名址录》出版[N];中国文化报;2001年
3 记者 王俐君 通讯员 欧志红;湖南名址信息库建设强力启动[N];中国邮政报;2003年
4 记者 刘苏;2000多件证书展示证书文化[N];徐州日报;2010年
5 记者 刘朝君;组织机构名址库年内建成[N];中国邮政报;2003年
相关硕士学位论文 前8条
1 万如;中文机构名识别的研究[D];大连理工大学;2008年
2 乌兰敖日格乐;中文军事组织机构名的识别[D];大连理工大学;2010年
3 凌雅娟;新闻文本中的中文机构名识别和机构关系抽取研究[D];华东师范大学;2013年
4 红霞;基于层叠条件随机场的中文机构名识别的研究[D];大连理工大学;2010年
5 陈霄;基于支持向量机的中文组织机构名识别[D];上海交通大学;2007年
6 米日姑·肉孜;维吾尔文机构名识别研究[D];新疆大学;2013年
7 杨德来;SVM和最大熵相结合的中文机构名自动识别[D];大连理工大学;2006年
8 刘彦宏;基于Internet的商业信息抽取[D];中国科学技术大学;2010年
,本文编号:2399343
本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/2399343.html