当前位置:主页 > 管理论文 > 科研管理论文 >

基于层次聚类的科技项目分类与查重研究

发布时间:2020-07-19 12:34
【摘要】: 科教兴国是我国的一项重要基本国策。国家每年都会投入大量的人力、物力、财力等资源用于各类科技项目的研究与开展。科技项目的立项、研究过程直至最终产生的科研成果所带来的科学价值、经济价值以及社会价值都直接影响着科学技术以及社会的发展。随着国家以及各地方政府对科技项目投入的经费逐年增加,科技投入范围的逐步扩大,我国的科学技术生产力得到了快速发展,但是随之而来的还有种种管理上的难题。 对科技项目的正确评估审查是保证国家资源能够得到科学合理配置的重要手段之一。因为不同领域的科技活动分别具有不同的科技特征,所以如果能采用科学合理的科技项目分类模型对科技申报项目进行分类处理,就可以为不同领域项目的财务评审、风险评估等等提供基本的分类依据,而在此基础上所建立的各类科技项目的评审模型也会变得更加有针对性,从而加强了科技项目评审的科学性与准确性。 基于层次聚类的科技项目分类模型在对项目进行聚类处理时,首先通过比较项目申报书的关键词词频统计向量对项目之间的相似度进行计算;然后将所得的相似度分布曲线用最小二乘法对其进行拟合,并求得曲线的拐点作为层次聚类的阈值参数;最后使用层次聚类算法在不同的粒度下逐层聚类,构造成层次树形结构,实现了不同粒度下的项目分类。 在对科技项目进行同类项目查找时,运用广度优先搜索算法对聚类处理所得到的层次树进行搜索,可以极大地提高相似项目查找的速度和效率,也可以高效、准确地查找出高于相似警戒阈值的类似项目,向项目评审者提供预警,防止同类科技项目重复立项,造成国家资源配置上的浪费。
【学位授予单位】:天津财经大学
【学位级别】:硕士
【学位授予年份】:2008
【分类号】:G311
【图文】:

分布曲线,相似度,分布曲线


我们根据曲线的多项式拟合技术提出一种新的阈值获取个数据集合,我们通过两两计算数据对象之间的相似度得拟合技术对其进行拟合得出一条光滑曲线,对其进行趋势度上反映了数据集合的分布在这一位置发生了较大的变化置相对合适的阈值参数。002-2006 年申报的 300 份科技项目项目申报书作为训练样算,以相似度取值作为横轴,相似度值等于某一特定值的相似度分布曲线,如下图所示:

【引证文献】

相关期刊论文 前1条

1 郭鹏伟;黄桥林;肖白;;基于聚类分析理论的空间负荷预测方法[J];黑龙江电力;2011年06期



本文编号:2762429

资料下载
论文发表

本文链接:https://www.wllwen.com/guanlilunwen/keyanlw/2762429.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户620fd***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com