基于网络分析的开源软件角色地位研究
发布时间:2024-04-22 00:53
关于开源软件社区内开发者角色地位的研究一直是软件工程领域热门的研究课题。当前对于开发者角色地位的分类方案大多基于统计计数,存在片面性和局限性。而网络分析法在该课题的应用得益于网络科学理论的发展,其较之于计数分类法,能够更为全面地分析社区内的开发者生态体系。在实验环节中,为了证明网络分析法在该课题研究中的优势性,本文首先依据开源社区的项目数据,分别使用计数分类法与网络分析法对开发者地位的分类效果进行综合比较,验证了网络分析法在该课题研究上的有效性和实用性。随后,为了对开发者分类问题进行应用方案拓展,本文以网络分析的思想,搭建了项目文件之间的交互网络,提出了一种新式的开发者地位分类指标,并证明其在开发者分类上较之传统方案有着精确度的优势。最后,为了对开发者分类问题得出具有普遍性意义的理论框架,本文将各类方法提取出的特征进行融合,以支持向量机分类算法为基础,建立角色分类器,用以从综合角度对影响开发者地位分类的因素进行分析和比对。同时,根据角色分类器的分析结论,多种分类指标的结合使用能够有效提高开发者分类模型性能。本文的研究内容主要包括:(1)讨论了开源社区数据的预处理和相关特征的提取方法,增...
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
本文编号:3961691
【文章页数】:67 页
【学位级别】:硕士
【部分图文】:
图1-1开源社区内的洋葱模型示意图
图1-1开源社区内的洋葱模型示意图而言,无论从理论或现实角度,两种开发者的特性都有着极大的差别:开源开发者对项目的研发有着卓越的贡献,并且在开源社区的社交网络内具有极当着发言领袖的作用[25]。不同的核心开发者之间组成了稳定的领导团期参与项目开发,变动较少。与之相对应的,....
图2-1邮件数据的本地数据格式
图2-1邮件数据的本地数据格式D1代表发送邮件的成员的ID标识,ID2代表接收邮件的成员的ID标识发送的时刻,Unix代表该时刻的具体时间戳,Project代表该邮件所属。得到了邮件相关的数据之后,我们便能以此为基础,构建各个项目内成网络。邮件社交网络构建的基....
图2-2开发记录的本地数据格式
3foreachrowinoriginaldata4if(userid==eachrow[0])5send_num+=16if(userid==eachrow[1])7receiver_num+=18endfor9output:send_num,....
图2-3文件交互记录的本地数据格式
量统计originaldata,userid:code_lineshrowinoriginaldata(userid==eachrow[0])code_lines+=eachrow[5]r:code_lines来自于开源社区的问题追踪系统(BT,B文件与文件之间....
本文编号:3961691
本文链接:https://www.wllwen.com/kejilunwen/ruanjiangongchenglunwen/3961691.html