股票网络论坛的意见领袖识别与分析方法研究
发布时间:2021-10-28 17:04
互联网自诞生以来,经历了几十年高速的发展,人们从信息贫乏的时代一跃进入信息爆炸的时代。BBS(电子公告板)因其简单易用、发表和接受信息迅速,成为公众交流思想、获取信息重要的平台。改革开放30多年来,中国经济腾飞,民众的物质财富有了一定的积累,公众投资理财的热情日趋高涨,股票投资因入门简单且资金门槛低,有着非常广大的投资者群体。在众多股票投资者中,有部分投资者因其对市场研究较深,在BBS中进行阐述的观点能够被其他投资者认同并成为效仿的对象,这些人就是论坛中的意见领袖。从分析意见领袖的内在特征开始,在研究了东方财富网股吧论坛的文本结构和数据抓取方法的基础上,设计并实现了面向东方财富网股吧的数据采集与分析系统,主要研究了基于聚类分析的意见领袖识别方法,以及意见领袖在不同市况下的表现。主要内容有:(1)针对东方财富网股吧中各股票的海量评论,通过研究数据抓取技术,结合股吧帖子地址变化规律及页面文字结构特征,设计了网络论坛数据的自动抓取与数据抽取系统。系统可以准确抓取股吧论坛中的各类帖子内容数据。(2)提出一种基于两步聚类的股吧论坛的意见领袖筛选方法。方法从意见领袖的共有特征出发,统计数据中各时间...
【文章来源】:复旦大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【图文】:
图3-6系统架构图??系统主要包括股票代码表采集模块、股吧数据采集模块、数据预处理模块W??
根据上述特点,实验设计了相应的代码采集模块,对软件中存储股票日线数??据的文件夹进行遍历,提取了基础的股票代妈,并存入XML文件中保存。??基础股票代码采集原理如图4-4所不:??M??□浅数拋徐?胃??迎化信软仲??m??图4-4股票代码表采集原理??1??采集的实现伪代码如下:??string?installpath=初始化通达信软件安装位置:??string?stkListPath?=定位代码文件夹地址(installpath)??foreach?(File?f?in?stkListPath)??{??string市场代码=get?f文件名前两位??string股票代码=get?f文件名后六位?'??写入XML?(市场代码,股票代码)??}??代码采集前,先确认股票软件的安装位置installpath,位置确认后,根据该软??件文件夹的设置原则定位其代码文件夹的地址St化istPath,最后,针对该文件??夹内的毎个文件
与意见领袖出现数量关系最为密切的指标是当期的大盘走势。当??大盘上涨时,同时段内涨幅越大,论坛中所涌现出的意见领袖越多。大盘下跌时,??同时段内跌幅度越大,论坛中所涌现出的意见领袖越少。其特征情况如图5-5所??/J、-?0??时间巧?-大涅巧况龄觀0根-热人.数瞄橋接佔子辟ST棺如人數ST檢埃M子駭成巧t?成女??20090729-20090901?j ̄p证:嚴 ̄^朵—?巧—广??巧巧H巧巧?4240巧刀?4巧89松??20100415-20100521?-12.4?840?1S9901?1101?238U2?2如%27^?巧699亿??200912巧-2CU0U如?|叫?妨?站?21338^?U4§?2巧2巧巧M29乃巧21列这??2的(U1别-撕1012巧?-2.?71?^—■巧扉T?2如9巧?9巧?224161?922巧3;打拍622亿??20100823-20100930?0.51?'?807?246392?1153?2414化孤0426乃如扣7£??20120927-20121109?广扔广…| ̄楓.?213069?341?獅IS??2日蛾研?19別2亿??如1212报-洗!號。4?P:灯- ̄|— ̄巧誦嚴?巧霜]?n日592。诫。61乃2別化亿??20090601-20090V07?
【参考文献】:
期刊论文
[1]基于时间变化图的网络论坛意见领袖识别算法[J]. 徐会杰,蔡皖东,王剑平,陈桂茸. 计算机科学. 2012(09)
[2]基于影响力形成的论坛意见领袖识别[J]. 何韬,胡勇,吴越. 信息安全与通信保密. 2012(06)
[3]基于局部中心度的在线论坛意见领袖发现算法[J]. 俞淮,郑倩冰,毛羽刚,朱培栋. 计算机技术与发展. 2012(04)
[4]基于话题的BBS论坛的SNA分析[J]. 杨勇,陈巍,李娟,胡勇,刘嘉勇. 四川大学学报(自然科学版). 2011(06)
[5]新型分布式Web Spider的设计[J]. 何绍荣,鲜乾坤. 计算机工程与应用. 2011(16)
[6]基于聚类分析的网络论坛意见领袖发现方法[J]. 王珏,曾剑平,周葆华,吴承荣. 计算机工程. 2011(05)
[7]网络社区中的意见领袖特征分析[J]. 肖宇,许炜,夏霖. 计算机工程与科学. 2011(01)
[8]聚类算法研究[J]. 孙吉贵,刘杰,赵连宇. 软件学报. 2008(01)
[9]BBS群体特征的社会网络分析[J]. 彭小川,毛晓丹. 青年研究. 2004(04)
[10]基于SNA的网络舆论意见领袖识别研究[J]. 丁雪峰,刘嘉勇,吴越,胡朝浪,崔鑫. 高技术通讯. 2011 (02)
硕士论文
[1]面向武器贸易关系的社会网络分析技术研究[D]. 俞淮.国防科学技术大学 2011
[2]BBS热点话题发现与监控系统[D]. 兰凯梅.北京交通大学 2011
[3]主题网络爬虫的研究和实现[D]. 林捷.武汉理工大学 2011
[4]Web数据集成中包装器自适应方法研究[D]. 罗伟.山东大学 2011
[5]面向金融领域BBS的话题发现和热度评价[D]. 王岩.哈尔滨工业大学 2010
[6]BBS中的意见领袖分析[D]. 李会颖.河北大学 2009
[7]Web数据抽取技术研究[D]. 陈雪杰.哈尔滨工程大学 2009
本文编号:3463079
【文章来源】:复旦大学上海市 211工程院校 985工程院校 教育部直属院校
【文章页数】:65 页
【学位级别】:硕士
【图文】:
图3-6系统架构图??系统主要包括股票代码表采集模块、股吧数据采集模块、数据预处理模块W??
根据上述特点,实验设计了相应的代码采集模块,对软件中存储股票日线数??据的文件夹进行遍历,提取了基础的股票代妈,并存入XML文件中保存。??基础股票代码采集原理如图4-4所不:??M??□浅数拋徐?胃??迎化信软仲??m??图4-4股票代码表采集原理??1??采集的实现伪代码如下:??string?installpath=初始化通达信软件安装位置:??string?stkListPath?=定位代码文件夹地址(installpath)??foreach?(File?f?in?stkListPath)??{??string市场代码=get?f文件名前两位??string股票代码=get?f文件名后六位?'??写入XML?(市场代码,股票代码)??}??代码采集前,先确认股票软件的安装位置installpath,位置确认后,根据该软??件文件夹的设置原则定位其代码文件夹的地址St化istPath,最后,针对该文件??夹内的毎个文件
与意见领袖出现数量关系最为密切的指标是当期的大盘走势。当??大盘上涨时,同时段内涨幅越大,论坛中所涌现出的意见领袖越多。大盘下跌时,??同时段内跌幅度越大,论坛中所涌现出的意见领袖越少。其特征情况如图5-5所??/J、-?0??时间巧?-大涅巧况龄觀0根-热人.数瞄橋接佔子辟ST棺如人數ST檢埃M子駭成巧t?成女??20090729-20090901?j ̄p证:嚴 ̄^朵—?巧—广??巧巧H巧巧?4240巧刀?4巧89松??20100415-20100521?-12.4?840?1S9901?1101?238U2?2如%27^?巧699亿??200912巧-2CU0U如?|叫?妨?站?21338^?U4§?2巧2巧巧M29乃巧21列这??2的(U1别-撕1012巧?-2.?71?^—■巧扉T?2如9巧?9巧?224161?922巧3;打拍622亿??20100823-20100930?0.51?'?807?246392?1153?2414化孤0426乃如扣7£??20120927-20121109?广扔广…| ̄楓.?213069?341?獅IS??2日蛾研?19別2亿??如1212报-洗!號。4?P:灯- ̄|— ̄巧誦嚴?巧霜]?n日592。诫。61乃2別化亿??20090601-20090V07?
【参考文献】:
期刊论文
[1]基于时间变化图的网络论坛意见领袖识别算法[J]. 徐会杰,蔡皖东,王剑平,陈桂茸. 计算机科学. 2012(09)
[2]基于影响力形成的论坛意见领袖识别[J]. 何韬,胡勇,吴越. 信息安全与通信保密. 2012(06)
[3]基于局部中心度的在线论坛意见领袖发现算法[J]. 俞淮,郑倩冰,毛羽刚,朱培栋. 计算机技术与发展. 2012(04)
[4]基于话题的BBS论坛的SNA分析[J]. 杨勇,陈巍,李娟,胡勇,刘嘉勇. 四川大学学报(自然科学版). 2011(06)
[5]新型分布式Web Spider的设计[J]. 何绍荣,鲜乾坤. 计算机工程与应用. 2011(16)
[6]基于聚类分析的网络论坛意见领袖发现方法[J]. 王珏,曾剑平,周葆华,吴承荣. 计算机工程. 2011(05)
[7]网络社区中的意见领袖特征分析[J]. 肖宇,许炜,夏霖. 计算机工程与科学. 2011(01)
[8]聚类算法研究[J]. 孙吉贵,刘杰,赵连宇. 软件学报. 2008(01)
[9]BBS群体特征的社会网络分析[J]. 彭小川,毛晓丹. 青年研究. 2004(04)
[10]基于SNA的网络舆论意见领袖识别研究[J]. 丁雪峰,刘嘉勇,吴越,胡朝浪,崔鑫. 高技术通讯. 2011 (02)
硕士论文
[1]面向武器贸易关系的社会网络分析技术研究[D]. 俞淮.国防科学技术大学 2011
[2]BBS热点话题发现与监控系统[D]. 兰凯梅.北京交通大学 2011
[3]主题网络爬虫的研究和实现[D]. 林捷.武汉理工大学 2011
[4]Web数据集成中包装器自适应方法研究[D]. 罗伟.山东大学 2011
[5]面向金融领域BBS的话题发现和热度评价[D]. 王岩.哈尔滨工业大学 2010
[6]BBS中的意见领袖分析[D]. 李会颖.河北大学 2009
[7]Web数据抽取技术研究[D]. 陈雪杰.哈尔滨工程大学 2009
本文编号:3463079
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/3463079.html