P2P舆情系统设计与实现
本文关键词:TC公司P2P网贷平台可行性分析及设计研究,,由笔耕文化传播整理发布。
内容摘要
点对点借贷平台(P2P)在2007年随着互联网浪潮进入国内,2013年开始飞速发展,平台数量、交易规模与投资用户数大幅增长,与此同时大量的平台跑路、倒闭,给用户们带来大量损失。面对信息过载、不透明的P2P平台和产品,用户们在选择靠谱平台、合适产品上存在巨大困难。基于这样的需求,本文将平台官网、门户新闻网站、论坛贴吧、社交平台、互联网金融协会、企业工商信息网等站点P2P相关的文本数据进行抓取、清洗、整理、分析和展示,进而反映出P2P产业的热度趋势变化、热门事件、行业口碑,以及各家P2P平台的相关资讯、相关事件、关系图谱、用户口碑,并提供在线访问服务,为千万互联网P2P用户做出明智的投资融资决策提供支持。
本文是基于web爬虫、机器学习、自然语言处理、可视化、文本搜索、Web开发、Android开发等技术开发的P2P舆情分析与监控系统。系统使用机器学习中的梯度下降渐进回归树进行问题平台预测,使用Doc2Vec、主题模型LDA、聚类模型进行话题发现,使用KFIDF提取热门关键字,使用情感分析技术分析平台口碑。系统后台使用Python语言开发,数据库采用Mongo DB,索引建立、检索使用Solr,框架使用Flask,服务器使用阿里云。本系统是一个注重用户体验,性能良好,功能全面的P2P舆情系统。
目录目录
第1章 绪论 1
1.1 系统开发背景 1
1.2 本文主要工作 2
1.3 本文组织结构 3
第2章 理论和技术基础 4
2.1 理论基础 4
2.1.1 机器学习算法 4
2.1.2 自然语言处理 5
2.2 技术基础 6
2.2.1 爬虫框架Scrapy 6
2.2.2 文档数据库Mongo DB 7
2.2.3 网站开发框架Flask 7
2.2.4 数据可视化Ets 7
2.2.5 C/S架构与B/S架构 8
第3章 系统分析 10
3.1 系统需求分析 10
3.1.1 功能性需求 11
3.1.2 非功能性需求 13
3.2 系统流程分析 14
3.3 系统目标分析 16
第4章 系统设计 18
4.1 技术架构设计 18
4.1.1 系统整体架构 18
4.1.2 系统后台架构 19
4.1.2 系统数据架构 20
4.2 系统模块设计 21
4.2.1 数据采集模块 21
4.2.2 数据整理模块 21
4.2.3 数据使用模块 22
4.3数据结构设计 24
第5章 系统实现 27
5.1实现环境 27
5.2 后台功能实现 27
5.2.1 数据采集 27
5.2.2 数据整理 28
5.2.3 舆情热点 29
5.2.4 监控预警 29
5.2.5 舆情资讯 30
5.3网站搭建与展示 31
5.3.1 网站概述 31
5.3.2 资讯业务版块 32
5.3.3 投哪儿业务版块 34
5.3.4 行业大盘业务版块 36
5.3.4 舆情管家业务版块 37
第6章 总结与展望 39
参考文献 40
致 谢 43
参考文献
[1]宁家骏. 积极促进大数据产业发展推动我国从数据大国走向数据强国[J]. 世界电信, 2014(1):44-48.
[2]李海燕. 网络舆情爬虫系统的设计与实现[D]. 厦门大学, 2014.
[3]石柳. P2P促进中小微企业发展[J]. 理财, 2014(7):40-40.
[4]Mitchell T M, Carbonell J G, Michalski R S. Machine learning.[M] Machine Learning. Springer US, 1986:417-433.
[5]陆茂邦. 论机器学习[J]. 计算机光盘软件与应用, 2014(8):213-213.
[6]杨伟. 半监督学习方法研究[D]. 国防科学技术大学, 2011.
[7]Rao S J. Regression Modeling Strategies: With Applications to Linear Models, Logistic Regression, and Survival Analysis.[J]. Commlaw Conspectus, 2005, 98(:1):257-258.
[8]Friedman J H. Greedy Function Approximation: A Gradient Boosting Machine[J]. Annals of Statistics, 2000, 29(5):1189--1232.
[9]尹松, 周永权, 李陶深. 数据聚类方法的研究与分析[J]. 航空计算技术, 2005, 35(1):63-66.
[10]Collobert R, Weston J, Bottou L, et al. Natural Language Processing (almost) from Scratch[J]. Journal of Machine Learning Research, 2011, 12(1):2493-2537.
[11]Blei D M, Ng A Y, Jordan M I. Latent dirichlet allocation[J]. Journal of Machine Learning Research, 2003, 3:993-1022.
[12]Porteous I, Newman D, Ihler A, et al. Fast collapsed gibbs sampling for latent dirichlet allocation[C] ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Las Vegas, Nevada, Usa, August. 2008:569--577.
[13]Xu R, Chen T, Xia Y, et al. Word Embedding Composition for Data IMBAlances in Sentiment and Emotion Classification[J]. Cognitive Computation, 2015, 7(2):226-240.
[14]Abbasi A, Chen H, Salem A. Sentiment analysis in multiple languages: Feature ion for opinion classification in Web forums[J]. Acm Transactions on Information Systems, 2008, 26(3):55-59.
[15]Wang J Z, Jia J F, Liu X, et al. Recognizing Contextual Polarity: An Exploration of Features for Phrase-Level Sentiment Analysis[J]. Computational Linguistics, 2010, 35(3):399--433.
[16]Prem Melville, Wojciech Gryc, Rid D. Lawrence. Sentiment analysis of blogs by combining lexical knowledge with text classification.[C] ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, Paris, France, June 28 - July. 2009:1275-1284.
[17]Wang J, Guo Y. Scrapy-Based Crawling and User-Behavior Characteristics Analysis on Taobao[C] International Conference on Cyber-Enabled Distributed Computing and Knowledge Discovery. 2012:44-52.
[18]Li C, Yang W. The distributed storage strategy research of remote sensing image based on Mongo DB[C] International Workshop on Earth Observation and Remote Sensing Applications. IEEE, 2014:101-104.
[19]李陈军. 基于MongoDB的SNS平台设计与实现[D]. 南京理工大学, 2013.
[20]李奕林. 基于MongoDB的新闻网站系统设计与实现[D]. 厦门大学, 2013.
[21]张雪亚. 一种新型试题库系统的架构设计[J]. 数字技术与应用, 2012(11):178-178.
[22]蒋慧科. 基于J2EE的企业级应用系统的设计与实现[D]. 南开大学, 2007.
[23]赵卓君, 张晓燕. 论BS和CS架构相结合的多层次系统架构设计和开发模式的选择[J]. 信息系统工程, 2012(11):99-100.
[24]杨光. 国内P2P网贷面临三大风险[J]. 计算机与网络, 2015, 41(3):16-16.
[25]陈辉. 金融风险管理系统的开发与性能改进[D]. 浙江大学, 2008.
[26]申变云. TC公司P2P网贷平台可行性分析及设计研究[D]. 西南交通大学, 2014.
[27]程芸芸. 基于企业搜索引擎重排序的研究与应用[D]. 武汉理工大学, 2014.
[28]梁永幸. 浅谈移动用户界面设计[J]. 科技风, 2014(22):30-30.
[29]陶宇炜, 熊长江, 王娟琳. 高校网络舆情信息监测管理体系的构建研究[J]. 现代教育技术, 2013, 23(12):111-113.
[30]屈妍妍. 网络借贷信息中介机构业务活动管理暂行办法(征求意见稿)政策解读[J]. 中国战略新兴产业, 2016(2).
本文关键词:TC公司P2P网贷平台可行性分析及设计研究,由笔耕文化传播整理发布。
本文编号:224399
本文链接:https://www.wllwen.com/jingjilunwen/touziyanjiulunwen/224399.html