基于社交网络分析的电影票房预测系统的设计与实现
发布时间:2020-03-25 09:38
【摘要】:进入21世纪以来,神经网络、情感分析等在电影票房预测上的广泛应用,使得电影票房预测的准确性逐年提高。由于电影制作的复杂与不确定性,未来电影票房预测的发展趋势需要吸纳更多数据,采取更贴合的模型跟踪预测。现有的基于产品的神经网络算法(PNN)模型在票房预测取得了不错的效果,但仍然有一些不足。本文针对性地提出了三种改进的模型架构。在特征工程阶段,PNN模型将所有特征按领域划分,领域间特征通过两两交叉映射到同一向量空间。这忽略了每个领域中特征表达的一致性,本文提出以组为单位的产品神经网络算法(GPNN)模型引入分组进入嵌入层(GSE)的概念,进行特征组划分时,对组内所有特征考虑表达的一致性和差异性。另外在GPNN特征工程基础上,强化对票房预测影响较大的一些交叉连续特征,作为有连续特征的以组为单位的产品神经网络算法(CGPNN)。在特征交叉阶段,GPNN、CGPNN模型均采用外积算子实现特征交叉,将特征映射到高维向量空间内,全面地学习出特征的深层表达,然而在数据不足的情况下模型难以收敛。针对这两种网络结构的特性,本文提出了基于探测的有连续特征的以组为单位的产品神经网络算法(Probe-based CGPNN)模型,用内积算子完成特征交叉,在保证预测效果不明显下降的前提下,合理地降低时空复杂度。基于上述的三种改进模型,借鉴现有票房预测系统的结构,本文设计与实现了基于社交网络分析的电影票房预测系统,将整个系统划分为网络爬虫子模块、数据存储模块、文本情感分析子模块、特征组合子模块、电影票房预测子模块、数据前端展示模块等六个主要功能模块,并详细阐述了其内部实现细节。
【图文】:
猫眼电影票房预测系统是现在国内商业应用最广且准确度相对较高的电影逡逑票房预测系统[19]。猫眼目前重点关注上映前一天、上映第一天以及上映当周周末逡逑这几个重要时间点的票房效果。如图2-1所示,是基础数据、预测服务和猫眼专逡逑业版三个子模块的关系:逡逑么休影赔隹逦全国逦rv邋天级逦,,邋总票逦逦逡逑°逦实时[=票房房预逡逑¥~栧危黄狈垮卧げ忮尾忮义希薄薄廾ㄑ圩ㄒ蛋驽义希斡霸哄纬鞘械劐义厦ㄑ劢灰资蒎问凳鼻凳卞义襄危湾迤狈垮纹狈垮五五义匣〗坛体卧げ夥皴义贤迹玻被∈荨⒃げ夥瘛⒚ㄑ圩ㄒ蛋婀叵低煎义先缤迹玻彼荆诤献饔霸菏燮笔荨⒚ㄑ凼燮逼教ń灰资莸日庑┗″义鲜荩啥匀凳逼狈考懊扛鲇霸旱氖凳逼狈拷性げ猓运竦玫氖萁绣义狭艘恍┙翟氪怼5玫饺扛鲇霸旱氖凳逼狈亢螅梢宰龅匠鞘械厍凳逼狈垮义系脑げ猓郏玻眩荨V氐闶翘旒镀狈亢妥芷狈康脑げ猓枰喽愿丛拥姆椒ɡ醋觯砗箦义系氖荻蓟嵴故驹诿ㄑ圩ㄒ蛋妫峁└缬按右嫡撸霸壕怼⑵降冉胁慰肌e义希玻玻笔凳逼狈垮义厦ㄑ鄣缬坝耄梗埃サ挠霸汉献鳎越恿隋澹保钢质燮毕低场⑾晗傅挠霸撼〈渭白义衔皇莸取Tげ
本文编号:2599734
【图文】:
猫眼电影票房预测系统是现在国内商业应用最广且准确度相对较高的电影逡逑票房预测系统[19]。猫眼目前重点关注上映前一天、上映第一天以及上映当周周末逡逑这几个重要时间点的票房效果。如图2-1所示,是基础数据、预测服务和猫眼专逡逑业版三个子模块的关系:逡逑么休影赔隹逦全国逦rv邋天级逦,,邋总票逦逦逡逑°逦实时[=票房房预逡逑¥~栧危黄狈垮卧げ忮尾忮义希薄薄廾ㄑ圩ㄒ蛋驽义希斡霸哄纬鞘械劐义厦ㄑ劢灰资蒎问凳鼻凳卞义襄危湾迤狈垮纹狈垮五五义匣〗坛体卧げ夥皴义贤迹玻被∈荨⒃げ夥瘛⒚ㄑ圩ㄒ蛋婀叵低煎义先缤迹玻彼荆诤献饔霸菏燮笔荨⒚ㄑ凼燮逼教ń灰资莸日庑┗″义鲜荩啥匀凳逼狈考懊扛鲇霸旱氖凳逼狈拷性げ猓运竦玫氖萁绣义狭艘恍┙翟氪怼5玫饺扛鲇霸旱氖凳逼狈亢螅梢宰龅匠鞘械厍凳逼狈垮义系脑げ猓郏玻眩荨V氐闶翘旒镀狈亢妥芷狈康脑げ猓枰喽愿丛拥姆椒ɡ醋觯砗箦义系氖荻蓟嵴故驹诿ㄑ圩ㄒ蛋妫峁└缬按右嫡撸霸壕怼⑵降冉胁慰肌e义希玻玻笔凳逼狈垮义厦ㄑ鄣缬坝耄梗埃サ挠霸汉献鳎越恿隋澹保钢质燮毕低场⑾晗傅挠霸撼〈渭白义衔皇莸取Tげ
本文编号:2599734
本文链接:https://www.wllwen.com/wenyilunwen/dianyingdianshilunwen/2599734.html