基于HADOOP的海量录音文件存储系统的设计与实现
本文选题:录音文件存储 + HDFS ; 参考:《电子科技大学》2014年硕士论文
【摘要】:随着通信服务行业的快速发展,各企业的业务种类与服务类别也变得多样化,用户与企业客服人员的互动数量也快速增长。许多公司的客服压力也越来越大,公司为保证服务人员正常工作,以及防止恶意骚扰电话,同时为了保证客服人员按照客户的要求办理业务,通常会对客服通话进行录音保存。这些录音文件数量巨大,而且还处于快速动态增长中。但是它们对于公司后期数据分析,用于提升员工服务品质管理等非常重要,通常会长期保存。传统的存储方式处理这些数据效率低,工作量大,而且成本高。如何安全有效且低成本的存储这些数据是当前迫切需要解决的一个问题。本文主要研究了如何利用多种存储设备,构建分布式存储系统,用以解决海量录音文件存储问题。本文分析了国内云储技术发展的现状,通过调研分布式文件系统技术,再结合海量录音文件的存储需求,设计并实现了基于HADOOP的海量录音文件存储系统。该系统是以HDFS为存储基础开发的一个海量录音文件存储系统,系统由客户端、消息队列以及服务存储端组成。客户端主要提供友好的用户交互界面,消息队列是客户端与服务端的纽带,服务端实现了分布式存储并响应客户端的各种请求。该系统是典型的生产消费者模式,客户端发送请求到消息队列,服务端处理从消息队列获取的请求并响应客户端。该系统服务端是可动态扩展的,新增服务端程序时,服务程序只要监听到指定的消息队列,就可以接收并处理客户端的请求。以下介绍从需求到系统实现的步骤:第一,通过分析企业的海量录音文件存储的现状,针对传统录音文件存储方式的不足,本文进行分布式存储技术调研,提出了基于HADOOP的海量录音文件系统的需求;第二,结合海量录音文件存储的现状及需求,对海量录音文件存储系统进行了详细设计,主要包含用户权限鉴定设计、录音文件的上传下载设计、录音文件管理功能设计和录音文件分享设计等;第三,本文对分布式文件系统的环境搭建做了详细介绍,并实现了海量录音文件存储系统,包括用户权限鉴定功能实现、录音文件的上传下载功能实现、录音文件管理功能实现和录音文件的分享功能实现等。考虑到可移植性及安全性,系统用Java语言开发。本系统分为客户端、服务端、数据库和分布式存储系统。本系统界面简单整洁,方便用户的使用;第四,对系统的安全性、文件传输效率以及系统的功能做了测试,在录音文件存储方式上,本系统和传统系统相比,具有更好的安全性能、数据传输效率也有很大的提升、数据的存储成本也更低。
[Abstract]:With the rapid development of the communication service industry, the business types and service categories of the enterprises have become diversified, and the number of interaction between users and customer service personnel has also increased rapidly.Many companies are also under increasing customer service pressure, to ensure that service personnel work properly, and to prevent malicious harassment of phone calls, and to ensure that customer service personnel do business in accordance with customer requirements, customer service calls are usually recorded and preserved.These audio files are huge in number and still in rapid dynamic growth.But they are important for later data analysis, for improving employee quality management, and are often preserved for long periods of time.The traditional storage method is low efficiency, heavy workload and high cost.How to store these data safely and efficiently and at low cost is an urgent problem.This paper mainly studies how to use a variety of storage devices to build a distributed storage system to solve the problem of massive audio file storage.This paper analyzes the present situation of cloud storage technology in China, designs and implements the storage system of massive audio files based on HADOOP by investigating the distributed file system technology and combining the storage requirements of massive audio files.This system is a massive recording file storage system based on HDFS. The system consists of client, message queue and service storage.The client mainly provides a friendly user interface. Message queue is the link between the client and the server. The server realizes distributed storage and responds to various requests from the client.The system is a typical production consumer mode, the client sends the request to the message queue, the server processes the request from the message queue and responds to the client.The system server is dynamically extensible. When the server program is added, the service program can receive and process the request of the client as long as it listens to the specified message queue.The following are the steps from requirements to system implementation: first, by analyzing the current situation of mass audio file storage in enterprises, aiming at the shortcomings of traditional recording file storage methods, this paper investigates distributed storage technology.This paper puts forward the requirement of mass audio file system based on HADOOP. Secondly, combining with the current situation and demand of mass audio file storage, the paper designs the storage system of mass sound recording file in detail, which mainly includes the design of user authority authentication.Audio file upload and download design, recording file management function design and audio file sharing design. Thirdly, this paper introduces the environment of distributed file system in detail, and realizes the massive audio file storage system.Including the realization of user authority authentication function, audio file upload and download function realization, recording file management function realization and audio file sharing function realization and so on.Considering portability and security, the system is developed with Java language.The system is divided into client, server, database and distributed storage system.The interface of the system is simple and clean, and it is convenient for users to use. Fourthly, the security of the system, the efficiency of file transfer and the functions of the system are tested. In the storage mode of recording files, the system is compared with the traditional system.With better security performance, data transmission efficiency is also greatly improved, data storage costs are lower.
【学位授予单位】:电子科技大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP333
【相似文献】
相关期刊论文 前10条
1 王春靖;FAT32的优点[J];电脑爱好者;1998年03期
2 何文才;郑钊;刘培鹤;杜敏;;一种基于目录数据分离存储的文件存储方法的研究与实现[J];网络安全技术与应用;2014年01期
3 飞雪散花;;手机文件存储看我的[J];电脑迷;2012年05期
4 孙有军;张大兴;;海量图片文件存储去重技术研究[J];计算机应用与软件;2014年04期
5 ;金刚指——计算机文件存储的保护神[J];信息安全与通信保密;2001年12期
6 赵跃龙;谢晓玲;蔡咏才;王国华;刘霖;;一种性能优化的小文件存储访问策略的研究[J];计算机研究与发展;2012年07期
7 周国安;李强;陈新;胡旭;;云环境下海量小文件存储技术研究综述[J];信息网络安全;2014年06期
8 张美芳;电子文件存储方式的研究[J];数字与缩微影像;2005年02期
9 陶慧;于守谦;刘夏;;适于测控系统的文件存储结构研究[J];计算机应用与软件;2010年11期
10 方勇;史跃辉;;浅谈减少地形图电子文件存储冗余的几种方法[J];江西测绘;2006年02期
相关会议论文 前6条
1 任勇;朱立谷;张雷;彭建峰;;新型虚拟文件存储系统的设计[A];第15届全国信息存储技术学术会议论文集[C];2008年
2 李浩;;基于制播分离的文件存储和传输方式的探讨[A];中国新闻技术工作者联合会五届二次理事会暨学术年会论文集(上篇)[C];2010年
3 陈海波;侯建卫;;针对海量详单快速存储检索的实现方法[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
4 陈海波;侯建卫;;针对海量详单快速存储检索的实现方法[A];2011全国无线及移动通信学术大会论文集[C];2011年
5 袁旦;张智君;;预览时间对颜色判断任务下客体文件存储的影响[A];第十一届全国心理学学术会议论文摘要集[C];2007年
6 黄步根;黄政;刘建军;;SANYO数码相机中被删除视频的恢复[A];第26次全国计算机安全学术交流会论文集[C];2011年
相关重要报纸文章 前10条
1 本报记者 郭平;Isilon扩充文件存储产品线[N];计算机世界;2009年
2 本报记者 郭平;容量与性能 一样都不能少[N];计算机世界;2010年
3 张峰;统一存储 业务连续[N];网络世界;2006年
4 清水 编译;基于文件存储大行其道[N];计算机世界;2011年
5 本报记者 郭涛;HCP Anywhere:为HDS内容云锦上添花[N];中国计算机报;2013年
6 于翔;让IT如业务般运营的应用路径[N];网络世界;2009年
7 刘一冰;IBM SoNAS专攻高端存储客户[N];电脑商报;2010年
8 清水 编译;云存储:机遇下暗藏挑战[N];计算机世界;2010年
9 沈建苗;互联网存储 你信得过吗[N];计算机世界;2007年
10 ;一月 笔类和文件存储产品关注度较高[N];消费日报;2010年
相关硕士学位论文 前10条
1 宫海林;支持事务的文件存储技术研究与系统实现[D];国防科学技术大学;2006年
2 曹挹芬;分布式文件存储与检索平台的设计与实现[D];湖南大学;2009年
3 黄斌;并行文件存储系统关键技术的研究[D];华南理工大学;2012年
4 蒋浩;分布式文件存储系统副本管理方法研究[D];浙江大学;2013年
5 张聪萍;钱塘分布式文件存储系统性能优化[D];浙江大学;2011年
6 周峰;互联网文件存储服务系统研究[D];华中科技大学;2011年
7 郑钊;专控计算机分离式文件存储的研究[D];西安电子科技大学;2014年
8 廖家赵;面向城轨线网的海量小文件存储方法的研究与实现[D];华南理工大学;2015年
9 何娟;基于分布式文件存储的个人信息融合系统的研究与实践[D];北京邮电大学;2010年
10 江柳;HDFS下小文件存储优化相关技术研究[D];北京邮电大学;2011年
,本文编号:1767957
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/1767957.html