基于邮件的行程信息归并系统设计与实现
发布时间:2018-03-01 15:43
本文关键词: 邮件解析 行程 订票通知邮件 正则表达式 出处:《武汉理工大学》2014年硕士论文 论文类型:学位论文
【摘要】:互联网的发展越来越贴近生活、服务生活,,越来越多的用户使用互联网预订预定火车票、酒店、航班等等出行服务。作为订票商会向用户发送通知邮件以确认订票的相关信息。但是用户从邮箱中查找到这些订票邮件,以及从邮件中获取信息是非常繁琐、耗时的。特别是对于出行的用户,多数时间使用手机接入互联网,在手机上操作和查找信息就变得更为不便。 本文设计和开发了一个用以帮助用户整理行程的信息系统。用户只需要将来自订票商的通知邮件转发到系统指定的邮箱,系统会自动的对邮件的内容进行解析和提取。此外,系统还会帮助用户查找并添加与此次行程相关地点的天气、出行路线等信息,减少用户查询,方便用户使用,辅助用户做出决策。 首先,当前系统支持火车、酒店、航班三种出行类型的邮件。通过对订票商邮件的查阅与分析,建立了分别描述这三类行程的数据模型。 在此基础上,阐述了邮件的传输路径和在传输过程中邮件内容发生的变化,以及这些变化对邮件信息提取工作带来的困难,提出了将HTML转换成文本的方法解决这个问题,此方法会过滤掉邮件中会带来不统一的数据内容。 再次,为了从邮件中得到数据模型中描述的数据信息,设计一种从邮件中提取出信息的方案。该方案使用正则表达式从邮件中匹配关键的数据点,并将这些数据点归纳、合并和补充成完整行程数据模型中描述的数据结构。使用该方案完成本系统中邮件信息提取的关键功能模块。 最后,设计了拥有高可扩展性的工程架构,使其能够快速对新的订票邮件提供支持。
[Abstract]:The development of the Internet is becoming more and more close to life, service life, more and more users use the Internet to book train tickets, hotels, Travel services such as flights, etc. It is very cumbersome for users to find these booking emails from their mailboxes, and to get information from them, by sending notification emails to users to confirm the booking information. Time consuming. Especially for travelling users, most of the time they use their mobile phones to connect to the Internet, and it becomes more difficult to operate and find information on the mobile phones. This paper designs and develops an information system to help users organize their itinerary. Users only need to forward the notification mail from the booking agent to the mailbox specified by the system, and the system will automatically parse and extract the contents of the mail. The system will also help users to find and add information about the weather, travel routes and other places related to the trip, reduce user inquiries, facilitate the use of users, and assist users to make decisions. Firstly, the current system supports three types of mail: train, hotel and flight. On the basis of this, this paper expounds the transmission path of mail and the changes of mail content in the course of transmission, and the difficulties of these changes to the extraction of mail information, and puts forward the method of converting HTML into text to solve this problem. This method will filter out the message will bring inconsistent data content. Thirdly, in order to get the data information described in the data model, a scheme is designed to extract the information from the mail. The scheme uses regular expressions to match the key data points from the mail, and summarizes these data points. The data structure described in the complete travel data model is merged and added, and the key function module of mail information extraction in this system is completed by using this scheme. Finally, an engineering architecture with high scalability is designed to support new booking mail quickly.
【学位授予单位】:武汉理工大学
【学位级别】:硕士
【学位授予年份】:2014
【分类号】:TP393.098
【参考文献】
相关期刊论文 前9条
1 胡军伟;秦奕青;张伟;;正则表达式在Web信息抽取中的应用[J];北京信息科技大学学报(自然科学版);2011年06期
2 黄俊;殷卫红;;基于Postfix电子邮件系统的设计与实现[J];上海电力学院学报;2006年02期
3 朱玲;张启宇;;电子邮件解析算法的研究与实现[J];华南金融电脑;2008年02期
4 文英;;面向对象的邮件解析器的设计与实现[J];计算机与信息技术;2006年10期
5 李春旺;;Web信息整合机制研究[J];图书情报工作;2005年10期
6 张健;林丽丽;;基于SMTP、POP3协议的电子邮件自动收发系统的开发[J];微型电脑应用;2007年04期
7 田纯青;;利用Nginx实现基于URI的Web负载分配[J];现代计算机(专业版);2009年07期
8 杨波;;基于Linux系统的Postfix邮件管理系统的开发[J];一重技术;2011年01期
9 凌质亿;刘哲星;曹蕾;;高并发环境下Apache与Nginx的I/O性能比较[J];计算机系统应用;2013年06期
本文编号:1552589
本文链接:https://www.wllwen.com/guanlilunwen/ydhl/1552589.html