资讯网站的设计和实现
一、 目的和意义:
资讯对于人们的日常生活而言非常重要,无论是国家政策还是生活中的柴米油盐,人民可以根据相关资讯调整自己的行为和计划。随着移动互联网的发展,人们获取资讯的渠道越来越多。目前国内97.4%的手机资讯用户每天都会通过手机查阅新闻等资讯。用户除了最常用的了解最新资讯的需求外,还衍生出了娱乐、社交、分享、个性化等的需求。个性化订阅、碎片化、场景化、内容聚合等形式已经成为了资讯类网站的发展趋势。 过去资讯网站的主要竞争在于是否有很强的采写和编辑能力,谁拥有了话语权,谁就拥有了压倒性的优势。因为过去资讯传播的模式都差不多,通过报纸或者门户网站进行资讯的传播,用户的选择也不多。因此过去资讯网站的建设更多在于拥有大量优秀的记者和优秀的编辑,典型的例子就是新浪门户。新浪门户多年来一直牢牢的把握住话语权,、所以即便新浪网站的其他产品不成功,其收入和变现能力甚至比不上一般的互联网公司,但是不妨碍其成为目前中国资讯的一把手。 与过去的传统资讯不同,今日头条网站和其客户端的兴起宣告了的新型资讯网站的诞生。今日头条是一款基于数据挖掘的推荐引擎产品,其主旨为用户推荐有价值的、个性化的信息,提供连接人与信息的新型服务,是目前国内移动互联网领域成长最快的产品服务之一。截止2016年8月底,今日头条仅仅是客户端便拥有超过5.5亿的装机用户,月活跃用户超过1.3亿,日活用户超过6000万,每个用户平均每日使用时长超过76分钟。今日头条本身并没有产生资讯或者新闻的媒体部门,所以将整个互联网的新闻都纳入了自己的信息源。尽管资讯的核心依旧是话语权,但是过去资讯网站最为看重的编辑和采编却可以被代替了,今日头条的成功就是在于使用机器学习和算法代替采编和编辑的这个优势。今日头条采取了推荐机制和订阅机制,抛弃了传统的采写和编辑,今日头条的核心在于兴趣算法,融合了搜索引擎和推荐引擎的双重优势,因此能深入挖掘用户的兴趣,打造围绕用户兴趣的集“搜索 和推荐”于一体的全新的阅读模式,对于用户来讲,在这里除了能够实现自身对兴趣阅读内容的掌控,还能带来阅读范围的拓展,代表了资讯阅读平台的一大发展趋势,为下一代资讯门户网站指出了新的方向。 |
二、 主攻关键之处: 本文主要实现一个基于HTML5、CSS3、Python、Java、WebSocket、MySQL技术的资讯网站。其中HTML5和CSS3可以提升用户体验,使得用户更多的登陆网站浏览资讯。主攻的关键之处有以下三个方面: (1) 使用Python构建资讯数据采集程序自动根据类别进行资讯的采集,用户或者网站管理员可以指定一些网站然后python爬虫会定时爬取这些网站,并且根据用户或者网站管理员自己定义的指定网站的类别进行归类,如果用户或者网站管理员没有指定爬取资讯的类别则爬虫根据爬取文章的内容进行提取和分类。 (2) Python数据采集程序爬取的内容将会存储到MySQL数据库中,然后Java构建的后台程序会对数据采集程序采集的内容定时进行更新整理,然后分门别类发布到资讯网站中。 (3) Java后台程序进行网站资讯的发布时,除了爬取的实时新闻资讯,其他采集的资讯都会先对数据库中的资讯进行对比然后去重,减少资讯信息的冗余 (4) 网站根据用户的订阅类别进行资讯信息的推送,减少用户搜索资讯信息的时间,提升用户体验。 (5) 整个资讯网站从资讯的采集到资讯的发布都是程序动态进行,减少了人工,提供了工作效率,同时因为是根据用户的指定网站进行爬取资讯,所以减少了无效信息的获取。 |
具体研究内容和重点解决问题 基于HTML5、CSS3、Java Web 、Python、MySQL等技术的资讯网站。具体分析和实现过程大致可分为以下五大部分: 1、资讯网站现状概述; 2、资讯网站的项目概述(用户需求分析); 3、资讯网站的设计(重点); 4、资讯网站的实现(重点); 5、总结与未来工作展望。 具体要求如下: 1、了解资讯网站用户的实际需求,写出需求分析报告: 2、根据用户需求分析报告,进行资讯网站的具体设计: 1)资讯网站的系统总体架构方案 2)资讯网站的系统网络拓扑图 3)资讯网站的系统硬件环境需求 4)资讯网站的用户登陆注册功能、用户管理功能 5)资讯网站的资讯信息的用户评价功能、资讯类别订阅、已发布的资讯的收藏、用户所收藏的资讯的管理功能 6)资讯网站的资讯自动采集功能 3、根据资讯网站的详细设计,实现资讯网站 1)实现资讯网站的登陆注册、会员管理功能 2)实现资讯网站的评价、收藏功能 3)使用HTML5和CSS3给用户展示资讯信息内容 4)使用Python技术构建爬虫自动采集资讯 5)用户可以根据类别订阅资讯、使用websocket方式对用户订阅的资讯信息进行推送 6)资讯网站的容灾设计 7)资讯网站的监控及日志 8)资讯网站的硬件开发环境和软件开发环境 重点解决问题: 1)资讯的采集,使用python根据用户的兴趣点进行相关采集; 2)资讯的推荐机制,能够根据用户的搜索内容和浏览历史进行相关资讯的推荐; 3)资讯的收藏和整理功能,一般资讯网站都只有浏览功能,用户浏览后应该可以对有用的资讯信息进行收藏和整理,尤其是国家相关政策的信息更改,这些重要信息更应该收藏 |
预期达到的成果以及提供形式 通过这次毕业设计,预期将要实现一个基于HTML5、CSS3、Python、Java、WebSocket、MySQL技术的资讯网站。网站将分为两大部分,基于Java Web的资讯网站和基于Python的数据采集程序,这两个部分都采用同一个数据库进行数据的存储。 除了提供基于资讯网站详细设计和实现的毕业论文外,还会提供程序的源代码。程序将会运行在Tomcat 8.0上,基于Java JDK 8.0.12. |