设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计
 首 页 机械毕业设计 电子电气毕业设计 计算机毕业设计 土木工程毕业设计 视觉传达毕业设计 理工论文 文科论文 毕设资料 帮助中心 设计流程 
垫片
您现在所在的位置:首页 >>毕设资料 >> 文章内容
                 
垫片
   我们提供全套毕业设计和毕业论文服务,联系微信号:biyezuopin QQ:2922748026   
基于Hadoop和SparkSQL大数据日志分析与可视化设计任务书
文章来源:www.biyezuopin.vip   发布者:毕业作品网站  

毕业设计(论文)题目:

基于Hadoop和SparkSQL大数据日志分析与可视化设计

毕业设计(论文)要求及原始数据(资料):

1.设计大数据日志分析并可视化平台系统;

2.实现SparkSQL大数据日志分析并可视化工作;

3.按照典型软件工程的流程、规范和方法,使用scala语言和sparkSQL完成数据清洗,数据分析,大数据存储,数据可视化,可视化前端界面的设计、实现。以及大数据测试环境和真实环境搭建,对项目进行测试和部署,最终实现课程排名的展示;

4.针对特定的大数据技术或框架,给出较为深入的研究分析结果;

6.训练检索文献资料和利用文献资料的能力。

7.训练撰写技术文档与学位论文的能力。

毕业设计(论文)主要内容:

1.前端部分用于数据展示,使用spring boot构建。主要内容为饼图,展示最受欢迎的课程TOPN;

2. 后台部分在spark集群上运行,主要包括日志数据清洗,数据分析,大数据存储等。离线分析GB以上的日志文件,统计最受欢迎的课程,按照地市统计TOP3课程,按照流量统计TOPN课程, 存储到mysql数据库中。搭建分布式的spark集群,通过yarn运行到hadoop集群上。。

3.设计系统的原型并形成原型设计文档;

4.设计系统的体系架构、数据库、开发框架、关键算法等并形成系统设计文档。

5.模块代码开发及单元测试并形成最终系统实现;

6. 系统集成、功能测试及形成测试报告;

7.编写系统安装使用文档;

8.在该系统基础上,加入一定的技术研究型内容,并最终形成毕业论文

学生应交出的设计文件(论文):

1.内容完整、层次清晰、叙述流畅、排版规范的毕业设计论文;

2.包括毕业设计论文、源程序等内容在内的毕业设计电子文档及其它相关材料。

主要参考文献(资料):

[1] Christos Kozanitis,David A. Patterson. GenAp: a distributed SQL interface for genomic data[J]. BMC Bioinformatics,2016,17(1).

[2]  Chenghao Guo,Zhigang Wu,Zhenying He,X. Sean Wang. An Adaptive Data Partitioning Scheme for Accelerating Exploratory Spark SQL Queries[M].Springer International Publishing:2017-06-15.

[3]  Bo Dong,Qinghua Zheng,Feng Tian,Kuo-Ming Chao,Nick Godwin,Tian Ma,Haipeng Xu. Performance models and dynamic characteristics analysis for HDFS write and read operations: A systematic view[J]. The Journal of Systems & Software,2014,93.

[4] 侯敬儒. 基于Spark的机器学习模型分析与研究[D].昆明理工大学,2017.

[5] 庞超. 基于Spark和Hive的网易移动大数据支持平台的设计与实现[D].北京交通大学,2017.

[6] 鲁宗飞. 基于Spark的空间数据平台系统的设计与实现[D].山东大学,2017.

[7] 张文童. 基于Spark的混合推荐系统的研究与实现[D].北京交通大学,2017.

[8] 李筱川. 基于Spark的情报大数据可视化分析[D].山东大学,2017.

[9] 黄廷辉,王玉良,汪振,崔更申.基于Spark的分布式交通流数据预测系统[J].计算机应用研究,2018,35(02):405-409+416.

[10] 顾荣. 大数据处理技术与系统研究[D].南京大学,2016.

专业班级

学生

要求设计(论文)工作起止日期

指导教师签字

日期

教研室主任审查签字

日期

系主任批准签字

日期

  全套毕业设计论文现成成品资料请咨询微信号:biyezuopin QQ:2922748026     返回首页 如转载请注明来源于www.biyezuopin.vip  

                 

打印本页 | 关闭窗口
本类最新文章
某MW级风力发电场电气初步设计 基于PLC控制的小车运料控制系统 圆柱形卷绕倍捻机传动机构机械设计
基于微信小程序+JavaSSM+ 基于微信小程序+JavaSSM+ 基于微信小程序+JavaSSM+
| 关于我们 | 友情链接 | 毕业设计招聘 |

Email:biyeshejiba@163.com 微信号:biyezuopin QQ:2922748026  
本站毕业设计毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!