数据分析与可视化应用实践
书 号:9787113325220
丛 书 名:教育部现代学徒制试点院校系列教材
作 者:严正香,商信华,李涛
译 者:
开 本:16开
装 帧:平装
正文语种:汉文
出 版 社:中国铁道出版社
定 价:59.8元
-
内容简介
本书涵盖了从大数据基础到数据可视化的一系列学习任务。首先,通过项目一,读者将了解大数据的定义、发展、基本特征及其在各行业的应用案例。接着,项目二至项目四将引导读者逐步掌握Python基础知识,以及Numpy和Pandas在数据分析中的应用。项目五和项目六则专注于数据可视化,分别介绍了Matplotlib和Pyecharts的使用,包括基础语法、常用设置及多种图形的绘制方法。通过本书,读者将能够系统地学习大数据与数据分析的基础知识,并掌握实用的数据可视化技能。 -
前言
数据分析作为一种前沿技术,其在物联网云计算、移动互联网等战略性新兴领域的应用非常广泛。数据分析技术对于企业用户来说至关重要,它可以帮助企业在合理的时间内有效地获取、管理、处理和整理大量的数据,从而为企业的经营决策提供有力的支持。近几年大数据技术发展迅速,其商业价值已经明显体现,具备实战经验的数据分析人才也成为企业之间争夺的焦点。为了满足不断增长的数据分析人才需求,众多高校已经开始尝试开设不同难度层次的数据分析课程,而“数据分析”作为大数据时代的核心技术,有望成为高校大数据技术及相关专业中的核心课程之一。
本书全面贯彻落实党的二十大精神,通过“健康中国”“环境保护”“优化税制”等系列案例,既体现了时代特征,又把握了发展规律,既有深度又有温度,旨在为构建教育强国、科技强国、人才强国作出贡献。
在结构上,本书分为七个项目三部分内容,包括大数据概述、Python 基础知识;数据分析基础——NumPy、数据分析进阶——Pandas;使用 Matplotlib 可视化、使用Pyecharts 可视化、使用 Seaborn 可视化。
在 Python 基础知识部分,首先通过认识 Python 了解其基本概念,安装 Anaconda 和PyCharm,并熟悉语法规范;接着学习 Python 命令的组成,包括基本符号、常量与变量、数据类型及功能符号;最后掌握 Python 程序结构,涵盖表达式语句、顺序 / 选择 / 循环结构、条件表达式及流程控制。
在数据分析进阶部分,先认识数据清洗的原理、步骤及常用工具,再掌握读取数据的方法,如读写文本和 Excel 文件;随后深入清洗数据,处理重复、缺失、异常数据及逻辑错误,并通过案例实践;接着学习数据定位技术,包括基本数据操作及 []、loc[]、iloc[]、iat[] 等定位方式;之后进行数据合并与筛选,包括合并、条件筛选、排序与排名;最后完成描述性分析,运用 Describe() 方法计算众数、均值、中位数,执行数据重塑并分析相关性。
在使用可视化工具部分,Matplotlib 项目从安装和基础语法入手,学习绘图流程、布局设置及参数调整,并绘制折线图、直方图、饼图等基础图形;Pyecharts 项目则介绍安装与公共属性设置,绘制二维图形(如柱状图、折线图)和三维图形(如三维柱状图、散点图),并通过实例分析功能实现;Seaborn 项目重点学习关系图(散点图、折线图)、分类图(分类散点图、分布图)及分布图(单变量、核密度估计等)。
本书由严正香、商信华、李涛任主编;邓太勇、樊建伟、王静、徐丽娟、郝宏博任副主编;王纪、谭庆吉、牛文姣、何莹、刘天梅、赵正华、李展鹏、赵帅参与编写。
本书由严正香负责全书的整体策划、架构设计与内容统稿,商信华和李涛负责部分章节内容的编写以及相关实验的设计、验证、总结。
本书是校企合作的成果,信阳势为教育科技有限公司参与本书编写,郑州新思齐科技有限公司提供了项目和技术支持。
本书在编写过程中得到了许多同事的大力支持和帮助,收到了许多宝贵的意见和建议,还参考了许多资料和国内外的优秀教材,在此一并表示衷心的感谢。
编写团队多年来持续跟踪大数据技术发展趋势,努力保持本书内容的先进性。但限于时间和水平,书中难免存在不足之处,望广大读者不吝赐教。 -
目录
项目一大数据概述任务一认识大数据任务二了解大数据的发展任务三了解大数据的基本特征任务四了解大数据行业应用案例项目二Python基础知识任务一认识Python任务二掌握Python命令的组成任务三掌握Python程序结构项目三数据分析基础——NumPy任务一认识NumPy任务二数组创建 任务三数组索引和切片 项目四数据分析进阶——Pandas任务一认识数据清洗任务二掌握读取数据任务三掌握清洗数据任务四掌握数据定位任务五掌握数据合并与筛选项目五使用Matplotlib可视化任务一认识Matplotlib任务二掌握Matplotlib基础语法与常用设置任务三绘制基础图形项目六使用Pyecharts可视化任务一认识Pyecharts任务二了解公共属性设置任务三绘制二维图形 任务四绘制三维图形 项目七使用Seaborn可视化任务一认识Seaborn任务二绘制关系图任务三绘制分类图任务四绘制分布图任 -
作者介绍
严正香,研究生学历,教授,河南省教育厅学术带头人、信阳市科技专家,现任信阳职业技术学院信息学院院长,主要负责讲授“spark数据分析”“数据可视化”等课程,参与编写《计算机应用基础》《应用数学》《计算机网络基础》等教材,发表论文35篇,其中全国中文核心期刊12篇;主持或参与省级以上教学科研成果12项。商信华,硕士研究生,教授,现任信阳农林学院专职教师,主要讲授“大数据导论”“程序设计基础”等课程,主编《CorelDRAW12中文版平面设计100例》《常用工具软件应用》《数据结构》《Internet技术及应用教程》《FlashMX2004中文版精品动画制作100例》等教材,发表专业学术论文20余篇,获河南省教学研究成果一等奖和二等奖各一次。李涛,博士,教授,现为郑州信息科技职业学院信息工程与人工智能学院副院长。参与省级大数据技术资源库、省级大数据教师教学创新团队建设,参与编写《Python程序设计项目化教程》教材并获批“十三五”、“十四五”职业教育国家规划教材。主持省级科技攻关计划项目4项、河南省高等学校重点科研项目2项。近两年,以第一作者身份发表3篇SCI高质量论文,获得国家发明专利3项,在申请 -
编辑推荐
本书通过丰富的图表和图形展示数据分析与可视化的结果,通过大量的案例讲解数据分析的过程,使读者能够更直观地理解相关概念和原理,掌握数据分析的步骤和操作方法。 -
书评书荐
-
附件下载
图书推荐



