数据科学通识导论
书 号:9787113318543
丛 书 名:
作 者:臧劲松,刘丽霞
译 者:
开 本:16开
装 帧:12
正文语种:汉文
出 版 社:中国铁道出版社
定 价:48元
-
内容简介
本书根据高等院校数据科学通识课程的教学需求编写,着重培养学生的数据意识、数据思维和数据能力,深入阐述了数据科学的核心理论与实践应用。全书共分9章,包括数据科学概论、Python与数据科学、数组的统计分析、数据清洗与统计、可视化数据挖掘、Web应用框架、文本数据处理、机器学习以及大数据技术。 为确保读者能够轻松掌握数据分析技能,本书采用当前流行的Python语言,通过实际案例演示各个数据分析过程,力求内容深入浅出,既方便读者快速上手,还能帮助他们在实践中不断巩固和加深所学知识。 本书适合作为高等院校理工科各专业平台课教材,也可作为各专业的数据科学通识课程教材,对于对数据科学有浓厚兴趣的读者,也是一本不可多得的参考书。 -
前言
党的二十大报告强调要加快建设数字中国,明确提出要促进数字经济和实体经济深度融合,打造具有国际竞争力的数字产业集群。数据科学在这一过程中扮演着关键角色,通过数据分析、机器学习等技术推动经济的数字化转型。
随着信息技术的快速发展,特别是大数据时代的到来,社会对数据科学人才的需求急剧增长。教育BU已将“大数据”确立为高等学校教学改革和教学建设的重点。数据科学,作为一门新兴的交叉学科,融合了计算机科学、统计学、数学等多个学科的知识,在有效处理和应用日益庞大的数据量方面具有举足轻重的地位。
在此背景下,多所高校积极响应,陆续开设了数据科学相关专业和课程,以满足社会对数据科学人才的迫切需求。而《数据科学通识导论》的编写,正是为了给学生提供一个系统、全面的入门和导论性质的学习资源。本教材旨在帮助高校学生构建完整的知识体系,掌握数据科学的基本原理,学会初级的实践技能,并了解前沿的技术动态,从而为他们的未来发展奠定的基础。值得一提的是,本教材已获批成为上海理工大学一流本科教材建设项目,进一步体现了其在教学中的重要性和价值。
本书内容主要包括以下几个方面:
(1)数据科学概论:包括数据科学的定位、工具软件和数据处理流程。
(2)Python与数据科学:包括Python的基础语法、内置数据类型和函数。
(3)数据分析工具的应用:包括统计分析中数组对象的创建和函数应用、数据清洗与统计,可视化数据挖掘、Web应用框架和文本数据处理。
(4)机器学习:包括scikit-learn库的基本使用、回归、分类、聚类和强化学习等模型。
(5)大数据技术:包括大数据概述、Hadoop生态系统和Spark生态系统的介绍及应用。
本书主要特色如下:
(1)兼顾理论与实践:本书不仅论述数据科学的基本概念、原则和方法,还介绍了具体的平台和工具,以及数据科学的丰富案例和具体领域的实践。这种设计使得学习者不仅易于理解理论,还有助于将理论应用于实践。
(2)案例式、形象化论述:为避免陷入数学公式的复杂推导过程,本书采用直观的案例、形象化的图形等手段,通过浅显易懂的语言,深入浅出地进行论述,使得内容不枯燥,以方便学习者迅速掌握概念和技术的要领。
(3)实践与案例驱动:通过大量案例和项目,使学习者能够采用数据科学的方法解决实际问题,强调动手实践的重要性。
本书由臧劲松、刘丽霞任主编,黄小瑜任副主编,黄义萍、黄春梅参与编写。各章编写分工如下:第1、3、6章由刘丽霞编写,第2章由黄义萍编写,第4、7章由黄小瑜编写,第5章由黄春梅编写,第8章由臧劲松和刘丽霞共同编写,第9章由
臧劲松编写,臧劲松和刘丽霞负责本书的架构设计及统稿。
由于时间仓促,加之学识所限,书中难免存在不妥和疏漏之处,恳请各位读者批评指正。
编 者
2024年10月 -
目录
第1章数据科学概论11.1数据科学的定位21.1.1数据和大数据21.1.2数据科学理论基础51.1.3数据科学家101.2工具软件111.2.1常用Python软件简介111.2.2JupyterNotebook软件141.3数据处理流程171.3.1传统的数据处理流程171.3.2数据科学的数据处理流程19拓展与练习21第2章Python与数据科学222.1Python基础语法232.1.1标识符与变量232.1.2运算符和表达式252.1.3程序流程控制292.2Python内置数据类型322.2.1数值类型322.2.2组合类型332.3函数372.3.1函数的定义与调用372.3.2参数传递382.3.3匿名函数382.4模块392.4.1模块的导入和使用392.4.2常用内置模块402.5综合案例42拓展与练习44第3章数组的统计分析453.1创建数组对象463.1.1创建一维数组463.1.2创建二维数组5 -
作者介绍
臧劲松,副教授。上海理工大学教师,主要研究方向为计算机应用,主要讲授大学计算机基础、C语言程序设计、Python程序设计、程序设计及实践等课程,共发表学术论文5篇;出版教材4种。 刘丽霞,上海理工大学讲师,主要教授大学本科程序设计及实践(C)、数据科学通识导论和Python程序设计等课程。参与多部教材的编写,有丰富的教材编写经验。2015年、2016年获得上海理工大学教学质量二等奖,2022年、2023年分别获得上海理工大学创新创业团队二等奖和一等奖,指导学生近50人参与上海市计算机应用能力大赛、中国计算机设计大赛和“蓝桥杯”全国软件大赛获得国家级和省赛奖项。 -
编辑推荐
(1)兼顾理论与实践:本书不仅论述数据科学的基本概念、原则和方法,还介绍了具体的平台和工具,以及数据科学的丰富案例和具体领域的实践。这种设计使得学习者不仅易于理解理论,还有助于将理论应用于实践。
(2)案例式、形象化论述:为避免陷入数学公式的复杂推导过程,本书采用直观的案例、形象化的图形等手段,通过浅显易懂的语言,深入浅出地进行论述,使得内容不枯燥,以方便学习者迅速掌握概念和技术的要领。
(3)实践与案例驱动:通过大量案例和项目,使学习者能够采用数据科学的方法解决实际问题,强调动手实践的重要性。
(4)配有微视频,扫描书中的二维码即可观看,方便读者自学。 -
书评书荐
-
附件下载
图书推荐