向智而行:数据标注技术与实战应用
书 号:9787113327071
丛 书 名:“十五五”职业教育人工智能技术应用专业系列教材
作 者:任健,钱颖丰,尹智
译 者:
开 本:16开
装 帧:平装
正文语种:汉文
出 版 社:中国铁道出版社
定 价:56元
-
内容简介
本书根据高等职业院校“数据标注”及相关课程教学大纲,融合《人工智能训练师国家职业技能标准(2021年版)》中“数据标注员”工种的技能标准,以及《数据标注职业技能等级标准》编写,较全面地介绍了从事数据标注职业所必备的基本理论和技能。 本书包括8个单元,每个单元均包括理论知识和实践项目,注重提升读者的实践技能。本书主要内容包括人工智能与数据标注的核心概念,文本、音频、图像、视频数据标注方法、类型、常用工具及相应的应用场景。同时,本书还介绍了数据标注项目管理流程,并剖析行业发展趋势,为读者择业从业提供参考。书中还对数据标注职业技能进行了详细介绍,并深入讲解1+X数据标注职业技能等级证书和人工智能训练师职业技能证书,助力读者清晰规划职业发展路径。 本书适合作为高等职业院校计算机类、大数据类、人工智能类专业“数据标注”及相关课程的教材,也可作为中等职业教育“数据标注”及相关课程的教材,还可作为“数据标注员”职业培训教材及有志于成为数据标注员的社会人士的自学用书。 -
前言
人工智能是推动新一轮科技革命和产业变革的战略性技术,事关我国能否抓住新一轮科技革命和产业变革机遇的战略问题。当前,人工智能正加速赋能各行各业,催生新产业、新模式、新业态,成为培育发展新质生产力的重要引擎。
无人驾驶、人脸识别、语音转写、同声传译……以生成式人工智能(GenAI)为代表的新一代人工智能浪潮汹涌而来,世界正因技术更迭、产业升级而日新月异。数据标注是人工智能的基石,服务于智慧城市、智慧金融、智慧医疗、智慧养老、智慧零售、智慧交通等几乎所有人工智能场景。数据标注作为人工智能的“老师”,是教会机器学习、感知、认知世界的重要手段,有助于让人工智能更好地服务社会、服务人类。2022年,新修订的
《中华人民共和国职业分类大典》正式收录数字职业“人工智能训练师”(包括“数据标注员”“人工智能算法测试员”两个工种),反映了新业态变化对新职业的需要。
本书旨在为中高职学生及广大对人工智能及数据标注领域感兴趣的读者,提供系统掌握数据标注核心知识与实践技能的途径。本书围绕数据标注行业标准与职业需求,“理论+实践”双轨并行构建了由八个单元组成的知识体系。
单元一系统阐释了人工智能与数据标注的核心概念,通过梳理人工智能发展历程,制作时间轴,帮助读者建立起理解人工智能与数据标注之间的桥梁。单元二聚焦数据标注技术原理及主流平台介绍,通过制作思维导图的方式,帮助读者搭建系统性知识框架,深化对数据标注核心知识的理解与把握。单元三~六将文本、音频、图像、视频数据标注作为核心实践模块,分别介绍针对不同类型数据的标注方法、类型、常用工具、应用场景。通过文本情感分析判别标注、智能车载语音数据标注、人脸关键点标注、视频车辆标注等多个具有真实数据与典型场景的实践任务,帮助读者全面掌握各类数据标注的技术要点,提升实际操作技能。单元七从产业应用视角出发,系统讲解数据标注项目需求分析、人员安排、进度把控、质量监督等关键环节的全流程管理,通过设计项目实施计划的实践任务,帮助读者将理论知识转化为实际项目管理能力。单元八立足人工智能行业前沿,深入剖析数据标注技术的创新方向与产业发展动态,并结合职业技能标准,对数据标注员的职业发展进行详细解读。通过制定个人职业规划的实践任务,引导读者明确职业定位,把握行业发展机遇。
本书特色如下:
(1)系统全面。本书从数据标注的基础理论出发,全面覆盖了数据标注各环节的关键技术。通过对不同类型数据(文本、音频、图像、视频)标注的系统讲解,本书能够为读者构建一个完整的数据标注知识体系。通过系统全面地介绍有关数据标注的基本概念、理论知识和应用场景,让读者能够初步理解人工智能和机器学习模型的训练过程,初窥各类智慧场景背后的逻辑。
(2)实战教学。本书将理论知识与实际应用紧密结合,从各行各业的业务场景中选取了多个真实项目,为读者提供丰富的实践练习。书中所使用的标注数据集均为真实数据,具有较高的代表性和实用价值。通过对这些真实数据集的标注和处理,读者不仅能将数据标注的理论、工具和方法应用于实践,完成实际的数据标注工作,还能更直观地了解数据标注在不同场景下的应用。
(3)课证融通。本书融合《人工智能训练师国家职业技能标准(2021年版)》中“数据标注员”工种的技能标准与《数据标注职业技能等级标准》,从职业技能等级划分、面向职业岗位(群),到职业技能(能力)要求,各个知识点与考证要点紧密关联,帮助读者构建完整的知识框架,系统学习考证必备知识,助力读者顺利持证上岗,为职场之路添砖加瓦。
(4)平台多样。为模拟真实工作场景,本书特意引入开源、众包、企业级三类演练平台。为每个单元配置1~3个多平台项目,读者可根据自身条件和需求,灵活完成标注任务。
(5)资源丰富。本书配有丰富的教学资源,包括微课视频、电子课件、教案、真实数据源、课后习题答案等,读者通过扫描书中的二维码即可观看微课,其他资源可以访问中国铁道出版社教育资源数字化平台(https://www.tdpress.com/51eds)进行下载。
为编写本教材,上海恒行元锦数字科技有限公司(下文简称“恒行元锦”)和河南多鲸信息技术有限公司(下文简称“河南多鲸”)成立专项组,由外聘专家、公司管理层、项目负责人、技术人员等构成。本书由长期从事教学研究与人工智能行业实践工作的任健和钱颖丰及来自上海人工智能研究院的尹智担任主编并统稿,由深入了解行业动态和流程管理的袁婷婷、侯玲玲、李丽君担任副主编,王浩参与编写并负责提供实践案例,姜传宇参与编写并审校教材内容,刘迎营进行资料查阅及参与编写工作。编者丰富的行业经验和深厚的专业知识,确保了教材内容的前沿性与实用性。
随着技术的不断进步,数据标注的未来充满无限可能,新的需求和挑战也将不断涌现。期待本书能够激发读者的学习热情,期待读者在学习中不断发现、不断成长,紧跟技术发展的步伐,实现自己的职业梦想。
在编写过程中,尽管编者力求准确和全面,但也难免会有疏漏之处。对于教材中存在的疏漏或不足之处,敬请各位读者批评指正。
编 者
2025年3月 -
目录
单元一初识人工智能与数据标注…………………………………………………………1【学习目标】……………………………………………………………………………………1【情景引导】……………………………………………………………………………………1【框架导图】……………………………………………………………………………………2【知识准备】……………………………………………………………………………………2一、数据标注概述………………………………………………………………………2二、人工智能基础………………………………………………………………………3【实践项目】…………………………………………………………………………………10项目人工智能与数据标注发展脉络可视化………………………………………10【单元小结】…………………………………………………………………………………14【课后练习】…………………………………………………………………………………14【学习评价】…………………………………………………………………………………16单元二数据标注技术与平台…………………………………………… -
作者介绍
任健,副教授,上海信息技术学校副校长兼信息管控中心主任、服务保障中心主任。获全国优秀共青团干部、上海市青年五四奖章。负责世界技能大赛网站技术项目中国集训基地建设,培育世赛铜牌选手;承办20余个ICT赛项,带领师生斩获40余枚金牌。曾主持开发2个上海市专业教学标准,上海市教学成果二等奖,主编多本规划教材。创新构建“企业主导”的专业群建设模式,助力建成五星级实训中心,成功申报市级教师教学创新团队。带领团队在“安全检测防护”“无人机巡检化工基地”等项目中,两次获上海市特等奖,并荣获国赛铜奖、银奖。 钱颖丰,软件设计师、量化分析师、经济师、PMP、ACP,上海恒行元锦数字科技有限公司副总经理、华东师范大学通信(电子)校友会理事、上海市职业学校特聘兼职教师、上海电子信息职业技术学院外聘教师,研究方向为模式识别与智能系统,在高校和企事业单位从事教学内训工作10余年,获省部级荣誉1项,主授Python程序设计、C语言程序设计、信息安全与管理等课程,具有丰富的人工智能、大数据领域技术经验,以及职业教育、高等教育授课经验。曾在核心期刊、EI会议等发表人工智能相关论文2篇,参与编写教材3本。 -
编辑推荐
(1)系统全面。本书从数据标注的基础理论出发,全面覆盖了数据标注各环节的关键技术。通过对不同类型数据(文本、音频、图像、视频)标注的系统讲解,本书能够为读者构建一个完整的数据标注知识体系。通过系统全面地介绍有关数据标注的基本概念、理论知识和应用场景,让读者能够初步理解人工智能和机器学习模型的训练过程,初窥各类智慧场景背后的逻辑。
(2)实战教学。本书将理论知识与实际应用紧密结合,从各行各业的业务场景中选取了多个真实项目,为读者提供丰富的实践练习。书中所使用的标注数据集均为真实数据,具有较高的代表性和实用价值。通过对这些真实数据集的标注和处理,读者不仅能将数据标注的理论、工具和方法应用于实践,完成实际的数据标注工作,还能更直观地了解数据标注在不同场景下的应用。
(3)课证融通。本书融合《人工智能训练师国家职业技能标准(2021年版)》中“数据标注员”工种的技能标准与《数据标注职业技能等级标准》,从职业技能等级划分、面向职业岗位(群),到职业技能(能力)要求,各个知识点与考证要点紧密关联,帮助读者构建完整的知识框架,系统学习考证必备知识,助力读者顺利持证上岗,为职场之路添砖加瓦。
(4)平台多样。为模拟真实工作场景,本书特意引入开源、众包、企业级三类演练平台。为每个单元配置1~3个多平台项目,读者可根据自身条件和需求,灵活完成标注任务。
(5)资源丰富。本书配有丰富的教学资源,包括微课视频、电子课件、教案、真实数据源、课后习题答案等,读者通过扫描书中的二维码即可观看微课,其他资源可以访问中国铁道出版社教育资源数字化平台(https://www.tdpress.com/51eds)进行下载。 -
书评书荐
-
附件下载
图书推荐



