欢迎来到中国铁道出版社有限公司官网!
$itImage.title$

大模型技术与应用

书      号:9787113319748

丛  书 名:“十五五”普通高等院校新形态一体化系列教材

作      者:井超

译      者:

开      本:大16开

装      帧:平装

正文语种:汉文

出  版 社:中国铁道出版社

定      价:59.8

  • 内容简介

    本书是关于人工智能中大模型的案例教程,以简洁明快的语言讲解了大模型的相关概念、原理和使用方式。全书共分11章,内容包括大模型概述、大模型产品概述、使用大模型、基于FastGPT平台的知识库微信机器人、基于NeRF模型的三维场景重建、基于OpenCV所实现的CP-VTON虚拟试衣技术、基于Bert-VITS2的语音转换、基于RWKV模型和DeepSeek框架的AI小说写作、基于StableDiffusion大模型的图像构造、AI数字人对话系统和基于PaddleDetection的印制电路板瑕疵检测识别。本书在讲解理论知识的同时,配有大量的实践案例,便于读者掌握和巩固所学内容。 本书适合作为普通高等院校人工智能专业和计算机相关专业人工智能课程的教材,也可作为有一定大模型技术基础的读者的参考书。
  • 前言

    当今时代, 人工智能无疑是炙手可热的话题, 而在人工智能中, 关注度最高的非大模型莫属。 关于大模型, 开始特指大语言模型, 随着 OpenAI 公司 ChatGPT 的出现和发展, 各种各样的人工智能产品离人们越来越近, 与此同时, 关于如何使用各类大模型产品也逐渐走入了人们的视线。 大模型凭借其强大的特征提取、 自主学习与复杂任务处理能力, 正深刻变革着互联网、 制造业、 教育、 文娱等多个行业,从日常的智能客服交互到工业场景的精准检测, 从创意内容生成到科学研究辅助, 大模型的应用范围持续拓宽, 成为驱动产业升级与技术创新的核心动力。


    由此, 编者面对技术的不断更新和变革, 针对学生与社会的需求进行了充分归纳与总结, 编写了本书。 由于在众多编程语言中 Python 是目前流行的语言之一, 同时拥有众多的第三方库, 非常利于编写人工智能相关程序, 所以本书的代码都使用 Python 来实现。 Python 语言的简洁性、 易读性与生态完备性, 使其成为连接理论与实践的理想工具, 无论是大模型 API 调用、 深度学习框架部署, 还是数据预处理与可视化, 都能通过简洁的代码高效实现, 极大降低了读者的技术入门门槛。


    全书共由 11 章组成, 内容包括大模型概述、 大模型产品概述、 使用大模型、 基于 FastGPT 平台的知识库微信机器人、 基于 NeRF 模型的三维场景重建、 基于 OpenCV 所实现的 CP-VTON 虚拟试衣技术、基于 Bert-VITS2 的语音转换、 基于 RWKV 模型的 DeepSeek 框架的 AI 小说写作、 基于 Stable Diffusion 大模型的图像构造、 AI 数字人对话系统和基于 PaddleDetection 的印制电路瑕疵检测识别。 第 11 章的案例本不应该属于大模型产品, 但仍然属于人工智能的范畴, 由于这个案例也有一定的意义, 所以也把它收录到了本书之中。 这些案例既涵盖了自然语言处理、 计算机视觉、 语音合成等主流 AI 方向, 又兼顾了工业检测、 游戏 AI 等特色场景, 实现了从基础应用到进阶开发的全覆盖, 帮助读者构建起 “理论认知—工具使用—项目实战” 的完整知识体系。


    本书的 8 个案例, 程序代码都已调试通过, 使用的都是开源的大模型, 并录制了相关的微课视频,读者可以在本地部署。 但由于相关库版本可能有升级, 所以在调试过程中可能需要修改若干代码, 如需帮助, 可以跟编者联系。 本书旨在抛砖引玉, 希望激发读者探索人工智能前沿技术的兴趣。


    本书适合作为普通高等院校人工智能专业和计算机相关专业人工智能课程的教材, 也可作为有一定大模型技术基础的读者的参考书。 使用本书时, 对于初学者, 建议按照章节顺序从头至尾完成阅读, 同时也应进行一定的实操练习。 本书针对具体案例提供了完整的代码包, 可从中国铁道出版社教育资源数字化平台 https:/ / www. tdpress. com/ 51eds 下载。 读者通过调试代码、 修改参数、 拓展功能, 可快速掌握大模型应用开发的核心技巧, 将理论知识转化为实际操作能力, 以更好地适应人工智能行业的快速发展需求。

    本书由井超任主编, 乔钢柱、 梁志剑、 杨霖任副主编。 其中, 乔钢柱编写了第 2 章, 梁志剑编写了第 3 章, 杨霖编写了第 10 章, 其余章均由井超编写。 在本书的编写过程中, 中北大学成昱婧、 任毅、薛彤、 王琰、 闫昱昕、 李立、 周嘉和、 丁俊强、 徐浩铭和李政道同学为我们提供了协助, 在此表示衷心感谢。


    由于时间仓促, 编者水平有限, 书中疏漏与不妥之处在所难免, 恳请读者批评指正。 如果读者需要联系作者, 可以发送电子邮件至: 172646928@ qq. com。


    编 者


    2025 年 11 月
  • 目录

    第1章大模型概述11.1大模型简介21.1.1大模型的定义21.1.2大模型的基本原理与特点21.1.3大模型的基本架构和形式21.2大模型的含义和特征31.2.1AIGC简介31.2.2大模型的含义41.2.3大语言模型41.2.4大模型的特征41.3训练大模型51.3.1预训练51.3.2指令微调51.3.3对齐微调61.4大模型应用的技术路线71.5大模型应用81.6大模型挑战8小结9习题9第2章大模型产品概述102.1人工智能的重要领域———自然语言处理112.1.1自然语言处理问题的由来112.1.2语言智能的探索历程112.2大模型的特点132.3大模型的优势142.3.1规模大142.3.2思维链/逻辑训练142.3.3价值观对齐142.4大模型的不足152.4.1大模型的核
  • 作者介绍

    井超,硕士,实验师,中国计算机学会会员。中北大学教师。现在中北大学大数据学院数据科学与大数据技术系任教并从事教学研究和计算机信息系统、大数据系统应用方面的科研工作。
  • 编辑推荐

    本书配有丰富的立体化资源。
  • 书评书荐

  • 附件下载

图书推荐