
会员
大语言模型:原理、应用与优化
更新时间:2024-12-18 17:07:10 最新章节:封底
书籍简介
这是一本从工程化角度讲解大语言模型的核心技术、构建方法与前沿应用的著作。首先从语言模型的原理和大模型的基础构件入手,详细梳理了大模型技术的发展脉络,深入探讨了大模型预训练与对齐的方法;然后阐明了大模型训练中的算法设计、数据处理和分布式训练的核心原理,展示了这一系统性工程的复杂性与实现路径。除了基座模型的训练方案,本书还涵盖了大模型在各领域的落地应用方法,包括低参数量微调、知识融合、工具使用和自主智能体等,展示了大模型在提高生产力和创造性任务中的卓越性能和创新潜力。此外,书中进一步介绍了大模型优化的高级话题和前沿技术,如模型小型化、推理能力和多模态大模型等。最后,本书讨论了大模型的局限性与安全性问题,展望了未来的发展方向,为读者提供了全面的理解与前瞻性的视角。无论是人工智能领域的研究员、工程师,还是对前沿技术充满好奇的读者,本书都将是您了解和掌握大模型技术的必备指南。
品牌:机械工业出版社
上架时间:2024-10-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
苏之阳 王锦鹏 姜迪 宋元峰
最新上架
- 会员本书共分为8章,分别讲解了常见的人工智能以及人工智能影响下的广告流量变现、商业合作变现、直播变现、私域变现和IP变现等。此外,还对未来的人工智能与新媒体变现做了趋势分析。计算机10.5万字
- 会员本书从人工智能导论入手,阐述人工智能的发展及现状,重点介绍了机器学习和神经网络基础、反向传播原理、卷积神经网络和循环神经网络等内容。本书内容由浅入深,循序渐进,从神经元和感知机入手,逐步讲解深度学习中神经网络基础、反向传播以及更深层次的卷积神经网络、循环神经网络。本书知识体系完整,内容覆盖面广,介绍了深度学习中常用的模型和算法,助力读者多方位掌握深度学习的相关知识。本书可作为高等院校计算机等相关专计算机11万字
- 会员DeepSeek是一种基于Transformer架构的生成式AI(ArtificialIntelligence)大模型,融合了MoE架构、混合精度训练、分布式优化等先进技术,具备强大的文本生成、多模态处理和任务定制化能力。本书系统性地介绍了开源大模型DeepSeek-V3的核心技术及其在实际开发中的深度应用。全书分三部分共12章,涵盖理论解析、技术实现和应用实践。本书通过深度讲解与实用案例相结合计算机17.1万字
- 会员本书讲解如何利用AI工具来高效制作和设计PPT,全书共分为8章,前面7章分别介绍了PPT不同制作内容的相关知识和技巧,包括软件操作层面、设计思维层面、素材应用层面的内容,第8章模拟了两个真实工作场景下的PPT使用需求,逐步讲解设计的关键环节,旨在帮助读者解决工作中的实际问题。计算机601字
- 会员本书通过实践案例操作,讲述AI绘画的生成步骤,展现了AI绘画的魔法魅力。从历史到未来,跨越百年时空;从理论到实践,讲述案例操作;从技术到哲学,穿越多个维度;从语言到绘画,落地实战演练。AI绘画的诞生,引发了奇点降临,点亮了AGI(通用人工智能),并涉及Prompt、风格、技术细节、多模态交互、AIGC等一系列讲解。计算机5.5万字
- 会员本书共分为8章,涵盖了从数据分析基础知识、常见的统计学方法到使用ChatGPT进行数据准备、数据清洗、数据特征提取、数据可视化、回归分析与预测建模、分类与聚类分析,以及深度学习和大数据分析等全面的内容。计算机10.7万字