Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

最新上架

  • 会员
    本书全程图解式讲解,通过大量全彩插图拆解概念,让读者真正告别学习大模型的枯燥和复杂。全书分为三部分,依次介绍语言模型的原理、应用及优化。第一部分理解语言模型(第1~3章),解析语言模型的核心概念,包括词元、嵌入向量及Transformer架构,帮助读者建立基础认知。第二部分使用预训练语言模型(第4~9章),介绍如何使用大模型进行文本分类、聚类、语义搜索、文本生成及多模态扩展,提升模型的应用能力。第
    (沙特)杰伊·阿拉马尔 (荷)马尔滕·格鲁滕多斯特计算机16.4万字
  • 会员
    本书从技术角度深度解析大模型的原理,从大模型的基础概念及领域发展现状入手,概述大模型的理论基础,介绍OpenAIGPT、清华大学GLM、MetaLlama等主流大模型的技术原理,并从大模型参数高效微调、大模型指令微调、大模型训练优化和大模型推理优化等多角度解析大模型背后的技术,带领读者全方位掌握大模型的原理和实践方法。本书最后介绍私有大模型的构建,手把手指导读者做技术选型并搭建自己的私有大模型
    文亮 江维计算机12.2万字
  • 会员
    在人工智能技术快速发展的时代,DeepSeek?作为国产自研的高性能?AI模型,在多领域得到广泛应用。本书是关于DeepSeek的实践指南,分为基础认知、开发实战、高能应用3篇。基础认知篇介绍DeepSeek的核心功能、使用方法与对话技巧;开发实战篇讲解DeepSeekAPI的申请与使用,以及部署方法;高能应用篇展示DeepSeek在多媒体生成、办公软件、智能助手方面的应用。本书内容由浅入深,涵
    李艮基 曹方咏峥 肖灵儿编著计算机3.3万字
  • 会员
    本书深入探讨了RAG技术体系及其应用,内容涉及从基础概念到高级应用的各个方面。首先,解构了大模型应用的基本模式与局限性,并引入RAG作为增强生成能力的一种方法,讲解了RAG的核心概念、组成结构及应用场景,还涵盖了RAG的基础、高级、模块化和智能体形式的技术体系。其次,以LlamaIndex为工具,展示了如何实现RAG,包括提示词设计、文档与索引创建、上下文检索及查询引擎构建等具体步骤。最后,介绍了
    郑天民计算机10万字
  • 会员
    我们在运用AI的时候,有时得不到自己想要的回答,于是责怪AI不够智能。我们容易忽略的是,AI的回答质量往往取决于提问的质量。《秒懂AI提问:让人工智能成为你的效率神器》系统地介绍了20种向AI提问的有效方法,用这些方法可以让AI给出高质量的回答。在介绍提问方法时,本书紧扣日常工作和生活,并通过对比让读者直观感受不同提问方法的效果,最后引出更多场景下的应用,让读者真正学以致用。《秒懂AI提问:让人工
    秋叶 刘进新 姜梅 定秋枫计算机5.4万字
  • 会员
    这是一本面向初中级读者的Agent学习指南,作者既是资深的AI技术专家,又是经验丰富的项目导师,融合作者亲身实践、培训反馈与官方资源,为Agent使用者和开发者提供了快速上手的实用指导。本书从基础知识、操作和应用开发3个维度循序渐进地讲解Agent实战技巧,分为三篇:基础篇(1~2章):介绍Agent定义、发展历程、常用开源技术、主要组件等基础知识和开发环境的搭建过程。应用篇(3~6章):从通用型
    高强文计算机7.2万字
  • 会员
    (1)AI与AIGC基础知识:从基础入手,深入讲解AI技术的基本概念和原理。通过通俗易懂的讲解和示例,帮助读者建立坚实的理论基础,为后续章节的深入学习打下良好基础。(2)智能设备上的AIGC系统设计:详细介绍AIGC技术在实际应用过程中的各种功能设计和实现方法。内容涵盖算法选择、模型训练、系统集成等各个环节,通过丰富的技术细节和设计策略,帮助读者全面掌握AIGC技术的应用要点。(3)AIGC关键工
    刘冰计算机18万字
  • 会员
    DeepSeek是一种生成式人工智能(AI)大模型,擅长处理复杂任务,具有训练效率高、成本低、性能强、开源等优势,吸引了全世界的关注。本书是写给DeepSeek初学者的快速上手实践指南。本书通过项目实例进行讲解,手把手地教读者如何使用DeepSeek。本书共6章,首先对DeepSeek进行概述,包括其成长路线、优势、技术原理、应用场景、应用方式等;其次讲解如何为DeepSeek写提示词,包括结构化
    李强编著计算机3.6万字
  • 会员
    对于我们每个普通人而言,核心的AI能力不是写作不是绘画,也不是编码,而是AIAgent设计!这是一本能帮助每个人轻松构建从提示词编写到AIAgent设计完整知识体系的实战指南,由LangGPT社区的的创始人等几位国内提示词编写和AIAgent设计领域的领军人物撰写,得到了硅基流动创始人袁进辉、润米咨询创始人刘润、通往AGI之路创始人AJ等众多行业专家的高度评价。设计AIAgent,提示词是
    云中江树 王照华 伊丽琦 李继刚计算机21.3万字