Joy RL:强化学习实践教程在线阅读
会员

Joy RL:强化学习实践教程

江季 王琦 杨毅远
开会员,本书免费读 >

计算机网络人工智能7.8万字

更新时间:2025-05-19 16:15:54 最新章节:第12章

立即阅读
加书架
下载
听书

书籍简介

本书是继《EasyRL:强化学习教程》(俗称“蘑菇书”)之后,为强化学习的读者专门打造的一本深入实践的全新教程。全书大部分内容基于3位作者的实践经验,涵盖马尔可夫决策过程、动态规划、免模型预测、免模型控制、深度学习基础、DQN算法、DQN算法进阶、策略梯度、Actor-Critic算法、DDPG与TD3算法、PPO算法等内容,旨在帮助读者快速入门强化学习的代码实践,并辅以一套开源代码框架“JoyRL”,便于读者适应业界应用研究风格的代码。与“蘑菇书”不同,本书对强化学习核心理论进行提炼,并串联知识点,重视强化学习代码实践的指导而不是对理论的详细讲解。本书适合具有一定编程基础且希望快速进入实践应用阶段的读者阅读。
品牌:人邮图书
上架时间:2025-04-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

江季 王琦 杨毅远
主页

最新上架

  • 会员
    本书以DeepSeek应用为基础,讲解了DeepSeek在自媒体、咨询、营销、教育、翻译、职场、编程等多个领域的应用。书中通过丰富的案例和详细的指导,展示了DeepSeek如何帮助自媒体人打造“爆款”内容,如何为咨询提供高效决策支持,如何在营销中实现流量裂变,如何重塑未来学习范式,以及如何助力职场人和企业实现业务增效等。本书内容通俗易懂,案例丰富,无论是AI(ArtificialIntellig
    李艮基 曹方咏峥 肖灵儿编著计算机8.2万字
  • 会员
    本书从人工智能导论入手,阐述人工智能的发展及现状,重点介绍了机器学习和神经网络基础、反向传播原理、卷积神经网络和循环神经网络等内容。本书内容由浅入深,循序渐进,从神经元和感知机入手,逐步讲解深度学习中神经网络基础、反向传播以及更深层次的卷积神经网络、循环神经网络。本书知识体系完整,内容覆盖面广,介绍了深度学习中常用的模型和算法,助力读者多方位掌握深度学习的相关知识。本书可作为高等院校计算机等相关专
    肖睿 程鸣萱编著计算机11万字
  • 会员
    本书聚焦通用人工智能的学科内涵与发展趋势,以一套基于“能力与价值双系统”的通用人工智能认知架构与测试模式为核心,梳理形成“一个定义、两个完备性、三个特征、八个关键问题”的理论框架。本书共6章,从人工智能的历史、内涵与哲学基础切入,依次介绍通用人工智能的定义与特征、测试与评级、训练与测试平台,以及TongAI理论框架,最后给出对发展通用人工智能的建议。本书既有助于科技领域的管理者和投资者提纲挈领,把
    朱松纯主编计算机16.4万字
  • 会员
    本书通过81个官方案例解析、120个知识点梳理,深入浅出介绍了Sora的技术原理、特色功能、创新之处、优势特点、文案工具、脚本创作、提示词技巧、绘画工具、创意应用、变现方式等,帮助读者一本书全面精通Sora的AI视频生成技术。10大专题内容、108分钟视频,手机扫码可看精华内容,同时赠送了9大超值资源:74组AI绘画提示词、104个效果文件、165页PPT课件、31集《AI摄影》教学视频、40集《
    智发编著计算机6.8万字
  • 会员
    《秒懂AI写作:让你轻松成为写作高手》针对职场、学习、生活、艺术创作领域常见的40余种写作应用场景,遵循“场景+方法+总结”的框架,详细介绍了如何正确利用AI完成多种写作任务,并归纳出使用AI写作的方法和技巧。《秒懂AI写作:让你轻松成为写作高手》分为6章。第1章通过5个步骤、6大场景介绍了如何驾驭AI完成多种类型的写作任务;第2章至第6章分别详细介绍了在职场应用文写作、商业营销文案写作、新媒体写
    秋叶 刘进新 贾凝墨 万静计算机8.1万字
  • 会员
    本书从ChatGPT的基础知识讲起,针对运营工作中的各种痛点,结合实战案例,如文案写作、图片制作、社交媒体运营、爆款视频文案、私域推广、广告策划、电商平台高效运营等,教会读者如何使用ChatGPT进行智能化工作;还介绍了通过ChatGPT配合Midjourney、D-ID等AI软件的使用,进一步帮助提高运营工作的效率。
    陈振轩计算机11.3万字
  • 会员
    这是一本面向初中级读者的Agent学习指南,作者既是资深的AI技术专家,又是经验丰富的项目导师,融合作者亲身实践、培训反馈与官方资源,为Agent使用者和开发者提供了快速上手的实用指导。本书从基础知识、操作和应用开发3个维度循序渐进地讲解Agent实战技巧,分为三篇:基础篇(1~2章):介绍Agent定义、发展历程、常用开源技术、主要组件等基础知识和开发环境的搭建过程。应用篇(3~6章):从通用型
    高强文计算机7.2万字
  • 会员
    本书共分为10章。第1章介绍短视频文案与AIGC;第2章为AIGC工具助力文案选题策划;第3章为短视频标题撰写与优化;第4章为短视频脚本与情节设计;第5章为短视频带货文案写作;第6章为评论区互动文案写作;第7章为段子文案写作;第8章为短视频内容标签化;第9章为短视频营销文案写作;第10章为短视频与AI的有机结合。
    邵诗雨编著计算机8.8万字
  • 会员
    本书结合AI原生应用落地的大量实践,系统讲解提示工程的核心原理、相关案例分析和实战应用,涵盖提示工程概述、结构化提示设计、NLP任务提示、内容创作提示、生成可控性提示、提示安全设计、形式语言风格提示、推理提示和智能体提示等内容。本书的初衷不是告诉读者如何套用各种预设的提示模板,而是帮助读者深入理解和应用提示设计技巧,以找到决定大语言模型输出的关键因子,进而将提示工程的理论知识应用到产品设计中。本书
    魏承东计算机18.2万字