会员
强化学习:原理与Python实战
肖智清更新时间:2023-10-19 17:44:38
最新章节:封底开会员,本书免费读 >
本书从原理和实战两个方面介绍了强化学习。原理方面,深入介绍了主流强化学习理论和算法,覆盖资格迹等经典算法和MuZero等深度强化学习算法;实战方面,每章都配套了编程案例,以方便读者学习。全书从逻辑上分为三部分。第1章:从零开始介绍强化学习的背景知识,介绍环境库Gym的使用。第2~15章:基于折扣奖励离散时间Markov决策过程模型,介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论,进而在理论的基础上讲解算法,并为算法提供配套代码实现。基础理论的讲解突出主干部分,算法讲解全面覆盖主流的强化学习算法,包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应,还给出了深度强化学习算法的TensorFlow和PyTorch对照实现。第16章:介绍其他强化学习模型,包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等,以便更好了解强化学习研究的全貌。
品牌:机械工业出版社
上架时间:2023-08-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
最新章节
肖智清
主页
同类热门书
最新上架
- 会员
人形机器人(原书第2版)
本书结合人形机器人研究中各类先进方法,系统地介绍了驱动人形机器人运动的基础知识、推导过程以及应用案例,阐述了人形机器人的运动学、动力学表示方法,解释了ZMP的概念及其与地面反作用力的关系,描述了人形机器人双足行走行为的生成和控制方法,并拓展了其他多种动作的实现方法,最后介绍了动力学建模、仿真和高效动力学的计算方法。计算机8.7万字 - 会员
玩转机器人:DIY智能小车机器人
本书主要介绍使用UG软件、Proteus软件、AltiumDesigner软件进行智能小车机器人设计的方法。本书内容涉及UG软件的模型绘制、模型装配和运动仿真,Proteus软件的电路设计和电路仿真,AltiumDesigner软件的元件库绘制、原理图绘制和PCB绘制。本书从机械结构、电路设计、PCB设计三部分对智能小车机器人进行详细讲解,完整介绍了动力模块零部件绘制、车体模块零部件绘制、零部计算机4.3万字 - 会员
生成式AI入门与AWS实战
本书是专注于如何在AWS上开发和应用生成式AI的实用指南,旨在为技术领导者、机器学习实践者、应用开发者等提供深入了解和应用生成式AI的策略与方法。本书首先介绍了生成式AI的概念及其在产品和服务中的应用潜力,然后详细阐述了生成式AI项目的完整生命周期。作者探讨了多种模型类型,如大语言模型和多模态模型,并提供了通过提示工程和上下文学习来优化这些模型的实际技巧。此外,本书讨论了如何使用LoRA技术对模型计算机10.8万字 - 会员
被算法操控的生活:重新定义精准广告、大数据和AI
这是一个“算法世界”:建立在数据之上的算法指导社会的运行、决定我们能在网上看到什么;它更是自动驾驶、智能管家、未来医疗以至智慧城市的基石。如果我们不了解算法如何使用数据,就无法知道人工智能将如何改变我们的生活。通过采访谷歌和剑桥分析公司的数据专家、亲自模拟高科技巨头的算法模型,萨普特带我们直击智能产品背后的秘密、思考数字科技给社会带来的风险。我们对科技和互联网的日益依赖,使数据研究者能够收集与我们计算机14.8万字 - 会员
智能计算系统:从深度学习到大模型
本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理,第6章回顾深度学习所用的处理器结构从计算机34.9万字 - 会员
自适应和反应式机器人控制:动态系统法
本书主要介绍如何通过动态系统学习控制律,从而使机器人具备实时反应能力。本书首先介绍机器人学习数据的收集方法,然后重点讲解使用动态系统学习控制律的核心技术,使用动态系统进行轨迹规划的方法,以及使用动态系统进行柔性控制和力控制的方法。本书提供大量应用示例,包括机械臂、拟人手和仿人机器人的全身控制等。本书要求读者熟悉关于机器人控制的基础知识,并熟悉机器学习、统计、优化以及动态系统等相关内容,适合作为高等计算机20.3万字 - 会员
智能计算技术与应用
本书面向初学者介绍智能计算的相关概念、典型应用,采用研究性学习方法和P-MASE模型,按照引入问题、寻找方法、问题分析、问题求解、效果评价的模式,讲授智能计算编程、数据获取和预处理、数据可视化、预测数据的值、分类问题、聚类分析、神经网络、智能图像识别、时间序列数据的处理等知识,并给出了两个综合案例。本书深入浅出、案例丰富、可操作性强,适合作为高校智能计算相关课程的入门教材,也适合相关技术人员学习参计算机10.1万字 - 会员
图分析与图机器学习:原理、算法与实践
本书向数据科学家、数据工程师、架构师和业务分析师展示了如何使用领先的图数据库模型TigerGraph,目标是向读者介绍图数据结构、图分析和图机器学习的概念、技术和工具。三位作者介绍了涵盖多种当代业务需求的真实使用案例。读者将探索从互联数据中获取价值的三阶段方法:连接、分析和学习。几乎每章的开头都列出了对应的三个方面的目标:学习图分析和机器学习的概念;用图分析解决特定问题;了解如何使用GSQL查询语计算机12.5万字 - 会员
AI效率手册:从ChatGPT开启高效能
ChatGPT是当下最新、最热门的工具、效率工具,但为什么不同的人使用效果天差地别,整体上来说:一是认知上的不足;二是方法上的不足。这正是本书要解决的问题。本书不仅让读者会用ChatGPT,更尝试让读者意识到自己需要构建一个完整的学习体系,同时本书提供构建这个学习体系的方法。有了这个学习体系,才能真正用好ChatGPT,也不止能用好ChatGPT。读者能够根据自己的需求,用好ChatGPT,既不停计算机22.5万字
同类书籍最近更新
- 会员
这就是ChatGPT
ChatGPT是OpenAI开发的人工智能聊天机器人程序,于2022年11月推出。它能够自动生成一些表面上看起来像人类写的文字,这是一件很厉害且出乎大家意料的事。那么,它是如何做到的呢?又为何能做到呢?本书会大致介绍ChatGPT的内部机制,然后探讨一下为什么它能很好地生成我们认为有意义的文本。人工智能4.7万字 - 会员
自适应和反应式机器人控制:动态系统法
本书主要介绍如何通过动态系统学习控制律,从而使机器人具备实时反应能力。本书首先介绍机器人学习数据的收集方法,然后重点讲解使用动态系统学习控制律的核心技术,使用动态系统进行轨迹规划的方法,以及使用动态系统进行柔性控制和力控制的方法。本书提供大量应用示例,包括机械臂、拟人手和仿人机器人的全身控制等。本书要求读者熟悉关于机器人控制的基础知识,并熟悉机器学习、统计、优化以及动态系统等相关内容,适合作为高等人工智能20.3万字 - 会员
智能计算系统:从深度学习到大模型
本书由中科院计算所、软件所的专家学者倾心写就,以“图像风格迁移”应用为例,全面介绍智能计算系统的软硬件技术栈。第2版以大模型为牵引进行更新,第1章回顾人工智能、智能计算系统的发展历程,第2、3章在介绍深度学习算法知识的基础上增加了大模型算法的相关知识,第4章介绍深度学习编程框架PyTorch的发展历程、基本概念、编程模型和使用方法,第5章介绍编程框架的工作原理,第6章回顾深度学习所用的处理器结构从人工智能34.9万字 - 会员
大型语言模型实战指南:应用实践与场景落地
这是一本系统梳理并深入解析大模型的基础理论、算法实现、数据构造流程、模型微调方法、偏好对齐方法的著作,也是一本能手把手教你构建角色扮演、信息抽取、知识问答、AIAgent等各种强大的应用程序的著作。本书得到了零一万物、面壁智能、通义千问、百姓AI、澜舟科技等国内主流大模型团队的负责人的高度评价和鼎力推荐。具体地,通过本书你能了解或掌握以下知识:(1)大型语言模型的基础理论,包括常见的模型架构、领人工智能11.2万字 - 会员
华为MindSpore深度学习框架应用开发实战
全书从逻辑上共分3部分。第一部分由第1章和第2章组成,介绍深度学习的基础理论、MindSpore总体架构和编程基础。第二部分由第3~8章组成,介绍MindSpore框架各子系统的具体情况,包括数据处理、算子、神经网络模型开发、数据可视化组件MindInsight、推理、以及移动端AI框架MindSporeLite。第三部分由第9章和第10章组成,介绍使用MindSpore框架开发和训练的经典深度人工智能13万字 - 会员
AI辅助编程实战
本书深入探讨了AI(人工智能)如何革新软件开发领域,从AI辅助编程的演变、优势与挑战到具体的工具与技术实现,为开发者打开了一个全新的世界。全书共10章,第1章介绍了编程的历史演变和生成式AI的崛起;第2章深入技术细节,解释了AI辅助编程工具的主要功能和工作原理;第3章讨论了提示工程的重要性,以及如何与AI工具进行有效沟通;第4章和第5章通过GitHubCopilot和其他AI编程工具的案例,展示人工智能11万字