强化学习又称激励学习、评价学习或增强学习,是机器学习范式和方法论之一,描述和解决智能体(Agent)在与环境的交互过程中通过学习策略以达成回报最大化。本实验通过示例理解 Q-Learning 算法基本原理。建筑中有 5 个房间,房间通过门相连,房间编号为 0-4,外围视为一个大房间 5。个人用户获取视频内相关代码及数据集,请访问企业网站,扫描【知识微店(个人用户)】二维码关注或订阅。注:全部实验演示视频、代码、数据集仅授权予个人用户学习与实验使用,禁止用于二次销售、课堂教学及培训用途。视频原创制作:广州跨象乘云软件技术有限公司