我们提出了一种新颖的探索框架,使用深度学习( Deep Learning,DL )来预测给定先前观测的最可能的室内地图,并使用深度强化学习( Deep Reinforcement Learning,DRL )进行探索,旨在运行在现代SWaP约束神经处理器上。基于DL的地图预测器提供了对不可视环境占用情况的预测,而基于DRL的规划器则确定了可以安全到达的最佳导航目标,以提供最多的信息。 这两个模块紧密耦合,并在车上运行,使车辆能够安全地映射未知环境。大量的实验和仿真结果表明,我们的方法在效率上超过了最先进的方法50 - 60 %,其中我们用探索空间的分数作为轨迹长度的函数来衡量。