城市公共空间,如街道景观和广场,服务于居民,并容纳社会生活中所有的活力变化。机器人技术和具身人工智能的新进展使城市公共空间不再是人类独有的。送餐机器人和电动轮椅已经开始与行人共用人行道,而各种各样的机器人狗和类人机器人最近也在街上出现。在城市空间中,确保这些即将到来的移动机器的通用性和安全性在穿越繁华街道的过程中至关重要。在本工作中,我们介绍了一个用于城市空间中的具身智能研究的组合模拟平台MetaUrban。MetaUrban可以从组成元素中构建无穷多的交互式城市场景,涵盖了大量的地面平面图、物体放置、行人、弱势群体道路使用者以及其他移动智能体的外观和动态。我们使用MetaUrban进行具身智能研究,设计了点导航和社交导航任务作为先导研究,并建立了强化学习和模仿学习的各种基线。实验表明,模拟环境的组合特性可以显著提高训练的移动智能体的泛化性和安全性。