Google全新机器人模型Robotic Transformer 2(RT-2)相当于机器人版ChatGPT,被Google DeepMind称作是视觉-语言-动作 (VLA)模型的新版本,可以教会机器人更好地识别视觉和语言模态,能够解释人类用自然语言发出的指令,并推断出如何做出相应的行动。