Gemini 1.5 Pro展示了其卓越的跨模态理解能力,它能够处理和分析多种类型的数据。在处理长篇文本方面,它能够阅读并理解长达44分钟的1924年无声电影的剧本,准确地捕捉到电影的情节要点和细节。更令人印象深刻的是,该模型还能通过分析一张简单的线条画,识别出电影中的特定场景。 这些功能目前是GPT-4所不具备的。