微软听听文档3.0 是一种将文本转换为逼真语音的服务,它允许您创建能够说话的应用程序,并构建全新类别的支持语音功能的产品。微软听听的文本转语音 (TTS) 服务使用高级深度学习技术来合成听起来像自然人类语言的语音。微软听听 提供众多语言的几十种逼真语音,您可以构建适用于许多不同国家/地区的具有语音功能的应用程序。除了标准 TTS 语音外,微软听听 还提供神经文本转语音 (NTTS) 声音,通过全新的机器学习方法提高语音质量。Polly 的神经 TTS 技术还支持新闻主播说话风格,这是针对新闻叙述用例量身定制。