发现商业评论 旗下
洞察商业 启迪未来

微软推出四款AI语音模型,提供更自然交互体验

   时间:2023-09-22 10:42 来源:发现者网

【发现者网】9月22日消息,随着生成式人工智能(AI)技术在全球范围内风靡,用户对于与AI进行对话时的文本转语音的自然性和表现力提出了更高的要求。为了满足这一需求,微软今天宣布推出了四款全新的TTS(文本转语音)语音模型,分别是en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNerual以及zh-CN-YunjieNeural。这些语音模型目前正在美国东部、东南亚和西欧三个市场提供公共预览版。

据发现者网了解,这四款TTS语音模型的目标是提供更加自然、生动且具有吸引力的语音交互体验。微软官方表示,通过这些模型,聊天声音将更贴近现实,更自然,为用户带来更加身临其境的感觉。

微软在新闻稿中展示了这四款TTS语音模型的对比效果,并演示了它们在不同语气风格下的表现。这些演示令人印象深刻,为开发者和用户提供了一个了解这些语音模型潜力的机会。

微软还提供了使用Azure Speech SDK和REST API将这些语音模型集成到现有应用程序中的方法,以便开发者能够充分利用这些新技术来提升其应用的用户体验。这一举措将为语音交互技术的发展带来更多的可能性,使用户可以更轻松地与人工智能进行沟通和互动。

 
标签: 微软
 
更多>同类内容
全站最新
热门内容