【发现者网】9月22日消息,随着生成式人工智能(AI)技术在全球范围内风靡,用户对于与AI进行对话时的文本转语音的自然性和表现力提出了更高的要求。为了满足这一需求,微软今天宣布推出了四款全新的TTS(文本转语音)语音模型,分别是en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNerual以及zh-CN-YunjieNeural。这些语音模型目前正在美国东部、东南亚和西欧三个市场提供公共预览版。
据发现者网了解,这四款TTS语音模型的目标是提供更加自然、生动且具有吸引力的语音交互体验。微软官方表示,通过这些模型,聊天声音将更贴近现实,更自然,为用户带来更加身临其境的感觉。
微软在新闻稿中展示了这四款TTS语音模型的对比效果,并演示了它们在不同语气风格下的表现。这些演示令人印象深刻,为开发者和用户提供了一个了解这些语音模型潜力的机会。
微软还提供了使用Azure Speech SDK和REST API将这些语音模型集成到现有应用程序中的方法,以便开发者能够充分利用这些新技术来提升其应用的用户体验。这一举措将为语音交互技术的发展带来更多的可能性,使用户可以更轻松地与人工智能进行沟通和互动。