指南AI
V:gogoh6

AI语音:文本转语音:借助微软ai语音azure ai

幕言助手 2024-10-16 17:29:34 幕言直播助手 5 ℃ 阿比整蛊源头|厂商微信:gogoh6
正文

近期,微软发布针对对话和各个领域进行优化的全新逼真多语言语音AI语音

微软的多语言语音可以实现跨语言的无缝沟通,使每个人都可以进行联系,无论其母语是什么AI语音。它们可用于客服呼叫中心、车载语音等,以服务更广泛的受众。此外,媒体和教育行业可以利用这些声音进行文章朗读和教学,创造一致的语气并增强整体用户体验。

这些声音也非常适合类似于 Copilot 的应用,为广泛的企业和消费者需求提供多功能解决方案AI语音

接下来看看如何试用↓

先决条件

Azure 订阅AI语音。在 Azure 门户中创建语音资源。获取语音资源密钥和区域。 部署语音资源后,选择“转到资源”以查看和管理密钥。

设置环境

语音 SDK 以 NuGet 包的形式提供,实现了 .NET Standard 2.0AI语音。 稍后使用控制台安装本指南中的语音 SDK。 有关详细的安装说明,请参阅安装语音 SDK。

设置环境变量

需要对应用程序进行身份验证才能访问 Azure AI 服务AI语音。 对于生产环境,请使用安全方式来存储和访问凭据。 例如,获取语音资源的密钥后,请将其写入运行应用程序的本地计算机上的新环境变量。

重要

如果使用 API 密钥,请将其安全地存储在某个其他位置,例如 Azure Key Vault 中AI语音。 请不要直接在代码中包含 API 密钥,并且切勿公开发布该密钥。

有关 Azure AI 服务安全性的详细信息,请参阅对 Azure AI 服务的请求进行身份验证AI语音

若要为语音资源密钥和区域设置环境变量,请打开控制台窗口,并按照操作系统和开发环境的说明进行操作AI语音

要设置 SPEECH_KEY 环境变量,请将“your-key”替换为你的资源的某一个密钥AI语音。要设置 SPEECH_REGION 环境变量,请将 “your-region”替换为你的资源的某一个地区。

WindowsLinuxmacOS

控制台复制

setx SPEECH_KEY your-key setx SPEECH_REGION your-region

备注

如果你只需要访问当前控制台中的环境变量,可使用 set(而不是 setx)来设置环境变量AI语音

添加环境变量后,你可能需要重启任何需要读取环境变量的程序(包括控制台窗口)AI语音。 例如,如果使用 Visual Studio 作为编辑器,请在运行示例之前重启 Visual Studio。

创建应用程序

按照以下步骤创建控制台应用程序并安装语音 SDKAI语音

在需要新项目的文件夹中打开命令提示符窗口AI语音。 运行以下命令,使用 .NET CLI 创建控制台应用程序。

.NET CLI复制

dotnet new console

该命令会在项目目录中创建 Program.cs 文件AI语音。使用 .NET CLI 在新项目中安装语音 SDK。

.NET CLI复制

dotnet add package Microsoft.CognitiveServices.Speech将 Program.cs 的内容替换为以下代码AI语音

C#复制

using System; using System.IO; using System.Threading.Tasks; using Microsoft.CognitiveServices.Speech; using Microsoft.CognitiveServices.Speech.Audio; class Program { // This example requires environment variables named "SPEECH_KEY" and "SPEECH_REGION" static string speechKey = Environment.GetEnvironmentVariable("SPEECH_KEY"); static string speechRegion = Environment.GetEnvironmentVariable("SPEECH_REGION"); static void OutputSpeechSynthesisResult(SpeechSynthesisResult speechSynthesisResult, string text) { switch (speechSynthesisResult.Reason) { case ResultReason.SynthesizingAudioCompleted: Console.WriteLine($"Speech synthesized for text: [{text}]"); break; case ResultReason.Canceled: var cancellation = SpeechSynthesisCancellationDetails.FromResult(speechSynthesisResult); Console.WriteLine($"CANCELED: Reason={cancellation.Reason}"); if (cancellation.Reason == CancellationReason.Error) { Console.WriteLine($"CANCELED: ErrorCode={cancellation.ErrorCode}"); Console.WriteLine($"CANCELED: ErrorDetails=[{cancellation.ErrorDetails}]"); Console.WriteLine($"CANCELED: Did you set the speech resource key and region values?"); } break; default: break; } } async static Task Main(string[] args) { var speechConfig = SpeechConfig.FromSubscription(speechKey, speechRegion); // The neural multilingual voice can speak different languages based on the input text. speechConfig.SpeechSynthesisVoiceName = "en-US-AvaMultilingualNeural"; using (var speechSynthesizer = new SpeechSynthesizer(speechConfig)) { // Get text from the console and synthesize to the default speaker. Console.WriteLine("Enter some text that you want to speak "); string text = Console.ReadLine(); var speechSynthesisResult = await speechSynthesizer.SpeakTextAsync(text); OutputSpeechSynthesisResult(speechSynthesisResult, text); } Console.WriteLine("Press any key to exit..."); Console.ReadKey(); } }若要更改语音合成语言,请将 en-US-AvaMultilingualNeural 替换为另一种受支持的语音AI语音

所有神经网络声音都是多语言的,并且能够流利地使用自己的语言和英语AI语音。 例如,如果英语的输入文本为“I'm excited to try text to speech”并且你设置了 es-ES-ElviraNeural 作为语言,则该文本将用带西班牙口音的英语讲出。 如果语音使用的不是输入文本的语言,则语音服务不会输出合成的音频。运行新的控制台应用程序,开始将语音合成到默认扬声器。

控制台复制

dotnet run

重要

请确保设置 SPEECH_KEY 和 SPEECH_REGION环境变量AI语音。 如果未设置这些变量,示例会失败并显示错误消息。输入要朗读的一些文本。 例如,键入“我对尝试文本转语音非常兴奋”。 选择 Enter 键可听到合成的语音。

控制台复制

Enter some text that you want to speak I'm excited to try text to speech

注解

更多语音合成选项

此快速入门使用 SpeakTextAsync 操作合成你输入的简短文本块AI语音。 你还可以使用文件中的长格式文本,并更好地控制语音风格、韵律和其他设置。

请参阅如何合成语音和语音合成标记语言 (SSML) 概述,了解文件中的语音合成以及如何才能更好地控制语音样式、音调和其他设置AI语音。请参阅文本转语音的批量合成 API,了解如何将长格式文本合成为语音。

Azure AI 语音中的 OpenAI 文本转语音

还支持 OpenAI 文本转语音AI语音。 请参阅 Azure AI 语音中的 OpenAI 文本转语音声音和多语言语音。 可以将 en-US-AvaMultilingualNeural 替换为受支持的 OpenAI 语音名称,例如 en-US-FableMultilingualNeural。

本文TAG:

V:gogoh6

幕言互游在线咨询

上班时间:9:00-22:00
周六、周日:14:00-22:00
wechat
打开微信扫一扫,加我好友!

无限流量卡免费领取

点击预约
免费领取 先到先得