零基础微软AI文本转语音

[MD] © Sunplace,2024

引言

  • 无需搭建服务器
  • 无需代码
  • 无需成本

1. 安装Microsoft Egde浏览器

https://azure.microsoft.com/zh-cn/free

Microsoft Azure规定,这是使用语音创作的先决条件之一。

先用Microsoft Edge的大声朗读功能读一遍文章,确定多音字、英文缩写等的发音是否正确。多音字可以用同音字替换,英文也可以用中文谐音替换。得到清洗后的发音文稿。

2. 创建Microsoft账户

3. 创建Microsoft Azure免费订阅

2.1 使用微软账户登陆https://azure.microsoft.com/zh-cn/free

2.2 验证信用卡,获取免费订阅,无需信用卡的版本

https://azure.microsoft.com/zh-cn/free/students/

前提你拥有学生资格。

学生额度:$100

普通用户额度:$200

3. 登陆Microsoft Azure

https://azure.microsoft.com/zh-cn/free

大陆地区登陆需要很久…

4. 创建应用

4.1 访问:https://portal.azure.com/#home

4.2 创建语音服务

资源组初始时没有,需要新建一个,随便取一个名称

定价层参考:https://azure.microsoft.com/zh-cn/pricing/details/cognitive-services/speech-services/

5. 使用文字转语音

5.1 转到Speech Studio

文本转语音项目组中,找到有声内容创作

5.2 点击我的文件

上传txt文本文件或者创建,每个文件不能超过 20000 个字符,超过了系统自动拆分为多个文件。导出时可以选择按段落或者按拆分后的文件个数导出,不能自动合并。

5.3 打开已经上传的文件

在右侧调音(可按喜好选择):

  • 语言:中文(普通话,简体)
  • 角色:晓伊
  • 说话风格:温柔
  • 发音-朗读规则:数字(.)

直接播放也会消耗额度。

5.4 调整完成后点击保存

5.5 点击导出

选择导出到本地磁盘

音频格式可选wav或mp3

本次用例备注

  • 全文字数: 24674
  • 消费额度: ¥ 20.77
  • 导出总时长: 约 1:25:00
  • 导出文件数: 2

导出的音频也不是完全正常的,用例有多处卡顿。所以大量文字需要试听以识别。