# 语音AI

可以控制程序收集音频元素,并转换成文字


# 语音识别(阿里云)

此方法开启后,将识别语音转换为文字

语法 listen(t)

参数 t: table类型,包含阿里云的appkey,accesskey_id,secret 三个参数

阿里云参数 app_key,ak_id,ak_secret 获取方式

t ={
    app_key ="******", -- 阿里云 中创建项目的appkey
    ak_id ="****", --阿里云管理后台中 创建的 accesskey_id
    ak_secret ="******" --阿里云管理后台中 创建的 accesskey_id 与之匹配的 secret
}

res =  listen(t);
print(res)

1
2
3
4
5
6
7
8
9

# 语音合成(阿里云)

  • 此方法开启后,会讲一段文本,转换为语音播放出来。
  • 该方法会生成pcm音频文件,并返回pcm文件地址
  • 如果所有参数不变的情况下,会默认发音本地缓存的pcm文件,不会另行请求阿里云服务器

语法 talk(msg,options)

阿里云参数 appkey,accesskey_id,secret 获取方式

发声模型-声音类型 (opens new window)

options ={
    appkey="******", -- (需阿里云后台获取) 创建项目的appkey
    accesskey_id ="***", --(需阿里云后台获取) 阿里云管理后台中 创建的 accesskey_id
    secret = "****",--(需阿里云后台获取) 阿里云管理后台中 创建的 accesskey_id 与之匹配的 secret
    font_name="siyue", -- 发声模型 https://help.aliyun.com/document_detail/173642.html 
    speed_level="1", -- 语速
    volume="50", -- 音量播报 (1-100)
    asyn = false -- 是否异步播报,asyn = true 时,不阻塞lua程序
}

local path = talk("欢迎倪妮来到直播间",options)

print(path)-- 这是合成后的pcm文件路径

options['font_name'] = "andy";
options['speed_level'] = "1.1";

talk("Welcome to online Nini",options)

-- sleep(10000)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20

# 阿里云相关配置获取

# 注册登陆阿里云

阿里云地址https://www.aliyun.com (opens new window)

# appkey

appkey 是阿里云服务器中项目的key 我们需要创建,并配置这个项目

  • 创建+配置+获取appkey 项目

    1. 进入智能语音交互
    1. 点击我的项目
    1. 创建并配置项目,获取appkey

# accesskey_id 和 secret

accesskey_id 和 secret 是成对出现的

是阿里云 安全访问服务的 id 和 密码

获取步骤如下

  1. 进入控制台
  1. 进入控制台后,鼠标悬浮至右上方头像,出现弹框后选择 accesskey
  1. 进入控制台后,鼠标悬浮至右上方头像,出现弹框后选择 accesskey