# 语音AI
可以控制程序收集音频元素,并转换成文字
# 语音识别(阿里云)
此方法开启后,将识别语音转换为文字
语法 listen(t)
参数 t: table类型,包含阿里云的appkey,accesskey_id,secret 三个参数
阿里云参数 app_key,ak_id,ak_secret 获取方式
t ={
app_key ="******", -- 阿里云 中创建项目的appkey
ak_id ="****", --阿里云管理后台中 创建的 accesskey_id
ak_secret ="******" --阿里云管理后台中 创建的 accesskey_id 与之匹配的 secret
}
res = listen(t);
print(res)
1
2
3
4
5
6
7
8
9
2
3
4
5
6
7
8
9
# 语音合成(阿里云)
- 此方法开启后,会讲一段文本,转换为语音播放出来。
- 该方法会生成pcm音频文件,并返回pcm文件地址
- 如果所有参数不变的情况下,会默认发音本地缓存的pcm文件,不会另行请求阿里云服务器
语法 talk(msg,options)
阿里云参数 appkey,accesskey_id,secret 获取方式
options ={
appkey="******", -- (需阿里云后台获取) 创建项目的appkey
accesskey_id ="***", --(需阿里云后台获取) 阿里云管理后台中 创建的 accesskey_id
secret = "****",--(需阿里云后台获取) 阿里云管理后台中 创建的 accesskey_id 与之匹配的 secret
font_name="siyue", -- 发声模型 https://help.aliyun.com/document_detail/173642.html
speed_level="1", -- 语速
volume="50", -- 音量播报 (1-100)
asyn = false -- 是否异步播报,asyn = true 时,不阻塞lua程序
}
local path = talk("欢迎倪妮来到直播间",options)
print(path)-- 这是合成后的pcm文件路径
options['font_name'] = "andy";
options['speed_level'] = "1.1";
talk("Welcome to online Nini",options)
-- sleep(10000)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
# 阿里云相关配置获取
# 注册登陆阿里云
阿里云地址https://www.aliyun.com (opens new window)
# appkey
appkey 是阿里云服务器中项目的key 我们需要创建,并配置这个项目
创建+配置+获取appkey 项目
- 进入智能语音交互
- 点击我的项目
- 创建并配置项目,获取appkey
# accesskey_id 和 secret
accesskey_id 和 secret 是成对出现的
是阿里云 安全访问服务的 id 和 密码
获取步骤如下
- 进入控制台

- 进入控制台后,鼠标悬浮至右上方头像,出现弹框后选择 accesskey

- 进入控制台后,鼠标悬浮至右上方头像,出现弹框后选择 accesskey
