产品与技能
在DUI系统上,完成设备赋能语音的过程,主要通过DUI系统的产品和技能来完成,那什么是产品和技能呢、二者之间有什么联系和区别,接下通过以下方面来进行介绍:
在生产环节
产品即语音系统,技能即安装在语音系统的上技能(软件),为了让大家能更好的理解,先介绍下技能和产品间的在生产环节:
在开始安装前,需要完成这个语音交互系统的生产过程,生产语音交互系统的过程,就是让整个全链路的语音技术,按照硬件和用户使用流程完成生产的过程,一部分的生产则需要和硬件能力相互依赖、一部分的能力则需要对应的资源支撑。
大家要知道一个电脑要完成用户动作指令的执行则需要有:硬件的处理能力、系统的支持和对应软件的完成;对于搭载智能硬件的语音交互系统其实也是这个的过程,为了让大家能更清晰的了解,举个例子:
硬件 |
系统 |
软件 |
过程说明 |
---|---|---|---|
电脑 |
Window |
浏览器 | 用户要想上网完成信息查询则需要电脑能联网、系统能安装上网的浏览器软件,只有三者结合才能完成用户上网动作的执行 |
智能音箱 | 语音交互系统 | 查天气 |
用户想要通过智能音箱完成查天气也需要这个智能音箱能联网,音箱的语音系统上安装了查天气技能(对应电脑的软件),只要这三者结合才能完成这个用户动作的执行 |
明白上述概念后,再来看看语音系统的生产其实则是,包括,语音系统本身的生产加上能安装在语音系统上技能(软件)的生产,已经默认自带技能的安装的过程,为了能更清晰的了解,我们来看下面的表格:
环节 |
说明 |
---|---|
语音系统生产 |
语音系统本身的生产分为两部分: (1)与硬件能力的结合,能发挥硬件的效能,主要有信号采集、信号处理、支持语音唤醒,以后后续让技能能直接控制硬件的操作(声音大小的控制等) (2)声音到执行命令的处理支持,就是大家常说的语音识别、语义理解、对话管理等环节。 |
技能的生产 | 技能生产则是基于语音系统的要求,来完成对应用户特定功能的开发过程,如果查天气、放音乐等,这个技能开发过程除了需要支持用户使用方式之外还需要支持对应资源的调用,如音乐资源,天气资源等 |
技能的安装 | 完成系统的开发后和技能生产后,还需要把技能直接预装在系统上,这样把系统烧录在设备上了,这样设备上就直接带有系统和技能(技能),接下来用户在拿到设备后开机后就能直接使用了。 |
在使用环节
在使用环节则可以通过下面的图来看看这个过程,用户如何基于设备和系统来完成自己场景的实现,即完成语音播放音乐、查天气的过程,那来看看这个过程怎么实现的。
基于语音全链条技术,可以大致通过下列图标的分类来了解产品系统和技能软件间的关系:
例子 |
U:XX音箱; S:放一首歌; U:好的,为您播放好评最高的由邓丽欣演唱的《黑白照》 |
|||||
产品系统环节 | 语音唤醒 | 声音采集 | 信号处理 | 语音识别 | 语义理解 | 对话管理 |
唤醒设备 | 采集用户声音 | 按照格式传输声音 | 把用户声音变成文字 | 理解用户的文字 | 基于理解的文字执行对应的动作,如打开技能 | |
技能环节 | 命中技能 |
语义理解
|
资源调用 |
回复生成 | 语音合成 | 动作执行 |
音乐技能 |
为用户放一首歌 播放条件为好评最好的歌曲 |
播放邓丽欣演唱的《黑白照》 | 生成要播报的文本:好的,为您播放好评最高的由邓丽欣演唱的《黑白照》 | 通过合成的音色,播报文本 | 打开系统音乐播放控制,播放该音乐 |
另外,在产品(系统)和技能(软件)方面,基于语音技术的大致分为,基本还可以分为以下方面:
环节 | 涉及语音技术的大致分类 | 说明 |
---|---|---|
产品(系统) |
声音采集、声音处理、语音唤醒语音识别、语义理解、对话管理 |
1、在整个全链路语音技术方面,会存在在产品系统和技能软件部分共同都会使用的部分; 2、在共同使用方面主要区别是产品是基于公共领域,而技能在针对对应功能领域。 |
技能(软件) |
语义理解、对话管理、资源调用、回复生成、动作执行、语音合成 |
|
-------------------------------------------------------------------------------------------------- |
好啦,至此,您对DUI的产品(系统)、技能(软件)间的关系有了大致的了解了吧,那接下来则可以开始您的产品赋能之旅了吧。