快捷搜索:

详解 OPPO“明星级”技术能力:Breeno 和 ARunit

在目前的手机产业中,OPPO 凭借其对用户需求的准确把握和将需求转化为产品卖点的能力,已迅速成为主流智能手机品牌,在全球市场份额排名中位居第四,占据了移动互联时代的流量入口。

从 2016 年开始,OPPO 把重点放在开放平台建设上,旨在为开发者打造技术、平台、资源和终端一站式的服务闭环。不久前,OPPO 正式开放 Breeno 语音技能平台的接入,同时不断拓展 ARunit 相关能力,助力开发者打造更加优质的产品。

4 月 13 日在北京举行的 OPPO 技术开放日,OPPO 相关技术和产品负责人现场为大家详细解读 Breeno 和 ARunit 框架的技术能力和开发流程,小编为大家整理了以下内容。

1

如何开发一款语音技能产品?

语音交互技能是这几年才兴起的新鲜事物。它使产品和服务可以覆盖用户的语音交互场景,并快速做出合理的响应。由于支持语音交互的产品和服务,极大地方便了人们的生活,这使语音技能开发成为了新一轮内容及服务的创业蓝海。

语音的技能几乎可以支持现在互联网所有的产品类型,包括信息的查询、益智的游戏、问答等。同时也支持多元化的资源载体,包括 APP、快应用、H5 等。

详解 OPPO“明星级”技术能力:Breeno 和 ARunit

那么,语音技能究竟是怎么开发的?在哪开发?怎么发布? 什么样的语音技能效果好?我们可以从 OPPO 的语音技能平台 Breeno 上寻找答案。

Breeno 语音技能平台,是一个为开发者提供技能创建、测试、部署的工具平台。通过该平台,开发者可享受完全免费的平台服务,更加简单高效地创建优质语音技能,实现了终端用户使用自然语言即可唤醒和使用语音技能的目的,在降低开发成本的同时,又能提高开发效率。

Breeno 语音技能平台框架

Breeno 语音技能平台主要分为三部分:平台工具、审核和上线部分。

在平台工具层中,「基础支撑」是最基础的底层能力,有海量数据和算法支持;「技能形态」是对多元化资源内容的接入形态支持,并提供通用性很强的标准卡片模板,具有广泛性和包容性;「核心流程」是整个框架中最核心的部分,也是开发者能做出优秀语音技能的过程支持。

在审核层中,「审核后台」具有审核流程和标准、审核机制、基本功能支持和技能统计四个模块,审核后台的价值是在技能上线前,帮助开发者把控技能体验。

在上线层中,「技能商店」是直接面向用户的,所以需要具备丰富的信息内容。此外,平台方面会帮助开发者做技能的运营和推荐。

详解 OPPO“明星级”技术能力:Breeno 和 ARunit

在 Breeno 上创建一个语音技能的流程是怎样的?

创建一个语音技能,可以分为六个步骤:语音技术→对话管理→接入方式→在线测试→一键部署→统计监控。Breeno 可以全程提供技术支持。

第一步,语音技术支持。语音技术支持分为四个环节:语音唤醒、语音识别、语音理解和语音合成。在这些环节中,Breeno 为开发者提供的支持有:

在语音唤醒方面,支持包括“打开 + 技能名称”的唤醒,还有“包括唤醒和意图需求的一句话”的唤醒;

在语音识别方面,采用了科大讯飞语音识别模型,识别准确率 95% 以上;

在语义理解方面,提供多种通用系统意图和词典支持,提供在线技能意图的训练模型,提高意图识别准确率;

在语音合成方面,提供中文普通话 TTS 语音播报,还有多种 SMML 播报标签语持续更新中。

第二步,对话管理支持。对话管理部分主要是指语音对话中用到的自然语言处理:

支持单轮和上下文多轮语音交互对话配置;

多轮对话中上下文槽位信息自动继承,从而能高效率管理对话服务。

第三步,接入方式支持。接入方式就是交互展现,用户收到的回复如果只有文本内容,未免太过简陋。Breeno 提供了多种形式的展现模板,并帮助开发者在各种交互形态下进行试验和自适应调整,整体降低了开发者的开发成本。包括:

提供多种卡片的选择,包括:纯文本、图文等基本信息模版,支持点击链接跳转,例如新闻类的技能;还有适合音频内容的多媒体模版;如果针对知识问答,可以选择 FAQ 自动问答配置等;

提供各种交互形态自适应,包括:无屏交互,有屏交互,微屏交互。

第四步,在线测试支持。当整套技能开发完毕后,最让人头疼的问题就是测试。Breeno 提供了模拟器在线模拟测试和真机测试,还支持测试正例上传和存储。

您可能还会对下面的文章感兴趣: