Riva 为 AI 从业者和开发者提供了基于深度学习的自动语音识别 (ASR)、文本转语音 (TTS) 和神经网络机器翻译 (NMT) 模型。ASR、TTS 和 NMT 是语音 AI 应用中的语音接口,这类应用包括呼叫中心坐席助理、数字助理、视频通话转录程序以及由大型语言模型 (LLM) 和检索增强型生成技术 (RAG) 驱动的 AI 增强对话工具等。
ASR 可将语音转换为文本,这通常是语音工作流的第一步,因此其转录准确度会影响所有下游任务。TTS 可依据文本生成类似人类的声音。NMT 可将词语从一种语言翻译成另一种语言。
从电信、金融到医疗健康、零售和汽车,Riva 已广泛应用于各行各业;凡是需要公司与客户交流互动的行业,都能看到 Riva 的身影。