IA vocale et IA pour la traduction

NVIDIA Riva

Développez et déployez des modèles multilingues d'IA vocale et de traduction entièrement personnalisables pour vos grands modèles de langage et vos applications basées sur la génération augmentée par récupération.

Aperçu

Qu’est-ce que NVIDIA Riva ?

NVIDIA® Riva constitue un ensemble de microservices multilingues de reconnaissance vocale et de traduction accélérés par GPU, qui permettent de concevoir des pipelines d’IA conversationnelle entièrement personnalisables en temps réel. Riva inclut des fonctionnalités de reconnaissance vocale automatique (ASR), de synthèse vocale (TTS) et de traduction automatique neuronale (NMT). Cette technologie peut être déployée sur n’importe quel Cloud, sur Data Center, à l'Edge ou sur des systèmes Embedded. Grâce à Riva, les entreprises peuvent se doter de capacités avancées de reconnaissance vocale et de traduction via de grands modèles de langage (LLM) ou des techniques de génération augmentée par récupération (RAG), de manière à transformer les chatbots en assistants et avatars multilingues à haut degré d'efficacité.

Unveiling End-to-End Speech and Translation AI Magic

Deliver AI chatbots with state-of-the-art multilingual transcription, translation, and voices.

Avantages

Découvrez les avantages de NVIDIA Riva

Transcriptions multilingues précises et voix expressives

Bénéficiez d’une précision multilingue élevée pour les services de transcription et traduction, et profitez de voix féminines et masculines professionnelles et expressives grâce à des modèles de pointe pré-entraînés via des milliers d’heures de données audio sur les supercalculateurs de NVIDIA.

Entièrement personnalisable

Profitez du niveau de personnalisation permis par les pipelines ASR concernant les langues, les accents, les domaines, le vocabulaire et le contexte pour obtenir une précision optimale et parfaitement adaptée à votre cas d’utilisation, et exploitez les pipelines TTS pour trouver la voix et l'intonation de marque que vous souhaitez.

Déploiements flexibles

Fournissez des expériences fiables à des centaines de milliers d'utilisateurs en simultané avec des performances d’inférence supérieures à celles des technologies existantes ainsi qu'un choix de déploiements à la carte : sur Data Center, sur site, dans le Cloud, à l'Edge ou sur des systèmes Embedded.

IA dédiée aux entreprises

Accélérez le développement et le déploiement des applications d'IA multilingues basées sur la voix pour la production avec NVIDIA AI Enterprise, une plateforme logicielle de bout en bout native dans le Cloud conçue pour fournir aux entreprises des fonctionnalités sécurisées et stables d'IA générative.

Les NIM de NVIDIA Riva sont désormais disponibles au téléchargement

Découvrez de nouveaux microservices d'ASR, de TTS et de NMT conçus pour fournir des fonctionnalités d'inférence d'IA vocale et de traduction optimisées. Ces microservices incluent des modèles Parakeet qui offrent une précision et des performances record en matière de reconnaissance vocale automatique (ASR).

Cas d'utilisation

Utilisation de NVIDIA Riva

Utilisation de NVIDIA Riva Découvrez comment les leaders de l’industrie mettent l'accent sur l’innovation avec Riva.

Assistants interactifs

Les entreprises déploient des assistants interactifs pour répondre automatiquement et en continu aux requêtes de millions de clients et d’employés. Grâce aux microservices de reconnaissance vocale et de traduction basés sur l'IA de NVIDIA Riva, ces assistants fournissent des réponses naturelles et pertinentes à tout moment de la conversation avec l'utilisateur, et ce malgré d'éventuels bruits de fond, problèmes sonores ou accents et dialectes des locuteurs.

Assistance aux agents

Les consommateurs s’attendent à ce que les agents des centres de contact résolvent leurs problèmes de manière à la fois rapide et efficace. Pour répondre à ces attentes et aider leurs agents à fournir les meilleures expériences qui soient, les entreprises de tous les secteurs mettent en œuvre des technologies d’assistance basées sur les microservices de reconnaissance vocale et de traduction de Riva.

Avatars numériques et ambassadeurs de marque

Pour améliorer les expériences de service client et consolider les relations avec leur clientèle, les entreprises de tous les secteurs conçoivent des avatars sur mesure dotés d'une voix de marque facilement reconnaissable. Grâce à Riva, ces sociétés peuvent créer une voix personnalisée de la plus haute qualité avec seulement trois secondes de données vocales.

Transcription de visioconférences

Alors que des centaines de millions de réunions se tiennent en ligne chaque jour, les technologies de visioconférence sont devenues un outil indispensable pour les entreprises. Grâce aux capacités de transcription en temps réel intégrées à Riva, les applications de visioconférence fournissent aujourd'hui une précision impressionnante pour le sous-titrage en direct et la synthèse de réunions, tout en s’adaptant à une grande variété d'utilisateurs, même s'ils disposent d'un accent marqué ou d'un vocabulaire spécifique à un domaine.

Traduction

Dans un contexte économique mondialisé, les entreprises mènent leurs activités dans différents pays en répondant aux demandes de clients d’origines linguistiques et culturelles diverses. Cette diversité linguistique pose un défi unique en son genre, car le recrutement de locuteurs natifs et la formation d'employés dans plusieurs langues est une solution qui ne peut pas s'avérer évolutive, rentable ou efficace. Les capacités de traduction de NVIDIA Riva facilitent la mise en œuvre d'applications de communication nettement plus précises et efficaces, facilitant ainsi les interactions à l'échelle mondiale.

Robots de service

Les robots de service sont utilisés de plus en plus fréquemment dans les hôpitaux, les aéroports et les boutiques du monde entier. Ils se placent au service des travailleurs en première ligne en traitant les tâches quotidiennes les plus répétitives dans les restaurants et sur les sites de production, ils aident les clients à localiser les articles dans les boutiques et ils assistent les médecins et les infirmières qui prodiguent des soins aux patients. Riva simplifie l'intégration de fonctionnalités de reconnaissance vocale et de traduction basées sur l'IA dans les robots de service.

Options de démarrage

Manières de démarrer avec NVIDIA Riva

Utilisez les bons outils et les technologies adaptées pour concevoir et déployer des applications d’IA vocale et de traduction multilingues entièrement personnalisables.

Essayez

Découvrez Riva par le biais d'un portail basé sur une interface utilisateur pour explorer et prototyper avec des points de terminaison gérés par NVIDIA, disponibles gratuitement dans le catalogue d'API de NVIDIA.

Expérimentez

Accédez à l'infrastructure hébergée par NVIDIA et à des ateliers pratiques comprenant des instructions pas à pas et des exemples détaillés, disponibles gratuitement via NVIDIA LaunchPad.

Déployez

Obtenez une licence gratuite de 90 jours pour essayer NVIDIA AI Enterprise dans un cadre de production en utilisant votre infrastructure existante. 

Études de cas

Comment les leaders de l'industrie stimulent l'innovation avec Riva

Télécommunications

L'IA vocale pour un service client de pointe

Client: T-Mobile

Produits: NVIDIA Riva, systèmes NVIDIA certifiés

Technologies: : GPU NVIDIA pour Data Centers, NVIDIA NeMo, NVIDIA Riva

Télécommunications

IA vocale de premier ordre pour une expérience de visioconférence incomparable

Client: RingCentral

Produits: NVIDIA DGX, NVIDIA Riva

Technologies: GPU NVIDIA pour Data Centers, NVIDIA NeMo, NVIDIA Riva, serveur d'inférence NVIDIA Triton

Enseignement supérieur / Université

Automatisation de la reconnaissance vocale en arabe et en temps réel

Clientr: Tarteel.ai

Produits: NVIDIA Riva, systèmes NVIDIA certifiés

Technologies: NNVIDIA NeMo, NVIDIA Riva, GPU NVIDIA pour Data Centers

Adoptants

Leading Adopters Across All Industries

Ressources

Découvrez nos ressources les plus récentes sur NVIDIA Riva

Essayez Riva sur NVIDIA LaunchPad

Vous disposez d'un projet existant d’IA vocale ? Inscrivez-vous si vous souhaitez tester et prototyper vos solutions basées sur la conversation et l'IA vocale grâce à la pile logicielle NVIDIA Riva à hautes performances, que vous pouvez déployer dès maintenant.

Développez des services ASR sur mesure à haute précision

Découvrez comment concevoir, entraîner, optimiser et déployer avec NVIDIA Riva un service de reconnaissance vocale automatique (ASR) accéléré par GPU incluant des fonctionnalités personnalisées.

Parlez à vos données dans votre langue maternelle

Rejoignez des experts en IA pour apprendre à configurer, à paramétrer et à déployer des systèmes d'IA prêts pour la production à des fins de reconnaissance vocale et de traduction multilingue dans des applications reposant sur les LLM afin d'augmenter les capacités de vos chatbots pour leur permettre de s'adresser à vos clients dans leur langue maternelle.

Utilisez l'IA vocale pour la transcription, la traduction et le traitement des voix

Développez des applications d’IA vocale de classe mondiale entièrement personnalisables dans des domaines comme les assistants virtuels intelligents, les services de transcription audio et les avatars numériques.

Réinventez les expériences dans les centres de contact avec NVIDIA Riva

En générant une transcription précise des interactions avec les clients en temps réel, Riva permet aux applications d'IA de fournir des informations contextuelles, d'évaluer les sentiments et de recommander aux agents la prochaine action à mettre en œuvre, garantissant ainsi une expérience sur mesure de la plus haute qualité.

Chien-robot capable d'aller récupérer des commandes dans un environnement urbain

Découvrez comment Spot exploite l'IA vocale pour passer et récupérer des commandes dans un environnement urbain et sans connexion Internet. Au lieu de transférer des commandes vocales dans le Cloud et de les traiter en ligne sur le serveur, Spot traite toutes les données en local pour fournir des performances et une livraison à la fois transparentes et efficaces.

Étapes suivantes

Vous voulez vous lancer ?

Utilisez les bons outils et les technologies adaptées pour concevoir et déployer des applications d’IA vocale et de traduction multilingues entièrement personnalisables.

Pour les développeurs

Découvrez tout ce dont vous avez besoin pour commencer à développer avec NVIDIA Riva, incluant la documentation la plus récente ainsi que des didacticiels, des articles techniques et plus encore.

Nous contacter

Discutez avec un spécialiste des produits NVIDIA pour savoir comment passer du stade de pilote à la phase de production en bénéficiant de la garantie de sécurité, de stabilité d'API et du support technique de NVIDIA AI Enterprise.

AI2Labs

En 2021, AI2Labs s'est détaché de Yoozoo Games pour devenir une startup technologique locale à Singapour. AI2Labs innove, expérimente et développe des produits et des applications d’IA, ce qui permet de mettre en œuvre des processus plus efficaces et d’améliorer la durabilité et les résultats commerciaux.

AI2Labs a intégré Riva à son Speakr, une API de reconnaissance vocale spécifique à un domaine, pour prendre en charge les subtilités des domaines du langage et des affaires asiatiques, tout en parvenant à une précision de pointe pour la traduction Singlish.

Avaya

Avaya est une société spécialisée dans les solutions de communication dans le Cloud et de collaboration en matière de workstream, qui fournit des communications unifiées, des centres de contact, des plateformes de communication en tant que service (CPaaS) et des services avec leur plateforme OneCloud.

Avaya a intégré le moteur de synthèse vocale NVIDIA Riva pour le sous-titrage en temps réel à grande échelle. Riva offre une meilleure qualité de transcription, un taux d’erreur des mots plus faible et une livraison économique.

C-DAC

For over 10 years, the Applied AI Group at C-DAC in Pune, India, has focused on research and development of speech technology. They’ve successfully created a cutting-edge speech-to-text (STT) system for Indic languages such as Hindiand Marathi. The group continues to advance their work by exploring AI-enabled, open-source deep learning frameworks, libraries, and tools for creating STT and speech-enabled applications for other Indic and low-resource languages. Experiments were conducted using various neural network architectures and topologies from NVIDIA’s open-source NeMo framework, with Citrinet and Conformer-CTC network topologies proving to be effective in building and training neural acoustic models for speech recognition. These models were trained on single- and multi-node Param Siddhi AI systems, optimizing training time and performance. Finally, the models were deployed for real-time and batch-mode inference using the Riva GPU-accelerated production pipeline.

NCS

NCS, filiale de Singtel Group, est une société de services technologiques de premier plan présente en Asie-Pacifique et associée à des gouvernements et à des entreprises pour faire avancer les communautés grâce à la technologie. En combinant l’expérience et l’expertise de ses 12 000 collaborateurs répartis dans 61 spécialisations, NCS fournit des services technologiques différenciés et de bout en bout aux clients avec leurs capacités NEXT en matière de numérique, de données, de Cloud et de plateformes, ainsi que des offres de base en matière d’applications, d’infrastructures, d’ingénierie et de cybersécurité. NCS s’est par ailleurs associé à des acteurs technologiques, des instituts de recherche et des start-ups pour soutenir l’innovation libre et la co-création. 

NCS utilise NVIDIA Riva TTS dans Breeze, l’application compagnon du conducteur, pour la navigation à guidage vocal, la mise à jour du trafic et de l’état de la route, les taux de stationnement en temps réel, les tarifs électroniques de tarification routière et les heures d’exploitation, afin d’aider les conducteurs singapouriens à vivre des trajets en toute fluidité.

En savoir plus.

breeze.com.sg/

www.ncs.co

Customer Story

RingCentral

RingCentral, un fournisseur majeur de solutions mondiales de communication, de collaboration et de centres de contact dans le Cloud d’entreprise, propose des services à des millions d’utilisateurs. La plateforme RingCentral facilite la collaboration depuis n’importe quel appareil et n’importe où, améliorant ainsi l’efficacité commerciale et la satisfaction des clients.

RingCentral utilise NVIDIA Riva pour la transcription de visioconférences pour 200 000 utilisateurs simultanés sur sa plateforme.

En savoir plus.

www.ringcentral.com

Customer Story

GTC Session

Snap

Snap est une société de caméra et de médias sociaux qui permet la création de messages multimédia avec des filtres et des effets. Pour créer des expériences plus interactives, les utilisateurs de Snapchat jouent avec des Lens, une fonctionnalité qui ajoute des effets en temps réel dans les captures d’écran, plus de 6 milliards de fois par jour. 

Le service d’IA vocale optimisé pour le bruit et le lingo de NVIDIA Riva est intégré à Snap AR Lens Studio, ce qui permet aux créateurs, aux infographistes et aux développeurs, de concevoir des expériences captivantes de réalité augmentée (AR).

T-Mobile

T-Mobile, un transporteur suralimenté, offre un réseau 4G LTE avancé et un réseau 5G transformateur pour la meilleure expérience client. Pour responsabiliser les agents du centre de contact, T-Mobile met en place Expert Assist. Ce logiciel basé sur l’IA utilise NVIDIA Riva pour la transcription des conversations avec les clients en temps réel afin d’alimenter les systèmes de recommandation et d’aider des milliers d’agents.

Avec Riva, T-Mobile optimise les modèles de reconnaissance vocale sur des jeux de données personnalisés et interprète le jargon du client avec précision dans les environnements bruyants.

En savoir plus.

www.t-mobile.com

Customer Story

GTC Session

Building Speech AI Applications

Explore how to get started with integrating and deploying Riva ASR and TTS models in production with high-performance inference and minimal effort.

An Introduction to NVIDIA Riva

Learn about Riva’s architecture, key features, and components for building speech and translation AI services.

NVIDIA Parlays Win in Voice Challenge

Read how a team of NVIDIANs won the LIMMITS ’24 challenge, which asked contestants to recreate in real time a speaker’s voice in English or any of six languages spoken in India with the appropriate accent.