toutpublic

common voice mozilla logoL’intelligence artificielle (IA) est entrée, depuis quelques années, dans une nouvelle ère, qui donne lieu à de nombreux espoirs. C’est en particulier dû à l’essor de l’apprentissage automatique. Ces technologies sont rendues possibles par des algorithmes nouveaux, la multiplication des jeux de données et le décuplement des puissances de calculs. Le projet Common Voice a pour objectif d’améliorer les technologies de reconnaissance vocale pour les rendre plus accessibles à tous. Common Voice est une immense base de données d’enregistrements vocaux qui permet à n’importe qui de facilement et rapidement entraîner des applications interagissant avec la voix, potentiellement dans toutes les langues.

A ce jour 18 langues différentes sont proposées, ce qui représente près de 1 400 heures de données vocales enregistrées par plus de 42 000 contributeurs.

Pourquoi ?

La parole est souvent le moyen le plus naturel de communiquer et les technologies vocales apportent ce confort à nos ordinateurs et appareils mobiles. Mozilla veut donner aux développeurs les moyens de créer des applications de reconnaissance vocale étonnantes, telles que des traducteurs en temps réel et des assistants numériques à commandes vocales.

Pour le moment, l’essentiel des données vocales nécessaires à la création d'applications sont coûteuses et propriétaires. L’idée de Common Voice est de proposer aux développeurs des enregistrements dont ils ont besoin pour innover et rendre la technologie de la parole disponible dans leur propre langue.

Comment ça marche ?

Pour rendre la reconnaissance vocale encore plus universelle, Mozilla collecte des échantillons de voix dans des langues largement parlées, mais aussi dans celles qui ont une population de locuteurs réduite, qui sont souvent mal desservies par les services commerciaux de reconnaissance vocale. La publication d'un jeu de données de voix diversifiées permettra aux développeurs, aux entrepreneurs et à des communautés linguistiques tout entières de combler cet écart.

Chacun peut donc donner un peu de sa voix pour aider à constituer une base de données libre, utilisable par n’importe qui dans le but de réaliser des applications innovantes, y compris sur le Web. Pour cela il suffit de lire une phrase pour aider les machines à apprendre la façon de parler des êtres humains. Écoutez les enregistrements que d’autres ont réalisés pour les valider et ainsi améliorer la qualité des données.

common voice mozilla

Créer un compte n’est pas nécessaire pour contribuer, mais cela permet:

  1. D’enrichir au maximum les données que vous envoyez en incluant des informations démographiques anonymes. Les informations ne sont pas liées à votre profil avant de les rendre publiques ;
  2. D’améliorer la qualité des données audio et la précision de la reconnaissance vocale ;
  3. De garder une trace de vos progrès pour toutes les langues auxquelles vous participez ;
  4. De comparer vos progrès à ceux de contributeurs dans le monde entier ;
  5. De comparer vos progrès par rapport à vos objectifs personnels et à ceux du projet ;
  6. De s’inscrire à la liste de diffusion pour être tenu au courant des évolutions du projet.

Le jeu de données de Common Voice est disponible au téléchargement selon les termes de la licence CC0 sur la page des jeux de données.

Plus d'informations sur : https://voice.mozilla.org/fr

Aucun commentaire

Devenir Membre

Pour vous informer sur l'école numérique (Tice), les applications pédagogiques, les outils, le codage, l'algorithmique, les objets connectés... Totalement Gratuit !

S'inscrire

Sauvegarder
Choix utilisateur pour les Cookies
Nous utilisons des cookies afin de vous proposer les meilleurs services possibles. Si vous déclinez l'utilisation de ces cookies, le site web pourrait ne pas fonctionner correctement.
Tout accepter
Tout décliner
Essentiel
Ces cookies sont nécessaires au bon fonctionnement du site, vous ne pouvez pas les désactiver.
session
Accepter
Analytique
Outils utilisés pour analyser les données de navigation et mesurer l'efficacité du site internet afin de comprendre son fonctionnement.
Google Analytics
Mesure d'audience
Accepter
Décliner