Peut-on se passer facilement des GAFAM pour le sous-titrage automatique ?
Publié le 11 mars 2025 à 10h00, mise à jour le 11 mars 2025 à 15h33
Temps de lecture : 5 minutes
Depuis l’investiture de Trump, de plus en plus de personnes veulent se détacher des logiciels GAFAM (Google, Apple, Facebook, Amazon et Microsoft) pour privilégier des outils open-source et indépendants.
Quand Zuckerberg a déclaré vouloir « plus d’énergie masculine » et soutenir Trump et Musk financièrement, de nombreuses personnes ont décidé de quitter Facebook, Instagram, WhatApps en guise de protestation pour se tourner vers des alternatives open-source et éthiques.
D’autres veulent ne plus utiliser les logiciels Microsoft 365, boycotter Amazon, ne plus utiliser le moteur de recherche Google. On peut trouver facilement des solutions équivalents.
Est-ce aussi simple que ça de ne plus utiliser les logiciels créés par les GAFAM ? Oui... et non.
Plusieurs fois, on m’a reproché de continuer à utiliser Google Meet et Microsoft Teams alors qu’il existe des logiciels plus éthiques et respectueux en RGPD.
La même réponse que je leur fais, je veux bien mais connaissez-vous des logiciels qui proposent du sous-titrage automatique ? Parce que c’est cela qu’il s’agit. L'accessibilité des réunions téléphoniques et visio.
J’ai réalisé il y a quelques temps que je suis devenue totalement dépendante des outils GAFAM pour les sous-titres automatiques.
Évidemment, j’ai cherché des alternatives.
Jitsi (nouvel onglet) ne propose pas de sous-titrage automatiques. Lutice (nouvel onglet), une plateforme de visio hébergée en France, n’en propose pas non plus.
On m’a suggéré de kMeet (nouvel onglet). Le sous-titrage automatique y est proposé qu’en version payante (nouvel onglet) sur les versions kSuite Pro et kSuite Entreprise. Pourquoi l'accessibilité doit être une fonctionnalité payante ?
Concernant BigBlueButton, la documentation écrite en anglais (nouvel onglet) (EN) suggère d’utiliser les sous-titres automatiques du navigateur Chrome qui appartient à… Google.
C’est le serpent qui se mord la queue.
Une autre question se pose également : est-on prêt à utiliser un logiciel qui propose des sous-titres automatiques de moins bonne qualité ? Parce que c’est aussi de ça qu’il s’agit. La qualité.
Certes, le sous-titrage automatique n’est pas toujours fiable et engendre de nombreuses erreurs surtout quand le sujet est technique ou quand la personne a une voix atypique ou accentuée. Je l'explique à travers d'une de mes conférences Speech-To-Text : quels sont ses avantages et ses limites ? (nouvel onglet) donnée en 2022 à Paris Web.
Quand il y a des erreurs, on essaie de combler les trous grâce à notre suppléance mentale. En écoutant si on entend plutôt bien avec nos appareils auditifs ou implants cochléaires. En lisant sur les lèvres quand les images sont bonnes. C’est constamment épuisant de faire appel à notre suppléance mentale.
Ces dernières années, la reconnaissance vocale a fait de nombreux progrès à tel point qu’on peut utiliser des applications de sous-titrage automatique pour suivre les réunions et conférences correctement quand toutes les conditions sont réunies (son, micro, langage utilisé, intervenants, qualité du wifi).
Beaucoup d’entre nous utilisent Google Meet et Microsoft Teams pour leur qualité de sous-titrage automatique. Quand on n’est pas en réunion, on dégaine Microsoft Translator (nouvel onglet), Live Transcribe , site en anglais (nouvel onglet) (EN) de Google ou la dictée vocale de Microsoft ou de Google pour transcrire les échanges, les conférences.
On ne peut pas toujours faire appel à Tadéo (nouvel onglet), Elioz (nouvel onglet), Voxa Direct (nouvel onglet), System RISP (nouvel onglet), Le Messageur (nouvel onglet) ou à un prestataire indépendant comme Céline Ripolles (nouvel onglet) pour sous-titrer à chaque instant de notre vie surtout que ces prestations ont que pour notre usage professionnel.
J’avais testé les sous-titres automatiques de Mozilla qui améliore la qualité grâce à son projet CommonVoice (nouvel onglet) ou encore Deepgram , site en anglais (nouvel onglet) (EN). Mais la qualité est beaucoup moins bonne que celle des GAFAM.
En contrario, les sous-titres des GAFAM ne marchent pas correctement sur les voix atypiques et accentuées parce qu’ils n’ont pas été entraînées sur ces voix. Mais j’ai remarqué une nette progression avec les sous-titres de Google grâce au projet Euphonia , site en anglais (nouvel onglet) (EN) qui recueille justement ces voix pour rendre la qualité meilleure.
Je peux trouver des outils gratuits et open-source qui utilisent Whisper , site en anglais (nouvel onglet) (EN) mais Whisper fait partie de la maison-mère Open AI qui n’est pas réputé pour être éthique.
Alors que faire ? Dois-je arrêter d’utiliser les logiciels de sous-titrage GAFAM alors qu’ils aident dans mon accessibilité ? Suis-je prête à abandonner ces logiciels pour une qualité moins bonne ?
J’ai posé ces mêmes questions à mes amis sourds et malentendants et en grande majorité, on m’a répondu « non » en étant totalement conscients des enjeux éthiques et écologiques.
Comme dirait mon amie Sophie Drouvroy, dans son article, Qui est le plus responsable : l’IA qui pollue ou l’humain qui exclut (nouvel onglet) :
« L'accessibilité numérique n'est pas juste un choix ou une loi, c'est une nécessité. Une évidence. Une urgence, pour moi et pour tant d’autres. »
Le sous-titrage automatique est devenue pour moi une nécessité pour suivre les réunions et conférences aussi bien dans la vie professionnelle que personnelle.
Tant qu’il n’y a pas d’alternative open-source, gratuite et de bonne qualité, je continuerai à utiliser ces logiciels pour mes besoins d’accessibilité. J’espère que ce jour arrivera sous peu parce qu’il devient de plus en plus difficile de justifier cela et de faire comprendre pourquoi j’en ai besoin.
Au lieu de nous faire culpabiliser, proposez nous (ou construisez nous) des alternatives correctes et accessibles.