J’ai beaucoup lu dans ma jeunesse d’articles sur la traduction automatique. C’était l’époque des systèmes experts et le sujet de la traduction était à la mode. J’ai ensuite travaillé dans l’intelligence artificielle, sur les réseaux de neurones bouclés plus précisément, et mon sujet de doctorat portait sur l’identification et la commande de processus. Puis je suis passé à autre chose. Mais le rêve d’avoir à portée de main un système de traduction automatique n’était jamais loin, et je sentais que le monde se porterait mieux si les personnes se comprenaient mieux.
Nous voici aujourd’hui avec des progrès fulgurants dans les systèmes d’apprentissage, supervisés ou non, rebaptisés DeepLearning et IA, avec des techniques similaires à celles que j’ai connues dans les années 1990, mais avec des puissances de calcul dont je n’aurais même pas rêvé à l’époque. Et cette idée d’avoir à disposition un système de traduction automatique me poursuit. C’est comme ça que m’est venue cette idée d’application qui va changer le monde.
J’imaginais deux personnes étrangères en train d’essayer de se parler. Je me trouvais face à un chinois dont je ne connais rien de la langue, et lui ne connaît rien du français que je parle. Je parle alors dans un microphone, puis un système de traduction convertit mon français en chinois sur un haut parleur. Ce système serait déjà génial, mais pas nécessairement très pratique. Si l’on parlait doucement, voire en murmurant, ce serait déjà mieux. Mais finalement, pourquoi parler à voix haute ? Lire sur les lèvres suffirait.
En cherchant sur internet, j’ai lu quelques études sur des programmes qui lisent sur les lèvres (parce que bien entendu, cela existe déjà), et je me suis imaginé assembler tout cela au sein d’une appli, tel un Jean-Marie Hullot murmurant à l’oreille de Steve Jobs.
L’appli qui lit sur les lèvres serait sur votre téléphone. La caméra du téléphone serait dirigée vers votre visage, comme pour un selfie pris d’en bas. Vous pourriez alors parler sans émettre aucun son. L’appli convertirait les mouvements de vos lèvres en texte qui serait ensuite traduit à la volée par un système comme Deepl dans la langue de votre choix, puis transmis sur le haut parleur de votre téléphone en sons intelligibles pour votre interlocuteur. Lui-même aurait son propre téléphone auquel il parlerait juste en remuant les lèvres, téléphone qui vous parlerait en français via son mode haut parleur.
Cette appli changerait la face du monde. A commencer par le tourisme, par le commerce, par les échanges culturels. On pourrait s’exprimer depuis sa langue maternelle vers n’importe quelle autre langue.
Bien entendu, il y a plein d’autres cas d’usage. En débrayant le module de traduction, vous pourriez par exemple répondre à un appel téléphonique dans le train (à condition d’avoir vos écouteurs sur les oreilles) juste en remuant vos lèvres, sans déranger vos voisins. Vous pourriez interagir dans un environnement très bruyant, avec d’autres personnes, ou avec des machines qui lisent sur les lèvres. Ou dans un environnement où il est difficile de parler, comme dans l’eau. La confidentialité pourrait être plus facile dans un openspace, à condition de prendre quelques précautions. HAL9000 n’est jamais loin…
On pourrait parler à n’importe qui, juste en remuant les lèvres. Des ponts seraient jetés entre toutes les communautés. Les muets pourraient parler aux aveugles…
Tous les outils sont là, il suffit de les assembler.
Faites tourner ce billet, traduisez le dans toutes les langues, pour que quelqu’un se lance dans l’assemblage des technologies. Je prends 0.1% des bénéfices.