newari

Un algorithme et pas mal de détermination sauvent une langue en danger

Dans l’Himalaya, le Népal compte plus d’une centaine de langues et dialectes. Certains sont parlés par de moins en moins de locuteurs et pourraient bien finir par disparaitre. Le newari est une de ces langues. Et celle-ci ne devrait finalement pas disparaitre de sitôt.

Le newari était une la langue officielle du Népal jusqu’au XVIIIème siècle. Depuis, son usage a reculé. La langue était même interdite pendant près le siècle de règne des Rânâ, jusqu’au milieu du XXème. Aujourd’hui à peine plus de 800.000 locuteurs la parlent encore notamment dans la vallée de Katmandou. De quoi mettre en péril son avenir, elle est considérée comme « en danger » d’extinction. Fin 2020, une poignée d’ingénieur s’intéresse à cette langue pour mettre en ligne un système de traduction. Mais intégrer le newari dans Google Translate n’est pas chose aisée.

Lire aussi : Apprendre le ladakhi, ce dérivé du tibétain ancien…

Ce système, qui fonctionne sur le principe du machine learning, doit être alimenté par une importante quantité de données sur la langue et sa traduction. Manque de chance, la quantité de matériel disponible était trop faible, peu de contenu en newari sur internet, encore moins de données bilingues newari-népalais ou de dictionnaires newari-anglais. L’algorithme avait besoin de dizaines de milliers de pages de contenu. La communauté des locuteurs du newari a peu à peu été mobilisée et la pandémie a donné la disponibilité nécessaire à des centaines de volontaires. A un rythme soutenu, ils se rejoignaient en vidéo pour traduire du contenu dans leur langue et partager leurs connaissances sur le sujet.

Juin 2024 : Google Translate intègre le newari

En février 2024, ils totalisaient près de 500.000 contributions. Google a alors considéré que c’était suffisant pour faire fonctionner son modèle. Quelques mois plus tard, le Nepalbhasha (Newari) apparaissait dans Google Translate. Permettant à n’importe quel internaute de traduire des sites internet. « Les personnes âgées sont heureuses de savoir que la langue ne va pas disparaître. Les plus jeunes peuvent l’utiliser pour apprendre la langue par eux-mêmes, ils ne peuvent plus reprocher aux aînés de ne pas leur avoir appris » explique Sanyukta Shrestha, ingénieur et historien à l’origine du projet. Il dirige aujourd’hui l’Organisation Mondiale Newah. Sa structure a été centrale dans la coordination du travail nécessaire pour sauvegarder cette langue.

D’autres projets similaires pourraient voir le jour pour sauver d’autres langues menacées du Népal.

Notez cet article

Arnaud P

Passionné par l'univers de la montagne sous tous ses aspects, Arnaud est membre de la rédaction d'Altitude.News ! Originaire du sud de la France, ça ne l'a pas empêché de s'installer un temps en Savoie ! Il écrit des articles dans les catégories : Alpinisme, Rando/Trek, Business et Nature. Pour le contacter directement : arnaud@altitude.news !

Voir tous les articles de Arnaud P →