25 juillet 2024

Hadretna
L’IA au service des dialectes

Le paysage technologique algérien est en pleine effervescence avec le lancement officiel de Hadretna, un plateforme révolutionnaire de traduction en ligne des différents dialectes parlés en Algérie, lors d’une conférence de presse à l’Hôtel Mariott. Développé par la startup Fentech, opérant sous le nom de Tamatech, en collaboration scientifique avec le professeur Merouane Debbah, un éminent chercheur en machine learning, intelligence artificielle et spécialiste dans le domaine des télécommunications. Ses recherches se situent à l’interface entre les mathématiques algorithmiques et la théorie de l’information et des télécommunications sans fil.

L’Algérie, caractérisée par une richesse linguistique unique, comprend des dialectes tels que le kabyle, le chaoui, le tamazight et diverses variantes de l’arabe. Hadretna vise à faciliter la communication entre les différentes communautés linguistiques en Algérie en fournissant des traductions précises et contextualisées.
« Le développement de Hadretna bénéficie de l’expertise du professeur Merouane Debbah. Son partenariat avec Tamatech garantit que l’algorithme repose sur des bases scientifiques solides et des techniques de pointe en matière de traitement du langage naturel et d’intelligence artificielle, » déclare Moussab Djerrab, CSO de Fentech. « Le développement de Hadretna a nécessité six mois de travail intensif, durant lesquels les équipes de Fentech et le Professeur Debbah ont travaillé sans relâche pour perfectionner l’algorithme, » ajoute-t-il. Il explique que ce « travail acharné a permis de surmonter les défis liés à la traduction des divers dialectes algériens, en créant un modèle capable de gérer ces variations linguistiques complexes. Le tout en open source et on cherche des partenaires. »

Hadretna est un modèle d’intelligence artificielle générative (LLM, large language model) avancé, conçu pour comprendre et traduire les nombreux dialectes algériens. Construire un tel modèle sur des dialectes disposant d’une documentation écrite limitée représente un défi technique majeur. « C’est apprendre sans grammaire » dira Merouane Debbah.
Pour atteindre une précision et une efficacité maximales, Hadretna a été entraîné avec 2 gigaoctets de tokens collectés en ligne dans trois alphabets : arabe, latin et tifinagh. Cette vaste quantité de données permet à la plateforme de comprendre et de traduire avec précision les nuances des différents dialectes algériens, offrant ainsi une solution de traduction de haute qualité. Le professeur Merouane Debbah précise : « C’est la première étape vers la mise en œuvre d’un modèle d’IA générative algérien utilisant les dialectes répandus en Algérie. »

Hadretna permettra aux Algériens de différentes régions de communiquer plus facilement, réduisant les barrières linguistiques et améliorant ainsi la communication. De plus, en traduisant et en documentant les dialectes locaux, Hadretna contribue à la préservation du patrimoine linguistique et culturel de l’Algérie. Lors de la conférence de presse, les responsables de la startup Fentech ont lancé « un appel à participation, invitant toutes les personnes intéressées à contribuer au projet en alimentant Hadretna avec leurs traductions et annotations ». Cela permettra à terme de créer le plus grand corpus de textes dans les différents dialectes en circulation en Algérie.

L’algorithme peut être intégré dans diverses applications, des plateformes de médias sociaux aux services gouvernementaux, améliorant ainsi l’accessibilité et l’efficacité des communications. Hadretna n’est pas seulement un outil de traduction utilisant un LLM, mais aussi un pont entre les différentes cultures et communautés linguistiques d’Algérie.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *