La langue kabyle se prépare pour la maîtrise de l’intelligence artificielle

20
3671

KABYLIE (Tamurt) – Tatoeba est une interface de phrases et  de traductions écrites et orales dans différentes langues pour développer le passage automatique d’une langue vers une autre. Common Voice est un grand projet de Mozilla, qui prépare la plus grande base de données vocales mondiales, il est ouvert à toutes les langues parmi lesquelles on trouve  le kabyle.

Langue kabyle est intégrée dans ces bases de données et dans ces systèmes vocaux  au même titre que les autres langues occidentales grâce au dévouement des ingénieurs kabyles.

Nous avons actuellement 44 personnes qui activent bénévolement dans le domaine de la localisation de la langue kabyle, ces militants volontaires sont en général des informaticiens des linguistes ou de simples personnes qui maitrisent la langue kabyle écrite. Ces équipes sont dirigées par  Mohand At Belqacem et Sliman Amiri qui sont des informaticiens de profession, bénévoles.

A ce jour ces équipes ont enregistré 12259 phrases sur tatoeba et 2019 phrases qui ont eu des enregistrements vocaux et des traductions en anglais ou en français.

Tatoeba et Common Voice sont des sites qui ont des interfaces entièrement kabylisées.

VK (réseau social Russe) et Firefox (moteur de recherche internet) sont entièrement kabylisés et ils sont utilisés par des milliers de Kabyles.

Les responsables de ces projets appellent les Kabyles au volontariat en particulier les étudiants des différents cycles universitaires  de Tamazight pour que la langue kabyle soit au même rang que le français et l’anglais.

Si tous les Kabyles s’investissent dans ce domaine de la localisation nous donnerons demain les ordres à  nos appareilles domestiques  (téléphones portables, télévisions, portes, frigidaire, climatiseur, voitures, portail, robots…) en kabyle et non pas en arabe.

Pour plus d’info : https://tatoeba.org/kab

Kader DAHDAH

20 Commentaires

  1. Azul

    Concernant les projets mentionés dans l’article, Je suis d’accord avec les critiques et réserves émises par les commentateurs.

    Premièrement, ceux qui travaillent véritablement pour
    être utiles à leur langue, le font en silence. C’est leur travail qui parle.

    Deuxièmement, ce n’est pas en localisant dans sa langue
    des logiciels ou applications web développées par des américains, russes ou autres qu’on élève le prestige de sa langue ou qu’on fait connaitre sa langue.
    Au contraire, cela montre qu’on est dépendants de l’innovation des autres peuples et qu’on ne produit rien dans sa langue. Si parmi les promoteurs, il y a des ingénieurs de bon niveau en informatique et soucieux de faire diffuser sa langue, pourquoi ne développent-t-ils pas un logiciel innovant dans leur langue avec le label de
    « Made in Vgayet » ou « Made in Tizi Wezzu »? Ainsi les autres
    peuples viendront s’intéresser à leur langue et ce seraient eux qui voudraient une localisation dans le sens inverse.

    Finalement, il faudrait évaluer l’utilité de ces localisations. Combien de personnes utilisent réellement ces logiciels localisés dans la langue de Mammeri? Moi je dirai que très peu, pour la simple raison qu’il y a très peu de gens qui ont la motivation et la capacité (linguistique et informatique,..) de le faire. On ne met pas la charrue avant les bœufs.

    • On peut se demander alors pourquoi initier de tels projets et en faire une grande publicité?
      Je pense qu’il y a très probablement le désir égocentrique d’acquérir un prestige personnel et de se faire une renommée. Mais j’irai plus loin. Contrairement à ce que l’on veut nous faire croire, on peut fortement soupçonner qu’il y a la motivation de l’argent dans ces activités. Prenons l’exemple de la localisation (traduction de l’interface, pour ceux qui ne connaissent pas ce terme) du réseau social russe vk.com. On incite ses compatriotes à s’inscrire sur ce réseau. Mis à part les problèmes de sécurité auxquels seraient exposés ses compatriotes et que cea « ingénieurs » n’ont pas l’air de comprendre suffisamment (ou s’en fichent royalement), il y a le fait que vk.com va gagner de l’argent pour chaque utilisateur qui s’inscrit (à travers les annonces publicitaires par exemple ou en vendant les listes de données). Il est d’usage dans le secteur, qu’on reverse une commission (1 Euro/par personne inscrite, par exemple) à celui qui ameute les utilisateurs à s’inscrire. Ainsi donc on gagnerait de l’argent sur le dos de la sécurité de ses compatriotes et sous couvert de la promotion de la langue !

  2. C’est de Mohammed Belkacem dont il s’agit et non “Mohand At Belqacem” comme écrit dans cet article. Je proteste contre cette usurpation de mon nom de famille. La famille “At Belkacem » ou « At Belqacem” n’a rien à voir avec “Belkacem” qui est le vrai nom de famille de cette personne.

  3. La localisation ou traduction de l’interface de Tatoeba à Tamazight est
    d’une qualité médiocre:
    – une notation déficiente
    – des mots araboïdes alors que les mots autochtones existent
    (exemples: « qebleɣ de « qabil » en arabe, et « mudd » de
    « madda » en arabe, …)
    – des mots inventés mal-formés
    – des traductions inadéquates
    – des structures syntaxiques erronées, calquées sur d’autres langues étrangères

    Il en va de même pour les phrases en Tamazight proposées pour l’enregistrement.

    Ce
    n´est pas avec ce niveau que notre langue risque de briller. Et ce
    n’est pas avec des encouragements gratuits et sans mérite que l’on va
    l’élever ce niveau. La critique est nécessaire.
    Heureusement qu’il y a
    des personnes qui travaillent sur d’autres projets de qualité sans
    faire de bruit et qui nous laissent juger par nous-mêmes de l´utilité de
    leur travail.

  4. Pourquoi est-ce que vous utilisez un alphabet réduit pour Tamazight qui ne correspond pas à la réalité des sons qui existent dans la langue?
    Par exemple, vous notez « b » pour le son [v] et vous ne notez pas du tout les sons vélaires come [gʷ] dans « agʷi » (et non pas « agi » qui est un mot avec un sens différent).

    • Vous n’aurez pas de réponse de ces gens là parce qu’ils ne maitrisent pas la langue sur laquelle ils veulent travailler. Aucun d’eux n’a investi dans une formation en Tamazight, qui serait pourtant le premier pas logique pour quelqu’un qui veut faire quelque chose de bien pour sa langue.

  5. Techniquement parlant, le projet de Common Voice ne vaut rien. Il ne produira rien d’utile et il finira aux oubliettes comme tant d’autres projets. Ceux qui participeront en donnant leur voix auront perdu du temps pour rien et ils retrouveront peut-être leurs voix utilisées là où il ne faut pas.

  6. Bravo les gars, très bon boulot! Continuez et laissez les gens qui ne font rien braire leur envie et leur frustration. Brillez et faites briller notre langue. Fier de vous…

    • Comment savez-vous que les gens qui critiquent ces projets ne font rien? Peut-être que c’est en connaissance de cause qu’ils écrivent leurs commentaires.

      C’est une issue facile de se jeter des fleurs et d´évoquer l’envie des autres sans répondre aux critiques avec des arguments. Mais cela n’aidera en rien à faire évoluer la qualité et notre langue ne brillera que dans les rêves.

      • Il y a des pseudonymes qui naissent à chaque fois qu’il y a quelque chose qui se fait pour l’identité kabyle, pas pour l’encourager mais pour l’étouffer. Pour moi, rien qu’entendre le mot KABYLE est déjà un exploit. Maintenant, je propose un moyen pour atténuer de l’envie et de la connerie: faire quelque chose de sa vie…

  7. Un titre sensationaliste pour impressioner mais ce n’est que de la poudre aux yeux.
    Il faudrait d’abord que ceux qui travaillent sur ces projets maitrisent leur langue pour pouvoir aspirer à « se préparer à maitriser l’intelligence artificielle ». Or on à affaire à des bricoleurs qui diffusent une langue massacrée. Il n’y a qu’à voir les traductions/localisations des interfaces. C´est tellement bâclé que cela décourage même les militants de cette langue. Il faut laisser le travail sur la langue aux personnes compétentes dans ce sujet et intègres. Les deux personnes citées comme informaticiens de profession, (bien que à ma connaissance l’un est un vendeur de systèmes ERP et l’autre un pirate informatique) ne font que diffuser une écriture et un vocabulaire erroné. Il ne faut pas les aider dans cette entreprise.
    Au passage, je signale à l’auteur que Mozilla n’est pas un moteur de recherche, comme il a écrit, mais un navigateur internet. De plus, il devrait vérifier la véracité des prétentions que lui communique « Mohand At Belqacem », comme par exemple « ils sont utilisés par des milliers de Kabyles », A ce que je sache, les utilisateurs fidèles des localisations de Firefox et VK peuvent se compter sur les doigts de la main.

    • Etant utilisateur de firefox et VK s_teqvaylit, je ne vois pas ou est votre probleme a si Mohamed (alias Mouloud). Si vous etes un connaisseur n_teqvaylit mettez la main a la pate, sinon tenez vous loin de ces leaders Kabyles.
      Et puis qu’avez vous contre les vendeurs, Bill Gates en ai un.
      Quand a accuser nos ingenieurs de pirates ajouter a cela votre style et vos intentions dans votre torchon, il est claire que cela sent les sous sols des Tagarins.

      • Le « si Mohamed » c’est Mohammed Belkacem, pas moi. Le « si » du fait que c’est un islamiste marabout du style de « Lwali n Udrar » qui prend ses compatriotes pour des ignorants. Et Mohammed c’est son vrai prénom qui confirme son allégeance à l’islamisme.

        Qui c’est ces leaders virtuels autoproclamés? Qu’ils nous disent depuis quand ils ont rasé leurs barbes d’islamistes et les crédentiels qu’ils ont pour prétendre travailler sur la langue. On ne risque pas de s’approcher d’eux, ni encore moins de mettre la main à la pate répugnante qu’ils sont en train d’essayer de faire avec notre langue.

        Bill Gates n’est pas un vendeur. Il a passé plusieurs années dans son garage à travailler jour et nuit pour développer un système d’exploitation pour les PC. Lui, on peut dire que c’est un ingénieur qui a produit un logiciel que les gens ont trouvé (et trouvent encore) utile. Il n’a pas perdu son temps dans des traductions bâclées de systèmes que d’autres ont développé.

        J’ai rien inventé dans mon commentaire sur le piratage informatique. C’est la personne concernée elle-même qui annonce dans ses écrits sur l’internet les logiciels qu’il pirate. Mohammed Belkacem doit en savoir quelque chose sur ces activités de piratage informatique puisqu’il il en est le bénéficiaire si ce n’est pas celui qui commande. On aime bien le gratuit et quand ca ne l’est pas, on vole.

        Les « sous sols des Tagarins », je ne sais même pas ce que c’est exactement. Mais Mohammed Belkacem a été vu du côté du HCA. Il pourrait nous dire s’il travaille avec le gouvernement central. Il faut se méfier de lui. Je pense que c’est un double agent qui fait semblant de travailler pour la langue. Mais en bon vendeur, il n’a de yeux que pour l’argent. A la première occasion il vendra ses compatriotes, sans remords.

  8. Awal i Leqvayel d_dda Mohand n_ At Velqasem.
    ɣurwat ad as tinim d_aken wiggi i d d_yuran d_Leqvayel. D_yiwen u serdas i yesƐan
    atas les faux comptes i yevɣan ad yesefcel deg imaɣnasen n_Teqvaylit.

    Ad as nini i dda Mohand aqlaɣ yid_ek, deffir_ek, leqdic_ik dayen iggerzen, yerna

    ne seqdac_iten s_wul d ttefanttazit.

    Win yeddan, yedda ma d_nekni nƐadda.

    Tanemirt i w_Wawal_d_wuzzal i yeran takmemt i w_serdas agi (si Mohammmed).

  9. I wawal i Tmaziɣin? Teƫƫuḍ_tent? Neɣ akken i d_nnan, kečč d vučamar ur yeƫƫaken ara azal i tlawin?

    Amek akka, wigi i d_yeƫƫarun ukkʷ ur llin d imaziɣen?
    Ihi d kečč kan d terva3t-ik i d_yeqqimen?

    D iserdasen i d_yeƫƫarun ad d_teqqaṛeḍ? Ihi yelha, ɣuṛ_neɣ iserdasen yeɣṛan. Yerna ssnen Tamaziɣt armi zemren ad seknen amek ssamasen Tamaziɣt deg yisenfaṛen_agi.

    Si melmi yuɣal vučamar d « dda »? Ivan ur tessineḍ ara azal n wawal d unamek-is.

    Гuṛ-k ad tɣileḍ Imaziɣen d iderɣalen. Yerna Imaziɣen ur ḥemmlen ara amqʷerqer yeƫcufun iman-is akken ad yuɣal d azger. Mmekti_d tizlit n Slimane Azem.

  10. Yella win i d-yeqqaṛen ivawen-iw ur ƫebbʷan ara?
    Di tideƫ, tira txuṣṣ aṭas deg yisenfaṛen-agi.

    A Mas Dahdah, tƫekkiḍ deg yisenfaṛen-agi, yax?
    Kečč teƫƫaruḍ s « v ». Ayɣeṛ deg usideg ur ƫƫarun ara s « v »?

    Ini-asen i ugraw-nwen, ad seggmen tira. Ad arun s v, ƫ , bʷ , gʷ , kʷ , qʷ, xʷ.
    Syen akkin, ad ẓṛen amek aṭas ad yasen ad fken afus.

LAISSER UN COMMENTAIRE

S'il vous plaît entrez votre commentaire!
S'il vous plaît entrez votre nom ici