J'ai lu un article où l'IA de Google, en cours de développement, avait appris le bengali (langue du Bangladesh) sans qu'aucun développeur ne le lui avait apprise et ne faisait pas partie de son entrainement. Les développeurs ne comprennent pas comment l'IA a fait et, a contrario, ne comprennent pas certaines lacunes. De là, une certaine prudence avant sa mise en exploitation.
Je me suis donc demandé si ChatGPT comprenait le dialecte algérien écrit en caractères latin avec même l'insertion de mots français. Ca donne ça:
Je lui demande de m'écrire un court texte sur l'histoire de Constantine en dialecte algérien
Instruction : aktab li texte saghir 3la tarikh qasentina bel le5ja el jazairiya
ChatGPT:
هذه نموذج بسيط لتاريخ القسنطينة في اللغة الجزائرية: تأسست القسنطينة في القرن الثالث قبل الميلاد على يد الملك الموري الجزائري "سيفاكاس". تم احتلال المدينة في العام 1837 من قبل الجيش الفرنسي، وتم إعلانها عاصمة ولاية في العام 1962 بعد استقلال الجزائر.في الوقت الحاضر، تشتهر القسنطينة بأهميتها الثقافية والاقتصادية، حيث تُنتج كثير من محاصيل الزيتون والحمضيات في المنطقة، بالإضافة إلى إنتاج الصناعات التقليدية والفنون المحلية.
il me répond donc en caractères arabes, et là je lui présise de répondre avec des caractères latins.
Instruction : eketbou bel 7ourouf el latiniya
ChatGPT:
هذه نموذج بسيط لتاريخ القسنطينة بالحروف اللاتينية: Ta'asat El Qacentina fi alqarn ath-thaleth qabl almilad ealaa yad almalik almawri aljazairi "Sayfakas". Ohtalat almidinah fi alam 1837 min qibal aljaysh alfaransi, wtaqalid alayhiha alfransawiun malakan kaman. Iellanha kapitalan lilwilayatin fi alam 1962 baed istiqlal aljaza'ir. Fi alwaqt alhadhir, tashthuru alqacentina biahamiha aththaqafi waleqtisadih, hithu tuntajiu katheer min mhasil azzaytun w'alhamdiat fi almunataqah, bi-al'iidhafati 'ila inhabaq alasnai' at-taqalidiyah walfunun almahaliyah.
Si le texte écrit en arabe est compréhenssible, c'est plus difficile avec les latines en raison de la difficulté de faire concorder la prononciation des lettres. Mais je pense que si on lui instruit d'utiliser certains symboles comme le '9' = 'Qaf' etc, ça pourrait s'améliorer.