La revue Linguistica Communication 

PREFACE Vol. 19 - 2018

 

Ce volume spécial de LC N°19 2018 est consacré à l’exploitation des corpus numériques dans l'enseignement de l'arabe, comme langue seconde. Il apparait au moment où le débat est trop chaud sur la protection de cette langue contre sa faiblesse et sa décadence, au cours de ces dernières années, pour des raisons multiples, tant internes et externes. Ce discours plutôt politique cous oblige à poser la question: Comment protégeons-nous cette langue? Comment combler le décalage numérique entre l’arabe et les autres langues dites développées de ce globe?  Il est évident que nous ne pouvons pas espérer avoir accès à la société de connaissance en dehors d’une langue, car l’unique passerelle vers tout développement doit passer obligatoirement via une langue, et la langue maternelle en particulier, à savoir que le concept Société de connaissance repose sur trois piliers: l'innovation, l’activation et l’exploitation  par l'être humain qui en est le bénéficier, sachant que la science, la philosophie et la technologie sont toutes fondées essentiellement sur les langues. Un survol des domaines récents de la recherche scientifique dure de nos jours montre l’appui total sur l'industrie des langues naturelles voire maternelle. Mais pourquoi cette démarche est nécessaire? La réponse simple et directe, c’est que les grandes entreprises internationales, comme GAFA[1] ont commencé par investir dans la numérisation des langues naturelles pour développer des applications sur lesquelles sont basés des machines intelligentes que nous utilisons dans notre vie quotidienne. C’est pourquoi nous demandons aux entrepreneurs arabes d’investir dans leur langue pour en faire un moyen efficace de transfert de nos sociétés à l’ère de l’économie du savoir. car, la plupart de nos investisseurs  arabes dépensent énormément d'argent dans divers coin du globe, à l'exception des leurs. Cela se passe  au moment où les chercheurs dans les grandes centres universitaires à travers le monde, constatent que l’arabe est la langue la plus adapté à la numérisation, ce qui motive les ingénieurs en NLP à construire des banques de données de l’arabe pour s’en servir dans le développement des applications informatiques de cette langue en dehors de leur pays d'origine. [2]

Cette revue scientifique (LC) spécialisée en linguistique formelle et NLP, n’épargne aucun effort pour publier des recherches scientifiques axées sur la numérisation  des langues naturelles. Les recherches qui y sont publiés dès son premier numéro en 1989 ont contribué à la réduction de décalage numérique entre nos sociétés et celles des langues dites développées, aussi bien par la publication des recherches en NLP de la langue arabe, que par les applications développées par l’équipe de chercheurs appartenant à la société El-Erfan qui publie LC. La construction  du dictionnaire électronique Erfan [3] qui va très bientôt voir le jour n’est qu’un exemple. Ce travail colossal va, certes,  offrir aux chercheurs l’opportunité de s’en servir pour développer des applications qui seront présentées dans cette revue. Toujours dans le même but, LC a consacré une douzaine de volumes spécialisés a l'ingénierie linguistique, rédigés par des chercheurs experts en traitement automatique des langues naturelles appartenant aux différentes régions géographiques du monde. Nous avons procédé de la sorte parce que nous sommes convaincu que la linguistique computationnelle, dite linguistique de la quatrième génération coupe ses liens avec la linguistique théorique dont le rôle a expiré depuis l’apparition des nouveaux outils technologiques basées sur l’intelligence  artificielles, conduisant ainsi à la naissance du NBIC[4] basé essentiellement sur les acquis du développement récents en NLP, ce qui a permis à plusieurs pays occidentaux d'accéder à la société du savoir.

Dans ce contexte nous avons consacré ce volume à l’exploitation des corpus numériques dans le domaine éducatif, car l’éducation constitue, pour nous, les champs privilégiés de validation des connaissances numériques. Nous l’avons divisé en deux parties:

  1. Corpus linguistiques, qui constitue le fondement pratique pour tout traitement numérique des langues naturelles. Nous y avons publié des articles réalisée par des spécialistes dans ce domaine : Dr Moataz Bellah Al-Saïd, qui a monté un dictionnaire numérique destiné à l'enseignement de l'arabe aux non arabes. Cette étude est très importante en termes de classification des ressources linguistiques orientées vers les objectifs pédagogiques. La deuxième recherche est rédigée par Dr Sultan Al-Mijaewel, chercheur spécialiste dans la linguistique de corpus, trace le cadre théorique de la construction des corpus numérique, il présente les dernières normes internationales actives dans le traitement du corpus. L’article suivant est rédigé par deux experts dans le domaine : Dr. Eric Atwell et le Dr Abdullah Alfaifi, ils nous présentent les techniques appliquées dans les corpus linguistiques à l'Université de Leeds en Grande-Bretagne, ils insistent surtout sur le codage des langues naturelles, y compris l'arabe. Cette section se termine par la recherche de Dr Mohammed El Hannach qui présente une étude pratique montrant comment investir les corpus numériques dans l'enseignement des langues basé sur la plate-forme Nooj spécialisée dans le traitement des textes et corpus linguistiques des langues naturelles y compris l’arabe.
  2. La deuxième partie de ce volume est consacrée à l'application des corpus dans l'enseignement de l'arabe, langue seconde, montrant comment le corpus peut être exploité dans les différents aspects éducationnelles: dans le développement des programmes d'enseignement dans l'apprentissage des langues, et dans l'évaluation des compétences des apprenants étrangers non arabes. Cette partie comprend trois articles : le premier de Dr. Montasir al-Hamad, et Dr. Hafidhi Alaoui, ilsi focalisent leur recherche sur l'éducation à travers la grammaire dite grammaire des fautes, le deuxième article est celui de Dr. Belkacem Al-Youbi, et Dr. Khalid Al-Youbi, les deux auteurs focalisent leur article sur l’usage l’interactivité dans l'enseignement de l'arabe aux non-arabophones en se servant de techniques numériques de nos joours. Ce volume se termine par l’article des deux auteurs Dr.Saleh Alhajouri et Dr Belkacem, qui mettent en application des exigences du cadre européen commun de référence pour l’enseignement et l’apprentissage des langues et évaluation des compétences de non arabes, en focalisant sur le les apprenants du niveau cinquième.

                                                                                                  Rédacteur en chef :

            Prof. Ibrahim Al-Balawi

 

[1] ) G = : Google ; A= Apple, F= : Facebook, et A= : Amazon

[2] ) En USA :  Nizar Habash, Imad Zitouni, Ali Farghaly, Mouna Diab,  En France : Joseph Dichy, Dj. Kouloughli, etc Ces chercheurs devenus des leaders de NLP ont tous travaillé sur l’arabe dans les pays occidentaux.

[3] ) Dictionnaire électronique de l’arabe, format Nooj 2018.

[4] ) Nano technologie, Biotechnologie, Informatique et Cognition.