Depuis le siècle dernier, la science du traitement automatique des langues naturelles (TALN) représente la préoccupation principale de plusieurs chercheurs. Cette science pose plusieurs difficultés au cœur du traitement à mesure de la quantité massive des documents contenant des milliers, voir des milliards, d’informations accumulées, et difficile à gérer d’une manière pertinente. Cette dernière problématique permettra d’ouvrir et d’illustrer des pistes de réflexions pour développer plus amplement des aspects importants dans le champ de la recherche d’information.
Ce projet « www.tila.ma» s’inscrit donc dans le cadre du Traitement Automatique du Langage Naturel (TALN) et plus précisément celui du traitement automatique (informatique) de la langue arabe (TILA) pour la recherche, filtrage, traitement et diffusion d’information sur le web. M. Taki, Responsable de ce site a choisi comme objectif de cette contribution dans la première partie de ce travail, de traiter d’une part, les mots arabes afin d’obtenir leurs sémantiques (approche de schèmes et technique contextuelle) et pour étiqueter d’autre part les mots dans le but de catégoriser ces derniers, selon leurs affixes et les particules correspondantes. Cette approche d’étiquetage permettra d’aider un utilisateur et précisément ses étudiants ( dont il se charge d’encadrer et d’assurer le suivi des thèses doctorales) à enrichir des requête afin de trouver une définition pertinente d’un certain mot-clé.

TILA s’intéresse en premier temps à :

  • Sciences du Langage et de la Communication.
  • Linguistique de Corpus.
  • Linguistique Informatique.
  • Traitement Automatique des Langues (TAL), spécialement la langue arabe.
  • Traitement Informatique de la Langue Arabe (TILA).
  • Fouille de Textes (Data-mining).
  • Information et Communication (TIC) – Didactique des Langues Dans le Domaine des Sciences du Langage et de la Communication.
  • Mettre l’outil informatique au service de la langue arabe.
  • Etablir des liens de coopération et de partenariat scientifiques avec des laboratoires et organismes de recherche nationaux et internationaux actifs dans le domaine
  • Mettre en évidence l’intérêt et le rôle de la linguistique dans les TIC (nouvelles technologies de l’information et de la communication)
  • l’intégration de l’outil informatique et de ses technologies sous-jacentes (réseaux, multimédia, …) aux langues et cultures.

TILA s’intéresse à des travaux de recherche sur l’activité langagière à travers ses différentes manifestations linguistiques, communicationnelles, sociales et cognitives en particulier. Il est clair que de nos jours, le terme englobant de Sciences du Langage fait référence à des champs de recherche pluridisciplinaires qui reflètent des relations étroites ou éloignées entre le Domaine des Sciences du Langage et d’autres disciplines du Savoir et de la Connaissance. D’où l’importance pour TILA de contributions transversales (pluridisciplinaires) de recherche empirique et théorique. Plus récemment, les contributions dans www.tila.ma traitera de thèmes de recherche en Linguistique de Corpus et en Linguistique Informatique avec comme point focal le Traitement informatique de la Langue Arabe. Le Projet TILA des Langues invite ainsi des contributions de chercheurs qui s’intéressent à la Linguistique de Corpus, la Linguistique Informatique et la Didactique des Langues. Certes, la majorité des contributions portera sur la langue arabe et les différents aspects de son transfert vers d’autres langues telles que le français et l’anglais. Des modèles de segmentation, de modélisation et de lexique seront décrits avec des outils, méthodes et concepts opératoires issus d’autres disciplines telles que les Mathématiques, les Statistiques et la Linguistique Informatique. Ceci n’empêche nullement l’envoi de travaux de recherche en Sciences du Langage dans son sens le plus large .