Avatar lord dah
Workshop international sur la dictionnairique des langues de moindre diffusion (le cas du tamazight) Juin 2010
par lord dah, dimanche 17 janvier 2010, 19:47
 
Workshop international sur la dictionnairique des langues de moindre diffusion
(le cas du tamazight)

Juin 2010

Aujourd’hui, l’un des moyens les plus sûrs, pour la conservation et le développement des langues de faible diffusion et de fonctionnalité sociale réduite, c’est la confection de bases lexicales, et de corpus d’expressions de tous ordres compatibles avec une utilisation informatisée. L’apprêtement de ces corpus à un traitement automatique est une tâche fondamentale, se situant à l’intersection des préoccupations de l’informaticien et du linguiste, dont on ne peut faire l’économie à l’âge de l’Internet et de l’informatique systématisés. C’est sur la base d’une analyse linguistique sérieuse que pourra se réaliser une extraction automatique réussie des données selon le besoin fixé.

Le traitement automatique des corpus suppose réglé un ensemble de questions relatives à la fixation graphique et orthographique des unités de la langue, par conséquent, de la morphologie et de la syntaxe. Le travail sémantique ne pourra débuter que lorsque des solutions méthodiques sont apportées à toutes ces questions.

La langue tamazight, le kabyle en particulier, a été l’objet de recherches diverses depuis le 19ème.siècle. On en dispose aujourd’hui d’une connaissance linguistique structurale importante en dépit de sa relative vétusté. S’il est un parent pauvre dans ces études nombreuses portées sur cette langue c’est bien l’aspect dictionnairique et celui relatif à son évolution dans le temps.

A l’heure actuelle il n’existe aucun dictionnaire de kabyle moderne mis à jour et vérifié valable au-delà d’un seul parler, d’un seul village comme celui des Ait Menguelat (v. J.-M. DALLET) fut-il d’une très grande densité démographique. Toute entreprise de normalisation, à quelque niveau que cela soit, exige pourtant la fabrication d’un tel outil indispensable à toute standardisation.

L’école, grand consommateur de dictionnaires et de grammaires scolaires, est concernée puisque cette langue y est enseignée sans qu’aucun outil dictionnairique soit mis à la disposition de l’élève berbérophone ou arabophone.

Il s’agit de réfléchir sur les méthodes et moyens pouvant aboutir à la mise en place et à disposition des chercheurs, des utilisateurs et des secteurs concernés d’une grande base de données lexicales et d’expressions numérisable susceptible d’être développée ultérieurement sous la forme de dictionnaires, électronique ou non, spécialisés par thèmes et par niveau.

L’obsession néologique et terminologique, qui confond besoins des élites et ceux de la masse, ne doit pas occulter les demandes les plus pressantes. Mieux, la description des données réelles d’une langue parlée, dans un espace et à un moment donnés de son histoire, est un fondement méthodologiquement inéluctable pour la création néologique elle-même.

Il s’agit de recueillir la langue telle qu’elle est utilisée par ses locuteurs, et de procéder à la fixation des morphogrammes, et leur orthographe compte tenu des aléas d’ordre syntagmatique (l’état d’annexion entre autres) et des graphies en concurrence dans la société algérienne ; l’Unicode ayant résout les écueils idéologiques liés aux graphies non latines.
Il faut évaluer aussi l’utilité d’une base monolingue ou plurilingue, ainsi que la question de la classification des entrées sur la base de l’ordre alphabétique des racines ou de l’ordre alphabétique simple des mots avec ou sans le préfixe ayant valeur d’article désignant le genre.

Les axes de cette problématique, sans être restrictifs, pourraient se décliner de la façon suivante :

1) Informatique et dictionnairique : quelles solutions

2) Informatique et linguistique : les problèmes de description de corpus

3) Les dictionnaires électroniques

4) La dictionnairique berbère : histoire critique

5) La dictionnairique pour des langues analogues au tamazight

6) Les problèmes de la classification alphabétique des mots

7) Le problème de la classification des entrées par ordre alphabétique des racines

8) La question de la néologie et des listes terminologiques

9) L’approche dictionnairique par les corpus

10) Les normes de fixation des morphogrammes et de l’orthographe à base latine et non latine
11) Les dictionnaires scolaires plurilingues

12) Les dictionnaires monolingues