Patrimoine linguistique en danger : un nouvel écrin pour la collection Pangloss – EurekAlert! – Science News

À ce jour, la bibliothèque sonore Pangloss contient plus de 3600 enregistrements audio ou vidéo en 170 langues de tous les continents. On y trouve ainsi des contes et chansons en xârâgurè (Nouvelle-Calédonie), des conversations et des récits en kakabe (Guinée), des recettes de cuisine en koyi rai (Népal) et en na-našu (Italie)… soit 780 heures d’écoute au total.

Ces extraits sonores sont le fruit de plus de vingt ans de travail de linguistes et d’ethnologues qui, chacun sur leur terrain d’étude, œuvrent à la collecte et à la sauvegarde du patrimoine linguistique mondial. Certains sons proviennent de la numérisation d’anciennes bandes magnétiques (1). Près de la moitié des enregistrements sont transcrits et annotés, par exemple avec des éléments de contexte ou des traductions vers d’autres langues. Le site est ouvert aux contributions d’experts, académiques ou non, pour améliorer le corpus en participant aux transcriptions et traductions.

Avec son design repensé, le site peut désormais être consulté avec deux niveaux de lecture, afin d’être plus accessible au grand public qui peut librement écouter et télécharger ces témoignages de la diversité linguistique. En grande partie sous licence Creative Commons, les contenus pourraient notamment alimenter des projets muséographiques ou des créations sonores.

Au-delà de son aspect patrimonial, cette collection participe d’une démarche de science ouverte, en facilitant la conservation, le référencement (2) et la mise à disposition des données primaires des chercheurs et chercheuses. Elle entend ainsi lutter contre la déperdition des données scientifiques (une « deuxième mort » pour les langues disparues) mais aussi favoriser les collaborations avec d’autres disciplines : les informaticiens intéressés par le traitement automatique des langues peuvent y trouver facilement les fichiers dont ils ont besoin et participer au co-développement d’outils (de transcription automatique, par exemple). Entièrement bilingue français-anglais, le site comprend des traductions partielles dans d’autres langues, dont le chinois pour les notices de certaines langues asiatiques.

Outre les contributions de différents laboratoires associés au CNRS (3), la collection Pangloss est soutenue par l’Institut des langues rares de l’EPHE-PSL, récemment créé. Les données sont sauvegardées dans l’archive de la Très grande infrastructure de recherche (TGIR) Huma-Num. La collection Pangloss est membre du réseau international DELAMAN, Digital Endangered Languages and Musics Archives Network. Elle est hébergée par la plateforme Cocoon, Collection de corpus oraux numériques, qui participe au réseau international OLAC, Open Language Archive Community.

Quelques exemples de contenus à découvrir :

« La chair de poisson rend intelligent », une histoire en oubykh (langue caucasienne autrefois parlée en Turquie et Géorgie, qui compte quelque 80 consonnes) racontée par Tevfik Esenç, son dernier locuteur, et enregistrée par le linguiste et anthropologue Georges Dumézil en 1968 (ses notes manuscrites sont aussi consultables). Lien : /doi.10.24397/pangloss-0004320 Corpus audio et vidéo en kakabe, langue de Guinée (qui fut par le passé une langue d’esclaves ou de serviteurs), enregistré et déposé par la linguiste Alexandra Vydrina. Lien : /pangloss.cnrs.fr/corpus/Kakabe Notes :

(1) Comme ceux du dernier locuteur de la langue oubykh, par Georges Dumézil, en 1968. (2) Chaque ressource est dotée d’identifiants de types DOI (Digital Object Identifier) et ARK (Archival Resource Key). (3) En particulier (liste non limitative) : Langues et civilisations à tradition orale (Lacito, CNRS/Université Sorbonne Nouvelle/Inalco) ; Centre de recherches linguistiques sur l’Asie orientale (CRLAO, CNRS/Inalco/EHESS) ; Langage, langues et cultures d’Afrique noire (Llacan, CNRS/Inalco) ; Structure et dynamique des langues (Sedyl, CNRS/Inalco/IRD).

Soyez le premier à commenter

Laisser un commentaire