En savoir plus sur le Catalogue des langues en danger, le projet de recherche qui donne les informations sur les langues sur le site de l’ELP (Projet Langues en Danger).
En savoir plus sur le Catalogue des langues en danger, le projet de recherche qui donne les informations sur les langues sur le site de l’ELP (Projet Langues en Danger).
Sur les quelque 7 000 langues parlées aujourd'hui sur terre, près de la moitié risquent d'être réduites au silence au cours des prochaines générations. C’est une crise humanitaire d’une magnitude et d’une rapidité sans précédent : à la connaissance des linguistes et d’autres érudits, jamais dans l’histoire de l’humanité la diversité linguistique n’a fait face à une destruction aussi rapide.
Pour connaître les taux actuels de mise en péril des langues, ou même pour estimer le nombre et le statut actuel des langues en danger dans le monde, nous avons besoin d'une source d'information fiable sur l'état actuel de la mise en péril des langues dans le monde. Le Catalogue des langues en danger (ELCat) répond à ce besoin en apportant des informations sur le danger et la vitalité des langues qui sont fiables et utilisées par les chercheurs, les organisations communautaires, les responsables politiques, les étudiants et d'autres publics dans le monde entier.
Le Catalogue est une ressource qui contient des informations complètes, fiables et actualisées sur le statut actuel des langues en danger dans le monde, depuis le milieu du 20e siècle jusqu'à aujourd'hui. Il constitue une base de données librement accessible d'informations sur la vitalité des langues à l'échelle mondiale, activement mise à jour en permanence. Il collecte aussi des informations sur la vitalité des langues auprès de sources multiples et partage les informations provenant d'un maximum de personnes et de publications fiables, au lieu de ne présenter qu'une seule source d'information.
Le Catalogue a pour objet d’informer et de soutenir les étudiants, les professionnels de la revitalisation, les défendeurs des langues, les éducateurs, les responsables politiques, et le public en général en partageant librement toute cette information. Nous pensons que le partage d'informations sur la vitalité et la mise en péril des langues peut aider les gens à inverser cette crise mondiale et à créer des réponses positives et proactives à la mise en péril des langues.
Le Catalogue des langues en danger (ELCat) est développé, publié et mis à jour par University of Hawaiʻi at Mānoa (UHM) Department of Linguistics, sous la direction du Dr. Gary Holton. Il est publié en ligne sur le site web du Projet des langues en danger (ELP), qui s’est associé avec UHM et le Catalogue depuis son lancement en 2012.
Pour plus de détails sur le Catalogue, les informations linguistiques qu'il contient et la manière dont ces informations peuvent être utilisées pour la documentation linguistique et la revitalisation des langues, la recherche et la politique, voir le livre Cataloguing the World’s Endangered Languages (2018).
Il est important de bien définir ce que le Catalogue contient et ne contient pas, et ce qu'il fait et ne fait pas. La façon dont la vitalité de la langue est représentée ici peut être très utile, mais ce n'est pas la seule façon de représenter ou de comprendre la vitalité de la langue.
Le Catalogue est une base de données d’information quantitative (chiffres et mesures). Il partage l’information telle que le nombre estimé de locuteurs, le degré de transmission intergénérationnelle (si les enfants apprennent une langue) et les domaines d'utilisation (dans quel domaine de la vie une langue est utilisée). Le Catalogue ne représente pas les aspects qualitatifs (expériences, histoires, perception, émotions) de la vitalité des langues et de leur mise en danger.
Les informations quantitatives, telles que celles contenues dans le Catalogue, peuvent être très utiles pour étudier les grands schémas mondiaux de vitalité et de dangerosité des langues. L'utilisation de chiffres et de mesures permet de comparer la vitalité de milliers de langues sur tous les continents, de manière générale. Cependant, les chiffres ne peuvent pas représenter ou décrire l'importance, les significations ou les expériences de la perte ou de la récupération de la langue.
L'utilisation de paramètres vitaux pour mesurer la vitalité et le danger des langues fait l'objet d'un grand nombre d'écrits et d'études de qualité. Cet ensemble de travaux aborde les façons dont la recherche quantitative peut à la fois créer des compréhensions incomplètes ou nuisibles de la mise en danger des langues, ainsi que les façons dont les chiffres et les statistiques peuvent être utilisés pour plaider en faveur de la revitalisation linguistique et des droits des langues.
Les informations contenues dans le Catalogue proviennent de sources très diverses. Le projet du Catalogue n’effectue pas une recherche de première main ou un travail de terrain. La plupart des informations proviennent de sources publiées : livres, articles de journaux, recensements, conférences, etc. L’équipe de recherche du Catalogue examine régulièrement les nouvelles publications, et ajoute l’information de ces publications à la base de données.
Nous recueillons aussi des informations directement auprès de personnes et d'organisations. Grâce à nos réseaux mondiaux bien développés, l'équipe du Catalogue et l'ELP sont en contact avec des organisations communautaires, des institutions académiques, des ONG, des programmes de revitalisation, des universitaires, des entités tribales et d'autres personnes qui ont une connaissance de première main de la vitalité d'une langue. Nous invitons notre réseau à partager avec nous des informations sur les langues et les communautés linguistiques avec lesquelles ils travaillent.
Toutes les informations contenues dans le Catalogue sont examinées par le Conseil d’administration international, un groupe de linguistes universitaires qui collaborent et se spécialisent dans les langues des régions spécifiques ou dans les familles linguistiques. Le public ne peut pas modifier directement les informations de la langue sur le site ELP ; il peut toutefois suggérer de nouvelles informations, qui seront examinées par le Conseil d'administration international. Ceci afin de garantir que les informations que vous trouverez dans le Catalogue répondent à des standards largement répandus de rigueur académique, et sont aussi fiables que possible pour les besoins de la recherche.
Le Catalogue vise à rassembler et à partager toutes les informations disponibles et fiables sur la vitalité de chaque langue en danger. Par conséquent, nos informations sur les langues peuvent être légèrement différentes de celles d'autres bases de données : pour chaque langue, nous estimons qu'il est important de présenter des informations provenant de nombreuses sources différentes. Les utilisateurs peuvent ainsi comparer différents paramètres de vitalité au fil du temps ou constater des divergences entre les sources. Le Catalogue ne décide pas quelle description est « correcte », mais il met en évidence une source d'information (généralement la plus récente ou la plus complète) comme premier ensemble d'informations apparaissant sur la page d’une langue. Pour savoir d'où proviennent les informations ou pour comparer plusieurs sources, vous pouvez consulter la section « Language Information by Source » sur chaque page linguistique.
Le projet du Catalogue donne aussi la priorité aux pratiques éthiques et responsables dans la collecte et le partage de l'information. Nous nous efforçons de ne partager que les informations qu'il convient de diffuser au public, et notre travail est une conversation permanente entre l'équipe de recherche, les communautés dont les langues sont examinées et les personnes qui utilisent le Catalogue.
Si vous souhaitez nous faire part d'informations plus récentes ou plus précises sur la vitalité d'une langue en particulier, nous vous invitons à nous contacter.
Le système utilisé par le Catalogue des langues en danger pour évaluer les niveaux de vitalité des langues s'appelle l'indice de mise en péril des langues (Language Endangerment Index, LEI).
Le LEI a été développé en 2011 par l’équipe de recherche du Catalogue à l’Université d’Hawaï à Mānoa. Dans la phase initiale de développement du projet du Catalogue, l’équipe de recherche a considéré l’utilisation d’outils d’évaluation existants tels que les EGIDS (échelle élargie de classement de perturbation intergénérationnelle) ou échelle UNESCO, mais pour diverses raisons, ils ont pensé que ces outils ne répondaient pas aux besoins du projet du Catalogue (voir Lee & Van Way 2016). L'objectif de l'élaboration du LEI était de pouvoir mieux comprendre et représenter les schémas de mise en péril des langues au niveau mondial, de mieux refléter les facteurs réels de substitution linguistique et de disposer d'un outil de mesure de la vitalité des langues plus nuancé sur le plan théorique que ce qui était disponible auparavant.
Le LEI comporte deux niveaux de mesure : la note de vitalité et la note de « certitude », qui se réfère à la quantité d'informations disponibles pour créer la note de vitalité. Ces niveaux sont décrits ci-dessous.
Note de vitalité : le LEI évalue quatre paramètres de la vitalité des langues :
Chacun de ces quatre facteurs se voit attribuer une note numérique de 0 à 5 (0 étant le moins en danger, 5 étant le plus en danger), sur la base des informations présentées par une source spécifique (une personne, un livre, un article, un site web, etc.).
La moyenne de chacun de ces quatre paramètres numériques est ensuite calculée pour obtenir une « note de vitalité » globale. Dans ce système de mesure, la transmission intergénérationnelle est pondérée deux fois plus que les trois autres paramètres, car la transmission de la langue est considérée dans le domaine de la linguistique comme une composante essentielle de la vitalité de la langue.
Indice de certitude : Si aucune information n’est disponible sur un facteur de vitalité donné, aucune note n’est obtenue. Par exemple, si une source ne fournit aucune information sur le nombre de personnes qui utilisent une langue, l’évaluation de la vitalité basée sur cette source n’inclura pas de score pour le nombre de locuteurs/signeurs.
Le nombre de facteurs notés détermine le niveau de « certitude » de chaque évaluation de la vitalité : par exemple, une étiquette « 100 % de certitude » ne signifie pas que cette évaluation est infaillible, mais simplement que des informations étaient disponibles pour évaluer tous les facteurs LEI. De la même façon, une étiquette « 20 % de certitude » signifie que l’information était seulement disponible pour facteur non lié à la transmission. Les notes de certitude faibles indiquent que la note de vitalité est basée sur des informations peu nombreuses, souvent parce que l'équipe de recherche du Catalogue n'a pas accès à ces informations.
La note de vitalité présentée pour chaque langue n'est pas définitive. Ces notes sont fournies à des fins pratiques, pour donner une indication visuelle rapide et approximative du statut de danger pour une langue. Une description plus détaillée du LEI est disponible dans cet article :
Lee, N. H., & Van Way, J. (2016). Assessing levels of endangerment in the Catalogue of Endangered Languages (ELCat) using the Language Endangerment Index (LEI). Language in Society, 45(2), 271–292. http://doi.org/10.1017/S0047404515000962
Les objectifs et la structure de base du Catalogue ont été définis lors d'un atelier organisé en 2009, qui a réuni une cinquantaine de linguistes universitaires du monde entier, avec le soutien d'une subvention de la National Science Foundation des États-Unis intitulée « Collaborative Research: Endangered Languages Information and Infrastructure Project » (Recherche collaborative : Projet d'information et d'infrastructure sur les langues en danger). Le Catalogue lui-même a été développé initialement sous la direction de Dr. Lyle Campbell (Université d’Hawaï à Mānoa) et Dr. Anthony Aristar et Dr. Helen Aristar-Dry (LINGUIST List à l’Université de l'Est du Michigan) dans la phase initiale du projet, 2010-2013.
En 2012, la première version du Catalogue a été rendue accessible au public comme une partie du nouveau site web du Projet des langues en danger (ELP).
En 2014, le projet est entré dans sa deuxième phase, et toutes les activités de recherche ainsi que l'hébergement du site web ELP ont été transférées à l’Université d’Hawaï à Mānoa. En 2016, Dr. Campbell a pris sa retraite, et Dr. Gary Holton est devenu Director du Catalogue.
Les informations contenues dans le Catalogue ont été rassemblées et saisies par une équipe de chercheurs étudiants diplômés de l'Université d'Hawaï à Mānoa et de l'Université de l'Est du Michigan pendant de nombreuses années, et ont été révisées par le Conseil d'administration international. L’équipe de recherche comprend :
Carolina Aragon | Katie Butler Gao | Melody Ann Ross |
Liam Archbold | Bryn Hauk | Sean Simpson |
Russell Barlow | Raina Heaton | Kaori Ueki |
Anna Belew | Joelle Kirtley | Gregory Vondiziano |
Amy Brunett | Eve Okura Koller | John Van Way |
Yen-ling Chen | Nala Huiying Lee | Stephanie Walla |
Jacob Collard | Clemens Mayer | Stephanie (Locke) Witkowski |
Uliana (Kazagasheva) Donahue | Lwin Moe | Brent Woo |
Cole Flottman | Josiah Murphy | Kristen (Dunkinson) Ikeda Yoza |
Shirley Gabber | Colleen O'Brien |
Les informations contenues dans le Catalogue sont examinées et approuvées par le Conseil d’administration international du Catalogue, un groupe de linguistes universitaires spécialisés dans les langues de régions ou de familles de langues spécifiques. Le Conseil d’administration international du Catalogue est composé de :
Pour des informations générales provenant du Catalogue des langues en danger, y compris cette page « À propos », citez comme suit :
Catalogue of Endangered Languages. 2025. Université d’Hawaï à Mānoa. http://www.endangeredlanguages.com
Pour les informations générales relatives à l'entrée d'une langue (par exemple, les noms des langues, la classification ou le statut de vitalité), citez :
« NOM DE LA LANGUE. » Catalogue of Endangered Languages. 2025. Université d’Hawaï à Mānoa. DATE D’ACCÈS. < URL COMPLÈTE DE LA PAGE DE LANGUE SPÉCIFIQUE >
Par exemple:
« Xipaya. » Catalogue of Endangered Languages. 2024. University of Hawaiʻi at Mānoa. Aug. 9, 2025. http://www.endangeredlanguages.com/lang/1001
Presque toutes les informations contenues dans le Catalogue des langues en danger comprennent une citation de la source originale dont elles proviennent (par exemple, article de revue, livre, communication personnelle, etc.). Vous trouverez des informations de citation en haut de la boîte « Info » de chaque page de langue ; si vous souhaitez reproduire des données telles que le nombre de locuteurs, vous pouvez citer la source originale donnée à cet endroit.
La distinction entre un « dialecte » et une « langue » est fortement contestée, non seulement par les linguistes, mais aussi par les communautés linguistiques, les responsables politiques, les traducteurs, les éducateurs et tous ceux qui travaillent avec les langues. Certains chercheurs se sont demandé si ces termes étaient même utiles à la compréhension contemporaine du langage ; des cadres alternatifs tels que les « languoïdes » sont de plus en plus utilisés en linguistique et dans des domaines connexes, et le terme plus général de « variété de langue » a longtemps été un moyen utile d’éviter de faire cette distinction.
Dans la discipline académique de la linguistique, les termes « langues » et « dialectes » sont définis de différentes manières. Le critère linguistique le plus courant pour distinguer une langue d’un dialecte est l’intelligibilité mutuelle. Si les gens parlent différemment, mais se comprennent raisonnablement bien, on considère qu'ils parlent des dialectes de la même langue. Ce critère est difficile à appliquer dans la pratique, car dans certains cas, les locuteurs auront déjà été exposés à l'autre variété ou en auront une certaine connaissance. Cependant, ce critère linguistique n’est pas le seul utilisé pour distinguer les langues des dialectes. Parfois, la décision repose sur des facteurs politiques et sociaux. Par exemple, les locuteurs du suédois et du norvégien se comprennent assez bien, mais pour des raisons politiques, ces langues sont considérées comme distinctes.
Il est souvent difficile de déterminer clairement si une variété est une « langue » ou un « dialecte ». De nombreuses variétés linguistiques sont considérées comme des langues indépendantes par certains spécialistes, mais comme des dialectes d'une seule langue par d'autres, même en appliquant le critère de l'intelligibilité mutuelle.
Le Catalogue n’a pas la prétention de déterminer la différence entre les dialectes et les langues ; cependant, cette question doit être abordée d’une manière ou d’une autre, car la conception originale du Catalogue spécifie un catalogue de langues en danger. C'est pourquoi les variétés qui sont sans ambiguïté des dialectes d'une autre langue ne font pas l'objet d'une entrée distincte dans le Catalogue. Dans le cadre du Catalogue des langues en danger, puisqu'il s'agit d'un projet académique, la priorité est donnée au critère linguistique de l'intelligibilité mutuelle des langues, bien que les facteurs sociaux et politiques soient aussi importants.
Dans les cas où l’on conteste si les variétés linguistiques sont des dialectes d’une seule langue, par opposition à des langues étroitement apparentées, le Catalogue comprend des entrées distinctes pour ces variétés. Ces entrées comprennent généralement des commentaires du Conseil d’administration international du Catalogue, résumant brièvement le débat académique au sujet de la variété. Au fur et à mesure que l’on en apprend davantage sur ces variétés de langue, il peut devenir possible de mieux comprendre les congruences et les distinctions entre elles. Leur statut de « langue » ou de « dialecte » peut simplement rester contesté, selon la personne qui en parle. Les différences entre les « dialectes » et les « langues » sont nuancées et compliquées, et dépendent de questions plus larges telles que le contexte politique, historique, économique et socioculturel.
Au fur et à mesure que le Catalogue se développera et évoluera, nous reverrons périodiquement notre réflexion et notre approche des langues, dialectes, variétés, languoïdes, etc. Vos commentaires et suggestions sont les bienvenus à l’adresse suivante : feedback@endangeredlanguages.com
Le Catalogue des langues en danger est censé inclure toutes les langues qui sont actuellement en danger, ainsi que les langues qui ont perdu tous leurs locuteurs/signeurs au cours du dernier demi-siècle (depuis 1960 environ). Cette période a été choisie pour délimiter le domaine du projet de recherche et reflète la disponibilité accrue des informations sur la vitalité des langues dans la littérature publiée depuis les années 1960. Les langues qui n’ont actuellement aucun locuteur/signeur (connus) sont incluses dans le Catalogue dans la catégorie en danger « Dormante » ou endormie. Cette terminologie est préférée et utilisée par de nombreux linguistes indigènes et défenseurs des langues, et elle est de plus en plus utilisée dans le cadre de la linguistique universitaire, car elle indique à juste titre qu'une langue qui n'a plus de locuteurs/signeurs vivants peut encore être « réveillée », ou remise en usage.
Le Catalogue des langues en danger n’utilise pas les termes « éteint », « mort », « mourant » ou d’autres termes similaires. Ces étiquettes sont chargées et porteuses de significations qui peuvent être utilisées comme armes contre les communautés linguistiques et les efforts de revitalisation. Des termes tels que « mort linguistique » et « extinction » impliquent à tort que les langues sans locuteurs/signeurs vivants ne peuvent pas être ressuscitées (puisque la mort est permanente), que leur destruction est naturelle ou inévitable (puisque tous les êtres vivants meurent), ou que les peuples et les communautés qui utilisaient ces langues ont en quelque sorte « disparus » ou se sont « éteints ». Ces termes peuvent être profondément nuisibles et décourageants pour les communautés qui s’engagent ou souhaitent s’engager dans la revitalisation linguistique.
Les langues qui n'ont plus de locuteurs/signeurs connus depuis des centaines ou des milliers d'années ne sont pas incluses dans le Catalogue, car cette ressource est censée contenir des informations sur l'état actuel de la menace qui pèse sur les langues dans le monde. Des informations détaillées sur la substitution linguistique et la perte des langues avant le milieu du XXe siècle dépassent la portée de ce projet, bien qu’il soit clair qu’un grand nombre de langues ont été réduites au silence au cours des 500 dernières années.
Les langues dont on pense qu'elles sont devenues dormantes depuis 1960 sont incluses dans le Catalogue pour un certain nombre de raisons. Tout d’abord, il est utile d’examiner la vitalité et la perte des langues au cours du passé récent (environ 60 ans) afin de comprendre l’état actuel des langues dans le monde. De plus, il y a eu de nombreux cas où l’on croyait qu’une langue n’avait plus de locuteurs/signeurs vivants, mais où un locuteur/signeur vivant s’est manifesté des années ou des décennies plus tard. C'est une autre raison pour laquelle le Catalogue inclut des langues qui sont récemment devenues inactives : il se peut qu'il y ait encore des locuteurs/signeurs en vie.
Les langues qui ont traversé une période sans locuteur/signeur connu, mais qui sont en train de renaître maintenant et d'être à nouveau parlées/signées, sont répertoriées dans le Catalogue sous la rubrique « Awakening (éveil) ». Ce statut signifie qu’il y a un effort concerté en cours pour remettre une langue en usage – la langue se « réveille » à travers ses locuteurs/signeurs, après une période de dormance.
Enfin, nous devons noter que de nombreuses langues figurant dans le Catalogue présentent peu ou pas d'informations récentes à la disposition des chercheurs concernant leur vitalité. Les informations les plus récentes disponibles sur la vitalité de certaines langues peuvent dater de plusieurs années ou décennies. Cela signifie que certaines langues répertoriées comme « en danger » peuvent en fait être dormantes maintenant – cela signifie également que certaines langues répertoriées comme « dormantes » peuvent être en train de s’éveiller. Les communautés du monde entier se réapproprient et font revivre leurs langues, et un nombre toujours croissant de langues se réveillent. Nous espérons être en mesure de mettre à jour de nombreuses entrées de langues de la catégorie « Dormante » à la catégorie « Éveil » dans les années à venir.
En tant que ressource en ligne, le Catalogue des langues en danger est destiné à être continuellement mis à jour et enrichi. Les langues de cette ressource, comme toutes les communautés et pratiques humaines, sont en constante évolution ; notre objectif est de mettre à disposition les informations nouvelles et actualisées dès qu'elles sont connues de l'équipe du Catalogue.
Nous faisons de notre mieux pour maintenir cette ressource à jour, en vérifiant et en ajoutant constamment de nouvelles informations provenant de publications, de reportages, de sondages communautaires et de communications provenant de communautés linguistiques et de chercheurs.
Cependant, le Catalogue est limité par son accès aux informations sur les langues du monde – Il n'y a pas toujours de moyen facile pour l'équipe de recherche d'être informée des changements dans la vitalité d'une langue, à moins que quelqu'un ne diffuse cette information au monde entier. C'est pourquoi il se peut que vous voyiez des informations qui datent de plusieurs années, qui sont incomplètes ou qui ne sont pas optimales.
Si vous voyez des informations manquantes ou périmées, veuillez nous contacter ! Vous pouvez utiliser le bouton « suggérer un changement » sur la page de la langue, ou nous envoyer un e-mail. Nous comptons sur les personnes qui connaissent bien une langue pour nous aider à diffuser des informations de qualité. Il est important pour nous de veiller à ce que les langues soient représentées aussi précisément que possible dans le Catalogue, et nous sommes reconnaissants à tous ceux qui ont partagé leurs connaissances pour améliorer la base de données au fil des ans.
Vous pouvez consulter les informations du Catalogue en vous rendant sur la page de la carte des langues et de la recherche. Si vous souhaitez télécharger toutes les informations sous la forme d’un fichier .csv, cliquez sur le lien « Télécharger les données ».