Analyseur de texte chinois




Note explicative – Seuils de l’analyseur de texte chinois

Cet analyseur permet d’évaluer un texte en chinois selon différents seuils de caractères issus des travaux de Joël Belassen et de la liste de fréquence Junda. Ces seuils indiquent les caractères qu’un apprenant est censé connaître à un certain niveau :

  • Actifs (écriture) : l’élève doit savoir les reconnaître et les écrire.
  • Passifs (lecture) : l’élève doit savoir les lire et les comprendre, sans nécessairement les écrire.

🔢 Table des seuils de caractères

Seuil / Liste Total de caractères Actifs (écriture) Passifs (lecture) Description / Usage
LV3 (405 caractères) 405 255 405 Seuil de base pour les lycéens débutants (niveau terminal LV3). Objectif : compréhension simple de textes élémentaires.
LV2 (505 caractères) 505 355 505 Seuil intermédiaire pour les lycéens ayant le chinois en LV2. Permet la lecture de textes courants et la rédaction simple.
LV1 (805 caractères) 805 505 805 Seuil avancé : destiné aux élèves de section chinoise approfondie (LV1). Permet de lire des articles courts et des textes narratifs authentiques.
Section internationale 1 555 Non indiqué 1 555 Niveau très avancé, utilisé dans les sections internationales ou baccalauréats chinois. Couverture lexicale proche d’un lettré moderne.
Liste Junda 9 931 Liste de fréquence basée sur un corpus de 15 millions de caractères modernes (journaux, romans, médias). Il s'agit du seuil "d'indépendance" pour être capable de lire un texte chinois moderne sans être bloqué, même si certains caractères restent inconnus.

Interprétation des couleurs dans l’analyse

  • Noir : caractère actif du seuil choisi (lecture + écriture).
  • Gris : caractère passif du seuil (lecture seule).
  • Rouge : caractère hors-seuil, non encore acquis pour le niveau choisi.

🎓 Utilisation pédagogique

  1. Choisir un seuil adapté au niveau de vos élèves (par ex. LV3 pour des débutants en lycée).
  2. Saisir un texte chinois dans l’analyseur.
  3. L’outil décompose le texte caractère par caractère, puis indique :
    • le nombre total de caractères,
    • éventuellement la différence entre caractères actifs/passifs (listes 405, 505 et 805)
    • les caractères « hors-seuil » en rouge
  4. Adapter votre progression :
    • si un texte contient trop de caractères hors-seuil, il est trop difficile,
    • si la majorité des caractères sont en noir/gris, le texte est adapté,
    • si le texte est très facile, passez au seuil supérieur (LV2 → LV1).

À propos des listes

Les seuils LV3 – LV1 ont été élaborés par Joël Belassen, inspecteur général de chinois, et sont utilisés comme référence dans les programmes français d’enseignement du chinois langue vivante. Ils définissent une progression cohérente entre les niveaux d’apprentissage (LV3 → LV2 → LV1 → Section internationale).

La liste Junda provient d’un corpus universitaire de 15 millions de caractères modernes, établi par Jun Da (Middle Tennessee State University). Elle fournit la fréquence d’apparition de chaque sinogramme dans la langue écrite contemporaine chinoise.

🔗 Jun Da Chinese Character Frequency List

⚙️ Limites & précautions

  • Les seuils mesurent la fréquence et la couverture, pas la compréhension du sens ni la syntaxe.
  • Certains caractères fréquents sont polysémiques ; d’autres, rares, sont culturellement essentiels.
  • La progression dépend aussi du lexique composé (mots polysyllabiques), non inclus dans ces listes.