Guide de réutilisation

Plateforme d'Analyse de Corpus (PAC)

Ce protocole explique comment récupérer, déployer et personnaliser la PAC pour n'importe quelle recherche qualitative.

GitHub Pages — gratuit Aucune installation Export CSV · Jamovi · Sphinx 1 fichier HTML unique
Présentation

Qu'est-ce que la PAC ?

La PAC est un outil de codage de corpus conçu pour la recherche en sciences humaines et sociales. Elle permet de gérer un corpus documentaire, de coder des extraits selon une grille de dimensions analytiques, puis d'exporter les données vers Jamovi ou Sphinx.

Pour quel usage ?

Toute recherche impliquant une analyse systématique de corpus : discours institutionnels, articles scientifiques, entretiens, rapports, manuels scolaires, presse, etc.

Comment ça fonctionne ?

Un fichier HTML unique qui tourne dans n'importe quel navigateur. Les données sont sauvegardées localement et exportables en CSV compatible avec les logiciels d'analyse.

Ce que vous allez modifier

Principalement le bloc DIMS dans le code JavaScript : c'est là que vivent vos 6 dimensions, leurs indicateurs, leurs options de codage et leurs questions directrices.

⏱ Combien de temps ?

Compter 30 à 60 minutes pour adapter l'outil à un nouveau corpus, une fois ce protocole en main. Aucune connaissance en programmation avancée n'est nécessaire.

Protocole

Les étapes de réutilisation

Suivez ces 7 étapes dans l'ordre. Chaque étape est autonome et illustrée d'exemples concrets.

1
Récupération du code

Accéder au fichier source sur GitHub

Rendez-vous sur le dépôt GitHub qui héberge la PAC. Si la page affiche l'interface de l'application, cherchez le lien vers le dépôt (souvent en bas de page ou dans le README). Sur la page du dépôt, cliquez sur le fichier index.html pour l'ouvrir.

Une fois le fichier ouvert, cliquez sur le bouton Raw (en haut à droite de la zone de code). Cela affiche le code source brut dans votre navigateur, sans mise en forme.

💡
Sur la page Raw, faites Ctrl+A puis Ctrl+C (ou Cmd+A / Cmd+C sur Mac) pour sélectionner et copier la totalité du code en une seule fois.
2
Création de votre dépôt

Créer votre propre dépôt GitHub Pages

Connectez-vous à GitHub (créez un compte gratuit si vous n'en avez pas). Cliquez sur New repository. Donnez-lui un nom explicite, par exemple : pac-curriculum-vitae ou analyse-manuels-histoire.

Dans les paramètres du dépôt (Settings → Pages), activez GitHub Pages en sélectionnant la branche main comme source. Votre application sera alors accessible à une URL du type :

Votre URL publique
https://votre-nom-utilisateur.github.io/nom-du-depot/

Créez maintenant un fichier index.html à la racine du dépôt et collez-y le code que vous avez copié à l'étape 1.

ℹ️
Vous pouvez aussi éditer directement dans l'interface GitHub sans installer quoi que ce soit : cliquez sur le fichier → icône crayon → modifiez → Commit changes. L'application se met à jour en 30 secondes.
3
Identification des zones à modifier

Repérer le bloc à personnaliser dans le code

Ouvrez votre fichier index.html dans un éditeur de texte (Notepad++, VSCode, ou même l'éditeur GitHub). Cherchez le commentaire suivant avec Ctrl+F :

Rechercher dans le fichier
// ═══════════════════ DATA ═══════════════════ const DIMS = [

C'est ici que résident toutes vos dimensions analytiques. Chaque objet dans ce tableau correspond à une dimension de votre grille de codage. C'est la seule zone du code que vous devez impérativement modifier pour adapter l'outil à votre recherche.

⚠️
Ne modifiez rien en dehors de ce bloc DIMS et de la section Étape 7 (titre et attribution) sauf si vous maîtrisez JavaScript. Toute la logique de l'application dépend de la structure exacte de ce tableau.
4
Personnalisation du cœur analytique

Remplacer les dimensions par les vôtres

Chaque dimension suit une structure précise. Voici le modèle à reproduire autant de fois que vous avez de dimensions (entre 4 et 8 est recommandé pour préserver la fiabilité inter-codeurs) :

Structure d'une dimension — à copier-coller et remplir
{ id: 'D1', // Identifiant court : D1, D2, D3... label: 'Nom de la dimension', question: 'La question directrice que se pose le codeur ?', options: [ // 2 à 4 options de codage {v:'P', l:'Présente'}, {v:'A', l:'Absente'}, {v:'M', l:'Mixte'} ], indicators: { present: [ // Liste des signes que la dimension est présente 'Indicateur 1', 'Indicateur 2', ], absent: [ // Liste des signes que la dimension est absente 'Indicateur A', 'Indicateur B', ] } },

Pour chaque dimension, remplacez simplement les textes entre guillemets par vos propres formulations. Les identifiants v (valeur courte, ex. 'P') doivent rester courts car ils apparaîtront dans les exports CSV.

Voici comment la grille originale de Lamolet est structurée, pour vous donner un modèle de référence :

IDDimensionQuestion directriceOptions
D1RéificationLe décrochage est-il traité comme une « chose » possédée par l'élève ?P / A / M
D2Vocabulaire cliniqueUn vocabulaire médical/pathologique est-il utilisé ?P / A / M + Cible
D3FocalisationOù est situé le problème ? Dans l'élève ou dans l'institution ?E / I / M
D4Reconnaissance des acquisLes savoirs hors école sont-ils évoqués ?P / A / M
D5Norme impliciteLes normes scolaires sont-elles explicitées ou présupposées ?I / E / M
D6Statut du LPLe LP est-il défini par défaut ou avec une logique propre ?D / P / M
💡
Bonne pratique. Testez votre grille sur 2 ou 3 extraits avant de coder l'ensemble du corpus. Si vous hésitez souvent entre deux options sur la même dimension, c'est signe que la question directrice ou les indicateurs doivent être précisés.
5
Adaptation des métadonnées

Ajuster les champs du formulaire Corpus

Les listes déroulantes du formulaire d'ajout de documents (Type, Focus, Période) sont également adaptables. Cherchez dans le code les blocs <select id="c-type">, <select id="c-focus"> et <select id="c-periode">.

Par exemple, si votre corpus couvre la presse quotidienne régionale et la presse nationale, vous pourriez remplacer Scientifique / Institutionnel par PQR / PQN / Presse spécialisée. Modifiez simplement le texte entre les balises <option>.

Exemple — Adapter le type de source
<!-- Remplacer ceci... --> <option>Scientifique</option> <option>Institutionnel</option> <!-- ...par vos propres catégories --> <option>Presse quotidienne régionale</option> <option>Presse quotidienne nationale</option> <option>Presse spécialisée</option>
⚠️
Si vous changez les valeurs du champ Type, pensez à mettre à jour la logique de la Synthèse comparative (ligne qui contient doc.type === 'Scientifique') pour que les barres du tableau comparatif restent cohérentes.
6
Test et validation

Vérifier l'application avant de commencer le codage

Avant de vous lancer dans le codage de l'ensemble de votre corpus, effectuez un test complet avec 1 document et 3 extraits fictifs :

  • L'onglet Corpus enregistre bien un document avec vos nouvelles catégories.
  • L'onglet Extraits génère des ID corrects (ex. 001-1).
  • L'onglet Codage affiche bien vos nouvelles dimensions, questions et indicateurs.
  • Les options de codage correspondent à vos choix théoriques.
  • L'onglet Synthèse affiche des barres après avoir codé au moins 1 extrait.
  • L'export codage_enrichi.csv s'ouvre correctement dans Jamovi ou Excel.
  • La sauvegarde JSON fonctionne (Export → Sauvegarder tout) et peut être restaurée.
💡
Double codage. Si un second codeur participe à la recherche, partagez l'URL GitHub Pages : il peut coder sur sa propre machine et vous envoyer son fichier JSON. Comparez ensuite les deux codages pour calculer le Kappa de Cohen dans Jamovi.
7
Attribution & publication

Mettre à jour le titre et conserver l'attribution

Personnalisez le titre de l'application pour votre recherche en modifiant la balise <title> et le texte du .brand dans le <header>. Vous pouvez ajouter votre propre nom :

Exemple — Personnalisation du titre
<!-- Titre dans l'onglet du navigateur --> <title>PAC — Analyse Presse Scolaire</title> <!-- Bandeau en haut de l'application --> <div class="brand"> PAC <span>— Analyse Presse Scolaire · Dupont (2026) · d'après Lamolet (2026)</span> </div>
Utilisation des données exportées

Analyser les CSV dans Jamovi ou Sphinx

La PAC produit 4 fichiers CSV. Voici comment les utiliser dans les logiciels d'analyse courants en SHS.

📊 Dans Jamovi

Ouvrez directement le fichier codage_enrichi.csv (Fichier → Ouvrir). Toutes les variables sont présentes dans une seule table. Utilisez Analyses → Fréquences pour les tris à plat et Analyses → Test du χ² pour les comparaisons entre types de sources.

📋 Dans Sphinx

Importez codage.csv comme base de données d'une enquête. Chaque colonne D1–D6 correspond à une variable catégorielle. Effectuez des tris à plat par dimension, puis des tris croisés (Type × D1, Période × D3, etc.).

🔗 Jointure manuelle

Si vous travaillez dans R ou Python, importez corpus.csv et codage.csv séparément et rejoignez-les sur ID_Doc. Cela reproduit exactement la logique du fichier enrichi.

💾 Sauvegarde longue durée

Le fichier JSON (Export → Sauvegarder tout) conserve l'intégralité de vos données, y compris les textes des extraits. Exportez-le régulièrement. Les CSV, eux, ne contiennent que les données structurées.