v4Bandeau_Data_SHS_2025_2_.jpg
                                          

Programme détaillé de la semaine (avec résumé)

Programme Data SHS – Semaine du 8 au 12 décembre


Lundi 8 décembre

Sur site : Université de Bordeaux (site Pessac), 16 Av. Léon Duguit, 33600 Pessac


8h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


9h00 – 12h00 : LLMs et SHS – État de l’art, usages pratiques et recommandations méthodologiques

Amar Lakel (MICA, UBM)

Université de Bordeaux – site Pessac – Bâtiment C4 – 1er étageTravée C4 – Salle 126 (COMPTRASEC)

Résumé :
Objectifs :

  • Dresser un état de l’art raisonné (2023–2025) des recherches mobilisant les LLM en SHS, à partir d’une méta-analyse systématique et de travaux récents.

  • Démontrer, par la pratique, la portée et les limites opérationnelles des LLM dans des protocoles de recherche qualitatifs et mixtes.

  • Formuler des recommandations méthodologiques, éthiques et politico-critiques pour une intégration responsable des LLM en SHS.

Structure de l’atelier (3 h) :

TempsAxe traitéContenu et format
0h00 – 0h30 Introduction Cadre théorique, protocole de méta-analyse, repérage des sources (revues, preprints, dépôts open-source).
0h30 – 1h30 Annotation automatique & assistance à la codification qualitative ; Prompt et contextual engineering (RAG) Démonstrations comparatives des grands modèles LLM. Discussion sur la traçabilité et la variabilité des performances.
1h45 – 2h45 Automatisation des process et architecture agentique (N8N, MCP etc) Cas pratique : la recherche bibliographique et l'Etat de l'art
2h25 – 2h45 Biais, reproductibilité, interprétabilité Risques de biais linguistiques et politiques ; bonnes pratiques de conservation des versions.
2h45 – 3h00 Conclusion Synthèse et grille de recommandations (transparence, audit humain, formation).

 

Principales conclusions attendues :

  • Efficacité économique des LLM pour l’annotation, contrebalancée par des performances hétérogènes.

  • Importance du prompt engineering et de la documentation systématique.

  • Potentiel des MAMM pour articuler scalabilité computationnelle et expertise qualitative.

  • Risques persistants de biais et enjeux de reproductibilité.

Pré-requis :
Une familiarité minimale avec R et Python est un plus. Ressources disponibles sur un dépôt GitHub.


13h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


14h00 – 17h00 : Initiation à Python

Léo Mignot (CED, CNRS, Sciences Po Bordeaux)

Université de Bordeaux – site Pessac – Bâtiment C4 – 1er étageTravée C4 – Salle 126 (COMPTRASEC)

Résumé:

Cette séance propose une initiation à la programmation scientifique en Python, pensée pour les SHS.
Python est un langage libre, simple et multiplateforme, bénéficiant d’une large communauté scientifique.
Avec la multiplication des données numériques, la programmation est devenue un atout pour la collecte, le traitement et l’analyse des données.

La session couvrira les bases du langage et l’usage de bibliothèques (notamment pandas) pour l’analyse de données.

Public cible :
Toute personne souhaitant découvrir Python pour le traitement de données. Aucun prérequis n’est nécessaire.

Préparation :
Avant la formation, il est conseillé :

Mardi 9 décembre

Sur site : Université de Bordeaux (site Pessac), 16 Av. Léon Duguit, 33600 Pessac


8h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


9h00 – 12h00 : Introduction à l’analyse de réseaux – un exemple pour le droit avec Gephi

Gautier Debruyne (CNRS, Comptrasec, UB)

Université de Bordeaux – site Pessac – Bâtiment C4 – 1er étageTravée C4 – Salle 126 (COMPTRASEC)

Résumé:

Cette formation pour débutants (sans prérequis techniques ou statistiques) propose :

  • une contextualisation historique et scientifique de l’analyse de réseaux,
  • un exemple d’application en recherche juridique,
  • un exercice pratique sur Gephi avec des données simples.

13h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


14h00 – 17h00 : Collecte automatisée de données sur le web – Initiation au webscraping

Laurent Berge (BSE, UB)

Université de Bordeaux – site Pessac – Bâtiment C4 – 1er étageTravée C4 – Salle 126 (COMPTRASEC)

Résumé :

Internet regorge d’informations exploitables pour la recherche.
Ce workshop propose une initiation à la collecte automatisée de données (webscraping) avec Python.
Après une présentation du fonctionnement du web, les participants apprendront à automatiser la récupération de données et créer leur propre page web à scrapper.
Aucune expérience en programmation n’est requise.

Mercredi 10 décembre

Sur site : Université de Bordeaux (site Pessac), 16 Av. Léon Duguit, 33600 Pessac


8h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


9h00 – 12h00 : Représentations graphiques avec ggplot2

Claire Kersuzan (PUD-Bx-PROGEDO, MSH-Bx, Comptrasec, UB)

Université de Bordeaux – site Pessac – Salle de formation URFIST - Bâtiment C4 RDCTravée C4 – Salle 014

Résumé :
Objectifs :

  1. Maîtriser les principes de la représentation graphique (variables, sémiologie, titres, échelles, etc.).

  2. Utiliser le package ggplot2 du tidyverse pour créer des graphiques reproductibles et esthétiques.

  3. Mettre en pratique sur les microdonnées de l’enquête ERFI-1 (INED/INSEE, 2005), en lien avec le nouveau cycle ERFI-2 (2023, projet LifeObs).

Prérequis :
Connaissance de base de R et RStudio (manipulation d’objets, tidyverse, statistiques simples).
Compétences acquises via le kit pédagogique Initiation à l’exploitation de données d’enquête avec R – ERFI-1.


13h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


14h00 – 17h00 : Représentations graphiques avec ggplot2 (suite)

Claire Kersuzan (PUD-Bx-PROGEDO, MSH-Bx, Comptrasec, UB)

Jeudi 11 décembre

Sur site : Université de Bordeaux (site Pessac), 16 Av. Léon Duguit, 33600 Pessac


8h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


9h00 – 12h00 : Initiation à Hyperbase

Camille Desiles (LAM, CNRS, Sciences Po Bordeaux)

Université de Bordeaux – site Pessac – Salle de formation URFIST - Bâtiment C4 RDCTravée C4 – Salle 014

Résumé :

Comment étudier les textes à grande échelle afin de produire des connaissances mobilisables et des analyses utiles dans différentes disciplines ?
Cet atelier propose une initiation pratique à Hyperbase, un outil d’analyse textuelle permettant d’explorer des corpus à l’aide de méthodes statistiques (fréquences, concordances, cooccurrences, comparaisons inter-corpus).


13h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


14h00 – 17h00 : Topic Modeling

Grégoire Le Campion (CNRS, Passages, UBM)

Université de Bordeaux – site Pessac – Salle de formation URFIST - Bâtiment C4 RDCTravée C4 – Salle 014

Résumé :

R offre un environnement de plus en plus intégré, avec de nombreux packages efficaces pour l’analyse textuelle.
Cet atelier propose une initiation à la textométrie avec R, ainsi qu’une présentation du topic modeling, une méthode phare du TAL pour faire émerger les grandes thématiques d’un corpus textuel.
Bien que datant des années 1990, cette approche reste encore peu connue, mais elle constitue une alternative intéressante aux méthodes de classification proposées par Iramuteq.

Vendredi 12 décembre

Sur site : Université de Bordeaux (site Pessac), 16 Av. Léon Duguit, 33600 Pessac


8h30 – Pot d’accueil

Université de Bordeaux – site Pessac – Bâtiment C4 RDCTravée C4 – Salle 016


9h00 – 12h00 : Données de panel et choix entre effets fixes et aléatoires – Création d’un outil pédagogique sous R

Véronique Darmendrail (IAE, UB) & Solenne Roux (LabPsy, UB)

Université de Bordeaux – site Pessac – Salle de formation URFIST - Bâtiment C4 RDCTravée C4 – Salle 014

Résumé :

A partir de données simulées, présentation d’un cas pratique permettant de comparer les modèles de régression à effets fixes et aléatoires selon la corrélation entre effet individuel et variable explicative.
Objectif : mieux comprendre les conséquences de ce choix de modèle, au-delà des habitudes disciplinaires.
La séance inclut la présentation d’un outil pédagogique de visualisation développé dans le cadre de l’AAP ECOr Émergence 2025, suivie d’un temps d’échanges avec les participants.

La séance sera suivie d’un déjeuner (plateaux-repas) proposé par Véronique Darmendrail (IAE, UB) et Solenne Roux (LabPsy, UB – SO-MATé). La participation au déjeuner est soumise à une inscription préalable avant le 1er décembre.

 

 


 

 

 

 

Chargement... Chargement...