Projet Final

Apprendre R avec les LLMs

Auteur·rice

Elias Bouacida

Date de publication

3 décembre 2025

Plan de la présentation

  • Présentation du projet : Cadrage et attentes
  • Choix et préparation : Sélection du jeu de données et définition des questions
  • Travail autonome : Analyse libre avec consultations individuelles

Production attendue : Analyse complète avec code, graphiques et interprétation

Objectifs de la séance

AstuceMener une analyse complète en autonomie
  • Choisir et cadrer un sujet d’analyse personnel
  • Appliquer toutes les compétences acquises
  • Travailler en autonomie avec le LLM comme assistant

Présentation du projet

Qu’est-ce qu’un projet intégré ?

C’est une analyse complète qui combine TOUT ce que vous avez appris :

  • Import et nettoyage de données
  • Statistiques descriptives
  • Fonctions personnalisées
  • Conditions et boucles si nécessaire
  • Visualisations avec ggplot2
  • Interprétation des résultats
  • Utilisation des LLMs

Structure attendue

Votre projet doit contenir :

  1. Introduction : Quel sujet ? Quelles questions ?
  2. Données : Source, description, nettoyage
  3. Analyse : Statistiques, visualisations
  4. Fonctions : Au moins 2 fonctions personnalisées
  5. Résultats : Interprétation claire
  6. Code : Commenté et organisé

Critères d’évaluation (à titre informatif)

Excellence technique (40%) :

  • Code fonctionnel et robuste
  • Nettoyage approprié des données
  • Utilisation correcte des fonctions
  • Visualisations claires

Analyse (30%) :

  • Questions pertinentes
  • Statistiques appropriées
  • Interprétation correcte

Communication (20%) :

  • Code commenté
  • Présentation structurée des résultats
  • Graphiques lisibles

Utilisation des LLMs (10%) :

  • Prompts efficaces
  • Validation critique des réponses

Choix et cadrage

Étape 1 : Choisir des données

NoteSources de données possibles
AvertissementCritères de choix
  • Pas trop volumineux (< 10 000 lignes)
  • Au moins 3-4 variables
  • Vous intéresse vraiment !

Étape 1 : Exploration initiale

Une fois vos données choisies :

  1. Importez-les dans R
  2. Explorez-les :
# Premières lignes
head(mes_donnees)

# Structure
str(mes_donnees)

# Résumé
summary(mes_donnees)

# Dimensions
dim(mes_donnees)
  1. Identifiez les problèmes potentiels (NA, types, incohérences)

15 minutes. Les étudiants découvrent leurs données.

Étape 2 : Définir ses questions

Avant d’analyser, définissez 2-3 questions claires.

Exemples de bonnes questions :

  • “Quelle est l’évolution des ventes au fil du temps ?”
  • “Y a-t-il une différence de salaire entre les groupes ?”
  • “Quels facteurs influencent le plus la note finale ?”

Mauvaises questions (trop vagues) :

  • “Qu’est-ce qu’il y a dans ces données ?”
  • “Fais une analyse”

Étape 3 : Cadrage du projet

Remplissez ce cadre (écrivez-le !) :

PROJET : [Titre court]

DONNÉES :
- Source :
- Nombre de lignes :
- Variables principales :

QUESTIONS :
1.
2.
3.

ANALYSES PRÉVUES :
- Statistiques :
- Graphiques :
- Fonctions à créer :

Montrez votre cadre à l’enseignant avant de commencer !

15 minutes. Validation du cadrage. Éviter que les étudiants se lancent sans direction.

Travail autonome

Phase de travail (chez vous)

AstuceVous êtes maintenant autonome !

Utilisez tout ce que vous avez appris :

  • Les LLMs pour vous aider
  • La documentation R
  • Votre journal de bord
  • Vos camarades
  • L’enseignant (par mail ou dans son bureau)
AvertissementAttention !
  • Testez votre code régulièrement
  • Commentez au fur et à mesure
  • Sauvegardez souvent
  • Documentez vos prompts LLM

Checklist de progression

Pendant votre travail, vérifiez que vous avez :

Stratégies pour avancer

Si vous êtes bloqué :

  1. Décomposez le problème en étapes plus petites
  2. Demandez au LLM une étape à la fois
  3. Testez chaque étape avant de passer à la suivante
  4. Consultez votre journal des séances précédentes
  5. Demandez de l’aide à un camarade ou l’enseignant

Vous pouvez en plus :

  • Créez des visualisations plus sophistiquées
  • Ajoutez des fonctions bonus
  • Explorez des analyses supplémentaires
  • Aidez vos camarades

Consultations individuelles

Vous pouvez demander :

  • Validation de votre approche
  • Aide sur un bug précis
  • Conseils sur les visualisations
  • Vérification de votre code
AstucePréparez votre question

Avant d’appeler l’enseignant, préparez :

  • Ce que vous essayez de faire
  • Ce que vous avez déjà essayé
  • Le message d’erreur exact (si erreur)

Exemples de projets réussis

Pour vous inspirer :

Analyse de données sportives :

  • Évolution des performances d’une équipe
  • Comparaison entre joueurs
  • Fonction : calculer et visualiser les statistiques d’un joueur

Analyse économique :

  • Évolution du PIB par pays
  • Comparaison de secteurs économiques
  • Fonction : calculer la croissance sur différentes périodes

Données de santé :

  • Relation entre facteurs et résultats de santé
  • Distribution des variables
  • Fonction : classifier les risques selon des critères

Analyse de sondage :

  • Pourcentages par catégorie
  • Comparaisons entre groupes
  • Fonction : créer des graphiques standardisés

Retour réflexif

Exercice réflexif : Journal de bord

Documentez en détail dans votre journal :

  1. Votre projet :
    • Sujet choisi et pourquoi
    • Questions posées
    • Résultats principaux
  2. Défis techniques :
    • Problèmes rencontrés
    • Solutions trouvées
    • Rôle du LLM dans la résolution
  3. Apprentissages :
    • Ce que vous maîtrisez maintenant
    • Ce qui reste difficile
    • Progression depuis la séance 1
  4. Prompts LLM :
    • Vos prompts les plus efficaces
    • Erreurs du LLM et comment vous les avez corrigées

15 minutes. Documentation importante de ce projet majeur.