# Premières lignes
head(mes_donnees)
# Structure
str(mes_donnees)
# Résumé
summary(mes_donnees)
# Dimensions
dim(mes_donnees)
Séance 5 : Projet personnel intégré
Apprendre R avec les LLMs
Plan de la séance
- Présentation du projet (15min) : Cadrage et attentes
- Choix et préparation (30min) : Sélection du dataset et définition des questions
- Travail autonome supervisé (120min) : Analyse libre avec consultations individuelles
- Présentations courtes (45min) : Partage des résultats (5min/étudiant)
Production attendue : Analyse complète avec code, graphiques et interprétation
Objectifs de la séance
- Choisir et cadrer un sujet d’analyse personnel
- Appliquer toutes les compétences acquises
- Travailler en autonomie avec le LLM comme assistant
- Communiquer ses résultats de manière claire
- Recevoir et donner du feedback constructif
Présentation du projet
Qu’est-ce qu’un projet intégré ?
C’est une analyse complète qui combine TOUT ce que vous avez appris :
- Import et nettoyage de données
- Statistiques descriptives
- Fonctions personnalisées
- Conditions et boucles si nécessaire
- Visualisations avec
ggplot2
- Visualisations avec
- Interprétation des résultats
- Utilisation efficace des LLMs
Structure attendue
Votre projet doit contenir :
- Introduction : Quel sujet ? Quelles questions ?
- Données : Source, description, nettoyage
- Analyse : Statistiques, visualisations
- Fonctions : Au moins 2 fonctions personnalisées
- Résultats : Interprétation claire
- Code : Commenté et organisé
Critères d’évaluation
Excellence technique (40%) :
- Code fonctionnel et robuste
- Nettoyage approprié des données
- Utilisation correcte des fonctions
- Visualisations claires
Analyse (30%) :
- Questions pertinentes
- Statistiques appropriées
- Interprétation correcte
Communication (20%) :
- Code commenté
- Présentation structurée
- Graphiques lisibles
Utilisation des LLMs (10%) :
- Prompts efficaces
- Validation critique des réponses
Choix et cadrage
Étape 1 : Choisir un dataset
- Pas trop volumineux (< 10 000 lignes)
- Au moins 3-4 variables
- Vous intéresse vraiment !
Exercice 1 : Exploration initiale
Une fois votre dataset choisi :
- Importez-le dans R
- Explorez-le :
- Identifiez les problèmes potentiels (NA, types, incohérences)
15 minutes. Les étudiants découvrent leurs données.
Étape 2 : Définir ses questions
Avant d’analyser, définissez 2-3 questions claires.
Exemples de bonnes questions :
- “Quelle est l’évolution des ventes au fil du temps ?”
- “Y a-t-il une différence de salaire entre les groupes ?”
- “Quels facteurs influencent le plus la note finale ?”
Mauvaises questions (trop vagues) :
- “Qu’est-ce qu’il y a dans ces données ?”
- “Fais une analyse”
Exercice 2 : Cadrage du projet
Remplissez ce cadre (écrivez-le !) :
PROJET : [Titre court]
DONNÉES :
- Source :
- Nombre de lignes :
- Variables principales :
QUESTIONS :
1.
2.
3.
ANALYSES PRÉVUES :
- Statistiques :
- Graphiques :
- Fonctions à créer :
Montrez votre cadre à l’enseignant avant de commencer !
15 minutes. Validation du cadrage. Éviter que les étudiants se lancent sans direction.
Travail autonome
Phase de travail (2h)
Utilisez tout ce que vous avez appris :
- Les LLMs pour vous aider
- La documentation R
- Votre journal de bord
- Vos camarades
- L’enseignant (consultations individuelles)
- Testez votre code régulièrement
- Commentez au fur et à mesure
- Sauvegardez souvent
- Documentez vos prompts LLM
Checklist de progression
Pendant votre travail, vérifiez que vous avez :
Stratégies pour avancer
Si vous êtes bloqué :
- Décomposez le problème en étapes plus petites
- Demandez au LLM une étape à la fois
- Testez chaque étape avant de passer à la suivante
- Consultez votre journal des séances précédentes
- Demandez de l’aide à un camarade ou l’enseignant
Si vous avancez vite :
- Créez des visualisations plus sophistiquées
- Ajoutez des fonctions bonus
- Explorez des analyses supplémentaires
- Aidez vos camarades
Consultations individuelles
Vous pouvez demander :
- Validation de votre approche
- Aide sur un bug précis
- Conseils sur les visualisations
- Vérification de votre code
Avant d’appeler l’enseignant, préparez :
- Ce que vous essayez de faire
- Ce que vous avez déjà essayé
- Le message d’erreur exact (si erreur)
Exemples de projets réussis
Pour vous inspirer :
Analyse de données sportives :
- Évolution des performances d’une équipe
- Comparaison entre joueurs
- Fonction : calculer et visualiser les statistiques d’un joueur
Analyse économique :
- Évolution du PIB par pays
- Comparaison de secteurs économiques
- Fonction : calculer la croissance sur différentes périodes
Données de santé :
- Relation entre facteurs et résultats de santé
- Distribution des variables
- Fonction : classifier les risques selon des critères
Analyse de sondage :
- Pourcentages par catégorie
- Comparaisons entre groupes
- Fonction : créer des graphiques standardisés
Présentations
Format de présentation
5 minutes par personne :
- Sujet et questions (30 sec) : Quoi et pourquoi ?
- Données (30 sec) : Source, nettoyage
- Résultats (3 min) : Montrez 2-3 graphiques clés
- Fonctions créées (1 min) : Vos outils personnalisés
- Questions (30 sec) : Discussions avec les pairs
Montrez votre code R en LIVE (pas de PowerPoint) !
Exercice 3 : Préparer sa présentation
Dans les 10 dernières minutes de travail :
- Sélectionnez vos 2-3 graphiques les plus importants
- Préparez votre script pour montrer :
- L’import des données
- Un exemple de nettoyage
- Les graphiques principaux
- Une fonction en action
- Testez que tout s’exécute sans erreur
- Notez les points clés à mentionner
Astuce : Créez un script de présentation séparé avec juste l’essentiel
Grille d’écoute
Pendant les présentations des autres, notez :
- Une approche intéressante que vous pourriez réutiliser
- Une visualisation particulièrement réussie
- Une question ou suggestion constructive
- Un problème similaire à ce que vous avez rencontré
Donnez des retours bienveillants et constructifs. Vous êtes tous en apprentissage !
Célébration des réussites
Réfléchissez :
- Qu’est-ce qui a été le plus difficile ?
- Qu’est-ce qui vous a le plus surpris ?
- Qu’est-ce qui vous a le plus appris ?
- Qu’est-ce qui vous a le plus plu ?
Retour réflexif
Exercice réflexif : Journal de bord
Documentez en détail dans votre journal :
- Votre projet :
- Sujet choisi et pourquoi
- Questions posées
- Résultats principaux
- Défis techniques :
- Problèmes rencontrés
- Solutions trouvées
- Rôle du LLM dans la résolution
- Apprentissages :
- Ce que vous maîtrisez maintenant
- Ce qui reste difficile
- Progression depuis la séance 1
- Prompts LLM :
- Vos prompts les plus efficaces
- Erreurs du LLM et comment vous les avez corrigées
15 minutes. Documentation importante de ce projet majeur.
Auto-évaluation
Évaluez votre propre projet :
Critère | 🔴 Faible | 🟡 Moyen | 🟢 Bon | 🟢🟢 Excellent |
---|---|---|---|---|
Code fonctionnel | ||||
Nettoyage données | ||||
Qualité graphiques | ||||
Interprétation | ||||
Commentaires | ||||
Utilisation LLM |
Ressources et prochaines étapes
Ce que vous avez accompli
- Choisi et cadré un projet d’analyse personnalisé
- Mené une analyse complète en autonomie
- Créé des fonctions personnalisées et réutilisables
- Produit des visualisations professionnelles
- Communiqué vos résultats à vos pairs
- Utilisé les LLMs comme partenaires d’analyse
- Développé votre autonomie en programmation
🎉 Félicitations ! Vous êtes maintenant capables d’analyser des données en autonomie !
Compétences à ce stade
Vous savez maintenant :
- Analyser des données de A à Z
- Choisir les bonnes analyses et visualisations
- Créer des fonctions adaptées à vos besoins
- Nettoyer et préparer des données réelles
- Interpréter et communiquer des résultats
- Utiliser les LLMs efficacement
- Débugger de manière autonome
Questions ?
- Vous êtes capables d’analyser des données en autonomie
- Le cadrage initial est crucial pour la réussite
- Les LLMs sont des assistants, mais c’est vous qui dirigez
- Tester et commenter au fur et à mesure est essentiel
- Le feedback des pairs enrichit votre apprentissage
Bravo pour ce projet ! 🚀