Apprendre R avec les LLMs
3 décembre 2025
Production attendue : Analyse commentée de données avec graphiques
Manipuler de vraies données
Conseils pour améliorer vos journaux
Sans utiliser le LLM, écrivez un script qui :
print()Ensuite, comparez avec votre voisin et discutez des différences.
Jusqu’ici, vous avez créé des données avec c() :
Dans la vraie vie, les données viennent souvent de fichiers : CSV, Excel, bases de données, etc.
CSV = Comma Separated Values
Un format simple et universel pour stocker des données tabulaires.
donnees_meteo.csvDemandez à votre LLM :
“Comment importer un fichier CSV en R ? Je débute en programmation.”
Vous devriez obtenir quelque chose comme :
Ou la proposition d’utiliser la commande d’importation de Rstudio.
Testez cette commande !
En cas d’erreur, demandez au LLM de vous aider à déboguer.
Une fois importé, vérifiez que ça a fonctionné :
À quoi servent ces fonctions ?
Les données importées sont stockées dans un data.frame.
Analogie
Un dataframe est comme une feuille d’un tableau Excel : des lignes (observations) et des colonnes (variables).
Avec vos données météo, testez :
Questions :
Pour accéder à une colonne spécifique, utilisez $ :
Pour chaque variable numérique dans vos données, calculez :
sd())Notez vos résultats dans un commentaire de votre script.
summary()summary() donne un aperçu rapide :
Elle affiche :
Comparez vos calculs précédents avec summary() :
Questions :
Testez ce code :
Demandez au LLM :
“Comment gérer les valeurs manquantes (NA) lors du calcul de statistiques en R ?”
Créez un script qui génère un rapport complet sur la variable température en utilisant la fonction paste (cherchez ce qu’elle fait).
Extension : Faites la même chose pour une autre variable.
Demandez au LLM :
“Comment créer un graphique simple en R pour visualiser l’évolution d’une variable dans le temps ? Je débute.”
Vous découvrirez probablement plot() (ou ggplot) :
Testez ce code !
Si vous avez une erreur avec les dates, demandez au LLM comment les convertir au bon format.
Les graphiques de base peuvent être personnalisés :
Que signifie chaque paramètre ?
Demandez au LLM comment créer :
Testez chaque type et notez dans votre journal :
Pour sauvegarder un graphique, vous pouvez utiliser l’exportation de Rstudio.
Note
Le fichier sera dans votre dossier de travail.
Important
Tout le monde rencontre des erreurs. C’est une partie essentielle de la programmation.
Stratégie de débogage :
Voici du code avec des erreurs. Trouvez-les et corrigez-les :
Travaillez par groupes de 2-3. Utilisez le LLM si nécessaire.
Erreurs à trouver :
paste() et virgule manquante dans print()Comment demander de l’aide efficacement
Mauvais prompt : > “Ça ne marche pas”
Bon prompt : > “J’essaie d’importer un fichier CSV avec read.csv() mais j’obtiens cette erreur : [copier l’erreur exacte]. Voici mon code : [copier le code]. Que dois-je corriger ?”
Donnez toujours :
Objectif : Analyser des données économiques réelles.
Étapes :
Rapport attendu
Votre analyse doit inclure :
str(), summary(), etc.)Bonus :
Si vous êtes bloqué :
Conseil
Procédez par étapes. Testez chaque ligne avant de passer à la suivante.
Dans votre journal, documentez :
Import et exploration :
read.csv(), getwd(), setwd()head(), str(), summary(), dim(), names()Statistiques :
mean(), median(), sd(), min(), max()na.rm = TRUE pour gérer les NAVisualisation :
plot(), hist(), boxplot()type, col, main, xlab, ylabggplot2 (pour plus tard)Devoirs
Prochaine séance : Fonctions, conditions et boucles – automatiser vos analyses !
Points clés à retenir
$ permet d’accéder aux colonnesSéance 2 - Données et fonctions