Apprendre R avec les LLMs
14 octobre 2025
Production attendue : Analyse commentée de données avec graphiques
Manipuler de vraies données
Conseils pour améliorer vos journaux
Sans utiliser le LLM, écrivez un script qui :
print()
Ensuite, comparez avec votre voisin et discutez des différences.
Jusqu’ici, vous avez créé des données avec c()
:
Dans la vraie vie, les données viennent souvent de fichiers : CSV, Excel, bases de données, etc.
CSV = Comma Separated Values
Un format simple et universel pour stocker des données tabulaires.
donnees_meteo.csv
Demandez à votre LLM :
“Comment importer un fichier CSV en R ? Je débute en programmation.”
Testez cette commande !
En cas d’erreur, demandez au LLM de vous aider à débugger.
Une fois importé, vérifiez que ça a fonctionné :
Demandez au LLM d’expliquer ce que montrent ces fonctions.
Les données importées sont stockées dans un data frame.
Analogie
Un data frame est comme un tableau Excel : des lignes (observations) et des colonnes (variables).
Avec vos données météo, testez :
Questions :
Pour accéder à une colonne spécifique, utilisez $
:
Pour chaque variable numérique dans vos données, calculez :
sd()
)Demandez au LLM :
“Comment calculer des statistiques descriptives sur une colonne d’un data frame en R ?”
Notez vos résultats dans un commentaire de votre script.
summary()
summary()
donne un aperçu rapide :
Elle affiche :
Comparez vos calculs précédents avec summary()
:
Questions :
Testez ce code :
Demandez au LLM :
“Comment gérer les valeurs manquantes (NA) lors du calcul de statistiques en R ?”
Créez un script qui génère un rapport complet sur la variable température :
# Rapport sur la température
print("=== ANALYSE DE LA TEMPÉRATURE ===")
print(paste("Nombre d'observations :", length(donnees_meteo$temperature)))
print(paste("Valeurs manquantes :", sum(is.na(donnees_meteo$temperature))))
print(paste("Moyenne :", mean(donnees_meteo$temperature, na.rm = TRUE)))
print(paste("Médiane :", median(donnees_meteo$temperature, na.rm = TRUE)))
print(paste("Écart-type :", sd(donnees_meteo$temperature, na.rm = TRUE)))
Extension : Faites la même chose pour une autre variable.
Demandez au LLM :
“Comment créer un graphique simple en R pour visualiser l’évolution d’une variable dans le temps ? Je débute.”
Testez ce code !
Si vous avez une erreur avec les dates, demandez au LLM comment les convertir au bon format.
Les graphiques de base peuvent être personnalisés :
Demandez au LLM d’expliquer chaque paramètre.
Demandez au LLM comment créer :
Testez chaque type et notez dans votre journal :
Pour sauvegarder un graphique :
Le fichier sera dans votre dossier de travail.
Important
Tout le monde rencontre des erreurs. C’est une partie essentielle de la programmation.
Stratégie de debugging :
Voici du code avec des erreurs. Trouvez-les et corrigez-les :
Travaillez par groupes de 2-3. Utilisez le LLM si nécessaire.
Erreurs à trouver :
print()
Comment demander de l’aide efficacement
Mauvais prompt : > “Ça marche pas”
Bon prompt : > “J’essaie d’importer un fichier CSV avec read.csv() mais j’obtiens cette erreur : [copier l’erreur exacte]. Voici mon code : [copier le code]. Que dois-je corriger ?”
Donnez toujours :
Objectif : Analyser des données économiques réelles.
Étapes :
Rapport attendu
Votre analyse doit inclure :
str()
, summary()
, etc.)Bonus :
Si vous êtes bloqué :
Conseil
Procédez par étapes. Testez chaque ligne avant de passer à la suivante.
Dans votre journal, documentez :
Séance 1 : Vous avez appris les bases (objets, fonctions, vecteurs)
Séance 2 : Vous savez maintenant :
Vous êtes déjà capable d’analyser de vraies données ! 🎉
Import et exploration :
read.csv()
, getwd()
, setwd()
head()
, str()
, summary()
, dim()
, names()
Statistiques :
mean()
, median()
, sd()
, min()
, max()
na.rm = TRUE
pour gérer les NAVisualisation :
plot()
, hist()
, boxplot()
type
, col
, main
, xlab
, ylab
ggplot2
(pour plus tard)Devoirs
Prochaine séance : Fonctions, conditions et boucles - automatiser vos analyses !
Points clés à retenir
$
permet d’accéder aux colonnesBon courage et bonnes analyses ! 📊
Séance 2 - Données et fonctions