Apprendre R avec les LLMs
14 octobre 2025
Production attendue : Dashboard avec 4 graphiques + fonction de visualisation réutilisable
Maîtriser les données complexes et la visualisation
Créez rapidement une fonction qui :
Dans le monde réel, les données contiennent souvent :
Important
Le nettoyage des données représente souvent 80% du travail d’analyse !
Voici un jeu de données de ventes :
Demandez au LLM :
“Quels sont les problèmes potentiels dans ce jeu de données pour une analyse ?”
Identifiez :
Problème : Les noms “Alice”, “alice” et “Bob”, “bob” sont comptés séparément.
Demandez au LLM comment standardiser les noms.
Vous découvrirez probablement :
Plusieurs stratégies possibles :
Demandez au LLM :
“Comment gérer les valeurs NA dans mes données de ventes ? Quelles sont les différentes approches ?”
Options principales :
na.omit()
na.rm = TRUE
dans les calculsRéflexion importante
Quelle stratégie choisir dépend du contexte ! Supprimer des données peut introduire des biais.
Nouveau challenge - Données étudiants :
Mission :
Utilisez le LLM étape par étape !
Jusqu’ici vous avez utilisé plot()
, hist()
, barplot()
…
ggplot2 est un package puissant pour créer des graphiques :
ggplot2 fonctionne par couches :
ggplot(data = mes_donnees)
aes(x = variable1, y = variable2)
geom_point()
, geom_line()
, geom_bar()
On ajoute des couches avec +
Demandez au LLM :
“Comment créer un graphique simple avec ggplot2 en R ? Je débute avec ce package.”
Ensuite, testez avec vos données de ventes :
Questions :
aes()
?geom_col()
et pas geom_bar()
?Personnalisez votre graphique :
Demandez au LLM :
“Comment personnaliser les couleurs, titres et thème d’un graphique ggplot2 ?”
Explorez :
theme_bw()
, theme_classic()
geom_hline()
Demandez au LLM de vous montrer comment créer :
geom_point()
)geom_line()
)geom_boxplot()
)geom_histogram()
)Testez chaque type avec des données adaptées.
Certains types nécessitent des données spécifiques !
Challenge : Créez un graphique des ventes coloré par vendeur.
Demandez au LLM :
“Comment créer un graphique avec ggplot2 où chaque catégorie a une couleur différente ?”
Vous découvrirez :
Questions :
position = "dodge"
?Si vous créez souvent le même type de graphique :
Créez une fonction qui génère un graphique en barres standard :
Demandez au LLM d’expliquer :
.data[[...]]
?Améliorez votre fonction avec plus d’options :
graphique_personnalise <- function(donnees, x, y, titre,
couleur = "steelblue",
type = "barres") {
# Créer le graphique de base
g <- ggplot(donnees, aes(x = .data[[x]], y = .data[[y]]))
# Ajouter la géométrie selon le type
if (type == "barres") {
g <- g + geom_col(fill = couleur)
} else if (type == "points") {
g <- g + geom_point(color = couleur, size = 3)
}
# Ajouter titre et thème
g <- g + labs(title = titre) + theme_minimal()
return(g)
}
Testez avec différentes options !
Objectif : Créer un dashboard d’analyse avec 4 graphiques différents.
Données :
Les 4 graphiques à créer :
Utilisez ggplot2 pour tous les graphiques
Personnalisez-les avec des couleurs et titres appropriés.
Bonus :
facet_wrap()
)ggsave()
Documentez dans votre journal :
plot()
de base✅ Nettoyer des données réelles avec incohérences ✅ Utiliser ggplot2 pour créer des graphiques professionnels ✅ Maîtriser différentes géométries (barres, points, lignes, boxplot) ✅ Personnaliser l’apparence des graphiques ✅ Créer des fonctions de visualisation réutilisables ✅ Combiner analyse et communication visuelle
Nettoyage :
tolower()
, toupper()
: standardiser la cassena.omit()
: supprimer les NAunique()
, table()
: explorer les valeursggplot2 :
ggplot()
+ aes()
: base du graphiquegeom_col()
, geom_point()
, geom_line()
: géométrieslabs()
: titres et labelstheme_minimal()
, theme_bw()
: thèmes?ggplot2
Devoirs
Prochaine séance : Projet personnel intégré - vous allez mener une analyse complète en autonomie !
Points clés à retenir
Bon courage et belles visualisations ! 📊
Séance 4 - Données tabulaires et graphiques avancés