Apprendre R avec les LLMs
3 décembre 2025
Production attendue : Tableau de pilotage avec 4 graphiques + fonction de visualisation réutilisable
Maîtriser les données complexes et la visualisation
ggplot2Créez rapidement une fonction qui :
Dans le monde réel, les données contiennent souvent :
Important
Le nettoyage des données représente souvent 80% du travail d’analyse !
Voici un jeu de données de ventes :
Quels sont les problèmes potentiels dans ce jeu de données pour une analyse ?
Identifiez :
Problème : Les noms “Alice”, “alice” et “Bob”, “bob” sont comptés séparément.
Demandez au LLM comment standardiser les noms.
Vous découvrirez probablement :
Plusieurs stratégies possibles :
Demandez au LLM :
“Comment gérer les valeurs NA dans mes données de ventes ? Quelles sont les différentes approches ?”
Options principales :
na.omit()na.rm = TRUE dans les calculsRéflexion importante
Quelle stratégie choisir dépend du contexte ! Supprimer ou interpoler des données peut introduire des biais.
Données étudiants :
Objectif :
ggplot2ggplot2 ?Jusqu’ici, vous avez utilisé plot(), hist(), barplot()…
ggplot2 est un package puissant pour créer des graphiques :
ggplot2 fonctionne par couches :
ggplot(data = mes_donnees)aes(x = variable1, y = variable2)geom_point(), geom_line(), geom_bar()On ajoute des couches avec +
ggplot2Testez ce code :
Questions :
aes() ?geom_col() et pas geom_bar() ?Personnalisez votre graphique :
Explorez :
theme_bw(), theme_classic()geom_hline()Demandez au LLM de vous montrer comment créer :
geom_point())geom_line())geom_boxplot())geom_histogram())Testez chaque type avec des données adaptées.
Certains types nécessitent des données spécifiques !
Créez un graphique des ventes coloré par vendeur.
Comment créer un graphique avec ggplot2 où chaque catégorie a une couleur différente ?
Une réponse :
Questions :
fill ? Pourquoi ?position = "dodge" ?Si vous créez souvent le même type de graphique :
Créez une fonction qui génère un graphique en barres standard :
Demandez au LLM d’expliquer :
.data[[...]] ?Améliorez votre fonction avec plus d’options :
graphique_personnalise <- function(donnees, x, y, titre,
couleur = "steelblue",
type = "barres") {
# Créer le graphique de base
g <- ggplot(donnees, aes(x = .data[[x]], y = .data[[y]]))
# Ajouter la géométrie selon le type
if (type == "barres") {
g <- g + geom_col(fill = couleur)
} else if (type == "points") {
g <- g + geom_point(color = couleur, size = 3)
}
# Ajouter titre et thème
g <- g + labs(title = titre) + theme_minimal()
return(g)
}Testez avec différentes options !
Objectif : Créer un dashboard d’analyse avec 4 graphiques différents.
Données :
Les 4 graphiques à créer :
Utilisez ggplot2 pour tous les graphiques
Personnalisez-les avec des couleurs et titres appropriés.
ggplot2Bonus :
facet_wrap())ggsave()Documentez dans votre journal :
ggplot2 :
plot() de baseggplot2 pour créer des graphiques professionnelsNettoyage :
tolower(), toupper() : standardiser la cassena.omit() : supprimer les NAunique(), table() : explorer les valeursggplot2 :
ggplot() + aes() : base du graphiquegeom_col(), geom_point(), geom_line() : géométrieslabs() : titres et labelstheme_minimal(), theme_bw() : thèmes?ggplot2Devoirs
Prochaine séance : Projet personnel intégré - vous allez mener une analyse complète en autonomie !
Points clés à retenir
Séance 4 - Données tabulaires et graphiques avancés