Découvrez l’addin Esquisse !

addin R esquisse ggplot2

Récemment, DreamRs (une entreprise FRANCAISE de conseils et d’expertises en data science spécialisée en R) a développé un addin R, nommé Esquisse, qui permet de créer des graphiques ggplot2 de façon interactive, en cliquer-glisser (ou drag and drop). Outre le fait que cet addin permet à ceux qui débutent avec ggplot2, d’obtenir plus simplement et plus rapidement les visualisations souhaitées, c’est aussi un véritable outil pédagogique ! En effet une fois la visualisation réalisée avec Esquisse, l’addin fournit les lignes de commandes à utiliser avec ggplot2 pour parvenir au même résultat.

 

1. C’est quoi un addinR?

Un addin R c’est une extension de R Studio, qui s’installe comme un package, et qui permet de simplifier certaines manipulations. Par exemple, vous pouvez retrouver ici un article sur l’addin color picker qui facilite la gestion des couleurs sous R.

 

2. Comment installer l’addin Esquisse ?

Il y a deux solutions. La plus simple consiste à installer la version déposée sur CRAN, par exemple en utilisant l’outil d’installation de R Studio :

 

addin R esquisse ggplot2

 

 

La deuxième solution consiste à installer la version de développement depuis le répertoire GitHub de l’addin. Pour cela il est d’abord nécessaire d’installer le package devtools :

 

3. Comment utiliser Esquisse ?

3.1 Les données :

Tous les jeux de données présents dans l’environnement R vont être accessibles dans l’outil Esquisse. J’ai choisi d’illustrer l’utilisation de cet addin avec le jeu de données “sleepstudy” du package “lme4”, je vais donc commencer par le charger :

Ces données sont relatives à une expérimentation explorant l’effet de la privation de sommeil sur le temps moyen de réaction. Dix huit sujets sont soumis à trois heures de sommeil par nuit, pendant 10 jours ; leur temps moyen de réaction à une série de tests sont enregistrés quotidiennement.

Le jeu de données comporte alors trois variables :

  • Reaction : le temps de réaction
  • Days : le nombre jour écoulé depuis le début de l’expérimentation
  • Subjet : un numéro d’identification du suejt

 

 

Je charge également les jeux de données “mtcars” et “iris” qui appartiennent au package “dataset” (installé par défaut à chaque session ), afin d’avoir plusieurs datasets dans mon environnement R.

 

3.2 Ouverture d’Esquisse

Pour utiliser Esquisse, il suffit d’aller dans le menu Addins, de repérer la partie ESQUISSE et de choisir “ggplot2 builder”.

addin R esquisse ggplot2

 

Une fenêtre va alors s’ouvrir en superposition de R Studio:

addin R esquisse ggplot2

 

Dans la première partie de la fenêtre, vous allez pouvoir choisir, via un menu déroulant, sur quel jeu de données vous souhaitez travailler. Esquisse va vous proposer tous les jeux de données présents dans votre environnement R. Si votre environnement n’en contient pas, alors Esquisse vous proposera les jeux de données inclus dans le package ggplot2.

Une fois, le jeu de données sélectionné, il est possible de mettre de coté certaines variables (elles ne seront pas accessibles dans Esquisse).

addin R esquisse ggplot2

 

Ici, je choisis de conserver les 3 variables du jeu de données “. Il suffit alors de valider tous ces choix :

addin R esquisse ggplot2

 

Cette fenêtre de sélection disparaît et laisse place à l’outil Esquisse à proprement parlé :

addin R esquisse ggplot2

 

 

4. Exemple d’utilisation d’Esquisse.

4.1 Le principe du cliquer-glisser

Ici, je souhaite réaliser un boxplot afin de visualiser l’évolution du temps de réaction des sujets au fil des jours. Pour cela, il suffit de déplacer l’étiquette Réaction dans la boite Y, puis l’étiquette Days dans la boite X. Le graph se crée alors de façon automatique.

addin R esquisse ggplot2

 

Pour obtenir une représentation par sujet, il suffit de placer l’étiquette de la variable “Subject” dans la boite “Facet” :

addin R esquisse ggplot2

 

4.2 Gestion des titres et labels des axes

Vous pouvez alors très facilement ajouter un titre, un sous titre, changer les noms des axes à partir de la boite “Labels et Title”, qui se trouve dans la partie inférieure gauche.

addin R esquisse ggplot2

 

4.3 Modification des options du plot

La boite “Plot options” permet d’accéder à des options spécifiques du type de plot considéré. Ici il s’agit d’un scatterplot puisque les variable Y et X sont de type numérique continue.

addin R esquisse ggplot2

 

Dans le cas d’un scatterplot, il est possible :

  • d’ajouter une courbe de lissage,
  • de modifier la taille des points,
  • de changer la couleurs des points,
  • de modifier le thème du plot,
  • de changer la position de la légende, ou la supprimer complètement.

Remarque : Le type de graph, peut être modifié à partir de la boite en haut à gauche (au dessous de Choose data). Selon les variables sélectionnées en X et Y tous les choix ne sont pas disponibles.

 

4.4 Sélection des données

A partir de la boite “Data”, il est possible de  limiter les valeurs des variables du jeu de données considérées (ici Reaction, Days et Subject).

addin R esquisse ggplot2

 

4.5 Obtenir le code et exporter le graph

La dernière boite, “Export & code” est extrêmement intéressante puisqu’elle permet :

  • d’obtenir le code ggplot2 du plot réalisé en cliquer-glisser,
  • de copier ce code (bouton Copy to clipboard),
  • d’insérer ce code directement dans la console (Insert Code in script),
  • d’exporter le plot dans un fichier PNG,
  • d’exporter le plot directement dans un power point !

Et par expérience, je sais que cette dernière option est génialissime ! En plus le plot est modifiable !

 

addin R esquisse ggplot2

 

Et maintenant c’est à vous ! Faites des essais, modifiez, recommencez….

 

5. Pour aller plus loin :

 

Vous pouvez retrouvez d’autres exemples d’utilisation de cet addin ici.

Si vous voulez connaître d’autres addin R, vous trouverez une liste ici.

Et enfin, si vous voulez en apprendre davantage sur le développement d’un addin, je vous conseille cette présentation de Fanny et Victor, les fondateurs de dreamRs

 

6. Conclusion

Je pense que cet addin Esquisse est vraiment un outil intéressant. D’abord parce qu’il peut permettre, notamment aux débutants, d‘explorer rapidement un jeu de données. Ensuite, parce qu’il permet d’essayer, de nouvelles choses, très facilement et de façon ludique. Et enfin, parce qu’en fournissant les lignes de commandes de ggplot2, il permet de progresser, dans l’utilisation de ce package.

Et vous, que pensez vous de cet addin ? Dite le moi en commentaire !

Et si cet article vous a plu, partagez le 😉

 

Crédits photos : stux.

 

Poursuivez votre lecture

 

Partager l'article
  •  
  •  
  •  
  •  
  •  
    10
    Partages
  • 10
  •  
  •  
  •  
  •  

2 commentaires

  1. Jonathan Répondre

    Très bon article. Bonne continuation et encore merci pour ce genre d’article très instructif

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *