Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (2024)

C’est quoi tous ces onglets dans RStudio ? Comment j’exécute du code R ? C’est quoi un package ? Elles sont où mes fonctions ? Comment je les utilise ? Comment je lis l’aide de R ? Comment je met RStudio en dark mode pour avoir la classe ? Vous êtes débutant avec R et/ou RStudio, on vous aide à faire le premier pas.

Si vous n’avez pas tout suivi, on vous expliquait récemment comment installer R et RStudio, il est maintenant temps de les prendre en main !

Sommaire

Présentation de l’interface de RStudio

À l’ouverture, l’interface de RStudio se divise en 4 parties principales :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (1)

  • L’Editeur pour éditer votre code, enregistré dans des fichiers
  • La Console pour exécuter des lignes de code, écrites ici ou depuis le fichier source ouvert dans l’éditeur
  • L’Environment : Les éléments/objets R que vous aurez créés lors de l’exécution du code. Et d’autres onglets dont la connexion à vos bases de données notamment.
  • L’onglet Files pour la navigation dans les dossiers, notamment celui de votre projet. Plots pour l’affichage de graphique selon votre utilisation de vos scripts. Packages pour la liste des packages déjà installés sur la machine. Help pour l’aide des fonctions. Viewer pour afficher le contenu de pages HTML créées dans vos scripts.

Lancer ses premières lignes de code dans la console

Le code que vous écrivez dans la console est exécuté dès que vous tapez sur Entrée. Une fois le code exécuté, le signe > s’affiche et vous pouvez ensuite renseigner une nouvelle instruction. Si par exemple on tape 1 + 1 et Entrée :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (2)

Si l’instruction renseignée n’est pas complète, un signe + s’affiche et il faut la compléter. Par exemple si on tape dans la console sum(1:10 puis Entrée :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (3)

Il faut compléter l’instruction avec la parenthèse manquante afin de pouvoir l’exécuter.

Les projets R avec RStudio

Travailler en mode projet sur R est essentiel. Cela encourage à rendre votre travail portable, transférable à d’autres utilisateurs, sans changer le code. Être débutant ne vous empêche pas de suivre les bonnes pratiques !
Chaque projet dispose de son propre répertoire de travail, son espace de travail, son historique, et ses propres fichiers. Il détermine le contexte dans lequel le code sera exécuté.
Sur votre ordinateur, il s’agit d’un dossier dans lequel vous stockez le tout.
Avec RStudio, c’est aussi un dossier sur votre ordinateur, qui contient en plus un fichier de configuration dédié à RStudio.

Créer son premier projet avec RStudio

Pour créer un nouveau projet, cliquez dans le menu sur File > New Project…

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (4)

Vous aurez ensuite à faire un choix parmi 3 options : New Directory, Existing Directory ou Version Control.

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (5)

Ils correspondent aux 3 manières de créer un projet :

  • New Directory : dans un nouveau dossier
  • Existing Directory : dans un dossier déjà existant
  • Version Control : dans un nouveau dossier en important un projet depuis Git (GitHub, Gitlab, BitBucket, …) ou SVN.

Si vous choisissez de créer un nouveau répertoire de travail (New Directory), vous aurez ensuite à spécifier quel type de projet vous souhaitez. Ce seront tous des projets R, mais certains seront déjà “préremplis” avec des fichiers nécessaires au projet (par exemple si vous souhaitez créer un package). Pour votre premier projet, choisissez le premier : New Project.

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (6)

Dans l’interface suivante, nommez votre projet, choisissez le lieu de stockage sur votre ordinateur et validez.

Vous voilà maintenant dans votre nouvel espace de travail. Vous pouvez le vérifier en regardant si le nom du projet s’affiche bien en haut à droite de l’IDE :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (7)

La partie dédiée à la liste des fichiers du projet, l’onglet Files, montre qu’un fichier de projet ayant pour extension ".Rproj" est créé dans le répertoire du projet. Il peut être utilisé comme raccourci pour ouvrir le projet directement.

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (8)

Si vous utilisez le gestionnaire de fichiers habituel de votre ordinateur, et que vous déposez un fichier ou un dossier (de données par exemple) dans le répertoire du projet, vous le verrez apparaître dans la liste de cet onglet Files. Il sera alors accessible à votre projet.

Ouvrir/fermer un projet R

Par la suite, pour ouvrir votre projet, vous pouvez soit double-cliquer sur le fichier .Rproj dans votre navigateur de fichiers, soit depuis RStudio : File > Open Project…, soit le retrouver dans la liste File > Recent Projects.
À l’ouverture d’un projet, une nouvelle session R est démarrée et le répertoire courant devient celui du projet.

Pour fermer un projet, utilisez File > Close Project.

Vous pouvez travailler sur plusieurs projets en simultané, en ouvrant différentes sessions RStudio. Vous verrez qu’en ouvrant un projet existant, RStudio vous demande, avec une case à cocher, si vous voulez l’ouvrir dans une nouvelle session.

Recommandation : Lorsque vous fermez un projet, par défaut, RStudio vous demande si vous souhaitez enregistrer les données de la session dans un fichier .RData. Pour des questions de reproductibilité de votre travail, nous vous déconseillons fortement d’accepter. Vous pouvez d’ailleurs bloquer ce choix dans les options générale de RStudio.

Créer son premier script R

Maintenant que vous êtes dans votre tout nouveau projet R, vous allez pouvoir commencer à travailler, et créer un fichier R dans lequel sera sauvegardé votre code. Pour cela, cliquez sur File > New File > R Script ou vous pouvez utiliser le raccourci clavier CTRL + MAJ + N. Votre nouveau script s’ouvre dans la partie éditeur, vous pouvez commencer votre code.

Tapez par exemple les instructions suivantes dans l’éditeur :

v1 <- 1:10v2 <- rnorm(10)v3 <- LETTERS[1:10]v1v2v3

Il ne se passe rien tant que vous n’avez pas exécuté le code. Le script est un fichier de stockage de vos commandes, les commandes ne sont exécutées que si vous le demander explicitement.
Par exemple, si vous vous placez sur la première ligne, vous pouvez pour l’exécuter en tapant CTRL + Entrée

Votre code est exécuté et le curseur passe alors à la ligne suivante. Vous pouvez également sélectionner plusieurs lignes de votre code et les exécuter de la même manière que précédemment.

v1 <- 1:10v1
## [1] 1 2 3 4 5 6 7 8 9 10

Les lignes de code ci-dessus permettent de créer des objets R. Ces objets qui stockent des valeurs sont réutilisable dans la suite de votre code. Les objets que vous venez de créer sont visibles et listés dans l’onglet Environnement :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (9)

Pour sauvegarder votre code, tapez sur CTRL + S ou File > Save.

RStudio vous permet également de coder dans d’autres langages que R, et il est possible depuis l’IDE de créer de nombreux types de fichiers lisibles et exécutables par RStudio : RMarkdown, Shiny, Scripts C++, Python, HTML, CSS, JavaScript, SQL, …

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (10)

Qu’est-ce-qu’un package R ?

Les packages R sont des modules complémentaires qui permettent d’augmenter les capacités de R.
Ils contiennent un ensemble de fonctions R, relatives à un domaine ou un sujet spécifique. Certains packages sont dédiés à la manipulation des données, comme par exemple {dplyr}, à la data visualisation comme {ggplot2}, à l’analyse statistique, et bien d’autres choses encore.
En effet, la communauté R étant très vaste et hétérocl*te, et puisque R est un langage open source qui invite ses utilisateurs au partage, un large spectre de packages est disponible, que ce soit officiellement sur le CRAN, en développement sur GitHub, ou encore sur Bioconductor. Rien que sur le CRAN, on dénombre à ce jour plus de 16 000 packages !!

Un package est rarement totalement indépendant. Il arrive souvent qu’il utilise des fonctions d’autres packages, on parle alors de dépendances du package.

Un package R, c’est comme une application tablette ou smartphone. Vous devez les télécharger depuis le magasin officiel pour les installer sur votre machine. Puis vous devez ouvrir l’app ou charger le package pour pouvoir l’utiliser.

Télécharger et installer un package R

Quand on travaille sur RStudio, on a 3 possibilités pour installer un package depuis le dépôt CRAN officiel :

  • via la console : par exemple, je souhaite installer le package {tidyr}. Je tape dans la console le code suivant, puis Entrée
install.packages("tidyr")
  • via l’onglet Packages dans la partie en bas à droite de RStudio : cliquez sur Install, renseignez le nom du package en question, puis Install de nouveau. Pour installer les dépendances du packages, on laissera la case Install dependencies cochée (En ligne de commande, c’est le cas par défaut).

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (11)

  • via le menu de RStudio : Tools > Install Packages…

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (12)

Charger un package pour utiliser ses fonctionnalités

Vous ne pouvez charger un package R que si vous l’avez installé. Sinon vous verrez ce message d’erreur:

## Error in library(toto): there is no package called 'toto'

ou en français

## Error in library(toto) : aucun package nommé ‘toto’ n'est trouvé

Pour pouvoir utiliser les fonctions d’un package installé, il faut le charger dans notre session R.

Dans la console (ou l’éditeur), on tape et exécute la ligne suivante :

library(tidyr)

Vous verrez, dans l’onglet Packages, que la case à côté du package chargé est maintenant cochée.

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (13)

Voilà, vous pouvez maintenant appeler les fonctions de {tidyr} comme bon vous chante !

Note : Certains packages de base sont déjà installés et leurs fonctions sont accessibles sans avoir besoin de les charger : {base}, {methods}, {datasets}, {utils}, {stats}, {graphics} et {grDevices}. Vous pouvez voir la liste des packages chargés dans votre session en cliquant sur Global Environment :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (14)

Bonne pratique : Nous vous recommandons de noter les chargements des packages tout en haut de vos scripts. De cette manière, un futur utilisateur, y compris vous dans 6 mois, peut voir en coup d’oeil la totalité des packages nécessaires à l’exécution de ce script. De même, quand vous travaillerez avec des scripts au format RMarkdown, votre premier réflexe sera de créer un chunk pour charger les packages.

Accéder à la liste des fonctions d’un package

Pour savoir quelles sont les fonctions d’un package et en avoir la liste, vous pouvez cliquer dans l’onglet des Packages, sur le nom du package en question. J’ai par exemple cliqué sur tidyr :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (15)

Accéder à l’aide d’une fonction

Une fois que vous avez accédé à la liste des fonctions d’un package comme explique ci-dessus, vous pouvez voir l’aide de ces fonctions en cliquant sur leur nom dans l’onglet Help:

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (16)

Vous y retrouverez une description de la fonction et de ses paramètres, ainsi que dans la plupart des cas des exemples reproductibles d’application de ces fonctions.

Il est également possible d’accéder à l’aide d’une fonction en tapant help(nom_de_la_fonction) ou ?nom_de_la_fonction depuis la Console.
Enfin, si vous n’êtes pas sûrs de l’orthographe de votre fonction ou que vous souhaitez faire une recherche par mot clé (en anglais toujours), vous pouvez taper help.search("mot") ou ??mot depuis la Console.

Comprendre l’aide d’une fonction R

L’aide de R est incluse dans le package que vous téléchargez. C’est une règle pour avoir le droit d’être recensé sur les serveurs du CRAN. Par construction, un package doit contenir un minimum d’informations sur les fonctions qu’il expose. L’aide est disponible hors connexion Internet si vous le souhaitez.

Prenons l’exemple de la fonction de base sort(). Affichez l’aide de cette fonction avec ?sort. Voici les extraits du contenu, de haut en bas.

  • sort {base} : Rappel du nom de la fonction, et du {package} dans lequel elle est disponible
  • Sorting or Ordering Vectors : Titre de la fonction résumant son action
  • Description : Description un peu plus détaillée de l’action de la fonction
DescriptionSort (or order) a vector or factor (partially) into ascending or descending order. For ordering along more than one variable, e.g., for sorting data frames, see order.
  • Usage : Quelle écriture utiliser et liste de tous les paramètres possibles. Certains paramètres présentent une valeur par défaut qu’il ne vous est pas nécessaire de renseigner. Les 3 points ... dénotent la possible utilisation de paramètres supplémentaires dans des cas très particuliers ou des fonctions enfants. Comme ici, il peut y avoir d’autres fonctions présentées lorsqu’elles sont de la même famille que la fonction principale (fonctionnalités proches ou liées).
Usagesort(x, decreasing = FALSE, ...)
  • Arguments : Liste de tous les paramètres évoqués dans Usage avec l’explication de ce qu’il faut renseigner pour les utiliser. Notez les précisions quant à l’utilisation des 3 petit* points ....
  • Details (facultatif) : Explications plus avancées de l’utilisation de la fonction dans des cas précis. Ici, sont détaillés les algorithmes de tri utilisés selon le choix des utilisateurs. Vous noterez quelques citations de publications des scientifiques ayant développés ces méthodes.
  • Value : Sortie de la fonction. Une fonction ne renvoie toujours qu’un seul et unique objet en sortie. Cet objet peut contenir plusieurs valeurs. La partie Value explique le contenu des objets qui sortent de votre fonction, selon les valeurs des paramètres que vous avez définis.
  • References (facultatif) : Liste des publications scientifiques sur lesquelles reposent les algorithmes utilisés dans la fonction. Souvenez-vous que R est un langage et logiciel développés à l’origine par des scientifiques et pour des scientifiques. Une grande partie des packages et donc des fonctions utilisent des algorithmes développés et publiés par des scientifiques. Vous devriez en retrouver la bibliographie dans cette section.
  • See Also (facultatif) : Liste de fonctions similaires ou en lien avec la fonction que vous explorez. Cliquez sur leur nom pour en voir la page d’aide.
  • Examples (facultatif mais recommandé) : Exemples reproductibles pour l’utilisation de la fonction. Les exemples qui sont proposés dans cette partie sont exécutables en l’état et ont été testés par le CRAN sur différents OS. Avec RStudio, vous pouvez sélectionner la code et faire CTRL + Entrée, le code s’exécute directement dans la Console. Ces exemples vous permettent de voir l’effet attendu de la fonction. Seules les parties notées ## Not run: ne sont pas validées par le CRAN. Ces sections apparaissent sur des exemples qui ne peuvent pas être testés sans des conditions particulières, par exemple la connexion à une base de données. Ils apparaissent aussi lorsque les calculs sont volontairement très longs car le CRAN limite les temps d’exécution des exemples. C’est le cas pour cette fonction sort() dont l’exemple en ## Not run: est mis à titre illustratif.
  • [Package base version 4.0.3 Index] : Rappel du nom du package et de sa version. Cliquer sur Index pour aller à la liste des fonctions de ce package.

Personnaliser RStudio

Un peu de paillettes, c’est bien aussi ! Faîtes-vous plaisir, mais attention aux yeux !

L’organisation des panels RStudio

Vous avez un de ces écrans ultra larges et incurvés qui font pâlir d’envie vos collègues et vous préférez avoir votre Console à droite de votre Editeur plutôt qu’en dessous ? (on peut en avoir envie même sur un petit écran de portable hein 😉 ) Et bien c’est possible !

Pour gérer l’organisation des différents panels de RStudio, suivez : Tools > Global Options… > Pane Layout. On y retrouve les 4 panneaux de RStudio. En cliquant sur les menus déroulants propres à chaque partie, on peut sélectionner le contenu que l’on souhaitera y faire figurer. Par exemple, je souhaite décaler la console en haut à droite :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (17)

Je me retrouve maintenant avec un RStudio qui ressemble à ça, avec la console à droite :

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (18)

Bon j’imagine que maintenant vous vous posez la question : comment faire pour avoir ces couleurs et pas ce blanc trop lumineux qui me fatigue les yeux ? J’y viens !

La personnalisation de l’apparence et du thème

En suivant : Tools > Global Options… > Appearance, vous trouverez de quoi modifier :

  • le thème RStudio, qui définira l’apparence hors éditeur et console
  • le niveau de zoom
  • la police et la taille des caractères dans l’éditeur et la console
  • le thème de l’éditeur qui définira la couleur du fond ainsi que la coloration syntaxique de votre code

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (19)

Pour aller plus loin…

Vous vous sentez prêts à coder vos premières fonctions et créer votre premier package ? Nous avons un article qui vous explique comment créer un package R en quelques minutes. Vous êtes intéressés par nos offres de formation ? N’hésitez pas à nous contacter !

Article rédigé par Élena Salette, avec la participation de Sébastien Rochette.

Articles similaires

Débuter avec R et RStudio - ThinkR - Certification & Formation langage R (2024)

FAQs

How to learn R language easily? ›

Learn R in 8 Steps
  1. Should you learn R?
  2. Study Essential R Terminology.
  3. Understand how R is used.
  4. Download R & Find Essential Resources.
  5. Take R Courses with Pluralsight.
  6. Commit to Best Practices for R.
  7. Meet other developers & start some advanced tasks.
  8. Get a job with R programming.
Feb 1, 2023

Is R code hard to learn? ›

R is considered one of the more difficult programming languages to learn due to how different its syntax is from other languages like Python and its extensive set of commands. It takes most learners without prior coding experience roughly four to six weeks to learn R. Of course, this depends on several factors.

What is the difference between R and RStudio? ›

R the application is installed on your computer and uses your personal computer resources to process R programming language. RStudio integrates with R as an IDE (Integrated Development Environment) to provide further functionality. RStudio combines a source code editor, build automation tools and a debugger.

How to get started with R and RStudio? ›

No one starting point will serve all beginners, but here are 6 ways to begin learning R.
  1. Install , RStudio, and R packages like the tidyverse. ...
  2. Spend an hour with A Gentle Introduction to Tidy Statistics In R. ...
  3. Start coding using RStudio. ...
  4. Publish your work with R Markdown. ...
  5. Learn about some power tools for development.

Is R easier or harder than Python? ›

Both Python and R are considered fairly easy languages to learn. Python was originally designed for software development. If you have previous experience with Java or C++, you may be able to pick up Python more naturally than R. If you have a background in statistics, on the other hand, R could be a bit easier.

What language does RStudio use? ›

Overview and history. The RStudio IDE is partly written in the C++ programming language and uses the Qt framework for its graphical user interface. The bigger percentage of the code is written in Java.

Is RStudio better than Excel? ›

It is evident that the source code of R can be used repeatedly and with different data sets in ways that Excel formulas cannot. R clearly shows the code (instructions), data and columns used for an analysis in ways that Excel does not.

Is R better than SQL? ›

R is a powerful tool for performing complex statistical analyses and creating visualizations, while SQL is better suited for working with large datasets and performing more basic operations like filtering, sorting, and aggregating data.

Is RStudio same as Python? ›

What is the main difference between Python and R? Python is a general-purpose programming language, while R is a statistical programming language. This means that Python is more versatile and can be used for a wider range of tasks, such as web development, data manipulation, and machine learning.

Can I learn R on my own? ›

Yes. At Dataquest, we've had many learners start with no coding experience and go on to get jobs as data analysts, data scientists, and data engineers. R is a great language for programming beginners to learn, and you don't need any prior experience with code to pick it up.

What can I use RStudio for? ›

RStudio is a must-know tool for everyone who works with the R programming language. It's used in data analysis to import, access, transform, explore, plot, and model data, and for machine learning to make predictions on data.

Can I learn R with no programming experience? ›

Though it helps to have basic computer skills and knowledge, you can enroll in a beginner level course to gain the necessary knowledge to use R in your career. You may also be able to succeed in R courses without having much experience in data science.

Is it possible to learn R by yourself? ›

Yes. At Dataquest, we've had many learners start with no coding experience and go on to get jobs as data analysts, data scientists, and data engineers. R is a great language for programming beginners to learn, and you don't need any prior experience with code to pick it up.

What is the best source to learn R? ›

Below is the list of best websites to learn R Programming for beginners:
  • GUVI. GUVI offers an R Programming course aimed at teaching all aspects of R programming, from basics to an advanced level. ...
  • DataCamp. ...
  • Coursera. ...
  • edX. ...
  • Codecademy. ...
  • swirl. ...
  • RStudio Education. ...
  • Tutorialspoint.
Mar 22, 2024

How do I memorize R codes? ›

Practice, the only way you will remember them is to use them. I recommend taking data sets from Your Home for Data Science and write some code in R to clean and graph the data. Then if you are interested run some machine learning on the data.

Top Articles
Latest Posts
Article information

Author: Carlyn Walter

Last Updated:

Views: 5470

Rating: 5 / 5 (50 voted)

Reviews: 81% of readers found this page helpful

Author information

Name: Carlyn Walter

Birthday: 1996-01-03

Address: Suite 452 40815 Denyse Extensions, Sengermouth, OR 42374

Phone: +8501809515404

Job: Manufacturing Technician

Hobby: Table tennis, Archery, Vacation, Metal detecting, Yo-yoing, Crocheting, Creative writing

Introduction: My name is Carlyn Walter, I am a lively, glamorous, healthy, clean, powerful, calm, combative person who loves writing and wants to share my knowledge and understanding with you.