| Logiciel/Sytsème | Windows | MacOS | Linux | BSD | Autres Unix |
|---|---|---|---|---|---|
| R | oui | oui | oui | oui | oui |
Introduction au langage R
UMR8504 Géographie-Cités
Transversalité Données et protocoles dans les Humanités Numériques
Hugues Pecout
1. Pourquoi utiliser R ?
3. Mise en pratique
2. Introduction au langage
Il existe de nombreux logiciels d’analyse statistique. Mais depuis le début des années 2000, le langage R gagne en importance dans ce domaine et s’impose progressivement comme une référence, au même titre que les trois principaux logiciels d’analyse de données qui dominent le marché.
Plusieurs aspects peuvent nous laisser penser que de nombreux utilisateurs de logiciels statistiques devraient progressivement converger vers R…
Prix licence SPSS Base edition
Intéropérabilité des principaux logiciels :
| Logiciel/Système | Windows | MacOS | Linux | BSD | Autres Unix |
|---|---|---|---|---|---|
| SAS | oui | terminé | oui | non | oui |
| SPAD | oui | non | non | non | non |
| SPSS | oui | oui | non | non | non |
| Stata | oui | oui | oui | non | non |
C’est pour cela que l’on préfère R…
Mais pourquoi ce langage et pas un autre ?
Deux langages de programmation utilisés pour le traitement et l’analyse des données en SHS, et très souvent comparés pour leurs fonctionnalités semblables
L’utilisation de R ou de Python dépend surtout de :
Qui suis-je ? Qu’est-ce que je veux faire ? Avec qui ?
R a autant de cerveau…
→ Spécialisé dans l’analyse statistique
→ Pour utilisateu·rices moins avancés en progr.
…que Python a du muscle !
→ Spécialisé dans la science de données
→ Pour utilisateu·rices avancés en progr.
En 2008, au MIT, des chercheurs se rassemblent pour faire le point sur les outils disponibles pour le calcul scientifique et statistique. Principal constat, la communauté est éclatée :
il fallait un langage prenant tous les avantages de chaque langage et rajoutant un aspect de plus en plus pointé du doigt : la parallélisation massive (rapidité de calcul)… Le langage Julia est né !
Cependant, le langage Julia ne s’est toujours pas imposé dans la communauté SHS, où R et Python semble toujours les langages les plus utilisés pour l’analyse de données…
R se base sur le langage de programmation S, créé en 1988.
L’objectif était de créer le meilleur environnement d’analyse statistique.
| Logiciel/Sytsème | Windows | MacOS | Linux | BSD | Autres Unix |
|---|---|---|---|---|---|
| R | oui | oui | oui | oui | oui |
R propose 2996 fonctions statistiques et graphiques standard (primitives)
Sur ce socle commun peut s’ajouter de nombreux packages, mis à disposition sur le Comprehensive R Archive Network (CRAN). Ex :
R a une structure modulaire qui offre toute une gamme d’applications possibles. Son expansion n’est limitée que par les contributions !
Nombre de packages disponibles sur le CRAN