Matière: Analyse Multivariée et Modélisation Statistique avec R
Enseignant | Choukri BAROUR |
Information |
-
Site web : https://www.univ-soukahras.dz/fr/module/143 Semestre : S2 Unité : Crédit : 0 Coefficient: 0 |
Contenu | Beginning R: The Statistical Programming Language. Le logiciel R est un logiciel de statistique créé par Ross Ihaka & Robert Gentleman (1996). Il est à la fois un langage informatique et un environnement de travail : les commandes sont exécutées grâce à des instructions codées dans un langage relativement simple, les résultats sont affichés sous forme de texte et les graphiques sont visualisés directement dans une fenêtre qui leur est propre. C'est un clone du logiciel S-plus qui est fondé sur le langage de programmation orienté objet S, développé par AT&T Bell Laboratories. Ce logiciel sert à manipuler des données, à tracer des graphiques et à faire des analyses statistiques sur ces données. Tout d'abord, R est un logiciel gratuit et à code source ouvert (open source). Il fonctionne sous UNIX (et Linux), Windows et Macintosh. C'est donc un logiciel multi-plates-formes. Il est développé dans la mouvance des logiciels libres par une communauté sans cesse plus vaste de bénévoles motives. Tout le monde peut d'ailleurs contribuer à son amélioration en y intégrant de nouvelles fonctionnalités ou méthodes d'analyse non encore implémentées. Cela en fait donc un logiciel en rapide et constante évolution. C'est aussi un outil très puissant et très complet, particulièrement bien adapté pour la mise en œuvre informatique de méthodes statistiques. Il est plus difficile d'accès que certains autres logiciels du marché (comme SPSS ou Minitab par exemple), car il n'est pas conçu pour être utilisé a l'aide de «clics» de souris dans des menus. L'avantage en est toutefois double: l'approche est pédagogique puisqu'il faut maitriser les méthodes statistiques pour parvenir ales mettre en œuvre ; l'outil est très efficace lorsque l'on domine le langage R puisque l'on de vient alors capable de créer ses propres outils, ce qui permet ainsi d'opérer des analyses très sophistiquées sur les données. Le logiciel R est particulièrement performant pour la manipulation de données, le calcul et l'affichage de graphiques. Il possède, entre autres choses : un système de documentation intégré très bien conçu (en anglais) ; des procédures efficaces de traitement des données et des capacités de stockage de ces données; une suite d'opérateurs pour des calculs sur des tableaux et en particulier sur des matrices; une vaste et cohérente collection de procédures statistiques pour l'analyse de données; des capacités graphiques évoluées ; un langage de programmation simple et efficace intégrant les conditions, les boucles, la récursivité, et des possibilités d'entrée-sortie. R est un logiciel dans lequel de nombreuses techniques statistiques modernes et classiques ont été implémentées. Les méthodes les plus courantes permettant de réaliser une analyse statistique telles que : statistique descriptive; tests d'hypothèses (paramétriques et non-paramétriques); analyse de la variance et de la covariance; méthodes de régression linéaire (simple et multiple) ; … etc sont enchâssées directement dans le cœur du système. Notez également que la plupart des méthodes avancées de statistique sont aussi disponibles au travers de modules externes appelés packages. Ceux-ci sont faciles à installer directement à partir d'un menu du logiciel. Ils sont tous regroupés sur le site internet du Comprehensive R Archive Network (CRAN) (http://cran.r-project.org) sur lequel vous pouvez les consulter. Ce site fournit aussi, pour certains grands domaines d'étude, une liste commentée des packages associes aces thèmes (appelée Task View), ce qui facilite ainsi la recherche d'une méthode statistique particulière. Par ailleurs, une documentation détaillée en anglais de chaque package est disponible sur le CRAN. Il est par ailleurs utile de noter que les méthodes statistiques les plus récentes y sont régulièrement ajoutées par la communauté statistique elle-même. Une des grandes forces de R réside dans ses capacités, bien supérieures a celles des autres logiciels courants du marché, à combiner un langage de programmation avec la possibilité de réaliser des graphiques de qualité. Les graphiques usuels s'obtiennent aisément au moyen de fonctions prédéfinies. Ces dernières possèdent de très nombreux paramètres permettant par exemple d'ajouter des titres, des légendes, des couleurs, etc. Mais il est également possible d'effectuer des graphiques plus sophistiqués permettant de représenter des données complexes telles que des courbes de surface ou de niveau, des volumes affichés avec un effet 3D, des courbes de densité, et bien d'autres choses encore. Il vous est également possible d'y ajouter des formules mathématiques. Vous pouvez aussi agencer ou superposer plusieurs graphiques sur une même fenêtre, et utiliser de nombreuses palettes de couleur. Source: P. Lafaye de Micheaux et al. 2011. Le Logiciel R Maîtriser le langage Effectuer des analyses statistiques. 1ère Edit. Springer Verlag. WWW.R-PROJECT.ORG |
Evaluation |