SAS (anciennement Statistical Analysis System) est une suite logicielle statistique développée par l’Institut SAS pour la gestion des données et l’analyse avancée de celles-ci. La suite comprend également des outils destinés à la business intelligence (BI), l’investigation criminelle et l’analyse prédictive.
40 Ans d’expérience
Le développement de cette suite logicielle commence en 1966 au sein de l’Université de Caroline du Nord. Anthony Barr y est recruté pour programmer un logiciel d’analyse de variance et de régression. Ce logiciel analyse les données agricoles pour améliorer les rendements des cultures.
En 1972, une version du logiciel introduit des fonctionnalités supplémentaires pour traiter les données manquantes ou combiner des ensembles de données. En 1976, Anthony Barr et ses associés fondent SAS Institute. La même année, l’adoption de l’architecture ouverte permet de lire la plupart des formats de données utilisés par les ordinateurs d’IBM. En 1979, SAS ajoute le support du système d’exploitation CMS.
En 1985, SAS est réécrit en C pour fonctionner sous UNIX, MS-DOS, Windows et Linux. Dans les années 1980 et 1990, SAS publie des extensions qui complètent la version de base. Par exemple, on remarque SAS/Graph qui produit des graphiques ou SAS/Ets, qui propose de l’analyse économétrique. Des produits verticaux comme SAS Financial Management et SAS Human Capital sont également lancés.
En 2002, le logiciel Text Miner fait son apparition. Il analyse les données textuelles comme les courriels pour en dégager des modèles dans les applications de BI. En 2004, avec la version 9, l’interface de type pointer-cliquer devient la principale interface graphique du logiciel. Les fonctionnalités de gestion de la relation client (CRM) sont améliorées avec SAS Interaction Management. En 2008, SAS Project Unity intègre la qualité des données, l’intégration des données et le master data management.
En 2010, SAS Social Media Analytics, un outil de surveillance des médias sociaux, d’analyse de l’engagement est lancé en même temps que SAS Rapid Predictive Modeler qui crée des modèles analytiques à l’aide de Microsoft Excel. Aujourd’hui, SAS emploie plus de 13 900 personnes réparties sur les cinq continents et compte des client dans 147 pays.
Une suite pour exploiter toutes les données
Le suite de logicielle s’adresse en priorité aux data scientist, analystes métier, statisticiens et analystes prédictifs. Elle contient également des outils pour explorer, transformer analyser et visualiser les données. Elle extrait et modifie les données provenant de diverses sources afin d’effectuer des analyses statistiques sur celles-ci. Puis, la suite propose une interface graphique de type pointer-cliquer pour les utilisateurs les moins techniques. Et permet ainsi aux programmeurs d’aller plus loin grâce à son langage propriétaire SAS.
Les programmes SAS comportent deux étapes principales nommées Data et Proc. Les étapes Data récupèrent et manipulent les données, et les étapes Proc analysent les données. Data comporte des déclarations exécutables qui amènent le logiciel à agir, fournissant des instructions pour lire un ensemble de données ou modifier l’apparence des données. Proc fait appel à des procédures qui effectuent des analyses et des rapports afin de produire des statistiques et des graphiques. Il en existe plus de 300. Elles peuvent afficher des résultats, trier des données ou effectuer d’autres opérations.
La suite logicielle compte plus de 200 composants qui s’ajoutent à Base SAS (procédures de base et gestion des données) et dont les plus importants sont : Stat (analyse statistique),Graph (graphiques), Or (recherche opérationnelle), Ets (économétrie et analyse des séries chronologiques), Af (mécanisme de dépôt de candidatures), Qc (contrôle de la qualité),Insight (extraction de données), Ph (analyse d’essais cliniques) et Ebi (Suite de BI).
Elle propose aussi des logiciels destinés au suivi de la relation client, à la maîtrise des risques, à la supply chain, à la maintenance du SI ou encore SAS for Sustainability Management, un ensemble de logiciels permettant de prévoir les effets environnementaux, sociaux et économiques de certaines décisions et d’identifier les relations de cause à effet entre les opérations et un impact sur l’environnement.
SAS, un leader reconnu
Par ailleurs, cette suite logicielle investit massivement dans le secteur de l’AI et du machine learning. Un partenariat avec Microsoft Azure vient d’ailleurs d’être signé pour décupler sa puissance de traitement et d’analyse des données.
Selon une étude d’IDC publiée en 2017, SAS est le plus grand détenteur de parts de marché en ce qui concerne l’analyse avancée de données avec 30,8 %. Il est en concurrence sur le marché de la BI avec des géants. Comme par exemple SAP BusinessObjects, IBM Cognos, SPSS Modeler, Oracle Hyperion et Microsoft Power BI.
Le cabinet Gartner a placé SAS dans le carré des leaders dans son Magic Quadrant for Data Quality Solutions 2020 aux côtés de Talend, SAP, Informatica, IBM et Precisely. Pour la septième année consécutive SAS fait aussi partie des leaders dans le secteur des plateformes de data science et de machine learning. L’évaluation de SAS s’est basée sur son outil Visual Data Mining et Machine Learning.
Il fournit des aperçus et des interprétations automatisés. Mais également une ingénierie et une modélisation de fonctionnalités automatisées, ainsi qu’une API publique pour la modélisation.
SAS Visual Data Mining et Machine Learning prend en charge le processus d’exploration de données et d’apprentissage machine de bout en bout grâce à une interface visuelle et de programmation complète. Enfin, il est exploitable par tous les collaborateurs quel que soit leur niveau de connaissance.
Les sujets qui m’intéressent le plus sont Data, Organisation et Temps Réel !
N’hésitez pas à me faire un retour sur cet article ou à me contacter sur LinkedIn pour partager nos actualités! Andrea