Du reporting à l'analyse prédictive
En 37 ans d'existence, SAS a vécu, accompagné et piloté bien des changements dans le marché des solutions décisionnelles. Selon Jim Davis, directeur du marketing, l'évolution la plus marquante date d'il y a 3 à 5 ans : "auparavant, les sociétés faisaient surtout du reporting, par exemple des rapports de ventes, des comparaisons avec les concurrents. Aujourd'hui, elles veulent s'appuyer sur les données pour prendre des décisions." Cela concerne les domaines les plus variés : calcul de risques, détection de fraudes, compréhension fine des clients...
Parallèlement, une exigence forte de rapidité s'est imposée : "on ne veut plus attendre une journée pour obtenir des résultats, ni même une heure ou cinq minutes. C'est une question de secondes", déclare Jim Davis. Mais cet impératif se complique avec l'évolution même du type des données examinées. Aux données structurées s'ajoutent maintenant des données provenant, par exemple, des médias sociaux. Lier ces différentes sources entre elles représente des enjeux complexes. "Les cubes OLAP ne sont plus nécessaires. Alors qu'il fallait 24 heures à un département spécialisé pour construire quelque chose, on effectue aujourd'hui des calculs à la volée : la génération de cubes virtuels peut se faire en quelques secondes", explique notre interlocuteur.
Créer un entrepôt de données ne suffit plus : les "Big Data" sont bien là. Mais définir exactement ce qu'ils représentent reste un exercice difficile. (Consultez par exemple "Big Data : les entreprises toutes concernées ?") Jim Davis propose de les définir ainsi : "tout ce qui dépasse les capacités de traitement des systèmes conventionnels de gestion des bases de données relationnelles."
Des plateformes multi-processeurs puissantes
Pour naviguer dans ces données et en déduire des résultats pertinents en quelques secondes et parfois moins, il faut mettre en place des plateformes efficaces. Les bases de données en mémoire sont sur toutes les lèvres. Mais si l'analyse reste séquentielle, la performance ne sera pas suffisante car l'analyse prédictive effectue plusieurs passes sur les données. Il faut donc passer à des systèmes comportant des processeurs multiples effectuant des calculs en parallèle sur des données réparties de manière efficace en mémoire.
SAS a été sollicité par ses clients qui voulaient accélérer les traitements pour améliorer leur capacité à prendre des décisions rapides. Jim Goodnight, cofondateur et CEO de SAS, cite le cas d'une banque dont le calcul des risques prenait 18 heures, et dont l'objectif consistait à passer à quelques dizaines de secondes. Pour répondre à ce type d'exigences, les équipes techniques de SAS ont mis au point des solutions qui consistent à répartir les calculs sur plusieurs processeurs travaillant en parallèle. SAS s'appuie sur les puces Intel multi-processeurs Sandy Bridge comportant 8 processeurs. Une machine comportant 32 processeurs exécute 3 milliards d'instructions par seconde.
La rapidité d'analyse d'un gros volume de données se révèle particulièrement appropriée à la prise de décision. Elle permet de lancer plusieurs analyses successives en faisant varier des paramètres comme un budget ou un taux de satisfaction : le résultat est obtenu en quelques dizaines de secondes. La
La visualisation des données
Pour présenter des résultats et en déduire des évolutions, les tableaux de chiffres ne suffisent pas. Des représentations graphiques variées sont beaucoup plus frappantes : elles utilisent de manière innovante les formes et les couleurs en jouant sur les surfaces et les tailles pour faire apparaître les grandes tendances de manière immédiatement perceptible. La dimension temporelle en fait aussi partie, avec une visualisation en temps réel et la possibilité de jouer des scénarios et de faire des simulations.
SAS Visual Analytics, la plateforme analytique de SAS, fait à la fois de l'analyse et de la visualisation de données, dans le cadre de processus de découverte des données. Ce type d'outils concerne tous les publics, qu'ils soient professionnels ou particuliers, aussi bien dans le secteur privé que dans le secteur public.
Répartition géographique des performances commerciales des magasins (cliquez sur l'image pour l'agrandir)
L'utilisation de la cartographie permet de visualiser des valeurs et de les relier à des territoires. La performance des magasins d'un groupe est synthétisée dans un diagramme et reportée sur une carte sous forme visuelle. En cliquant sur un magasin du diagramme sur la gauche, on obtient son emplacement sur une carte locale et son chiffre d'affaires annuel.
Répartition des coûts d'installations industrielles par équipement (cliquez sur l'image pour l'agrandir)
Un groupe implanté dans plusieurs pays analyse les coûts de maintenance et les pertes de capacité de production de ses installations industrielles. L'analyse détaillée des coûts présente le détail des coûts de chaque équipement dans l'ensemble des pays.
Taux d'appels interrompus en fonction du modèle de commutateur (cliquez sur l'image pour l'agrandir)
La qualité des communications téléphoniques mobiles dépend des commutateurs, de la technologie du réseau et des téléphones. L'analyse étudie l'impact de chacun de ces éléments sur le nombre de communications interrompues. Ce rapport relie chaque modèle de commutateur au volume d'appels et au nombre de communications interrompues.
René Beretz