Tableau - accès aux données
Feuille de route pratique pour faire évoluer votre culture analytique.
Sommaire
Le changement, c'est dès maintenant.[modifier]
Pour les professionnels des données, les signes sont évidents. Alors que de nombreuses sociétés sont encore en train d'essayer de mettre en place leur premier entrepôt de données tout-en-un, la quantité et la variété des données les rendent d'ores et déjà obsolètes. Les utilisateurs métiers, adaptés aux technologies conviviales, exigent de pouvoir travailler directement avec leurs données. Les technologies actuelles offrent des moyens de manipuler et d'interagir avec les données qui étaient inimaginables il y a encore quelques années.
De prime abord, un tel changement peut paraître effrayant, voire incontrôlable, mais il ne doit pas être craint. En réalité, il permet de réduire l'énorme charge des requêtes de tableaux de bord, pour permettre à l'informatique de se focaliser sur les questions plus stratégiques. Ainsi, l'informatique ne se limite plus à la manufacture de tableaux de bord, mais permet désormais de construire et d'orienter les actifs d'une entreprise, et libère les utilisateurs métiers de la lenteur des cycles des requêtes de changements et des réponses à ces requêtes. L'analyse en libre-service permet de générer d'importants dividendes pour l'entreprise et les employés, tout en protégeant les actifs des données et en offrant des sources de données optimales et non biaisées à l'entreprise.
Cependant, malgré ces nouvelles technologies, qui décuplent les possibilités des utilisateurs métiers, les entreprises échouent parfois dans leurs stratégies d'analyse.
Qui dit nouvelle approche, dit méthodologie adaptée. Nous recherchons des méthodes de déploiement et de développement agile éprouvées, qui s'adaptent rapidement aux exigences en matière de changement. Nous recherchons une méthodologie permettant de combiner informatique et activités professionnelles.
Nous recherchons des processus simplifiés qui favorisent la créativité et la curiosité naturelles des utilisateurs. Tableau Drive permet de répondre à ces attentes. Cette méthodologie tire parti des méthodes agiles et puise ses informations auprès des sociétés avec un solide esprit d'analyse dans le monde entier.
Nouvelle méthode[modifier]
La société Facebook est parvenue à adopter les analyses de données en masse.
Ses employés appuient chaque décision avec des données. Il appartient aux chargés d'affaires de réaliser des analyses. L'informatique sert à gérer et sécuriser les données. Chaque équipe respecte ce que les autres proposent. La combinaison des deux permet de renforcer la capacité de Facebook à répondre aux questions, et crée ainsi une forte valeur.
Namit RaiSurana, Data Product Manager chez Facebook, explique : « Aucun employé ne compte sur les autres pour répondre à ces questions. Les utilisateurs peuvent découvrir les réponses par eux-mêmes. Nous ouvrons Tableau à l'entreprise toute entière. » Il est possible de créer des tableaux de bord de solution décisionnelle sans avoir à passer des semaines à les programmer.
Tout cela est rendu possible par les sources de données configurées et gérées par le service informatique, invisibles pour les utilisateurs métiers. Il s'agit là d'un concept clé en la matière : vous devez disposer de données utilisables et facilement accessibles afin de tirer le meilleur parti d'une stratégie d'analyse en libre-service. Les meilleures solutions analytiques mises en œuvre sont des tableaux de bord créés par des utilisateurs et superposés à une infrastructure gérée par le service informatique.
Ancienne méthode[modifier]
Traditionnellement, les utilisateurs accédaient aux données par le biais de rapports statiques issus d'applications métiers et de plates-formes de solution décisionnelle gérées par les services informatiques. Ces systèmes, pour la plupart conçus dans les années 1990, étaient généralement lourds, complexes, onéreux et manquaient de flexibilité. Par conséquent, les utilisateurs métiers étaient forcés de s'appuyer sur des ressources spécialisées pour la gestion, la modification et l'entretien de ces systèmes. Cet état de fait a créé un fossé entre les utilisateurs à la recherche d'informations exploitables et les spécialistes techniques, qui ne disposaient pas du contexte commercial. Ce fossé limitait l'utilité de ces systèmes. La plupart des utilisateurs ne disposant pas du temps et des compétences nécessaires pour combler ce fossé, ils décidaient tout simplement de ne pas utiliser ces systèmes analytiques, mis à disposition par les entreprises.
Par conséquent, la plupart des spécialistes des informations d'aujourd'hui s'appuient sur les feuilles de calcul comme principal outil d'analyse. Il s'agit là en grande partie d'un échec de la technologie, mais aussi du processus.
Un changement favorisé par les nouvelles technologies[modifier]
Une nouvelle génération de produits de solution décisionnelle a vu le jour, destinés à aider les employés en quête d'informations Ces produits disposent d'interfaces épurées et à interaction directe, qui permettent de simplifier le changement de perspective et offrent des réponses aux employés. Ces derniers peuvent se lancer dans des cycles de questions/réponses interactifs et itératifs avec les données, sans formation spécialisée préalable.
Cette technologie présente plusieurs caractéristiques clés :
- Facilité d'emploi
- Comme l'ont prouvé les systèmes analytiques de première génération, les outils difficiles à utiliser ne seront pas adoptés par la plupart des spécialistes des informations. Afin de permettre aux décisionnaires d'accéder aux données, un outil doit offrir une expérience d'utilisation conviviale, amusante et attrayante.
- Rapidité.
- Les ingénieurs de Google ont découvert que le nombre de visites sur un site diminue si les pages se chargent ne serait-ce que 250 ms plus lentement que celles d'un site concurrent. « Les études démontrent que la rapidité joue un rôle déterminant. 80 % des internautes iront voir ailleurs si une vidéo s'arrête pendant qu'elle se charge.[1] » La barre a été relevée.
- Puissance
- Les logiciels de productivité permettent aux utilisateurs d'obtenir des résultats sans passer par des outils intermédiaires. Une telle puissance ce retrouve déjà dans les outils de traitement de texte, de création Web ou encore de production vidéo.
- Désormais, les utilisateurs en attendent de même en matière de traitement de données.
- Visualisation
- Le fait de travailler visuellement avec des données améliore la vitesse et la qualité de la découverte d'informations exploitables. À mesure que le volume de données continue d'augmenter, les représentations visuelles jouent un rôle de plus en plus crucial.
Les utilisateurs métiers savent quelles questions poser, et comment interpréter les résultats. Mais ils ne sont peut-être pas conscients, ou ne se soucient que peu, de la sécurité ou de l'évolutivité des outils qu'ils utilisent. En revanche, un ralentissement des performances, ou des informations sensibles qui sont compromises peuvent leur causer des soucis. Pour un fonctionnement optimal, un système d'analyse en libre-service doit permettre aux utilisateurs de trouver des réponses à leurs questions, et être pris en charge par une infrastructure informatique garantissant performances, sécurité et intégrité des données.
Limitation des processus[modifier]
La norme consiste aujourd'hui à permettre aux utilisateurs d'analyser leurs propres données. La plupart des services informatiques reconnaissent la supériorité d'une approche en libre-service, et sont ravis de se libérer des tâches d'écriture de rapports. Mais l'informatique souhaite conserver le contrôle des aspects critiques du système, comme l'évolutivité, la sécurité ou la gouvernance. Et elle se doit de le conserver. Mais les modèles de développement traditionnels se sont focalisés uniquement sur le rôle de l'informatique, et n'ont pris en considération l'aspect métier que lors de la phase de définition des exigences. L'informatique s'est ainsi retrouvée en charge des modifications à apporter aux exigences ou de l'évolution de l'aspect métier, au détriment de l'aspect métier lui-même.
La plupart des modèles de déploiement de logiciels, y compris ceux pour les solutions décisionnelles, sont basés sur une méthode de développement logiciel « en cascade » ou « en série ». Il est toutefois à noter qu'avec le recul et des exigences bien connues, le développement traditionnel de ce type peut donner d'excellents résultats.
- Exigences => Planification => Développement => Test => Acceptation par les utilisateurs => Production
Des méthodologies en cascade correctement exécutées ont permis de garantir une qualité optimale et de sauver des vies sur de nombreux projets civils et militaires complexes. Prenons l'exemple d'un projet de navette spatiale, mené avec une approche Capability Maturity Model de niveau 5, comportant 420 000 lignes de code [2] et 1,7 million de lignes de code supplémentaires pour les outils des applications logicielles de vol. Le logiciel contrôle chaque aspect du vol, notamment le décollage, les propulseurs d'appoint le retour au site de lancement en cas d'arrêt, la coupure du moteur principal, la séparation du réservoir, les opérations sur orbite, la rentrée dans l'atmosphère, la gestion de l'énergie, l'approche et l'atterrissage. Tout cela est le fruit d'une méthodologie en cascade.
Cependant, une telle méthodologie ne fonctionne pas toujours.
En 1997, Edward Yourdon a écrit « Death March: The Complete Software Developer’s Guide to Surviving Mission Impossible Projects », qui présente les craintes associées à l'accomplissement de chaque objectif métier, qui évolue rapidement, à l'aide de méthodologies logicielles traditionnelles.
Il note que dans les années 70 et 80, il était courant pour les projets de s'étendre sur une durée de 3 à 5 ans, du stade initial au développement complet. Dans les années 90, les technologies client-serveur et de langage de programmation ont permis d'intégrer des projets substantiels dans le cycle budgétaire annuel. Vers la fin des années 90, les projets de 7 ans, qui étaient devenus des projets de 7 mois, arrivaient au stade de production en 7 semaines. Des méthodologies plus légères, qui permettent de réduire les cycles traditionnels, furent créées et évangélisées.
Ces approches de développement agiles avaient de nombreux points communs.
Dans l'ancien modèle de méthodologie, les développeurs et les utilisateurs métiers convenaient d'un cahier des charges, et ces derniers acceptaient de ne pas modifier les exigences jusqu'à ce que le code soit terminé et qu'une version de la solution soit publiée pour être testée par les utilisateurs, pour obtenir en contrepartie toutes les fonctionnalités que les développeurs acceptaient.
Dans les modèles récents, les projets volumineux étaient divisés en étapes plus petites et plus rapides. Les exigences étaient moins formelles et plus flexibles, et les développeurs pouvaient les modifier ou les améliorer à leur discrétion. La collaboration entre les équipes en charge des aspects métiers, du développement, ainsi que de la documentation, des tests et de la publication était continue et des versions fonctionnelles étaient publiées en permanence. Les cycles plus courts et plus rapides permettaient de réussir ou d'échouer plus vite, au lieu de recourir à des objectifs « tout ou rien », qui étaient souvent obsolètes une fois atteints.
Application des principes de méthodologie agile aux systèmes analytiques[modifier]
Les approches agiles peuvent tout à fait se réduire à limiter et assouplir les cycles en cascade classiques. Ces cycles, ou lignes droites, s'intègrent ensuite à l'expertise dans les domaines clés. Les principes de conduite des méthodes agiles sont les suivants :
- Les individus avant les processus et les outils
- Des logiciels opérationnels plutôt qu'une documentation exhaustive
- La collaboration plutôt que la négociation sur les exigences
- Adaptation au changement plutôt que le suivi d'un
Experts en la matière (Exigences)
- Planification
- Développement
- Production
- Test
- Acceptation par les utilisateurs
Dans un processus agile, la documentation exhaustive des exigences ne présente pratiquement aucun avantage. Les exigences sont plus flexibles, et l'adaptation à leur changement ne prend plus que quelques heures ou jours, pas des mois.
Cela permet d'intégrer des commentaires et réactions bien en amont dans les processus, afin d'obtenir des résultats plus efficaces.
C'est là l'idée derrière Tableau Drive. Tableau Drive est une méthodologie métier qui tire parti des méthodes agiles et puise ses informations auprès des sociétés les plus solides sur le plan analytique dans le monde entier. Grâce à Tableau Drive, la propriété de la plate-forme analytique est partagée entre les services métiers et informatiques.
La division des tâches mise en place tient compte des intérêts et des forces de chaque partie. La plate-forme conserve également la possibilité de continuer à évoluer et grandir, même dans le cadre d'un développement au niveau de l'entreprise.
Cette situation est à l'opposé de celle de solutions décisionnelles dans de nombreuses entreprises, dans lesquelles les rapports sont renvoyés au terme de nombreuses étapes rigides, et bien souvent au terme de leur période d'utilité.
Tableau Drive ne permet pas seulement d'améliorer les systèmes analytiques.
Cette solution permet également d'accélérer et de rendre plus flexibles les activités métiers. Imaginez à quel point le passage de la correspondance écrite aux appels téléphoniques a permis de modifier nos relations. Ou encore, l'effet du passage au courrier électronique pour les services internes d'une entreprise. Le déroulement des projets a ainsi été accéléré, et les tâches inefficaces (impression, recherche d'enveloppes, livraisons entre services) ont pu être éliminées, afin de simplifier et d'accélérer la mise en pratique des idées. Cette amélioration a permis de réduire considérablement les corvées pour les employés, et de les remplacer par la possibilité de collaborer de manière plus informelle, plus vivante, et au final plus productive. Il s'agit là des bases de Tableau Drive : un système analytique amélioré peut entraîner des changements fondamentaux dans la culture de l'organisation.
La voie à suivre[modifier]
Les utilisateurs métiers élaborent les objectifs et l'expertise de l'analyse des données en libre-service. Le modèle de développement en cascade, relativement lent et qui s'appuie sur des exigences rigoureuses en amont, s'est souvent traduit par des échecs. Les départements informatiques surexploités ne peuvent concevoir ce que les utilisateurs métiers attendent, si eux-mêmes n'ont pas déterminé toutes les questions qu'ils souhaitent poser.
La méthodologie Drive intègre le processus itératif de création d'analyses dans une structure prenant en charge un déploiement agile en entreprise. Lors de la phase d'identification des besoins, les acteurs des services métiers et informatiques se réunissent pour décrire une vision du processus. La production d'un prototype commence immédiatement, avec les données disponibles, peu importe son aspect.
Les enseignements tirés de la production de prototype alimentent la phase de création de la base du système, à mesure que le service informatique crée des sources de données pour l'entreprise, que des programmes de formation sont développés et que les utilisateurs métiers évangélisent le système, le tout à partir des résultats du prototype. Si la base conçue est efficace, l'organisation sera en position d'intégrer de nouveaux groupes et utilisateurs.
Tableau Drive présente un schéma permettant de proposer un libre-service au niveau de l'entreprise.
Ses principes sont les suivants :
- Plan
- Develop
- Production
- Subject Matter
- Expert
- Test
- User
- Acceptance
- Identification des besoins
- Production de prototype
- Conception d'une base solide
- Évolution
Production rapide de prototype[modifier]
Les utilisateurs métiers ont la possibilité d'analyser à tout moment, en commençant de manière immédiate avec les données dont ils disposent. La production de prototype n'est plus une activité qui se déroule de manière solitaire, résultant en un prototype qui est abandonné une fois que le projet démarre réellement. Cette phase donne des informations sur la manière de créer des sources de données et de former les nouveaux utilisateurs métiers. Par ailleurs, les résultats obtenus par le prototype constituent eux-mêmes des données analytiques utiles.
Rôle de facilitation clairement défini pour l'informatique=[modifier]
Dans Tableau Drive, le service informatique conserve la propriété de l'infrastructure utilisée pour les analyses en libre-service. Les systèmes de production doivent être contrôlés par le service informatique, afin de garantir la sécurité et l'intégrité des données, et la diffusion d'informations exactes. Le service informatique reste en charge de définir les sources de données de production et de documenter les dictionnaires de données, et fait partie intégrante du centre d'excellence en matière d'analyses. Il doit participer aux discussions le plus tôt possible dans un projet, idéalement lors de la phase d'identification des besoins, et doit ensuite mener les débats sur des sujets comme la gouvernance.
Flux de travail[modifier]
Le service informatique doit créer un « bac à sable » permettant aux analystes métiers de lancer des requêtes et de collaborer par petits groupes sans supervision, et supervise le processus de certification de rapports (ou classeurs) et de leur promotion vers le système de production.
Équipes qualifiées[modifier]
Le service informatique est intégré à des équipes dont les compétences sont les suivantes :
- Compréhension des données
- Compréhension des aspects logiciels
- Compréhension des aspects métiers
Il n'existe pas de taille optimale pour ces équipes, mais leur capacité à analyser et à comprendre des données en temps réel permet de déterminer leur adéquation. Les consultants sont parfois amenés à augmenter les effectifs des équipes à mesure que le nombre d'utilisateurs métiers augmente.
Gestion du changement pour garantir une culture analytique[modifier]
Favoriser une culture de créativité qui permet aux utilisateurs de sonder les données ne se limite pas uniquement au produit logiciel. Les processus décisionnels basés sur des données nécessitent une assistance en programmation dans l'ensemble de l'organisation. Le service informatique, en tant que propriétaire de la solution analytique, peut favoriser une utilisation intelligente des analyses (et a tout intérêt à le faire), d'une manière qui permet d'assurer le développement de l'entreprise.
Grâce à Tableau Drive, le service informatique joue en fin de compte un rôle de conception stratégique. Il a la charge de concevoir le véhicule que l'entreprise utilisera pour se développer. Et pour progresser rapidement et en toute sécurité, une solide collaboration est nécessaire.
Fondamentalement, Tableau Drive constitue un exercice de gestion du changement.
Si votre organisation est réfractaire au changement, par exemple si un conflit naît entre les services métiers et le service informatique, ou si l'entreprise est fondamentalement opposée à permettre aux utilisateurs d'accéder aux données, vous devez vous attaquer à ces points le plus tôt possible dans le processus.
Dans le cadre du processus Drive, les équipes doivent se réunir et convenir ensemble de leur mission, une étape qui est absolument obligatoire pour permettre de créer une culture analytique. Voici une suggestion de déclaration de mission, que vous pouvez adapter aux besoins de votre organisation.
Exemple de déclaration de mission Drive[modifier]
Nous nous engageons à élaborer des solutions opérationnelles plus intelligentes.
Pour ce faire, nous devons permettre à tous les employés de poser leurs questions, et d'y trouver eux-mêmes les réponses. Cela permet à chacun d'entre eux de prendre chaque jour des décisions plus éclairées.
L'équipe Drive lancera le processus de changement en concevant les structures de données et les rapports pour trouver des réponses à nos principales questions actuelles. Nous emploierons une méthodologie agile dans notre approche. Cela peut nécessiter la modification des structures de données, la conception de nouvelles structures, ou l'exécution de nouvelles fonctions ETL, afin de garantir des données épurées et utilisables.
L'équipe a également pour mission de permettre à l'organisation de trouver des réponses aux questions importantes à venir. Pour ce faire, nous mettrons en place une plate-forme qui permettra à l'entreprise d'explorer, développer et partager des informations exploitables. Cette plate-forme sera en libre-service dans la mesure du possible, de la recherche de sources de données jusqu'à la publication et au partage de contenu.
Drive propose une vision de ce à quoi une organisation analytique doit ressembler, ainsi qu'une voie à suivre pour parvenir à cet objectif. Une telle évolution nécessite une volonté d'ouverture et de changement.
La prochaine étape[modifier]
Ce document propose une vision d'organisation analytique. Le manuel Drive est un document de conseil exhaustif qui présente les étapes nécessaires pour le déploiement d'un système analytique en entreprise. Vous pouvez vous y référer dans votre processus de développement. Si votre entreprise est prête à aller de l'avant, nous vous recommandons de consulter ce document.
A propos de Tableau[modifier]
Tableau Software aide les utilisateurs à voir et à comprendre leurs données. Tableau permet à chacun d'analyser, de visualiser et de partager rapidement des informations. Plus de 19 000 comptes clients font confiance à Tableau pour obtenir rapidement des résultats, au bureau ou en déplacement. Tableau Public permet à des dizaines de milliers d'utilisateurs de partager des données sur leurs blogs et sites Web. Découvrez en quoi Tableau peut vous aider. Téléchargez la version d'évaluation gratuite à l’adresse www.tableausoftware.com/trial.
- ↑ http://www.nytimes.com/2012/03/01/technology/impatient-web-users-flee-slow-loading-sites.
- ↑ Bill Curtis, et all. The Capability Maturity Model: Guidelines for Improving the Software Process. 1994.