Entreposage de données
Qu'est-ce que l'entreposage de données ?
L'entreposage de données est le stockage électronique sécurisé d'informations par une entreprise ou une autre organisation. L'objectif de l'entreposage de données est de créer un trésor de données historiques qui peuvent être récupérées et analysées pour fournir un aperçu utile des opérations de l'organisation.
L'entreposage de données est un élément essentiel de l'informatique décisionnelle. Ce terme plus large englobe l'infrastructure d'information que les entreprises modernes utilisent pour suivre leurs succès et leurs échecs passés et éclairer leurs décisions pour l'avenir.
- L'entreposage de données est le stockage d'informations au fil du temps par une entreprise ou une autre organisation.
- De nouvelles données sont périodiquement ajoutées par des personnes de divers départements clés tels que le marketing et les ventes.
- L'entrepôt devient une bibliothèque de données historiques qui peuvent être récupérées et analysées afin d'éclairer la prise de décision dans l'entreprise.
- Les facteurs clés de la construction d'un entrepôt de données efficace incluent la définition des informations essentielles à l'organisation et l'identification des sources d'informations.
- Une base de données est conçue pour fournir des informations en temps réel. Un entrepôt de données est conçu comme une archive d'informations historiques.
Comment fonctionne l'entreposage de données
Le besoin d'entreposer des données a évolué à mesure que les entreprises ont commencé à s'appuyer sur des systèmes informatiques pour créer, classer et récupérer des documents commerciaux importants. Le concept d'entreposage de données a été introduit en 1988 par les chercheurs d'IBM Barry Devlin et Paul Murphy.
L'entreposage de données est conçu pour permettre l'analyse des données historiques. La comparaison de données consolidées à partir de plusieurs sources hétérogènes peut donner un aperçu de la performance d'une entreprise. Un entrepôt de données est conçu pour permettre à ses utilisateurs d'exécuter des requêtes et des analyses sur des données historiques issues de sources transactionnelles.
Les données ajoutées à l'entrepôt ne changent pas et ne peuvent pas être modifiées. L'entrepôt est la source utilisée pour exécuter des analyses sur des événements passés, en mettant l'accent sur les changements au fil du temps. Les données entreposées doivent être stockées de manière sécurisée, fiable, facile à récupérer et facile à gérer.
Maintenance de l'entrepôt de données
Certaines mesures sont prises pour maintenir un entrepôt de données. L'une des étapes est l'extraction des données, qui consiste à collecter de grandes quantités de données à partir de plusieurs points sources. Une fois qu'un ensemble de données a été compilé, il passe par le nettoyage des données, le processus de recherche d'erreurs et de correction ou d'exclusion de celles qui sont trouvées.
Les données nettoyées sont ensuite converties d'un format de base de données à un format d'entrepôt. Une fois stockées dans l'entrepôt, les données sont triées, consolidées et récapitulées, de sorte qu'elles seront plus faciles à utiliser. Au fil du temps, davantage de données sont ajoutées à l'entrepôt à mesure que les différentes sources de données sont mises à jour.
Un livre clé sur l'entreposage de données est "Building the Data Warehouse" de WH Inmon, un guide pratique qui a été publié pour la première fois en 1990 et a été réimprimé plusieurs fois.
Aujourd'hui, les entreprises peuvent investir dans des services logiciels d'entrepôt de données basés sur le cloud de sociétés telles que Microsoft, Google, Amazon et Oracle, entre autres.
Exploration de données
Les entreprises entreposent des données principalement pour l'exploration de données. Cela implique de rechercher des modèles d'informations qui les aideront à améliorer leurs processus métier.
Un bon système d'entreposage de données permet aux différents services d'une entreprise d'accéder plus facilement aux données des autres. Par exemple, une équipe marketing peut évaluer les données de l'équipe de vente afin de prendre des décisions sur la manière d'ajuster ses campagnes de vente.
Les 5 étapes de l'exploration de données
Le processus de datamining se décompose en cinq étapes :
Une organisation collecte des données et les charge dans un entrepôt de données.
Les données sont ensuite stockées et gérées, soit sur des serveurs internes, soit dans un service cloud.
Les analystes commerciaux, les équipes de direction et les professionnels des technologies de l'information accèdent aux données et les organisent.
Le logiciel d'application trie les données.
L'utilisateur final présente les données dans un format facile à partager, tel qu'un graphique ou un tableau.
Le concept d'entrepôt de données a été introduit par deux chercheurs d'IBM en 1988.
Entreposage de données vs bases de données
Un entrepôt de données n'est pas la même chose qu'une base de données :
Une base de données est un système transactionnel qui surveille et met à jour les données en temps réel afin de n'avoir que les données les plus récentes disponibles.
Un entrepôt de données est programmé pour agréger des données structurées dans le temps.
Par exemple, une base de données peut n'avoir que l'adresse la plus récente d'un client, tandis qu'un entrepôt de données peut avoir toutes les adresses du client au cours des 10 dernières années.
L'exploration de données s'appuie sur l'entrepôt de données. Les données de l'entrepôt sont triées pour obtenir des informations sur l'entreprise au fil du temps.
Avantages et inconvénients des entrepôts de données
L'entreposage de données vise à donner à une entreprise un avantage concurrentiel. Il crée une ressource d'informations pertinentes qui peuvent être suivies au fil du temps et analysées afin d'aider une entreprise à prendre des décisions plus éclairées.
Cela peut également épuiser les ressources de l'entreprise et surcharger son personnel actuel avec des tâches routinières destinées à alimenter la machine de l'entrepôt.
Le Corporate Finance Institute identifie ces inconvénients potentiels liés à la maintenance d'un entrepôt de données :
Il faut beaucoup de temps et d'efforts pour créer et entretenir l'entrepôt.
Les lacunes dans l'information, causées par une erreur humaine, peuvent mettre des années à apparaître, ce qui nuit à l'intégrité et à l'utilité de l'information.
Lorsque plusieurs sources sont utilisées, les incohérences entre elles peuvent entraîner des pertes d'informations.
TTT
FAQ sur l'entrepôt de données
Voici les réponses à certaines questions fréquemment posées sur l'entreposage de données.
Qu'est-ce qu'un entrepôt de données et à quoi sert-il ?
Un entrepôt de données est un système de stockage d'informations pour les données historiques qui peuvent être analysées de nombreuses façons. Les entreprises et autres organisations s'appuient sur l'entrepôt de données pour avoir un aperçu des performances passées et planifier des améliorations à leurs opérations.
Qu'est-ce qu'un exemple d'entrepôt de données ?
Considérez une entreprise qui fabrique des équipements d'exercice. Son best-seller est un vélo stationnaire, et il envisage d'élargir sa gamme et de lancer une nouvelle campagne de marketing pour le soutenir.
Il se rend dans son entrepôt de données pour mieux comprendre son client actuel. Il peut savoir si ses clients sont principalement des femmes de plus de 50 ans ou des hommes de moins de 35 ans. Il peut en savoir plus sur les détaillants qui ont le mieux réussi à vendre leurs vélos et sur leur emplacement. Il pourrait être en mesure d'accéder aux résultats d'enquêtes internes et de découvrir ce que leurs anciens clients ont aimé et n'ont pas aimé à propos de leurs produits.
Toutes ces informations aident l'entreprise à décider du type de nouveaux modèles de vélos qu'elle souhaite construire et de la manière dont elle les commercialisera et en fera la publicité. Il s'agit d'informations concrètes plutôt que d'une prise de décision improvisée.
Quelles sont les étapes de l'entreposage de données ?
Il y a au moins sept étapes dans la création d'un entrepôt de données, selon ITPro Today, une publication de l'industrie. Ils comprennent:
Déterminer les objectifs de l'entreprise et ses indicateurs clés de performance.
Recueillir et analyser les informations appropriées.
Identifier les processus métier de base qui contribuent aux données clés.
Construire un modèle conceptuel de données qui montre comment les données sont présentées à l'utilisateur final.
Localiser les sources des données et établir un processus d'alimentation des données dans l'entrepôt.
Établir une durée de suivi. Les entrepôts de données peuvent devenir peu maniables. Beaucoup sont construits avec des niveaux d'archivage, de sorte que les informations plus anciennes sont conservées avec moins de détails.
Mise en Ĺ“uvre du planning.
SQL est-il un entrepôt de données ?
SQL, ou Structured Query Language, est un langage informatique utilisé pour interagir avec une base de données dans des termes qu'elle peut comprendre et auxquels elle peut répondre. Il contient un certain nombre de commandes telles que "sélectionner", "insérer" et "mettre à jour". C'est le langage standard des systèmes de gestion de bases de données relationnelles.
Une base de données n'est pas la même chose qu'un entrepôt de données, bien que les deux soient des magasins d'informations. Une base de données est une collection organisée d'informations. Un entrepôt de données est une archive d'informations qui est continuellement construite à partir de plusieurs sources.
L'essentiel
L'entrepôt de données est le référentiel d'informations d'une entreprise sur son activité et ses performances au fil du temps. Créé avec la contribution des employés de chacun de ses départements clés, il est la source d'analyse qui révèle les succès et les échecs passés de l'entreprise et éclaire sa prise de décision.