Investor's wiki

Almacenamiento de datos

Almacenamiento de datos

¿Qué es el almacenamiento de datos?

El almacenamiento de datos es el almacenamiento electrónico seguro de información por parte de una empresa u otra organización. El objetivo del almacenamiento de datos es crear un tesoro de datos históricos que se puedan recuperar y analizar para proporcionar información útil sobre las operaciones de la organización.

El almacenamiento de datos es un componente vital de la inteligencia comercial. Ese término más amplio abarca la infraestructura de información que utilizan las empresas modernas para rastrear sus éxitos y fracasos pasados e informar sus decisiones para el futuro.

  • El almacenamiento de datos es el almacenamiento de información a lo largo del tiempo por parte de una empresa u otra organización.
  • Las personas de varios departamentos clave, como marketing y ventas, agregan periódicamente nuevos datos.
  • El almacén se convierte en una biblioteca de datos históricos que se pueden recuperar y analizar para informar la toma de decisiones en el negocio.
  • Los factores clave en la construcción de un almacén de datos eficaz incluyen la definición de la información que es crítica para la organización y la identificación de las fuentes de la información.
  • Se diseña una base de datos para suministrar información en tiempo real. Un almacén de datos está diseñado como un archivo de información histórica.

Cómo funciona el almacenamiento de datos

La necesidad de almacenar datos evolucionó a medida que las empresas comenzaron a depender de los sistemas informáticos para crear, archivar y recuperar documentos comerciales importantes. El concepto de almacenamiento de datos fue introducido en 1988 por los investigadores de IBM Barry Devlin y Paul Murphy.

El almacenamiento de datos está diseñado para permitir el análisis de datos históricos. La comparación de datos consolidados de múltiples fuentes heterogéneas puede proporcionar información sobre el desempeño de una empresa. Un almacén de datos está diseñado para permitir que sus usuarios ejecuten consultas y análisis sobre datos históricos derivados de fuentes transaccionales.

Los datos agregados al almacén no cambian y no se pueden modificar. El almacén es la fuente que se utiliza para ejecutar análisis de eventos pasados, con un enfoque en los cambios a lo largo del tiempo. Los datos almacenados deben almacenarse de manera segura, confiable, fácil de recuperar y fácil de administrar.

Mantenimiento del almacén de datos

Hay ciertos pasos que se toman para mantener un almacén de datos. Un paso es la extracción de datos, que implica recopilar grandes cantidades de datos de múltiples puntos de origen. Una vez que se ha compilado un conjunto de datos, pasa por la limpieza de datos, el proceso de peinarlo en busca de errores y corregir o excluir cualquiera que se encuentre.

Los datos limpios luego se convierten de un formato de base de datos a un formato de almacén. Una vez almacenados en el almacén, los datos se clasifican, consolidan y resumen para que sean más fáciles de usar. Con el tiempo, se agregan más datos al almacén a medida que se actualizan las diversas fuentes de datos.

Un libro clave sobre almacenamiento de datos es "Building the Data Warehouse" de WH Inmon, una guía práctica que se publicó por primera vez en 1990 y se ha reimpreso varias veces.

Hoy en día, las empresas pueden invertir en servicios de software de almacenamiento de datos basados en la nube de empresas como Microsoft, Google, Amazon y Oracle, entre otras.

Procesamiento de datos

Las empresas almacenan datos principalmente para la minería de datos. Eso implica buscar patrones de información que les ayuden a mejorar sus procesos comerciales.

Un buen sistema de almacenamiento de datos facilita que los diferentes departamentos de una empresa accedan a los datos de los demás. Por ejemplo, un equipo de marketing puede evaluar los datos del equipo de ventas para tomar decisiones sobre cómo ajustar sus campañas de ventas.

Los 5 pasos de la minería de datos

El proceso de minería de datos se divide en cinco pasos:

  1. Una organización recopila datos y los carga en un almacén de datos.

  2. Luego, los datos se almacenan y administran, ya sea en servidores internos o en un servicio en la nube.

  3. Los analistas comerciales, los equipos de gestión y los profesionales de tecnología de la información acceden y organizan los datos.

  4. El software de la aplicación clasifica los datos.

  5. El usuario final presenta los datos en un formato fácil de compartir, como un gráfico o una tabla.

El concepto de almacén de datos fue introducido por dos investigadores de IBM en 1988.

Almacenamiento de datos frente a bases de datos

Un almacén de datos no es lo mismo que una base de datos:

  • Una base de datos es un sistema transaccional que monitorea y actualiza datos en tiempo real para tener solo los datos más recientes disponibles.

  • Un almacén de datos está programado para agregar datos estructurados a lo largo del tiempo.

Por ejemplo, una base de datos puede tener solo la dirección más reciente de un cliente, mientras que un almacén de datos puede tener todas las direcciones del cliente durante los últimos 10 años.

La minería de datos se basa en el almacén de datos. Los datos en el almacén se tamizan para obtener información sobre el negocio a lo largo del tiempo.

Ventajas y desventajas de los almacenes de datos

El almacenamiento de datos está destinado a dar a una empresa una ventaja competitiva. Crea un recurso de información pertinente que se puede rastrear a lo largo del tiempo y analizar para ayudar a una empresa a tomar decisiones más informadas.

También puede agotar los recursos de la empresa y sobrecargar a su personal actual con tareas rutinarias destinadas a alimentar la maquinaria del almacén.

El Corporate Finance Institute identifica estas posibles desventajas de mantener un almacén de datos:

  • Se necesita mucho tiempo y esfuerzo para crear y mantener el almacén.

  • Las brechas en la información, causadas por errores humanos, pueden tardar años en aparecer, dañando la integridad y la utilidad de la información.

  • Cuando se utilizan múltiples fuentes, las inconsistencias entre ellas pueden causar pérdidas de información.

TTT

Preguntas frecuentes sobre almacenamiento de datos

Aquí están las respuestas a algunas preguntas frecuentes sobre el almacenamiento de datos.

¿Qué es un almacén de datos y para qué sirve?

Un almacén de datos es un sistema de almacenamiento de información para datos históricos que se pueden analizar de muchas maneras. Las empresas y otras organizaciones recurren al almacén de datos para obtener información sobre el rendimiento anterior y planificar mejoras en sus operaciones.

¿Qué es un ejemplo de almacén de datos?

Considere una empresa que fabrica equipos de ejercicio. Su producto más vendido es una bicicleta estacionaria y está considerando expandir su línea y lanzar una nueva campaña de marketing para apoyarla.

Acude a su almacén de datos para comprender mejor a su cliente actual. Puede averiguar si sus clientes son predominantemente mujeres mayores de 50 años u hombres menores de 35 años. Puede obtener más información sobre los minoristas que han tenido más éxito en la venta de sus bicicletas y dónde están ubicados. Es posible que pueda acceder a los resultados de encuestas internas y descubrir qué les ha gustado y qué no les ha gustado a sus clientes anteriores sobre sus productos.

Toda esta información ayuda a la empresa a decidir qué tipo de nuevos modelos de bicicletas quieren construir y cómo los comercializarán y publicitarán. Es información sólida en lugar de una toma de decisiones improvisada.

¿Cuáles son las etapas del almacenamiento de datos?

Hay al menos siete etapas para la creación de un almacén de datos, según ITPro Today, una publicación de la industria. Incluyen:

  • Determinación de los objetivos de negocio y sus indicadores clave de rendimiento.

  • Recopilación y análisis de la información adecuada.

  • Identificar los procesos de negocio core que aportan los datos clave.

  • Construir un modelo de datos conceptual que muestre cómo se muestran los datos al usuario final.

  • Localizar las fuentes de los datos y establecer un proceso para alimentar los datos en el almacén.

  • Establecer una duración de seguimiento. Los almacenes de datos pueden volverse difíciles de manejar. Muchos están construidos con niveles de archivado, de modo que la información más antigua se conserva con menos detalle.

  • Implementación del plan.

¿SQL es un almacén de datos?

SQL, o lenguaje de consulta estructurado, es un lenguaje informático que se utiliza para interactuar con una base de datos en términos que pueda comprender y responder. Contiene una serie de comandos como "seleccionar", "insertar" y "actualizar". Es el lenguaje estándar para los sistemas de gestión de bases de datos relacionales.

No es lo mismo una base de datos que un almacén de datos, aunque ambos son almacenes de información. Una base de datos es una colección organizada de información. Un almacén de datos es un archivo de información que se construye continuamente a partir de múltiples fuentes.

La línea de fondo

El almacén de datos es el depósito de información de una empresa sobre su negocio y cómo se ha desempeñado a lo largo del tiempo. Creado con aportes de los empleados en cada uno de sus departamentos clave, es la fuente de análisis que revela los éxitos y fracasos pasados de la empresa e informa su toma de decisiones.