データウェアハウジング
##データウェアハウジングとは何ですか?
データウェアハウジングは、企業または他の組織による情報の安全な電子ストレージです。データウェアハウジングの目標は、組織の運用に関する有用な洞察を提供するために取得および分析できる履歴データの山を作成することです。
データウェアハウジングは、ビジネスインテリジェンスの重要なコンポーネントです。その広い用語は、現代の企業が過去の成功と失敗を追跡し、将来の決定を通知するために使用する情報インフラストラクチャを含みます。
-データウェアハウジングとは、企業または他の組織による長期にわたる情報の保存です。
-新しいデータは、マーケティングや販売などのさまざまな主要部門の人々によって定期的に追加されます。
-倉庫は、ビジネスの意思決定に情報を提供するために取得および分析できる履歴データのライブラリになります。
-効果的なデータウェアハウスを構築するための重要な要素には、組織にとって重要な情報の定義と、情報のソースの特定が含まれます。
-データベースは、リアルタイムの情報を提供するように設計されています。データウェアハウスは、履歴情報のアーカイブとして設計されています。
##データウェアハウジングの仕組み
重要なビジネスドキュメントの作成、ファイリング、および取得を企業がコンピュータシステムに依存し始めるにつれて、データを保管する必要性が高まりました。データウェアハウジングの概念は、IBMの研究者であるBarryDevlinとPaulMurphyによって1988年に導入されました。
データウェアハウジングは、履歴データの分析を可能にするように設計されています。複数の異種ソースから統合されたデータを比較することで、企業のパフォーマンスに関する洞察を得ることができます。データウェアハウスは、ユーザーがトランザクションソースから派生した履歴データに対してクエリと分析を実行できるように設計されています。
ウェアハウスに追加されたデータは変更されず、変更できません。ウェアハウスは、時間の経過に伴う変化に焦点を当てて、過去のイベントの分析を実行するために使用されるソースです。保管されたデータは、安全で信頼性が高く、取得しやすく、管理しやすい方法で保存する必要があります。
###データウェアハウスの保守
データウェアハウスを維持するために実行される特定の手順があります。 1つのステップはデータ抽出です。これには、複数のソースポイントから大量のデータを収集することが含まれます。データのセットがコンパイルされた後、データクリーニングが実行されます。これは、エラーがないかデータを調べ、検出されたデータを修正または除外するプロセスです。
クリーンアップされたデータは、データベース形式からウェアハウス形式に変換されます。ウェアハウスに保存されると、データは並べ替え、統合、および要約が行われるため、使いやすくなります。時間の経過とともに、さまざまなデータソースが更新されるにつれて、より多くのデータがウェアハウスに追加されます。
データウェアハウジングに関する重要な本は、WHInmonの「BuildingtheData Warehouse」です。これは、1990年に最初に発行され、何度か再版された実用的なガイドです。
今日、企業は、Microsoft、Google、Amazon、Oracleなどの企業が提供するクラウドベースのデータウェアハウスソフトウェアサービスに投資できます。
## データマイニング
ビジネスは主にデータマイニングのためにデータを保管します。それには、ビジネスプロセスの改善に役立つ情報のパターンを探すことが含まれます。
優れたデータウェアハウジングシステムにより、企業内のさまざまな部門が互いのデータに簡単にアクセスできるようになります。たとえば、マーケティングチームは、販売キャンペーンを調整する方法を決定するために、販売チームのデータを評価できます。
###データマイニングの5つのステップ
データマイニングプロセスは、次の5つのステップに分かれています。
1.組織はデータを収集し、データウェアハウスにロードします。
1.データは、社内サーバーまたはクラウドサービスのいずれかに保存および管理されます。
1.ビジネスアナリスト、管理チーム、および情報技術の専門家がデータにアクセスして整理します。
1.アプリケーションソフトウェアがデータをソートします。
1.エンドユーザーは、グラフや表などの共有しやすい形式でデータを提示します。
データウェアハウスの概念は、1988年に2人のIBM研究者によって導入されました。
##データウェアハウジングとデータベース
データウェアハウスはデータベースと同じではありません。
-データベースは、最新のデータのみを利用できるようにするために、リアルタイムデータを監視および更新するトランザクションシステムです。
-データウェアハウスは、時間の経過とともに構造化データを集約するようにプログラムされています。
たとえば、データベースには顧客の最新の住所しか含まれていない場合がありますが、データウェアハウスには過去10年間の顧客のすべての住所が含まれている場合があります。
データマイニングはデータウェアハウスに依存しています。倉庫内のデータは、時間の経過に伴うビジネスへの洞察のために選別されます。
##データウェアハウスの長所と短所
データウェアハウジングは、企業に競争上の優位性を与えることを目的としています。これは、ビジネスがより多くの情報に基づいた決定を下すのを支援するために、時間をかけて追跡および分析できる関連情報のリソースを作成します。
また、会社のリソースを浪費し、倉庫の機械に供給することを目的とした日常的なタスクで現在のスタッフに負担をかける可能性があります。
Corporate Finance Instituteは、データウェアハウスを維持することのこれらの潜在的な欠点を特定しています。
-倉庫の作成と保守にはかなりの時間と労力がかかります。
-人為的ミスによって引き起こされる情報のギャップは、表面化するのに何年もかかる可能性があり、情報の完全性と有用性を損なう可能性があります。
-複数のソースが使用されている場合、それらの間の不整合により情報が失われる可能性があります。
TTT h5>
##データウェアハウスのFAQ
データウェアハウジングに関してよくある質問への回答は次のとおりです。
###データウェアハウスとは何ですか?また、それは何のために使用されますか?
データウェアハウスは、さまざまな方法で分析できる履歴データの情報ストレージシステムです。企業やその他の組織は、データウェアハウスを利用して、過去のパフォーマンスに関する洞察を得て、運用の改善を計画します。
###データウェアハウスの例とは何ですか?
運動器具を製造している会社を考えてみましょう。そのベストセラーは固定自転車であり、ラインを拡大し、それをサポートするための新しいマーケティングキャンペーンを開始することを検討しています。
現在の顧客をよりよく理解するためにデータウェアハウスに行きます。顧客が主に50歳以上の女性なのか35歳未満の男性なのかを知ることができます。自転車の販売で最も成功している小売業者とその所在地について詳しく知ることができます。社内の調査結果にアクセスして、過去の顧客が自社の製品について好きなものと嫌いなものを見つけることができるかもしれません。
このすべての情報は、会社がどのような種類の新しいモデルの自転車を製造したいか、そしてそれらをどのように販売および宣伝するかを決定するのに役立ちます。パンツの座席の意思決定ではなく、難しい情報です。
###データウェアハウジングの段階は何ですか?
業界の出版物であるITProTodayによると、データウェアハウスの作成には少なくとも7つの段階があります。それらが含まれます:
-ビジネス目標とその主要業績評価指標の決定。
-適切な情報の収集と分析。
-重要なデータを提供するコアビジネスプロセスを特定します。
-データがエンドユーザーにどのように表示されるかを示す概念データモデルを構築します。
-データのソースを特定し、データをウェアハウスにフィードするためのプロセスを確立します。
-追跡期間を設定します。データウェアハウスは扱いにくくなる可能性があります。多くはアーカイブのレベルで構築されているため、古い情報はあまり詳細に保持されません。
-計画の実施。
SQLはデータウェアハウスですか?
SQL(Structured Query Language)は、データベースが理解して応答できるという観点からデータベースと対話するために使用されるコンピューター言語です。これには、「選択」、「挿入」、「更新」などの多数のコマンドが含まれています。これは、リレーショナルデータベース管理システムの標準言語です。
データベースはデータウェアハウスと同じではありませんが、どちらも情報のストアです。データベースは、組織化された情報のコレクションです。データウェアハウスは、複数のソースから継続的に構築される情報アーカイブです。
##結論
データウェアハウスは、企業のビジネスおよび時間の経過に伴うパフォーマンスに関する情報のリポジトリです。各主要部門の従業員からのインプットを基に作成され、会社の過去の成功と失敗を明らかにし、意思決定に情報を提供する分析のソースです。