Investor's wiki

Pergudangan Data

Pergudangan Data

Apakah itu Data Warehousing?

Penyimpanan data ialah penyimpanan maklumat elektronik yang selamat oleh perniagaan atau organisasi lain. Matlamat pergudangan data adalah untuk mencipta koleksi data sejarah yang boleh diambil dan dianalisis untuk memberikan gambaran berguna tentang operasi organisasi.

Penyimpanan data ialah komponen penting dalam perisikan perniagaan. Istilah yang lebih luas itu merangkumi infrastruktur maklumat yang digunakan oleh perniagaan moden untuk menjejaki kejayaan dan kegagalan masa lalu mereka dan memaklumkan keputusan mereka untuk masa depan.

  • Pergudangan data ialah penyimpanan maklumat dari semasa ke semasa oleh perniagaan atau organisasi lain.
  • Data baharu ditambah secara berkala oleh orang di pelbagai jabatan penting seperti pemasaran dan jualan.
  • Gudang menjadi perpustakaan data sejarah yang boleh diambil dan dianalisis untuk memaklumkan pembuatan keputusan dalam perniagaan.
  • Faktor utama dalam membina gudang data yang berkesan termasuk menentukan maklumat yang penting kepada organisasi dan mengenal pasti sumber maklumat.
  • Pangkalan data direka untuk membekalkan maklumat masa nyata. Gudang data direka bentuk sebagai arkib maklumat sejarah.

Bagaimana Pergudangan Data Berfungsi

Keperluan untuk menyimpan data berkembang apabila perniagaan mula bergantung pada sistem komputer untuk mencipta, memfailkan dan mendapatkan semula dokumen perniagaan yang penting. Konsep pergudangan data telah diperkenalkan pada tahun 1988 oleh penyelidik IBM Barry Devlin dan Paul Murphy.

Penyimpanan data direka bentuk untuk membolehkan analisis data sejarah. Membandingkan data yang disatukan daripada pelbagai sumber heterogen boleh memberikan gambaran tentang prestasi syarikat. Gudang data direka bentuk untuk membolehkan penggunanya menjalankan pertanyaan dan menganalisis data sejarah yang diperoleh daripada sumber transaksi.

Data yang ditambahkan ke gudang tidak berubah dan tidak boleh diubah. Gudang ialah sumber yang digunakan untuk menjalankan analitis pada peristiwa lalu, dengan tumpuan pada perubahan dari semasa ke semasa. Data yang disimpan mesti disimpan dalam cara yang selamat, boleh dipercayai, mudah diambil dan mudah diurus.

Menyelenggara Gudang Data

Terdapat langkah-langkah tertentu yang diambil untuk mengekalkan gudang data. Satu langkah ialah pengekstrakan data, yang melibatkan pengumpulan sejumlah besar data daripada berbilang titik sumber. Selepas satu set data telah disusun, ia melalui pembersihan data, proses menyisirnya untuk kesilapan dan membetulkan atau mengecualikan mana-mana yang ditemui.

Data yang telah dibersihkan kemudiannya ditukar daripada format pangkalan data kepada format gudang. Setelah disimpan di dalam gudang, data akan melalui pengisihan, penyatuan dan ringkasan, supaya lebih mudah digunakan. Dari masa ke masa, lebih banyak data ditambahkan ke gudang kerana pelbagai sumber data dikemas kini.

Buku utama mengenai pergudangan data ialah "Membina Gudang Data" WH Inmon, sebuah panduan praktikal yang pertama kali diterbitkan pada tahun 1990 dan telah dicetak semula beberapa kali.

Hari ini, perniagaan boleh melabur dalam perkhidmatan perisian gudang data berasaskan awan daripada syarikat termasuk Microsoft, Google, Amazon dan Oracle, antara lain.

Perlombongan Data

Data gudang perniagaan terutamanya untuk perlombongan data. Itu melibatkan mencari corak maklumat yang akan membantu mereka meningkatkan proses perniagaan mereka.

Sistem pergudangan data yang baik memudahkan jabatan yang berbeza dalam sesebuah syarikat untuk mengakses data masing-masing. Contohnya, pasukan pemasaran boleh menilai data pasukan jualan untuk membuat keputusan tentang cara melaraskan kempen jualan mereka.

5 Langkah Perlombongan Data

Proses perlombongan data terbahagi kepada lima langkah:

  1. Organisasi mengumpul data dan memuatkannya ke dalam gudang data.

  2. Data kemudiannya disimpan dan diuruskan, sama ada pada pelayan dalaman atau dalam perkhidmatan awan.

  3. Penganalisis perniagaan, pasukan pengurusan dan profesional teknologi maklumat mengakses dan mengatur data.

  4. Perisian aplikasi mengisih data.

  5. Pengguna akhir membentangkan data dalam format yang mudah dikongsi, seperti graf atau jadual.

Konsep gudang data telah diperkenalkan oleh dua penyelidik IBM pada tahun 1988.

Gudang Data lwn Pangkalan Data

Gudang data tidak sama dengan pangkalan data:

  • Pangkalan data ialah sistem urus niaga yang memantau dan mengemas kini data masa nyata untuk mempunyai hanya data terkini yang tersedia.

  • Gudang data diprogramkan untuk mengagregat data berstruktur dari semasa ke semasa.

Sebagai contoh, pangkalan data mungkin hanya mempunyai alamat pelanggan yang paling terkini, manakala gudang data mungkin mempunyai semua alamat untuk pelanggan selama 10 tahun yang lalu.

Perlombongan data bergantung pada gudang data. Data dalam gudang ditapis untuk mendapatkan cerapan tentang perniagaan dari semasa ke semasa.

Kelebihan dan Kelemahan Data Warehouse

Penyimpanan data bertujuan untuk memberikan syarikat kelebihan daya saing. Ia mencipta sumber maklumat berkaitan yang boleh dijejaki dari semasa ke semasa dan dianalisis untuk membantu perniagaan membuat keputusan yang lebih termaklum.

Ia juga boleh mengalirkan sumber syarikat dan membebankan kakitangan semasanya dengan tugas rutin yang bertujuan untuk memberi makan kepada mesin gudang.

Institut Kewangan Korporat mengenal pasti potensi kelemahan ini dalam mengekalkan gudang data:

  • Ia memerlukan banyak masa dan usaha untuk mencipta dan menyelenggara gudang.

  • Jurang dalam maklumat, yang disebabkan oleh kesilapan manusia, boleh mengambil masa bertahun-tahun untuk muncul, merosakkan integriti dan kegunaan maklumat.

  • Apabila berbilang sumber digunakan, ketidakkonsistenan antara mereka boleh menyebabkan kehilangan maklumat.

TTT

Soalan Lazim Gudang Data

Berikut ialah jawapan kepada beberapa soalan lazim tentang pergudangan data.

Apakah Gudang Data dan Untuk Apa Ia Digunakan?

Gudang data ialah sistem penyimpanan maklumat untuk data sejarah yang boleh dianalisis dalam pelbagai cara. Syarikat dan organisasi lain menggunakan gudang data untuk mendapatkan pandangan tentang prestasi masa lalu dan merancang penambahbaikan pada operasi mereka.

Apakah Contoh Gudang Data?

Pertimbangkan sebuah syarikat yang membuat peralatan senaman. Yang paling laris ialah basikal pegun, dan ia sedang mempertimbangkan untuk mengembangkan barisannya dan melancarkan kempen pemasaran baharu untuk menyokongnya.

Ia pergi ke gudang datanya untuk memahami pelanggan semasanya dengan lebih baik. Ia boleh mengetahui sama ada pelanggannya kebanyakannya adalah wanita berusia lebih 50 tahun atau lelaki di bawah 35 tahun. Ia boleh mengetahui lebih lanjut tentang peruncit yang paling berjaya dalam menjual basikal mereka, dan di mana mereka berada. Ia mungkin dapat mengakses hasil tinjauan dalaman dan mengetahui perkara yang disukai dan tidak disukai oleh pelanggan terdahulu mereka tentang produk mereka.

Semua maklumat ini membantu syarikat memutuskan jenis basikal model baharu yang mereka mahu bina dan cara mereka akan memasarkan dan mengiklankannya. Ia adalah maklumat yang sukar dan bukannya membuat keputusan tempat duduk.

Apakah Peringkat Pergudangan Data?

Terdapat sekurang-kurangnya tujuh peringkat untuk penciptaan gudang data, menurut ITPro Today, penerbitan industri. Mereka termasuk:

  • Menentukan objektif perniagaan dan petunjuk prestasi utamanya.

  • Mengumpul dan menganalisis maklumat yang sesuai.

  • Mengenal pasti proses perniagaan teras yang menyumbang data utama.

  • Membina model data konsep yang menunjukkan cara data dipaparkan kepada pengguna akhir.

  • Mencari sumber data dan mewujudkan proses untuk memasukkan data ke dalam gudang.

  • Tetapkan tempoh penjejakan. Gudang data boleh menjadi sukar digunakan. Banyak yang dibina dengan tahap pengarkiban, supaya maklumat lama dikekalkan dengan kurang terperinci.

  • Melaksanakan rancangan.

Adakah SQL Gudang Data?

SQL, atau Bahasa Pertanyaan Berstruktur, ialah bahasa komputer yang digunakan untuk berinteraksi dengan pangkalan data dari segi yang boleh difahami dan bertindak balas. Ia mengandungi beberapa arahan seperti "pilih," "masukkan" dan "kemas kini." Ia adalah bahasa standard untuk sistem pengurusan pangkalan data hubungan.

Pangkalan data tidak sama dengan gudang data, walaupun kedua-duanya adalah simpanan maklumat. Pangkalan data ialah koleksi maklumat yang teratur. Gudang data ialah arkib maklumat yang dibina secara berterusan daripada pelbagai sumber.

Garisan bawah

Gudang data ialah repositori maklumat syarikat tentang perniagaannya dan prestasinya dari semasa ke semasa. Dicipta dengan input daripada pekerja di setiap jabatan utamanya, ia merupakan sumber untuk analisis yang mendedahkan kejayaan dan kegagalan masa lalu syarikat serta memaklumkan pembuatan keputusannya.