Investor's wiki

بيانات التعدين

بيانات التعدين

ما هو التنقيب عن البيانات؟

التنقيب عن البيانات هو عملية تستخدمها الشركات لتحويل البيانات الخام إلى معلومات مفيدة. باستخدام البرنامج للبحث عن أنماط في مجموعات كبيرة من البيانات ، يمكن للشركات معرفة المزيد عن عملائها لتطوير استراتيجيات تسويق أكثر فاعلية وزيادة المبيعات وخفض التكاليف. يعتمد التنقيب عن البيانات على فعالية جمع البيانات وتخزينها ومعالجتها بواسطة الكمبيوتر.

كيف يعمل التنقيب عن البيانات

يتضمن التنقيب عن البيانات استكشاف وتحليل كتل كبيرة من المعلومات لاستخلاص أنماط واتجاهات ذات مغزى. يمكن استخدامه بعدة طرق ، مثل تسويق قاعدة البيانات ، وإدارة مخاطر الائتمان ، واكتشاف الاحتيال ، وتصفية البريد الإلكتروني العشوائي ، أو حتى لتمييز مشاعر أو آراء المستخدمين.

تنقسم عملية التنقيب عن البيانات إلى خمس خطوات. أولاً ، تقوم المؤسسات بجمع البيانات وتحميلها في مستودعات البيانات الخاصة بها. بعد ذلك ، يقومون بتخزين البيانات وإدارتها ، إما على الخوادم الداخلية أو السحابة. يقوم محللو الأعمال وفرق الإدارة ومتخصصو تكنولوجيا المعلومات بالوصول إلى البيانات وتحديد كيفية تنظيمها. بعد ذلك ، يقوم برنامج التطبيق بفرز البيانات بناءً على نتائج المستخدم ، وأخيراً ، يقدم المستخدم النهائي البيانات بتنسيق سهل المشاركة ، مثل الرسم البياني أو الجدول.

تخزين البيانات وبرامج التعدين

تقوم برامج التنقيب عن البيانات بتحليل العلاقات والأنماط في البيانات بناءً على ما يطلبه المستخدمون. على سبيل المثال ، يمكن للشركة استخدام برنامج التنقيب عن البيانات لإنشاء فئات من المعلومات. للتوضيح ، تخيل أن مطعمًا يريد استخدام التنقيب عن البيانات لتحديد متى يجب أن يقدم عروض خاصة معينة. إنه ينظر إلى المعلومات التي جمعتها وينشئ فصولاً بناءً على وقت زيارة العملاء وما يطلبونه.

في حالات أخرى ، يجد عمال مناجم البيانات مجموعات من المعلومات بناءً على العلاقات المنطقية أو ينظرون إلى الارتباطات والأنماط المتسلسلة لاستخلاص استنتاجات حول الاتجاهات في سلوك المستهلك.

التخزين هو جانب مهم من التنقيب عن البيانات. التخزين هو عندما تقوم الشركات بتجميع بياناتها في قاعدة بيانات أو برنامج واحد. مع مستودع البيانات ، قد تقوم المؤسسة بفصل أجزاء من البيانات لمستخدمين محددين لتحليلها واستخدامها.

ومع ذلك ، في حالات أخرى ، قد يبدأ المحللون بالبيانات التي يريدونها وإنشاء مستودع بيانات بناءً على تلك المواصفات. بغض النظر عن كيفية تنظيم الشركات والكيانات الأخرى لبياناتها ، فإنها تستخدمها لدعم عمليات صنع القرار في الإدارة.

التنقيب عن البيانات ووسائل التواصل الاجتماعي

كان أحد أكثر التطبيقات المربحة للتنقيب عن البيانات هو وسائل التواصل الاجتماعي. تقوم منصات مثل Facebook (المملوكة لشركة Meta) و TikTok و Instagram و Twitter بجمع رزم من البيانات حول المستخدمين الفرديين لتقديم استنتاجات حول تفضيلاتهم من أجل إرسال إعلانات تسويقية مستهدفة. تُستخدم هذه البيانات أيضًا لمحاولة التأثير على سلوك المستخدم وتغيير تفضيلاته ، سواء كان ذلك لمنتج استهلاكي أو لمن سيصوتون في الانتخابات.

أصبح التنقيب عن البيانات على وسائل التواصل الاجتماعي نقطة خلاف كبيرة ، مع العديد من التقارير الاستقصائية والكشفات التي توضح كيف يمكن أن تكون بيانات مستخدمي التعدين الشائنة.

فضيحة Cambridge Analytica هي مثال ساطع على كيفية استخدام شركات وسائل التواصل الاجتماعي لاستخراج البيانات على حساب مستخدميها.

مثال على التنقيب عن البيانات

تعتبر متاجر البقالة مستخدمين معروفين لتقنيات استخراج البيانات. تقدم العديد من محلات السوبر ماركت بطاقات ولاء مجانية للعملاء تتيح لهم الوصول إلى أسعار مخفضة غير متاحة لغير الأعضاء. تسهل البطاقات على المتاجر تتبع من يشتري ماذا ومتى يشتريه وبأي سعر. بعد تحليل البيانات ، يمكن للمتاجر بعد ذلك استخدام هذه البيانات لتزويد العملاء بقسائم تستهدف عاداتهم الشرائية وتحديد وقت طرح العناصر للبيع أو وقت بيعها بالسعر الكامل.

يمكن أن يكون التنقيب عن البيانات مدعاة للقلق عندما تستخدم الشركة فقط معلومات مختارة ، والتي لا تمثل مجموعة العينة الإجمالية ، لإثبات فرضية معينة.

تُستخدم عمليات استخراج البيانات لبناء نماذج التعلم الآلي التي تدعم التطبيقات بما في ذلك تكنولوجيا محرك البحث وبرامج توصية مواقع الويب.

يسلط الضوء

  • يمكن للشركات استخدام التنقيب عن البيانات في كل شيء بدءًا من التعرف على ما يهتم به العملاء أو يرغبون في شرائه وحتى اكتشاف الاحتيال وتصفية البريد العشوائي.

  • تعمل برامج التنقيب عن البيانات على تفكيك الأنماط والوصلات في البيانات بناءً على المعلومات التي يطلبها المستخدمون أو يقدمونها.

  • التنقيب عن البيانات هو عملية تحليل مجموعة كبيرة من المعلومات لتمييز الاتجاهات والأنماط.

  • تستخدم شركات التواصل الاجتماعي تقنيات التنقيب عن البيانات لتسليع مستخدميها من أجل جني الأرباح.

  • تعرض هذا الاستخدام للتنقيب في البيانات إلى انتقادات في الآونة الأخيرة ، وغالبًا ما يكون المستخدمون غير مدركين للتنقيب في البيانات الذي يحدث مع معلوماتهم الشخصية ، خاصةً عند استخدامها للتأثير على التفضيلات.

التعليمات

كيف يتم التنقيب في البيانات؟

يعتمد التنقيب عن البيانات على البيانات الضخمة وعمليات الحوسبة المتقدمة بما في ذلك التعلم الآلي وأشكال أخرى من الذكاء الاصطناعي (AI). الهدف هو العثور على الأنماط التي يمكن أن تؤدي إلى استدلالات أو تنبؤات من مجموعات بيانات كبيرة أو غير منظمة.

ما هو المصطلح الآخر للتنقيب في البيانات؟

يمر التنقيب عن البيانات أيضًا بالمصطلح الأقل استخدامًا الذي تكتشفه المعرفة في البيانات ، أو KDD.

من يستخدم التنقيب عن البيانات؟

تتراوح تطبيقات التنقيب عن البيانات من القطاع المالي للبحث عن أنماط في الأسواق إلى الحكومات التي تحاول تحديد التهديدات الأمنية المحتملة. تستخدم الشركات ، وخاصة عبر الإنترنت وشركات الوسائط الاجتماعية ، التنقيب عن البيانات على مستخدميها لإنشاء حملات إعلانية وتسويقية مربحة تستهدف مجموعات محددة من المستخدمين.