Investor's wiki

دلالة إحصائية

دلالة إحصائية

ما هي الدلالة الإحصائية؟

تشير الأهمية الإحصائية إلى الادعاء بأن مجموعة البيانات المرصودة ليست نتيجة للصدفة ولكن يمكن بدلاً من ذلك أن تُعزى إلى سبب محدد. الأهمية الإحصائية مهمة للتخصصات الأكاديمية أو الممارسين الذين يعتمدون بشكل كبير على تحليل البيانات والأبحاث ، مثل الاقتصاد ، والتمويل ، والاستثمار ، والطب ، والفيزياء ، وعلم الأحياء.

يمكن اعتبار الدلالة الإحصائية قوية أو ضعيفة. عند تحليل مجموعة بيانات وإجراء الاختبارات اللازمة لتمييز ما إذا كان متغيرًا واحدًا أو أكثر له تأثير على النتيجة ، تساعد الأهمية الإحصائية القوية في دعم حقيقة أن النتائج حقيقية وليست ناجمة عن الحظ أو الصدفة. وببساطة ، إذا كانت قيمة p صغيرة ، فإن النتيجة تعتبر أكثر موثوقية.

تنشأ المشكلات في الاختبارات ذات الأهمية الإحصائية لأن الباحثين عادةً ما يعملون مع عينات من مجموعات سكانية أكبر وليس السكان أنفسهم. نتيجة لذلك ، يجب أن تكون العينات ممثلة للسكان ، لذلك يجب ألا تكون البيانات الواردة في العينة متحيزة بأي شكل من الأشكال. في معظم العلوم ، بما في ذلك الاقتصاد ، يمكن اعتبار النتيجة ذات دلالة إحصائية إذا كانت بمستوى ثقة 95٪ (أو 99٪ في بعض الأحيان).

فهم الدلالة الإحصائية

يخضع حساب الدلالة الإحصائية (اختبار الأهمية) لدرجة معينة من الخطأ. حتى إذا بدا أن البيانات لها علاقة قوية ، يجب على الباحثين أن يأخذوا في الحسبان احتمالية نشوء ارتباط واضح بسبب فرصة عشوائية أو خطأ في أخذ العينات.

يعد حجم العينة مكونًا مهمًا للدلالة الإحصائية حيث أن العينات الأكبر حجمًا أقل عرضة للإصابة بالصدمات. يجب استخدام عينات تمثيلية يتم اختيارها عشوائيًا فقط في اختبار الأهمية. يُعرف المستوى الذي يمكن للمرء أن يقبل عنده ما إذا كان الحدث ذا دلالة إحصائية باسم مستوى الأهمية.

يستخدم الباحثون مقياسًا يُعرف بالقيمة p لتحديد الأهمية الإحصائية: إذا كانت القيمة p أقل من مستوى الأهمية ، فإن النتيجة ذات دلالة إحصائية. القيمة p هي دالة للوسائل والانحرافات المعيارية لعينات البيانات.

تشير القيمة p إلى الاحتمال الذي حدثت تحته النتيجة الإحصائية المحددة ، بافتراض أن الصدفة وحدها هي المسؤولة عن النتيجة. إذا كان هذا الاحتمال صغيرًا ، فيمكن للباحث أن يستنتج أن بعض العوامل الأخرى يمكن أن تكون مسؤولة عن البيانات المرصودة.

عكس مستوى الأهمية ، المحسوب بـ 1 ناقص مستوى الأهمية ، هو مستوى الثقة. يشير إلى درجة الثقة في أن النتيجة الإحصائية لم تحدث بالصدفة أو عن طريق الخطأ في أخذ العينات. مستوى الثقة المعتاد في العديد من الاختبارات الإحصائية هو 95٪ ، مما يؤدي إلى مستوى اعتيادي معتاد أو قيمة احتمالية تبلغ 5٪.

"القرصنة الإلكترونية" هي ممارسة للمقارنة الشاملة للعديد من مجموعات البيانات المختلفة بحثًا عن نتيجة ذات دلالة إحصائية. هذا يخضع للإبلاغ عن التحيز لأن الباحثين أبلغوا عن النتائج الإيجابية فقط - وليس النتائج السلبية.

إعتبارات خاصة

لا تشير الأهمية الإحصائية دائمًا إلى الأهمية العملية ، مما يعني أنه لا يمكن تطبيق النتائج على مواقف العمل في العالم الحقيقي. بالإضافة إلى ذلك ، يمكن إساءة تفسير الدلالة الإحصائية عندما لا يستخدم الباحثون اللغة بعناية في الإبلاغ عن نتائجهم. حقيقة أن النتيجة ذات دلالة إحصائية لا تعني أنها ** ليست ** نتيجة للصدفة ، فقط أنه من غير المرجح أن تكون هذه هي الحالة.

فقط لأن سلسلتي بيانات لهما علاقة قوية مع بعضهما البعض لا يعني السببية. على سبيل المثال ، يرتبط عدد الأفلام التي يلعب فيها الممثل نيكولاس كيج دور البطولة في عام معين ارتباطًا وثيقًا بعدد حالات الغرق العرضي في حمامات السباحة. لكن هذا الارتباط زائف لأنه لا يوجد ادعاء سببي نظري يمكن تقديمه.

هناك مشكلة أخرى قد تنشأ ذات دلالة إحصائية وهي أن البيانات السابقة والنتائج من تلك البيانات ، سواء كانت ذات دلالة إحصائية أم لا ، قد لا تعكس الظروف الحالية أو المستقبلية. في الاستثمار ، قد يتجلى ذلك في نموذج تسعير ينهار خلال أوقات الأزمة المالية حيث تتغير الارتباطات ولا تتفاعل المتغيرات كالمعتاد. يمكن أن تساعد الأهمية الإحصائية أيضًا المستثمر على تمييز ما إذا كان نموذج تسعير أحد الأصول أفضل من الآخر.

أنواع اختبارات الدلالة الإحصائية

يتم استخدام عدة أنواع من اختبارات الأهمية اعتمادًا على البحث الذي يتم إجراؤه. على سبيل المثال ، يمكن استخدام الاختبارات لعينات بيانات واحدة أو اثنتين أو أكثر من أحجام مختلفة للمتوسطات أو الفروق أو النسب أو البيانات المزدوجة أو غير المزاوجة أو توزيعات البيانات المختلفة.

هناك أيضًا طرق مختلفة لاختبار الأهمية ، اعتمادًا على نوع البيانات المتاحة. يعود الفضل إلى رونالد فيشر في صياغة أحد أكثر الأساليب مرونة ، بالإضافة إلى تحديد معيار الأهمية عند ** p ** <0.05. نظرًا لأن معظم العمل يمكن إجراؤه بعد جمع البيانات بالفعل ، تظل هذه الطريقة شائعة لمشاريع البحث قصيرة الأجل أو المخصصة.

سعيًا للبناء على طريقة فيشر ، انتهى الأمر بجيرزي نيمان وإيجون بيرسون إلى تطوير نهج بديل. تتطلب هذه الطريقة مزيدًا من العمل قبل جمع البيانات ، لكنها تسمح للباحثين بتصميم دراستهم بطريقة تتحكم في احتمالية الوصول إلى استنتاجات خاطئة.

اختبار فرضية لاغية

يتم استخدام الدلالة الإحصائية في اختبار فرضية العدم حيث يحاول الباحثون دعم نظرياتهم من خلال رفض التفسيرات الأخرى. على الرغم من إساءة فهم الطريقة في بعض الأحيان ، إلا أنها تظل الطريقة الأكثر شيوعًا لاختبار البيانات في الطب وعلم النفس والمجالات الأخرى.

الفرضية الصفرية الأكثر شيوعًا هي أن المعلمة المعنية تساوي الصفر (تشير عادةً إلى أن المتغير ليس له تأثير صفري على نتيجة الفائدة). إذا رفض الباحثون فرضية العدم بثقة 95٪ أو أفضل ، فيمكنهم الادعاء بأن العلاقة الملحوظة ذات دلالة إحصائية. يمكن أيضًا اختبار الفرضيات الفارغة من أجل المساواة في التأثير لعلاجين بديلين أو أكثر.

على عكس الاعتقاد الخاطئ الشائع ، لا يمكن أن يثبت المستوى العالي من الدلالة الإحصائية أن فرضية ما صحيحة أو خاطئة. في الواقع ، تقيس الأهمية الإحصائية احتمالية حدوث نتيجة ملحوظة ، على افتراض أن الفرضية الصفرية صحيحة.

إن رفض الفرضية الصفرية ، حتى لو كانت درجة عالية جدًا من الأهمية الإحصائية لا يمكن أن ** تثبت ** شيئًا ما ، يمكن فقط أن تضيف دعمًا لفرضية موجودة. من ناحية أخرى ، غالبًا ما يكون الفشل في رفض فرضية العدم سببًا لرفض فرضية.

بالإضافة إلى ذلك ، يمكن أن يكون التأثير ذا دلالة إحصائية ولكن ليس له سوى تأثير ضئيل للغاية. على سبيل المثال ، قد يكون من المهم إحصائيًا أن الشركات التي تستخدم ورق التواليت ذو الطبقتين في حماماتها لديها موظفين أكثر إنتاجية ، ولكن من المرجح أن يكون التحسن في الإنتاجية المطلقة لكل عامل ضئيلًا.

** تصحيح - 15 أيار (مايو) 2022: ** تم تعديل هذه المقالة لتسليط الضوء على المغالطات المحتملة في اختبار الأهمية.

يسلط الضوء

  • تشير الدلالة الإحصائية إلى الادعاء بأن النتيجة من البيانات الناتجة عن الاختبار أو التجريب من المحتمل أن تُعزى إلى سبب محدد.

  • حساب الدلالة الإحصائية يخضع لدرجة معينة من الخطأ.

  • تشير درجة عالية من الدلالة الإحصائية إلى أن العلاقة المرصودة من غير المحتمل أن تكون بسبب الصدفة.

  • يتم استخدام عدة أنواع من اختبارات الأهمية اعتمادًا على البحث الذي يتم إجراؤه.

  • يمكن إساءة تفسير الدلالة الإحصائية عندما لا يستخدم الباحثون اللغة بحذر في الإبلاغ عن نتائجهم.