Investor's wiki

حسن التلاؤم

حسن التلاؤم

ما هو خير الملاءمة؟

يشير مصطلح "جودة الملاءمة" إلى اختبار إحصائي يحدد مدى ملاءمة بيانات العينة لتوزيع من مجتمع ذي توزيع عادي. ببساطة ، إنها تفترض ما إذا كانت العينة منحرفة أو تمثل البيانات التي تتوقع أن تجدها في المجتمع الفعلي.

تحدد جودة الملاءمة التناقض بين القيم المرصودة وتلك المتوقعة من النموذج في حالة التوزيع العادي. هناك عدة طرق لتحديد مدى الملاءمة ، بما في ذلك مربع كاي.

فهم جودة الملاءمة

اختبارات الجودة الملائمة هي طرق إحصائية تقدم استنتاجات حول القيم المرصودة. على سبيل المثال ، يمكنك تحديد ما إذا كانت مجموعة العينة تمثل حقًا المجتمع بأكمله. على هذا النحو ، فهي تحدد كيفية ارتباط القيم الفعلية بالقيم المتوقعة في النموذج. عند استخدامها في صنع القرار ، فإن اختبارات جودة الملاءمة تجعل من السهل التنبؤ بالاتجاهات والأنماط في المستقبل.

كما هو مذكور أعلاه ، هناك عدة أنواع من اختبارات جودة الملاءمة. وهي تشمل اختبار خي مربع ، وهو الأكثر شيوعًا ، بالإضافة إلى اختبار Kolmogorov-Smirnov ، واختبار Shipiro-Wilk. يتم إجراء الاختبارات عادةً باستخدام برامج الكمبيوتر. لكن يمكن للإحصائيين إجراء هذه الاختبارات باستخدام الصيغ المصممة خصيصًا لنوع الاختبار المحدد.

لإجراء الاختبار ، تحتاج إلى متغير معين ، إلى جانب افتراض حول كيفية توزيعه. تحتاج أيضًا إلى مجموعة بيانات ذات قيم واضحة وصريحة ، مثل:

  • القيم المرصودة المشتقة من مجموعة البيانات الفعلية

  • القيم المتوقعة المأخوذة من الافتراضات

  • العدد الإجمالي للفئات في المجموعة

تُستخدم اختبارات جودة الملاءمة بشكل شائع لاختبار الحالة الطبيعية للمخلفات أو لتحديد ما إذا كان قد تم جمع عينتين من توزيعات متطابقة.

إعتبارات خاصة

من أجل تفسير اختبار جودة الملاءمة ، من المهم للإحصائيين إنشاء مستوى ألفا ، مثل القيمة p لاختبار خي مربع. تشير القيمة p إلى احتمال الحصول على نتائج قريبة من أقصى درجات النتائج المرصودة. هذا يفترض أن الفرضية الصفرية صحيحة. تؤكد الفرضية الصفرية أنه لا توجد علاقة بين المتغيرات ، وتفترض الفرضية البديلة وجود علاقة.

بدلاً من ذلك ، يتم قياس تكرار القيم المرصودة ثم استخدامها لاحقًا مع القيم المتوقعة ودرجات الحرية لحساب مربع كاي. إذا كانت النتيجة أقل من ألفا ، فإن الفرضية الصفرية غير صالحة ، مما يشير إلى وجود علاقة بين المتغيرات.

أنواع اختبارات الجودة الملائمة

اختبار كاي سكوير

< ميل> χ 2 = i < mo> = 1 k ( O i - E i ) 2 / E i \ chi ^ 2 = \ sum \ limits ^ k_ (O_i-E_i) ^ 2 / E_i <span class =" mspace "style =" margin-right: 0.22222222222222em؛ "> - <span class =" strut "style =" height: 1.064108em؛ vertical-align: -0.25em؛ "> <span class =" mord mathnormal "style =" margin-right: 0.05764em؛ "> E <span class =" vlist "style =" height: 0.31166399999999994em؛ "> <span class =" pstrut "style =" height: 2.7em؛ "> i </ span > </ span> ) <span class =" pstrut "style =" height: 2.7em؛ "> 2 </ span> / </ span> E <span class =" vlist "style =" height: 0.31166399999999994em؛ "> <span class =" pstrut "style =" height: 2.7em؛ "> i </ span> < / س و>

اختبار مربع كاي ، والذي يُعرف أيضًا باسم اختبار مربع كاي للاستقلالية ، هو طريقة إحصائية استنتاجية تختبر صحة ادعاء تم تقديمه حول مجموعة سكانية بناءً على عينة عشوائية.

تُستخدم حصريًا للبيانات التي يتم فصلها إلى فئات (سلال) ، وتتطلب حجم عينة كافٍ لإنتاج نتائج دقيقة. لكنها لا تشير إلى نوع العلاقة أو شدتها. على سبيل المثال ، لا يستنتج ما إذا كانت العلاقة إيجابية أم سلبية.

لحساب جودة تناسب مربع كاي ، قم بتعيين مستوى ألفا المطلوب من الأهمية. لذلك إذا كان مستوى ثقتك هو 95٪ (أو 0.95) ، فإن مستوى ألفا هو 0.05. بعد ذلك ، حدد المتغيرات الفئوية لاختبارها ، ثم حدد عبارات الفرضيات حول العلاقات فيما بينها.

يجب أن تكون المتغيرات حصرية بشكل متبادل من أجل التأهل لاختبار كاي سكوير من أجل الاستقلال. ولا ينبغي استخدام اختبار تشي جودة الملاءمة للبيانات المستمرة.

اختبار كولموغوروف سميرنوف

D = max 1 < mo> ≤ i N (</ mo> F ( Y i ) - i - 1 </ mrow > N <moeparator = "true">، i N < mo> - F ( Y i </ msub > ) ) D = \ max \ limits_ { 1 \ leq i \ leq N} \ bigg (F (Y_i) - \ frac ، \ frac -F (Y_i) \ bigg) </ semantics > <span class =" pstrut "style =" height: 3em؛ "> 1 i <span class =" mord mathnormal mtight "style =" margin-right: 0.10903em؛ "> N max < span class = "mspace" style = "margin-right: 0.16666666666666666em؛"> ( F ( <span class = "mord mathnormal "style =" margin-right: 0.22222em؛ "> Y <span class = " pstrut "style =" height: 2.7em؛ "> i </ span> </ span> </ span> ) - <span class =" strut "style =" height: 1.200664em؛ vertical-align: -0.345em؛ "> < span class = "vlist" style = "height: 0.855664em؛"> < span class = "sizing reset-size6 size3 mtight"> N </ span > <span class = "frac-line "style =" border-bottom-width: 0.04em؛ "> <span class =" pstrut "style =" height: 3em؛ "> i - 1 ، <span class =" mspace "style =" margin-right: 0.16666666666666666em؛ "> </ span > < span style = "top: -2.6550000000000002em؛"> <span class =" mord mathnormal mtight "style =" margin-right: 0.10903em؛ "> N <span class =" pstrut "style =" height: 3em؛ "> <span class =" frac-line "style =" border-bottom-width: 0. 04em؛ "> <span class =" pstrut "style =" height: 3em؛ "> i </ span > - <span class =" mspace "style =" margin-right: 0.22222222222222em؛ "> F ( <span class =" mord mathnormal "style =" margin-right: 0.22222em؛ "> Y <span class =" pstrut "style =" height: 2.7em؛ "> i < / span> ) ) </ span>

تم تسمية اختبار Kolmogorov-Smirnov على اسم عالم الرياضيات الروسي Andrey Kolmogorov و Nikolai Smirnov (المعروف أيضًا باسم اختبار KS) وهو طريقة إحصائية تحدد ما إذا كانت العينة من توزيع معين ضمن مجموعة سكانية.

هذا الاختبار ، الموصى به للعينات الكبيرة (على سبيل المثال ، أكثر من 2000) ، غير حدودي. هذا يعني أنه لا يعتمد على أي توزيع ليكون صالحًا. الهدف هو إثبات الفرضية الصفرية ، وهي عينة التوزيع الطبيعي.

مثل مربع كاي ، فإنه يستخدم فرضية فارغة وبديلة ومستوى ألفا من الأهمية. يشير Null إلى أن البيانات تتبع توزيعًا محددًا داخل السكان ، ويشير البديل إلى أن البيانات لم تتبع توزيعًا محددًا داخل المجتمع. يتم استخدام ألفا لتحديد القيمة الحرجة المستخدمة في الاختبار. ولكن بخلاف اختبار مربع كاي ، ينطبق اختبار كولموغوروف-سميرنوف على التوزيعات المستمرة.

غالبًا ما يُشار إلى إحصائية الاختبار المحسوبة على أنها D. وهي تحدد ما إذا كانت الفرضية الصفرية مقبولة أو مرفوضة. إذا كانت D أكبر من القيمة الحرجة عند alpha ، فسيتم رفض فرضية العدم. إذا كانت D أقل من القيمة الحرجة ، يتم قبول فرضية العدم.

اختبار شيبيرو-ويلك

W = ( i < / mi> = 1 n a i ( x ( i ) ) 2 </ mn > i = 1 n ( x i </ msub> - x ˉ ) 2 <moeparator = "true">، W = \ frac {\ big (\ sum ^ n_ a_i (x _ {(i)} \ big) ^ 2} {\ sum ^ n_ (x_i- \ bar ) ^ 2}، = <span class =" strut "style =" height: 2.1552369999999996em؛ vertical-align: -0.5700069999999999em؛ "> < span class = "mord"> </ span > <span class = "vlist" شارع yle = "height: 0.7046857142857144em؛"> i = 1 <span class =" pstrut "style =" height: 2.5em؛ "> n < / span> <span class = "vlist "style =" height: 0.32143857142857146em؛ "> (</ span> x <span class =" pstrut "style =" height: 2.5em؛ "> < / span> i <span class =" vlist "style =" height: 0.143em؛ "> - x <span class =" pstrut "style =" height: 2.7em؛ "> <span class =" accent-body "style =" left: -0.22222em؛ "> ˉ </ span> ) </ span > 2 ، <span class =" pstrut "style =" height: 3em؛ "> </ span > ( <span class =" vlist "style =" height: 0.7385428571428572em؛ "> <span class =" pstrut "style =" height: 2.5em؛ "> i = 1 n a < span class = "vlist" style = "height: 0.3280857142857143em؛"> i < / span> < span> ( < span class = "mord mathnormal mtight"> x <span class = " vlist "style =" height: 0.3448em؛ "> <span class =" pstrut "style =" height: 2.5357142857142856em؛ "> ( i ) ) <span class =" pstrut "style =" height: 2.5em؛ "> 2 ، GTIZ </ span > ،

يحدد اختبار Shipiro-Wilk ما إذا كانت العينة تتبع التوزيع الطبيعي. يتحقق الاختبار فقط من الحالة الطبيعية عند استخدام عينة ذات متغير واحد من البيانات المستمرة ويوصى به لأحجام عينة صغيرة تصل إلى 2000.

يستخدم اختبار Shipiro-Wilk مخططًا احتماليًا يسمى QQ Plot ، والذي يعرض مجموعتين من الكميات على المحور y والتي يتم ترتيبها من الأصغر إلى الأكبر. إذا جاء كل مقدار من نفس التوزيع ، فإن سلسلة المؤامرات تكون خطية.

يتم استخدام مخطط QQ لتقدير التباين. باستخدام تباين مخطط QQ جنبًا إلى جنب مع التباين المقدر للمجتمع ، يمكن للمرء تحديد ما إذا كانت العينة تنتمي إلى توزيع عادي. إذا كان حاصل قسمة كلا الفروقتين يساوي أو قريبًا من 1 ، فيمكن قبول الفرضية الصفرية. إذا كانت أقل بكثير من 1 ، يمكن رفضها.

تمامًا مثل الاختبارات المذكورة أعلاه ، يستخدم هذا الاختبار ألفا ويشكل فرضيتين: لاغية وبديلة. تنص الفرضية الصفرية على أن العينة تأتي من التوزيع الطبيعي ، بينما تنص الفرضية البديلة على أن العينة لا تأتي من التوزيع الطبيعي.

مثال حسن الملاءمة

إليك مثالًا افتراضيًا لإظهار كيفية عمل اختبار جودة الملاءمة.

لنفترض أن صالة ألعاب رياضية صغيرة تعمل على افتراض أن أعلى نسبة حضور في أيام الاثنين والثلاثاء والسبت ، ومتوسط الحضور يومي الأربعاء والخميس ، وأدنى حضور يومي الجمعة والأحد. بناءً على هذه الافتراضات ، توظف صالة الألعاب الرياضية عددًا معينًا من الموظفين كل يوم لتسجيل الوصول ، وتنظيف المرافق ، وتقديم خدمات التدريب ، ودروس التدريس.

لكن الصالة الرياضية لا تعمل بشكل جيد من الناحية المالية ويريد المالك معرفة ما إذا كانت افتراضات الحضور ومستويات التوظيف صحيحة. يقرر المالك حساب عدد الحاضرين في صالة الألعاب الرياضية كل يوم لمدة ستة أسابيع. يمكنهم بعد ذلك مقارنة الحضور المفترض للصالة الرياضية بحضورها الملحوظ باستخدام اختبار جودة مربع كاي على سبيل المثال.

الآن بعد أن أصبح لديهم البيانات الجديدة ، يمكنهم تحديد أفضل طريقة لإدارة الصالة الرياضية وتحسين الربحية.

الخط السفلي

تحدد اختبارات جودة الملاءمة مدى ملاءمة بيانات العينة مع ما هو متوقع من السكان. من بيانات العينة ، يتم جمع القيمة المرصودة ومقارنتها بالقيمة المتوقعة المحسوبة باستخدام مقياس التناقض. تتوفر اختبارات فرضية مختلفة تتعلق بجودة الملاءمة بناءً على النتيجة التي تبحث عنها.

يعتمد اختيار اختبار الملاءمة المناسب إلى حد كبير على ما تريد معرفته عن العينة ومدى حجم العينة. على سبيل المثال ، إذا كنت ترغب في معرفة ما إذا كانت القيم المرصودة للبيانات الفئوية تتطابق مع القيم المتوقعة للبيانات الفئوية ، استخدم مربع كاي. إذا كنت ترغب في معرفة ما إذا كانت عينة صغيرة تتبع التوزيع الطبيعي ، فقد يكون اختبار Shipiro-Wilk مفيدًا. هناك العديد من الاختبارات المتاحة لتحديد مدى ملاءمة المنتج.

يسلط الضوء

  • خير الملاءمة هو اختبار إحصائي يحاول تحديد ما إذا كانت مجموعة القيم المرصودة تتطابق مع تلك المتوقعة في النموذج المطبق.

  • يمكنهم أن يوضحوا لك ما إذا كانت بيانات العينة الخاصة بك تناسب مجموعة متوقعة من البيانات من مجموعة سكانية ذات توزيع طبيعي.

  • يحدد اختبار مربع كاي ما إذا كانت هناك علاقة بين البيانات الفئوية.

  • توجد أنواع متعددة من اختبارات جودة التوافق ، ولكن الأكثر شيوعًا هو اختبار مربع كاي.

  • يحدد اختبار Kolmogorov-Smirnov ما إذا كانت العينة تأتي من توزيع محدد للسكان.

التعليمات

ما هي جودة الملاءمة في اختبار Chi-Square؟

يختبر مربع كاي ما إذا كانت العلاقات موجودة بين المتغيرات الفئوية وما إذا كانت العينة تمثل الكل. ويقدر مدى قرب البيانات المرصودة من البيانات المتوقعة ، أو مدى ملاءمتها.

ماذا يعني حسن الملاءمة؟

Goodness-of-Fit هو اختبار فرضية إحصائية يُستخدم لمعرفة مدى دقة البيانات المرصودة تعكس البيانات المتوقعة. يمكن أن تساعد اختبارات Goodness-of-Fit في تحديد ما إذا كانت العينة تتبع التوزيع الطبيعي ، أو ما إذا كانت المتغيرات الفئوية مرتبطة ، أو ما إذا كانت العينات العشوائية من نفس التوزيع.

كيف تجري اختبار جودة الملاءمة؟

يتكون اختبار Goodness-of-FIt من طرق اختبار مختلفة. سيساعد الهدف من الاختبار في تحديد الطريقة التي يجب استخدامها. على سبيل المثال ، إذا كان الهدف هو اختبار الحالة الطبيعية على عينة صغيرة نسبيًا ، فقد يكون اختبار Shipiro-Wilk مناسبًا. إذا كنت ترغب في تحديد ما إذا كانت العينة جاءت من توزيع محدد ضمن مجموعة سكانية ، فسيتم استخدام اختبار Kolmogorov-Smirnov. يستخدم كل اختبار صيغته الفريدة. ومع ذلك ، لديهم قواسم مشتركة ، مثل فرضية العدم ومستوى الأهمية.

لماذا يعتبر حسن الملاءمة مهمًا؟

تساعد اختبارات Goodness-of-Fit في تحديد ما إذا كانت البيانات المرصودة تتوافق مع ما هو متوقع. يمكن اتخاذ القرارات بناءً على نتيجة اختبار الفرضية الذي تم إجراؤه. على سبيل المثال ، يريد بائع تجزئة أن يعرف ما هو المنتج الذي يجذب الشباب. يقوم بائع التجزئة بمسح عينة عشوائية من كبار السن والشباب لتحديد المنتج المفضل. باستخدام مربع chi ، حددوا أنه مع ثقة بنسبة 95٪ ، توجد علاقة بين المنتج "أ" والشباب. بناءً على هذه النتائج ، يمكن تحديد أن هذه العينة تمثل مجتمع الشباب. يمكن لمسوقي التجزئة استخدام هذا لإصلاح حملاتهم.