الوسيلة المجنونة
ما هو المعنى المجزأ؟
الوسيلة المجنحة هي طريقة لحساب المتوسط تستبدل مبدئيًا أصغر وأكبر القيم بالملاحظات الأقرب إليها. يتم ذلك للحد من تأثير القيم المتطرفة أو القيم المتطرفة غير الطبيعية ، أو القيم المتطرفة ، على الحساب.
بعد استبدال القيم ، يتم بعد ذلك استخدام معادلة المتوسط الحسابي لحساب المتوسط الذي تم اكتسابه.
صيغة لمتوسط Winsorized
حيث: </ span> </ span> n <span class =" mspace "style = "margin-right: 0.2777777777777778em؛"> = </ span > </ span > <span class =" pstrut "style =" height: 3em؛ "> عدد أكبر وأصغر البيانات </ span> < span class = "mord text"> النقاط المطلوب استبدالها بالملاحظة </ span> <span class =" pstru t "style =" height: 3em؛ "> الأقرب إليهم </ span> <span class =" vlist "style =" height: 2.000000000000001em؛ "> </ span> <span class =" mord mathnormal "style =" margin-right: 0.10903em؛ "> N </ span > = < span class = "mspace" style = "margin-right: 0.2777777777777778em؛"> إجمالي عدد نقاط البيانات </ span> </ span> <span class = "vlist" النمط = "الارتفاع: 4.773165000000000 5em؛ ">
يتم التعبير عن الوسائل المبتذلة بطريقتين. يشير المتوسط المصقول "k ^ n ^" إلى استبدال الملاحظات الأصغر والأكبر بـ "k" ، حيث يمثل "k" عددًا صحيحًا. يتضمن المتوسط "X٪" الذي تم تجسيده استبدال نسبة مئوية معينة من القيم من كلا طرفي البيانات.
يتم تحقيق المتوسط المُكتسب عن طريق استبدال أصغر نقاط البيانات وأكبرها ، ثم جمع جميع نقاط البيانات وقسمة المجموع على العدد الإجمالي لنقاط البيانات.
ماذا يعني المجندين أن يخبرك؟
الوسيلة المُجسَدة أقل حساسية للقيم المتطرفة لأنها يمكن أن تحل محلها بقيم أقل تطرفًا. أي أنها أقل عرضة للقيم المتطرفة مقابل المتوسط الحسابي. ومع ذلك ، إذا كان للتوزيع ذيول كبيرة ، فإن تأثير إزالة القيم الأعلى والأدنى في التوزيع سيكون له تأثير ضئيل بسبب درجة التباين العالية في أرقام التوزيع .
أحد الجوانب السلبية الرئيسية للوسائل التي تم الفوز بها هو أنها تقدم بشكل طبيعي بعض التحيز في مجموعة البيانات. من خلال الحد من تأثير القيم المتطرفة ، يتم تعديل التحليل لتحليل أفضل ، ولكن أيضًا يزيل المعلومات حول البيانات الأساسية.
مثال على كيفية استخدام الوسيلة Winsorized
دعنا نحسب المتوسط المُجَمَّع لمجموعة البيانات التالية: 1 ، 5 ، 7 ، 8 ، 9 ، 10 ، 34. في هذا المثال ، نفترض أن المتوسط المُجَمَّع هو بالترتيب الأول ، حيث نستبدل القيم الأصغر والأكبر بـ أقرب ملاحظاتهم.
تظهر مجموعة البيانات الآن على النحو التالي: 5 ، 5 ، 7 ، 8 ، 9 ، 10 ، 10. أخذ متوسط حسابي للمجموعة الجديدة ينتج عنه متوسط مشهود قدره 7.7 ، أو (5 + 5 + 7 + 8 + 9 + 10 + 10) مقسومًا على 7. لاحظ أن المتوسط الحسابي كان يمكن أن يكون أعلى - 10.6. يقلل المتوسط المُجذب بشكل فعال من تأثير القيمة 34 باعتبارها قيمة متقطعة.
أو ضع في اعتبارك متوسط 20٪ تم الفوز به يأخذ أعلى 10٪ وأدنى 10٪ ويستبدلهم بأقرب قيمة تالية. سوف نفوز بمجموعة البيانات التالية: 2 ، 4 ، 7 ، 8 ، 11 ، 14 ، 18 ، 23 ، 23 ، 27 ، 35 ، 40 ، 49 ، 50 ، 55 ، 60 ، 61 ، 61 ، 62 ، 75. الاثنان أصغر نقطتين وأكبر نقطتين بيانات - 20٪ من 20 نقطة بيانات - سيتم استبدالها بأقرب قيمة تالية لها. وبالتالي ، فإن مجموعة البيانات الجديدة هي كما يلي: 7 ، 7 ، 7 ، 8 ، 11 ، 14 ، 18 ، 23 ، 23 ، 27 ، 35 ، 40 ، 49 ، 50 ، 55 ، 60 ، 61 ، 61 ، 61 ، 61. المتوسط المُجَمَّع هو 33.9 ، أو إجمالي البيانات (678) مقسومًا على العدد الإجمالي لنقاط البيانات (20).
المتوسط المجزأ مقابل المتوسط المقتطع
يتضمن الوسيلة المبتذلة تعديل نقاط البيانات ، بينما يتضمن المتوسط المقتطع إزالة نقاط البيانات. من الشائع أن يكون الوسيط المُستحضر والمتوسط المقطوع قريبًا أو متساويًا في بعض الأحيان من حيث القيمة مع بعضهما البعض.
يسلط الضوء
إن الوسيلة winsorized ليست مماثلة للمتوسط المقتطع ، والذي يتضمن إزالة نقاط البيانات بدلاً من استبدالها - على الرغم من أن نتائج الاثنين تميل إلى أن تكون متقاربة.
يخفف من آثار القيم المتطرفة عن طريق استبدالها بقيم أقل تطرفا.
الوسيلة المُكتسبة هي طريقة حساب متوسط تتضمن استبدال القيم الأصغر والأكبر لمجموعة البيانات بأقرب الملاحظات إليها.