مجموع المربعات
ما هو مجموع المربعات؟
مجموع المربعات هو أسلوب إحصائي يستخدم في تحليل الانحدار لتحديد تشتت نقاط البيانات. في تحليل الانحدار ، الهدف هو تحديد مدى ملاءمة سلسلة البيانات لوظيفة قد تساعد في شرح كيفية إنشاء سلسلة البيانات. يتم استخدام مجموع المربعات كطريقة رياضية للعثور على الوظيفة التي تناسب (تختلف على الأقل) من البيانات.
صيغة مجموع المربعات هي
<span class = "katex -html "aria-hidden =" true "> <span class =" strut "style =" height: 10.874834000000002em؛ vertical-align: -5.187417000000001em؛ "> < تمتد فئة = "vlist" style = "ارتفاع: 5. 687417000000001em؛ "> <span class =" pstrut "style =" height: 3.6513970000000002em؛ "> < / span> لمجموعة </ span> X من </ span> n من العناصر: </ span> <span class =" pstrut "style =" height: 3.6513970000000002em؛ "> مجموع المربعات </ span> = </ sp an> <span class =" pstrut "style =" height: 3.05em؛ "> i = 0 <span class =" pstrut "style =" height: 3.05em؛ "> <span class =" pstrut "style =" height: 3.05em؛ "> n ( <span class =" mord mathnormal "style =" margin-right: 0.07847em؛ "> X <span class =" pstrut "style =" height: 2.7em؛ "> </ span> i <span class =" vlist "style =" height: 0.15em؛ "> < / span> - </ span > <span class =" pstrut "style =" height: 3em؛ "> <span class =" mord mathnormal "style =" margin-right: 0.07847em ؛ "> X <span class =" pstrut "style =" height: 3em؛ "> < span class = "overline-line" style = "border-bottom-width: 0.04em؛"> ) <span class =" vlist "style =" height: 1.087338em؛ "> 2 </ span> حيث: </ span> <span class =" mord mathnormal "style =" margin-right : 0.07847em؛ "> X <span class =" vlist "style = "height: 0.31166399999999994em؛"> i </ span > = <span class =" mspace "style =" margin-right: 0.2777777777777778em؛ "> </ span> i <span class =" pstrut "style =" height: 2.7em؛ "> t h عنصر في المجموعة </ span> < span style = "top: -0.6673100000000005em؛"> < / span> <span class =" mord mathnormal "style =" margin-right: 0.07847em؛ "> X < span class = "pstrut" style = "height: 3em؛"> = </ span> متوسط جميع العناصر في المجموعة < span class = "mord"> ( X <span class =" pstrut "style =" height: 2.7em؛ "> i </ span> - <span class =" vlist "style =" height: 0.8833300000000001em؛ "> <span class =" pstrut "style =" height: 3em؛ "> </ sp an> X <span class =" pstrut "style =" height: 3em؛ "> <span class =" overline-line "style =" border-bottom-width: 0.04em؛ "> < / span> ) </ span> = انحراف كل عنصر عن المتوسط </ span> <span class = " vlist "style =" height: 5.187417000000001em؛ "> </ span> </ span >
يُعرف مجموع المربعات أيضًا باسم التباين.
ماذا تخبرك مجموع المربعات؟
مجموع المربعات هو مقياس الانحراف عن المتوسط. في الإحصاء ، المتوسط هو متوسط مجموعة من الأرقام وهو المقياس الأكثر استخدامًا للاتجاه المركزي. يتم حساب المتوسط الحسابي ببساطة عن طريق تلخيص القيم في مجموعة البيانات والقسمة على عدد القيم.
لنفترض أن أسعار إغلاق Microsoft (MSFT) في الأيام الخمسة الماضية كانت 74.01 و 74.77 و 73.94 و 73.61 و 73.40 بالدولار الأمريكي. مجموع الأسعار الإجمالية هو 369.73 دولارًا ، وبالتالي سيكون متوسط أو متوسط سعر الكتاب المدرسي 369.73 دولارًا ** / ** 5 = 73.95 دولارًا.
لكن معرفة متوسط مجموعة القياس لا يكفي دائمًا. في بعض الأحيان ، يكون من المفيد معرفة مقدار التباين الموجود في مجموعة من القياسات. مدى تباعد القيم الفردية عن المتوسط قد يعطي بعض الأفكار حول مدى ملاءمة الملاحظات أو القيم للانحدار الذي تم إنشاؤه.
على سبيل المثال ، إذا أراد أحد المحللين معرفة ما إذا كان سعر سهم MSFT يتحرك جنبًا إلى جنب مع سعر Apple (AAPL) ، فيمكنه سرد مجموعة الملاحظات لعملية كلا السهمين لفترة معينة ، على سبيل المثال 1 ، 2 ، أو 10 سنوات وإنشاء نموذج خطي مع تسجيل كل من الملاحظات أو القياسات. إذا كانت العلاقة بين كلا المتغيرين (أي سعر AAPL وسعر MSFT) ليست خطاً مستقيماً ، فهناك متغيرات في مجموعة البيانات تحتاج إلى التدقيق.
في الإحصاء العامية ، إذا كان الخط في النموذج الخطي الذي تم إنشاؤه لا يمر عبر جميع قياسات القيمة ، فإن بعض المتغيرات التي لوحظت في أسعار الأسهم غير مفسرة. يتم استخدام مجموع المربعات لحساب ما إذا كانت هناك علاقة خطية بين متغيرين ، ويشار إلى أي متغير غير مفسر بالمجموع المتبقي للمربعات.
مجموع المربعات هو مجموع مربع التباين ، حيث يتم تعريف التباين على أنه الانتشار بين كل قيمة فردية والمتوسط. لتحديد مجموع المربعات ، يتم تربيع المسافة بين كل نقطة بيانات وخط أفضل ملاءمة ثم تلخيصها. سيقلل الخط الأنسب من هذه القيمة.
كيفية حساب مجموع المربعات
يمكنك الآن معرفة سبب تسمية القياس بمجموع الانحرافات التربيعية ، أو مجموع المربعات باختصار. باستخدام مثال MSFT أعلاه ، يمكن حساب مجموع المربعات على النحو التالي:
SS = (74.01 - 73.95) ^ 2 ^ + (74.77 - 73.95) ^ 2 ^ + (73.94 - 73.95) ^ 2 ^ + (73.61 - 73.95) ^ 2 ^ + (73.40 - 73.95) ^ 2 ^
SS = (0.06) ^ 2 ^ + (0.82) ^ 2 ^ + (-0.01) ^ 2 ^ + (-0.34) ^ 2 ^ + (-0.55) ^ 2 ^
SS = 1.0942
ستؤدي إضافة مجموع الانحرافات بمفرده دون تربيع إلى رقم يساوي الصفر أو قريبًا منه لأن الانحرافات السالبة ستعوض تمامًا تقريبًا الانحرافات الإيجابية. للحصول على رقم أكثر واقعية ، يجب تربيع مجموع الانحرافات. سيكون مجموع المربعات دائمًا عددًا موجبًا لأن مربع أي رقم ، سواء كان موجبًا أو سالبًا ، يكون دائمًا موجبًا.
مثال على كيفية استخدام مجموع المربعات
بناءً على نتائج حساب MSFT ، يشير مجموع كبير من المربعات إلى أن معظم القيم بعيدة عن المتوسط ، وبالتالي ، هناك تباين كبير في البيانات. يشير مجموع المربعات المنخفض إلى تباين منخفض في مجموعة الملاحظات.
في المثال أعلاه ، يوضح 1.0942 أن التباين في سعر سهم MSFT في الأيام الخمسة الماضية منخفض جدًا ، وقد يختار المستثمرون الذين يتطلعون إلى الاستثمار في الأسهم التي تتميز باستقرار الأسعار وانخفاض التقلبات MSFT.
قيود استخدام مجموع المربعات
يتطلب اتخاذ قرار استثماري بشأن الأسهم المراد شراؤها العديد من الملاحظات أكثر من تلك المدرجة هنا. قد يضطر المحلل إلى العمل مع سنوات من البيانات ليعرف بقدر أكبر من اليقين مدى ارتفاع أو انخفاض تباين الأصل. كلما تمت إضافة المزيد من نقاط البيانات إلى المجموعة ، يصبح مجموع المربعات أكبر حيث ستنتشر القيم بشكل أكبر.
التباين استخدامًا هي الانحراف والتباين المعياري . ومع ذلك ، لحساب أي من المقياسين ، يجب أولاً حساب مجموع المربعات. التباين هو متوسط مجموع المربعات (أي مجموع المربعات مقسومًا على عدد المشاهدات). الانحراف المعياري هو الجذر التربيعي للتباين.
هناك طريقتان لتحليل الانحدار تستخدمان مجموع المربعات: طريقة المربعات الصغرى الخطية وطريقة المربعات الصغرى غير الخطية. تشير طريقة المربعات الصغرى إلى حقيقة أن دالة الانحدار تقلل مجموع مربعات التباين من نقاط البيانات الفعلية. بهذه الطريقة ، من الممكن رسم دالة توفر إحصائيًا أفضل ملاءمة للبيانات. لاحظ أن دالة الانحدار يمكن أن تكون إما خطية (خط مستقيم) أو غير خطية (خط منحني).
يسلط الضوء
يقيس مجموع المربعات انحراف نقاط البيانات بعيدًا عن القيمة المتوسطة.
تشير نتيجة مجموع المربعات الأعلى إلى درجة كبيرة من التباين ضمن مجموعة البيانات ، بينما تشير النتيجة الأقل إلى أن البيانات لا تختلف اختلافًا كبيرًا عن القيمة المتوسطة.