Investor's wiki

Kareler Toplamı

Kareler Toplamı

Karelerin Toplamı Nedir?

Kareler toplamı, veri noktalarının dağılımını belirlemek için regresyon analizinde kullanılan istatistiksel bir tekniktir. Bir regresyon analizinde amaç, veri serisinin nasıl oluşturulduğunu açıklamaya yardımcı olabilecek bir fonksiyona bir veri serisinin ne kadar iyi uydurulabileceğini belirlemektir. Kareler toplamı , verilerden en iyi uyan (en az değişen) işlevi bulmanın matematiksel bir yolu olarak kullanılır.

Kareler Toplamı Formülü

X kümesi için < mi>n öğe:<mstyle scriptlevel="0" displaystyle="true" Karelerin toplamı</ mtext >=i=0</ mrow >n<mo çit="true">(Xi</ mi >X<mo çit = "true">)2<mstil komut dosyası düzeyi ="0" görüntü stili ="true">burada:</ mrow>X i=it h kümedeki öğe X=İçindeki tüm öğelerin ortalaması küme</ mstyle><mo çit="true">(Xi< /mi>X<mo çit="true">)=Her bir öğenin ortalamadan sapması \begin &\text X \text n \text{ öğe kümesi için:}\ &amp ;\text{Kareler toplamı}=\sum_^\left(X_i-\overline\right)2\ &\textbf\ &X_i =\text{kümedeki } i \text{ öğe}\ &\overline=\text{kümedeki tüm öğelerin ortalaması}\ &\left(X_i- \overline\right) = \text{Her bir öğenin ortalamadan sapması}\ \end{hizalanmış}

Kareler toplamı varyasyon olarak da bilinir.

Karelerin Toplamı Size Ne Anlatıyor?

Karelerin toplamı, ortalamadan sapmanın bir ölçüsüdür. İstatistikte ortalama, bir dizi sayının ortalamasıdır ve en yaygın olarak kullanılan merkezi eğilim ölçüsüdür. Aritmetik ortalama, veri kümesindeki değerlerin toplanması ve değer sayısına bölünmesiyle basitçe hesaplanır.

Microsoft'un (MSFT) son beş gündeki kapanış fiyatlarının ABD doları cinsinden 74.01, 74.77, 73.94, 73.61 ve 73.40 olduğunu varsayalım. Toplam fiyatların toplamı 369,73 $'dır ve ders kitabının ortalama veya ortalama fiyatı bu nedenle 369,73 $ / 5 = 73,95 $ olacaktır.

Ancak bir ölçüm setinin ortalamasını bilmek her zaman yeterli değildir. Bazen, bir dizi ölçümde ne kadar varyasyon olduğunu bilmek yardımcı olur. Bireysel değerlerin ortalamadan ne kadar uzak olduğu, gözlemlerin veya değerlerin oluşturulan regresyon moduna ne kadar uygun olduğuna dair bir fikir verebilir.

Örneğin, bir analist MSFT'nin hisse fiyatının Apple'ın fiyatı (AAPL) ile birlikte hareket edip etmediğini bilmek isterse, belirli bir süre için her iki hisse senedinin süreci için gözlem setini listeleyebilir, örneğin 1, 2 veya 10 yıl ve kaydedilen gözlemlerin veya ölçümlerin her biri ile doğrusal bir model oluşturun. Her iki değişken arasındaki ilişki (yani, AAPL'nin fiyatı ve MSFT'nin fiyatı) düz bir çizgi değilse, o zaman veri setinde incelenmesi gereken varyasyonlar vardır.

İstatistik dilinde, oluşturulan doğrusal modeldeki doğru, tüm değer ölçümlerinden geçmiyorsa, hisse fiyatlarında gözlenen değişkenliğin bir kısmı açıklanamaz. Karelerin toplamı, iki değişken arasında doğrusal bir ilişki olup olmadığını hesaplamak için kullanılır ve açıklanamayan herhangi bir değişkenlik, artık kareler toplamı olarak adlandırılır.

Karelerin toplamı, varyasyon karesinin toplamıdır; burada varyasyon, her bir değer ile ortalama arasındaki yayılma olarak tanımlanır. Karelerin toplamını belirlemek için, her bir veri noktası ile en uygun çizgi arasındaki mesafenin karesi alınır ve ardından toplanır. En uygun çizgi bu değeri en aza indirecektir.

Kareler Toplamı Nasıl Hesaplanır

Şimdi, ölçümün neden kare sapmaların toplamı veya kısaca karelerin toplamı olarak adlandırıldığını görebilirsiniz. Yukarıdaki MSFT örneğimizi kullanarak karelerin toplamı şu şekilde hesaplanabilir:

  • SS = (74.01 - 73.95)2 + (74.77 - 73.95)2 + (73.94 - 73.95)2 + (73.61 - 73.95)2 + (73.40 - 73.95)2

  • SS = (0.06) 2 + (0.82)2 + (-0.01)2 + (-0.34)2 + (-0.55)2

  • SS = 1.0942

Negatif sapmalar pozitif sapmaları neredeyse mükemmel bir şekilde dengeleyeceğinden, sapmaların toplamının karesini almadan tek başına eklenmesi, sıfıra eşit veya sıfıra yakın bir sayı ile sonuçlanacaktır. Daha gerçekçi bir sayı elde etmek için sapmaların toplamının karesi alınmalıdır. Karelerin toplamı her zaman pozitif bir sayı olacaktır çünkü pozitif veya negatif herhangi bir sayının karesi her zaman pozitiftir.

Kareler Toplamının Nasıl Kullanılacağına İlişkin Örnek

MSFT hesaplamasının sonuçlarına dayanarak, yüksek kareler toplamı, değerlerin çoğunun ortalamadan daha uzak olduğunu ve dolayısıyla verilerde büyük değişkenlik olduğunu gösterir. Düşük kareler toplamı, gözlem setindeki düşük değişkenliği ifade eder.

Yukarıdaki örnekte 1.0942, son beş gün içinde MSFT'nin hisse senedi fiyatındaki değişkenliğin çok düşük olduğunu ve hisse senedi yatırımı yapmak isteyen yatırımcıların fiyat istikrarı ile karakterize edildiğini ve düşük oynaklığın MSFT'yi tercih edebileceğini göstermektedir.

Kareler Toplamını Kullanmanın Sınırlamaları

Hangi hisse senedinin satın alınacağına dair bir yatırım kararı vermek, burada listelenenlerden çok daha fazla gözlem gerektirir. Bir analist, bir varlığın değişkenliğinin ne kadar yüksek veya düşük olduğunu daha yüksek bir kesinlikle bilmek için yıllarca verilerle çalışmak zorunda kalabilir. Kümeye daha fazla veri noktası eklendikçe, değerler daha fazla yayılacağından karelerin toplamı büyür.

En yaygın olarak kullanılan varyasyon ölçümleri standart sapma ve varyanstır. Ancak, iki metrikten birini hesaplamak için önce karelerin toplamının hesaplanması gerekir. Varyans, kareler toplamının ortalamasıdır (yani karelerin toplamının gözlem sayısına bölümü). Standart sapma, varyansın kare köküdür.

Karelerin toplamını kullanan iki regresyon analizi yöntemi vardır: doğrusal en küçük kareler yöntemi ve doğrusal olmayan en küçük kareler yöntemi. En küçük kareler yöntemi, regresyon fonksiyonunun gerçek veri noktalarından varyansın karelerinin toplamını en aza indirdiği gerçeğini ifade eder. Bu şekilde istatistiksel olarak verilere en iyi uyumu sağlayan bir fonksiyon çizmek mümkündür. Bir regresyon fonksiyonunun doğrusal (düz bir çizgi) veya doğrusal olmayan (eğri bir çizgi) olabileceğine dikkat edin.

##Öne çıkanlar

  • Karelerin toplamı, veri noktalarının ortalama değerden sapmasını ölçer.

  • Daha yüksek kareler toplamı sonucu, veri seti içinde büyük ölçüde değişkenlik olduğunu gösterirken, daha düşük bir sonuç, verilerin ortalama değerden önemli ölçüde farklılık göstermediğini gösterir.