Линия наилучшего соответствия
Что такое линия наилучшего соответствия
Линия наилучшего соответствия относится к линии, проходящей через точечную диаграмму точек данных, которая лучше всего выражает взаимосвязь между этими точками. Статистики обычно используют метод наименьших квадратов, чтобы получить геометрическое уравнение для линии, либо с помощью ручных расчетов, либо с помощью программного обеспечения для регрессионного анализа. Прямая линия будет результатом простого линейного регрессионного анализа двух или более независимых переменных. Регрессия, включающая несколько связанных переменных, в некоторых случаях может давать кривую линию.
Основы линейки наилучшего соответствия
Линия наилучшего соответствия является одним из наиболее важных результатов регрессионного анализа. Регрессия относится к количественному показателю связи между одной или несколькими независимыми переменными и результирующей зависимой переменной. Регрессия полезна профессионалам в самых разных областях, от науки и государственной службы до финансового анализа.
Чтобы выполнить регрессионный анализ, статистик собирает набор точек данных, каждая из которых включает полный набор зависимых и независимых переменных. Например, зависимой переменной может быть цена акций фирмы, а независимыми переменными могут быть индекс Standard and Poor's 500 и уровень безработицы в стране, при условии, что акции не котируются в S&P 500. Набором выборки может быть каждая из этих три набора данных за последние 20 лет.
На диаграмме эти точки данных будут отображаться в виде точечной диаграммы, набора точек, которые могут отображаться или не располагаться вдоль какой-либо линии. Если линейный узор очевиден, можно нарисовать линию наилучшего соответствия, которая сводит к минимуму расстояние этих точек от этой линии. Если организующая ось не видна визуально, регрессионный анализ может создать линию на основе метода наименьших квадратов. Этот метод строит линию, которая минимизирует квадрат расстояния каждой точки от линии наилучшего соответствия.
Чтобы определить формулу для этой строки, статистик вводит эти три результата за последние 20 лет в программу регрессии. Программное обеспечение выводит линейную формулу, которая выражает причинно-следственную связь между индексом S&P 500, уровнем безработицы и ценой акций рассматриваемой компании. Это уравнение является формулой для линии наилучшего соответствия. Это инструмент прогнозирования, предоставляющий аналитикам и трейдерам механизм прогнозирования будущей цены акций фирмы на основе этих двух независимых переменных.
Линия уравнения наилучшего соответствия и ее компоненты
Регрессия с двумя независимыми переменными, такая как рассмотренный выше пример, даст формулу со следующей базовой структурой:
y= c + b1(x1) + b2(x2)
В этом уравнении y — зависимая переменная, c — константа, b1 — первый коэффициент регрессии, а x1 — первая независимая переменная. Второй коэффициент и вторая независимая переменная равны b2 и x2. Исходя из приведенного выше примера, цена акции будет равна y, S&P 500 будет равна x1, а уровень безработицы будет равен x2. Коэффициент каждой независимой переменной представляет собой степень изменения y для каждой дополнительной единицы этой переменной. Если S&P 500 увеличится на единицу, результирующая цена y или акции вырастет на величину коэффициента. То же самое верно и для второй независимой переменной, уровня безработицы. В простой регрессии с одной независимой переменной этот коэффициент представляет собой наклон линии наилучшего соответствия. В этом примере или любой регрессии с двумя независимыми переменными наклон представляет собой смесь двух коэффициентов. Константа c представляет собой точку пересечения оси Y с линией наилучшего соответствия.
Особенности
Линия наилучшего соответствия используется для выражения отношения на точечной диаграмме различных точек данных.
Это результат регрессионного анализа, который можно использовать в качестве инструмента прогнозирования индикаторов и ценовых движений.