Оценка качества уравнения регрессии

Качество модели регрессии связывают с адекватностью модели наблюдаемым (эмпирическим) данным. Проверка адекватности (или соответствия) модели регрессии наблю­даемым данным проводится на основе анализа остатков.

После построения уравнения регрессии мы можем разбить значение Y, в каждом наблюдении на две составляющих - Оценка качества уравнения регрессии - №1 - открытая онлайн библиотека и Оценка качества уравнения регрессии - №2 - открытая онлайн библиотека .

Оценка качества уравнения регрессии - №3 - открытая онлайн библиотека

Остаток Оценка качества уравнения регрессии - №2 - открытая онлайн библиотека представляет собой отклонение фактического зна­чения зависимой переменной от значения данной перемен­ной, полученное расчетным путем: Оценка качества уравнения регрессии - №5 - открытая онлайн библиотека ( Оценка качества уравнения регрессии - №6 - открытая онлайн библиотека ).

На практике, как правило, имеет место некоторое рассеива­ние точек корреляционного поля относительно теоретической линии регрессии, т. е. отклонения эмпирических данных от тео­ретических ( Оценка качества уравнения регрессии - №7 - открытая онлайн библиотека ). Величина этих отклонений и лежит в осно­ве расчета показателей качества (адекватности) уравнения.

При анализе качества модели регрессии используется основное положение дисперсионного анализа, согласно которому общая сумма квадратов отклонений зависимой переменной от среднего значения Оценка качества уравнения регрессии - №8 - открытая онлайн библиотека может быть разложе­на на две составляющие - объясненную и необъясненную уравнением регрессии дисперсии:

Оценка качества уравнения регрессии - №9 - открытая онлайн библиотека (4)

где Оценка качества уравнения регрессии - №10 - открытая онлайн библиотека - значения y, вычисленные по модели Оценка качества уравнения регрессии - №11 - открытая онлайн библиотека .

Разделив правую и левую часть (4) на Оценка качества уравнения регрессии - №12 - открытая онлайн библиотека

Оценка качества уравнения регрессии - №13 - открытая онлайн библиотека ,

получим

Оценка качества уравнения регрессии - №14 - открытая онлайн библиотека .

Коэффициент детерминации определяется следующим образом:

Оценка качества уравнения регрессии - №15 - открытая онлайн библиотека

Коэффициент детерминации показывает долю вариации результативного признака, находя­щегося под воздействием изучаемых факторов, т. е. определяет, ка­кая доля вариации признака Y учтена в модели и обусловлена влия­нием на него факторов.

Чем ближе Оценка качества уравнения регрессии - №16 - открытая онлайн библиотека к 1, тем выше качество модели.

Для оценки качества регрессионных моделей целесообразно также ис­пользовать коэффициент множественной корреляции (индекс корреляции) R

Данный коэффициент является универсальным, так как он отра­жает тесноту связи и точность модели, а также может использовать­ся при любой форме связи переменных.

При построении однофакторной модели он равен коэффициенту линейной корреляции Оценка качества уравнения регрессии - №17 - открытая онлайн библиотека.

Очевидно, что чем меньше влияние неучтенных факторов, тем лучше модель соответствует фактическим данным.

Также для оценки качества регрессионных моделей целесообразно ис­пользовать среднюю ошибку аппроксимации:

Оценка качества уравнения регрессии - №18 - открытая онлайн библиотека Оценка качества уравнения регрессии - №19 - открытая онлайн библиотека

Чем меньше рассеяние эмпирических точек вокруг теоре­тической линии регрессии, тем меньше средняя ошиб­ка аппроксимации. Ошибка аппроксимации меньше 7 % свидетельствует о хорошем качестве модели.

После того как уравнение регрессии построено, выполняется проверка значимости построенного уравнения в целом и отдельных параметров.

Оценить значимость уравнения регрессии – это означает установить, соответствует ли математическая модель, выражающая зависимость между Y и Х, фактическим данным и достаточно ли включенных в уравнение объясняющих переменных Х для описания зависимой переменной Y

Оценка значимости уравнения регрессии производится для того, чтобы узнать, пригодно уравнение регрессии для практического использования (например, для прогноза) или нет. При этом выдвигают основную гипотезу о незначимости уравнения в целом, которая формально сводится к гипо­тезе о равенстве нулю параметров регрессии, или, что то же самое, о равенстве нулю коэффициента детерминации: Оценка качества уравнения регрессии - №20 - открытая онлайн библиотека . Альтернативная ей гипотеза о значимости уравне­ния - гипотеза о неравенстве нулю параметров регрессии.

Для проверки значимости модели регрессии используется F-критерий Фишера, вычисляемый как отношение дисперсии исходного ряда и несме­щенной дисперсии остаточной компоненты. Если расчетное значение с n1= k и n2 = (n - k - 1) степенями свободы, где k – количество факторов, включенных в модель, больше табличного при заданном уровне значимости, то модель считается значимой.

Для модели парной регрессии:

Оценка качества уравнения регрессии - №21 - открытая онлайн библиотека

В качестве меры точности применяют несмещенную оценку дис­персии остаточной компоненты, которая представляет собой отно­шение суммы квадратов уровней остаточной компоненты к величи­не (n- k -1), где k – количество факторов, включенных в модель. Квадратный корень из этой величины ( Оценка качества уравнения регрессии - №22 - открытая онлайн библиотека ) называется стандартной ошибкой: Оценка качества уравнения регрессии - №23 - открытая онлайн библиотека

Для модели парной регрессииОценка качества уравнения регрессии - №24 - открытая онлайн библиотека