Множественная линейная регрессия
Для нахождения оценок коэффициентов регрессии воспользуемся средствами MS Excel. Вызываем надстройку «Анализ данных». В открывшемся меню надстройки «Анализ данных» выбираем пункт «регрессия». В открывшемся диалоговом окне «Регрессия» вводим исходные данные и указываем таблицы, которые процедура регрессия должна вывести. В итоге получаем таблицы, представленные на рис. 11.2. На любой экономический… Читать ещё >
Множественная линейная регрессия (реферат, курсовая, диплом, контрольная)
На любой экономический показатель чаще всего оказывает влияние не один, а несколько факторов. Например, производительность труда зависит от качества оборудования, уровня автоматизации технологических процессов, профессиональной подготовки рабочих и т. д. Поэтому обобщим полученные ранее результаты на многомерный случай.
Рассмотрим самую употребительную и наиболее простую из моделей множественной регрессии — модель множественной линейной регрессии.
Пусть результативный признак Y зависит от т факторных признаков Xv Х2,…, Хт. Тогда теоретическое уравнение множественной линейной регрессии имеет вид.
Пусть проведено п наблюдений, тогда результат /-го наблюдения можно записать в виде
где Xjj — значение факторного признака Xpj = 1, 2, т, в г-м наблюдении; у, — соответствующее им значение результативного признака F; е, — случайная ошибка измерения. Параметры Р0, Р, Рт являются количественным выражением влияния каждой из объясняющих переменных на результативный признак Y. Эти параметры называются частными коэффициентами регрессии и интерпретируются как среднее изменение значения результирующей переменной при изменении на единицу значения данной объясняющей переменной при условии постоянства всех остальных объясняющих переменных.
При анализе формулу (11.11) обычно записывают в матричной форме: где
Применяя для оценки вектора неизвестных параметров (3 МНК, нетрудно получить общую формулу вычисления оценок коэффициентов множественной линейной регрессии:
где ХТ — матрица, транспонированная к матрице X, а (ХТХ)~1 — матрица, обратная к матрице ХТХ.
Замечание 11.13. Проверка значимости (качества предсказания) уравнения множественной линейной регрессии в принципе мало отличается от соответствующей проверки парной зависимости и проводится с помощью F-критерия Фишера.
Замечание 11.14. Уже при п > 20 и m > 3 расчеты коэффициентов множественной линейной регрессии вручную весьма затруднительны. Поэтому можно воспользоваться, например, средствами MS Excel.
Пример 11.9. Изучается зависимость себестоимости продукции У (тыс. руб.) от объема валовой продукции Х{ (млн руб.) и производительности Х2 (тыс. руб. на человека). Данные 11 предприятий отрасли представлены в таблице:
6,5. | 7,5. | И. | |||||||||
х2 | |||||||||||
Y | 3382,1. | 3829,4. | 4018,9. | 3636,3. | 4472,1. | 4248,6. | 4011,7. | 4788,9. | 4741,7. | 4716,7. | 4870,7. |
Построим уравнение регрессии.
Решение. Будем строить линейную регрессионную модель.
Для нахождения оценок коэффициентов регрессии воспользуемся средствами MS Excel. Вызываем надстройку «Анализ данных». В открывшемся меню надстройки «Анализ данных» выбираем пункт «регрессия». В открывшемся диалоговом окне «Регрессия» вводим исходные данные и указываем таблицы, которые процедура регрессия должна вывести. В итоге получаем таблицы, представленные на рис. 11.2.
Рис. 11.2. Регрессионная модель в MS Excel.
Таблица «Регрессионная статистика». В этой таблице основную информацию для нас содержит строка R-квадрат, так как показывает коэффициент детерминации (R2 = 0,925).
Таблица «Дисперсионный анализ». Эта таблица предназначена для проверки значимости коэффициента детерминации, т.с. для проверки гипотезы Я0: R2 = 0. Самым главным для нас в этой таблице является столбец «Значимость F», который выводит /7-значснис для вычисленного значения Тнабл = 49,43. В нашем случае p-значение равно 0,3, поэтому при уровне значимости, а = 0,05 гипотезу о том, что R2= 0, отвергаем, так как р < а, и признаем выбранную линейную регрессионную модель работоспособной с R2 = 0,925.
Таблица «Коэффициенты модели и их анализ». В этой таблице первая строка, называемая «У-пересечение», выводит информацию для оценки коэффициента р0, а именно р0 =2097,2. В столбце t-статистика выведено значение ?набл = 9,1 для проверки гипотезы //0: р0 = 0; /7-значение равно 0,2, поэтому при уровне значимости, а = 0,05 гипотезу о равенстве нулю коэффициента следует отклонить, так как р < а; 95%-ный доверительный интервал для р0 равен (1562,9; 2631,4).
Аналогичные выводы можно сделать по второй и третьей строке. В частности, р! =163,7, р2 =33,6.
Таким образом, выборочное уравнение множественной линейной регрессии имеет вид