Предмет и метод эконометрики.
Эконометрические взаимосвязи
Но использование только одного индекса детерминации для определения наилучшего уравнения регрессии недостаточно. Необходимо учитывать, что при увеличении факторов включенных в уравнение регрессии, при одном и том же числе наблюдений, при расчете показателей корреляции, за счет использования остаточной дисперсии появляется систематическая ошибка — чем больше число параметров в уравнении регрессии… Читать ещё >
Предмет и метод эконометрики. Эконометрические взаимосвязи (реферат, курсовая, диплом, контрольная)
Контрольно-курсовая работа Предмет и метод эконометрики. Эконометрические взаимосвязи
1. Эконометрика, предмет и метод
1.1 Предмет и метод
1.2Эконометрическая модель
1.3 Измерения в экономике
2. Изучение взаимосвязей в эконометрике
2.1 Понятие о взаимосвязях в эконометрике
2.2 Метод сопоставления параллельных рядов. Корреляция альтернативных признаков
2.3 Метод аналитических группировок
2.4 Корреляционно-регрессионный анализ
2.4.1 Парная регрессия. Парная корреляция
2.4.1.1 Парная линейная регрессия
2.4.1.2 Парная линейная корреляция
2.4.1.3 Оценка надежности параметров парной линейной регрессии и корреляции
2.4.1.4 Парная нелинейная регрессия
2.4.1.5 Коэффициенты эластичности в парных моделях
2.4.1.6 Парная нелинейная корреляция
2.4.1.7 Оценка надежности параметров парной нелинейной регрессии и корреляции
2.4.1.8 Прогнозирование на основе парной модели регрессии. Расчет доверительных интервалов для прогнозного значения, параметров уравнения регрессии и коэффициента (индекса) корреляции
2.4.2 Множественная регрессия. Множественная корреляция
2.4.2.1 Множественная регрессия
2.4.2.2 Частные уравнения регрессии
2.4.2.3 Множественная корреляция
2.4.2.4 Частная корреляция
2.4.2.5 Оценка надежности параметров множественной регрессии и корреляции Литература
1. Эконометрика, предмет и метод
1.1 Предмет и метод Термин «эконометрика» впервые введен в Австро-Венгрии П. Цьемпой. Слово эконометрика это комбинация слов «эконом» и «метрика» т. е. экономика и измерение. Соответственно эконометрика это измерение в экономике.
На данный момент под эконометрикой понимают науку, которая занимается измерением и анализом экономических явлений.
В основу эконометрики положены три основных компонента:
1. экономическая теория;
2. статистические методы;
3. математические методы.
Эконометрика это слияние всех этих трех компонентов, каждый из которых является ее неотъемлемой частью.
В основе метода эконометрики лежат методы статистики, такие как:
1. регрессионный анализ;
2. корреляционный анализ;
3. выделение тренда динамического ряда;
4. изучение сезонных и циклических колебаний динамического ряда;
5. статистическое оценивание результатов и т. д.
Но так как, эконометрика является эмпирической наукой и решает конкретные экономические задачи, методы эконометрического анализа должны исключать проявление процессов искажающих результаты статистического анализа. К таким процессам относятся:
1. асимметричность связей;
2. мультиколлинеарность переменных;
3. гетероскедастичность;
4. автокорреляция;
5. ложная корреляция;
6. наличие лагов и т. д.
1.2 Эконометрическая модель Эконометрические модели являются главным инструментом в эконометрике. Невозможно, например, абсолютно точно подсчитать спрос на автомобили в следующем году. Но можно, зная основные факторы, влияющие на спрос, построить модель спроса.
Эконометрическая модель — теоретическая модель экономических процессов, которая является средством прогнозирования эмпирических экономических процессов.
В эконометрике используют три класса эконометрических моделей:
1. Модели временных рядов.
2. Регрессионные модели с одним уравнением.
3. Системы одновременных уравнений.
Моделью временных рядов называется эконометрическая модель, в которой результативных признак — функция переменной времени, или переменных относящихся к другим моментам времени. К моделям временных рядов относятся:
1. Модель тренда — отражает зависимость результативного признака от трендовой компоненты:
(1)
где:
временной тренд, заданный функцией определенного вида, линейной или нелинейной.
— случайная компонента.
2. Модель сезонности — отражает зависимость результативного признака от сезонной компоненты
(2)
где:
сезонная компонента.
— случайная компонента.
3. Тренда и сезонности — отражает зависимость результативного признака и от трендовой и от сезонной компоненты. Может быть:
аддитивная (дополняющая) модель
(3)
мультипликативная (множительная) модель
(4)
4. К моделям, отражающим зависимость результативного признака от переменных, относящихся к другим моментам времени относятся:
модель с распределенным лагом — модель, отражающая зависимость результативного признака от предыдущих значений факторных признаков.
модель авторегрессии — модель, отражающая зависимость результативного признака от предыдущих значений результативных признаков.
модели ожидания — модель, отражающая зависимость результативного признака от будущих значений факторных или результативных переменных.
Регрессионной моделью с одним уравнением называется модель, в которой результативный признак представляется в виде функции факторных переменных:
(5)
где
— результативный признак (зависимая переменная).
— факторные признаки (независимые или объясняющие переменные).
Регрессионные модели с одним уравнением в зависимости от вида функции делятся на линейные и нелинейные.
Наиболее часто в экономике используют следующие модели с одним уравнением:
1. Функция цены, где цена товара зависит от объема поставки и цен конкурентов :
(6)
2. Функция спроса, где величина спроса товара зависит от его цены, от цен конкурентов, и доходов потребителей :
(7)
3. Производственная функция, где зависимость объема производства товара зависит от производственных факторов, например затрат капитала и затрат труда :
(8)
Системы одновременных уравнений — модели, которые описываются системами взаимосвязанных регрессионных уравнений.
Системы уравнений могут быть тождественными или поведенческими.
Тождественные системы уравнений состоят из уравнений, вид которых и значения параметров известны.
Поведенческие системы уравнений состоят из уравнений, вид которых и значение параметров требуется оценить, а также уравнения, которые в качестве независимых переменных могут включать, кроме факторных переменных, результативные признаки из других уравнений системы.
К системам одновременных уравнений относится, например, модель спроса и предложения из трех уравнений:
(9)
где
— предложение товара в момент времени .
— спрос на товар в момент времени .
— цена товара в момент времени .
— цена товара в предыдущий момент времени .
— доход потребителя в момент времени .
Системы одновременных уравнений могут включать в себя большое количество уравнений, например, модель Уортона американской экономики, содержит более одной тысячи уравнений, которые решаются одновременно.
1.3 Измерения в экономике В настоящее время термин «измерение» употребляется в трех значениях:
1. Измерение — это получение, сравнение и упорядочение информации. Предполагает сравнение объектов исследования по наличию или отсутствию исследуемого свойства. Данному понятию соответствуют термины «классификация», «нумерация».
2. Измерение — это операция, в результате которой получается численное значение величины измеряемого признака. Данному понятию соответствуют термины «шкалирование», «топология», «упорядочение».
3. Измерение — измерение с обязательным наличием единицы измерения, т. е. сравнение изучаемых объектов с эталоном. Данному понятию соответствуют термины «измерение», «квантификация».
Измерение, по любому из определений, предполагает наличие шкалы измерения. Различают следующие типы шкал:
номинальная;
порядковая (ранговая, ординальная);
интервальная;
шкала отношений.
Тип шкалы определяется допустимым преобразованием, при котором истинные утверждения не становятся ложными, а ложные утверждения не становятся истинными.
Номинальная шкала Номинальная шкала — шкала, в которой измерением называется классификация, при которой каждое значение определяет отдельную категорию, т. е. каждая категория «отличается» от других, но это отличие не может быть количественно измерено. Например, нумерация игроков в футбольной команде.
Номинальной шкале присущи только свойства «симметричности» и «транзитивности».
Симметричность — если то и .
Транзитивность — если и то и .
Порядковая (ординальная, ранговая) шкала Порядковая шкала ранжирует объекты по уровню свойства, т. е. «больше» или «меньше», но не позволяет сказать «на сколько больше» или «на сколько меньше».
Ординальная шкала допускает следующие операции: «равенство-неравенство» и «больше-меньше».
Для порядковой шкалы возможно любое монотонное преобразование.
Среди порядковых шкал большое распространение получили бальные шкалы.
Примерами ординальной шкалы может служить рейтинг популярных песен, успеваемость учеников в школе, оценка силы волн, и т. д.
Интервальная шкала (шкала разностей) Интервальная шкала — шкала, которая позволяет не только упорядочить объекты по уровню свойства, но и сравнивать между собой разности количеств свойства.
Шкала разностей — интервальная шкала, масштаб в которой зафиксирован. По шкале разностей мы можем сказать, например, что температура воды 100С больше, чем 30С, но и определить разницу в 70С, между двумя значениями.
Шкала разностей допускает следующие операции: «равенство-неравенство» и «больше-меньше», «равенство-неравенство интервалов» и операцию вычитания.
Шкала отношений (пропорциональная шкала) Шкала отношений — шкала, на которой указан абсолютный ноль. По шкале отношений можно определить во сколько раз величина одного объекта больше другого. Например, используя шкалу температур Кельвина, можно сказать, что 400К по сравнения с 200К не только больше на 200, но и в два раза «горячее».
Шкала отношений допускает следующие операции: «равенство-неравенство интервалов», «больше-меньше» и операции вычитания и деления.
Особенность экономических измерений Естественно, что измерения в экономике отличаются от измерений в физике или механике. Экономика это так называемая «неточная» наука, так как ей свойственны большие погрешности, чем «точным» наукам.
Экономическим измерениям свойственна более низкая контролируемость их точности, т.к. в естественных науках точность измерения зависит, в основном, от самого измерения, а в экономических измерениях точность кроме самого измерения зависит от:
правильного определения экономической величины и экономического показателя;
формирования системы условий, определяющих точность экономического измерения;
выбора условий соизмеримости показателей;
разработки других специфических условий экономического измерения.
2. Изучение взаимосвязей в эконометрике
2.1 Понятие о взаимосвязях. Методы выявления и измерения взаимосвязей В природе, и тем более в обществе, все явления взаимосвязаны между собой. Урожайность зависит от качества почвы, внесения удобрений, обеспеченности производственными фондами и от многих других факторов; производительность труда от производственных затрат, обеспеченности основными и оборотными фондами и т. д.; среднедневная температура от времени года, местоположения страны удаленности от океана и т. д. Соответственно, что бы прогнозировать, то есть управлять развитием явлений, общественных и природных, необходимо установить связи, существующие между интересующими нас явлениями, их силу, вид, направление и т. д.
Так как, в статистике изучают детерминированность следствия факторами (детерминизм — обусловленность явлений множеством факторов) будем называть признак (явление) характеризующий следствие результативным признаком (зависимым признаком, результатом). Признаки, характеризующие факторы — факторными признаками (независимыми признаками). Результативные признаки принимают то или иное значение под влиянием на них признаков факторных. Соответственно размер результативного признака есть результат влияние на него факторных признаков.
В статистике различают два вида взаимосвязей между явлениями: функциональная и корреляционная.
Функциональная связь — это связь, жестко детерминированная или полная (связь равная единице или 100%), размер результативного признака зависит только от одного фактора, причем каждому конкретному значению факторного признака может соответствовать одно, или несколько четко заданных значений результативного признака.
Строго определить функциональную связь можно, только придав ей математическую формулировку. Функциональной связью является, например, связь вида:
а), при ,
б), при, , или
Видно, что величина признака зависит, лишь от признака, причем строго определенным образом.
Но, в мире природы и тем более в обществе функциональных связей не бывает — все явления реального мира взаимосвязаны между собой. И поэтому функциональная связь — это связь абстрактная, упрощающая расчеты, но и упрощающая объективно существующую реальность. Тем не менее, представление о связях как связях функциональных используют такие науки как химия, физика, механика, электротехника и т. д.
Обратная величина функциональной связи — это отсутствие связи (связь между явлениями равна нулю), размер результативного признака совершенно не зависит от какого-то фактора. Отсутствие связи, как и связь функциональная не существует в реальном мире — это также абстрактное понятие, упрощающее расчеты и соответственно реальность.
Корреляционная связь — это связь схоластически детерминированная, неполная. При корреляционной связи каждому значению факторного признака (признаков) соответствует множество значений результативного признака. Корреляционная связь проявляется лишь при большом числе наблюдений, в среднем.
Также различают формы связи:
1. прямая связь — с возрастанием величины фактора наблюдается рост величины результата, а при уменьшении величины фактора уменьшение величины результативного признака.
2. обратная связь — с увеличением величины фактора величина результативного признака уменьшается, а с уменьшением увеличивается.
Кроме того, по математическому выражению, связи делятся на линейные и нелинейные.
При изучении взаимосвязей общественных явлений используют различные методы, такие как:
1. сопоставление параллельных рядов;
2. метод аналитических группировок;
3. корреляционно-регрессионный анализ;
4. и др.
Изучение взаимосвязей позволяет решить следующие задачи:
1. определить наличие связи;
2. определение формы связи;
3. измерение тесноты связи;
4. прогнозирование изменения результативного признака под влиянием изменения фактора (факторов).
2.2 Метод сопоставления параллельных рядов. Корреляция альтернативных признаков Метод сопоставления параллельных рядов является наиболее простым методом исследования взаимосвязей между явлениями.
Данный метод заключается в сопоставлении ранжированного ряда факторного признака с ранжированным рядом результативного признака. Данное сопоставление позволяет определить наличие или отсутствие связи между явлениями, а также ее направление.
Также метод параллельных радов позволяет определить тесноту связи. Для этого рассчитывают коэффициент Фехнера и коэффициент корреляции рангов Спирмена.
Расчет коэффициента Фехнера.
Для расчета данного коэффициента необходимо рассчитать отклонения значений признаков и от их средних значений и, при этом определяют знак отклонений или. Если знаки отклонений у признаков и совпадают, то делается вывод о согласованности вариации, если не совпадают — вариация несогласованна. Формула расчета коэффициента Фехнера:
(10)
где:
С — число совпавших знаков отклонений и
Н — число не совпавших отклонений и
Коэффициент Фехнера может принимать значения от до. В статистике принято считать, что до 0,3 связь слабая, от 0,3 до 0,7 связь средняя, свыше 0,7 связь сильная. Знак плюс показывает, что связь прямая, знак минус — связь обратная.
Необходимо учитывать, что коэффициент Фехнера определяет направление связи, но дает лишь очень грубую оценку ее величины.
Коэффициент корреляции рангов Спирмена Коэффициент корреляции рангов учитывает согласованность рангов единиц совокупности.
Ранг — номер, который занимает единица совокупности по признакам и .
Формула расчета коэффициента корреляции рангов:
(11)
где: — число единиц совокупности,
— квадрат разности рангов.
Коэффициент корреляции рангов может принимать значения в интервале .
Корреляция альтернативных признаков В случае, когда имеются противоположные по значению варианты признака, говорят об альтернативном признаке (да, нет). Например, продукция может быть годной или не годной.
Для исследования взаимосвязей между двумя альтернативными признаками, то есть, вариация обоих атрибутивных признаков ограничена двумя группами, используют «тетрахорические показатели». Их расчет основан на использовании определенной расчетной таблицы (табл. 1).
Таблица 1.
II I | ; | ||
a | b | ||
; | c | d | |
Она состоит из четырех ячеек обозначенных буквами a, b, c, d — частоты, расположенные в I, II, III, IV квадрантах. Знаки и в заголовках столбцов и строк характеризуют наличие или отсутствие альтернативного признака.
К «тетрахорическим показателям» относят:
коэффициент ассоциации Пирсона коэффициент коллигации Юла коэффициент контингенции Юла и Кендэла коэффициент Шарлье и др.
Рассмотрим некоторые из них.
Коэффициент ассоциации Пирсона, данный коэффициент используют для измерения тесноты взаимосвязи надежности и годности. Рассчитывается по формуле:
(12)
Коэффициент коллигации Юла рассчитывается как:
(13)
Данный коэффициент показывает средний размер связи.
Рассмотренные коэффициенты могут принимать значения от до .
Если при измерении связи между качественными показателями образуется более двух групп, для определения тесноты связи используют:
коэффициент взаимной сопряженности Пирсона коэффициент взаимной сопряженности Чупрова коэффициент взаимной сопряженности Крамера и. д.р.
Коэффициент взаимной сопряженности Пирсона рассчитывается:
(14)
Коэффициент взаимной сопряженности Чупрова рассчитывается:
(15)
где:
— число групп по первому и второму признаку соответственно.
— показатель взаимной сопряженности Коэффициент взаимной сопряженности Чупрова целесообразно использовать, когда число групп по каждому признаку одинаково. Если используют коэффициент Крамера.
Показатель взаимной сопряженности рассчитывают, используя вспомогательную таблицу (табл. 2)
Данные подставляют в формулу:
(16)
Таблица 2. Вспомогательная таблица для расчета показателя взаимной сопряженности
y x | I | II | III | Итого | |
I | … | … | |||
II | … | … | |||
III | … | … | |||
Итого | |||||
Коэффициент взаимной сопряженности Крамера рассчитывается:
(17)
где:
— минимальное, из значений и
При значения коэффициентов Чупрова и Крамера совпадают.
Пример 1. По совокупности, состоящей из 27 предприятий, имеются данные о фондовооруженности тыс.руб. и производительности труда тыс.руб. (табл. 3).
Таблица 3.
№ | № | |||||
8,0 | 11,1 | |||||
8,2 | 11,6 | |||||
8,3 | 11,8 | |||||
8,4 | 12,0 | |||||
8,9 | 12,1 | |||||
9,2 | 12,3 | |||||
9,3 | 12,5 | |||||
9,4 | 12,9 | |||||
9,7 | 13,0 | |||||
9,9 | 13,2 | |||||
10,2 | 13,7 | |||||
10,3 | 13,8 | |||||
10,6 | 14,0 | |||||
10,9 | ||||||
Необходимо определить направление и тесноту связи с помощью коэффициента Фехнера и коэффициента корреляции рангов Спирмена.
Решение.
I. Рассчитаем коэффициент Фехнера.
1. В таблице 4 рассчитаем отклонения значений признаков и от их средних значений — и, определим знак отклонений или и подсчитаем число совпадений © и несовпадений (Н) знаков отклонений.
Таблица 4.
№ | x | С или Н | ||||
8,0 | — 2,9 | — 6,2 | С | |||
8,2 | — 2,7 | — 5,2 | С | |||
8,3 | — 2,6 | — 6,2 | С | |||
8,4 | — 2,5 | — 3,2 | С | |||
8,9 | — 2,0 | — 6,2 | С | |||
9,2 | — 1,7 | — 5,2 | С | |||
9,3 | — 1,6 | — 3,2 | С | |||
9,4 | — 1,5 | — 2,2 | С | |||
9,7 | — 1,2 | — 2,2 | С | |||
9,9 | — 1,0 | — 0,2 | С | |||
10,2 | — 0,7 | — 2,2 | С | |||
10,3 | — 0,6 | — 1,2 | С | |||
10,6 | — 0,3 | — 0,2 | С | |||
10,9 | 0,0 | 0,8 | С | |||
11,1 | 0,2 | 1,8 | С | |||
11,6 | 0,7 | — 0,2 | Н | |||
11,8 | 0,9 | 0,8 | С | |||
12,0 | 1,1 | 1,8 | С | |||
12,1 | 1,2 | 2,8 | С | |||
12,3 | 1,4 | 3,8 | С | |||
12,5 | 1,6 | 2,8 | С | |||
12,9 | 2,0 | 2,8 | С | |||
13,0 | 2,1 | 3,8 | С | |||
13,2 | 2,3 | 4,8 | С | |||
13,7 | 2,8 | 5,8 | С | |||
13,8 | 2,9 | 4,8 | С | |||
14,0 | 3,1 | 6,8 | С | |||
Среднее | 10,9 | 9,2 | ||||
2. Коэффициент Фехнера будет равен:
Коэффициент Фехнера показывает сильную положительную связь между признаками и .
II. Рассчитаем коэффициент корреляции рангов Спирмена.
1. Назначим ранги для показателя (табл. 5). Для этого ранжируем показатель по возрастанию и определим ранг, который признак занимает в ранжированном ряде.
а) Значение признака равное 3 занимает № 1, № 2 и № 3, соответственно ранг данного значение будет .
б) Значение признака равное 4 занимает № 4 и № 5, соответственно ранг данного значение будет .
в) Значение признака равное 6 занимает № 6 и № 7, соответственно ранг данного значение будет .
г) Значение признака равное 7 занимает № 8, № 9 и № 10, соответственно ранг данного значение будет .
д) Значение признака равное 8 занимает № 11, соответственно ранг данного значение будет .
е) Значение признака равное 9 занимает № 12, № 13 и № 14, соответственно ранг данного значение будет .
ж) Значение признака равное 10 занимает № 15 и № 16, соответственно ранг данного значение будет .
з) Значение признака равное 11 занимает № 17 и № 18, соответственно ранг данного значение будет .
и) Значение признака равное 12 занимает № 19, № 20 и № 21, соответственно ранг данного значение будет .
к) Значение признака равное 13 занимает № 22 и № 23, соответственно ранг данного значение будет .
л) Значение признака равное 14 занимает № 24 и № 25, соответственно ранг данного значение будет .
м) Значение признака равное 15 занимает № 26, соответственно ранг данного значение будет .
н) Значение признака равное 16 занимает № 27, соответственно ранг данного значение будет .
Таблица 5
№ | по возрастанию | ранг признака | |
А | |||
2. Назначим ранги для показателя ранжированием по порядку возрастания — 1; 2; 3;. .. 27 (табл. 6).
Далее в таблице 6 проставим ранги признаков и, рассчитаем разности рангов, квадраты разности рангов и сумму квадратов разностей рангов (табл. 5).
Таблица 6
№ | |||||||
8,0 | 2,0 | 1,0 | 1,00 | ||||
8,2 | 4,5 | 2,5 | 6,25 | ||||
8,3 | 2,0 | — 1,0 | 1,00 | ||||
8,4 | 6,5 | 2,5 | 6,25 | ||||
8,9 | 2,0 | — 3,0 | 9,00 | ||||
9,2 | 4,5 | — 1,5 | 2,25 | ||||
9,3 | 6,5 | — 0,5 | 0,25 | ||||
9,4 | 9,0 | 1,0 | 1,00 | ||||
9,7 | 9,0 | 0,0 | 0,00 | ||||
9,9 | 13,0 | 3,0 | 9,00 | ||||
10,2 | 9,0 | — 2,0 | 4,00 | ||||
10,3 | 11,0 | — 1,0 | 1,00 | ||||
10,6 | 13,0 | 0,0 | 0,00 | ||||
10,9 | 15,5 | 1,5 | 2,25 | ||||
11,1 | 17,5 | 2,5 | 6,25 | ||||
11,6 | 13,0 | — 3,0 | 9,00 | ||||
11,8 | 15,5 | — 1,5 | 2,25 | ||||
12,0 | 17,5 | — 0,5 | 0,25 | ||||
12,1 | 20,0 | 1,0 | 1,00 | ||||
12,3 | 22,5 | 2,5 | 6,25 | ||||
12,5 | 20,0 | — 1,0 | 1,00 | ||||
12,9 | 20,0 | — 2,0 | 4,00 | ||||
13,0 | 22,5 | — 0,5 | 0,25 | ||||
13,2 | 24,5 | 0,5 | 0,25 | ||||
13,7 | 26,0 | 1,0 | 1,00 | ||||
13,8 | 24,5 | — 1,5 | 2,25 | ||||
14,0 | 27,0 | 0,0 | 0,00 | ||||
Итого | 77,00 | ||||||
3. Рассчитаем коэффициент корреляции рангов Связь сильная.
Пример 2. Имеются данные о количестве торговых точек, сгруппированных по уровню средней прибыли и уровню квалификации продавцов в разных торговых точках (табл. 7).
Определить тесноту связи, через коэффициенты взаимной сопряженности.
Решение.
Рассчитаем показатель взаимной сопряженности непосредственно в таблице, используя формулу:
1. Рассчитаем коэффициент Пирсона.
и из полученного значения (значение находится в нижнем правом углу таблицы) вычтем единицу:
2. Так как рассчитаем коэффициент Чупрова:
Коэффициент Чупрова всегда меньше чем коэффициент Пирсона.
3. Коэффициент взаимной сопряженности Крамера:
Так как значения коэффициентов Чупрова и Крамера совпадают.
Таблица 7.
Средняя прибыль Квалификация | Низкая | Средняя | Высокая | Итого | |
Низкий | |||||
Средний | |||||
Высокий | |||||
Итого | |||||
Пример 3. Группа предприятий, исследованная по влиянию на прибыль новой маркетинговой схемы, разделена на две подгруппы по надою.
Таблица 8
Схема Прибыль | Переведены на новую схему | Не переведены | |
Прибыль увеличилась | 230 (а) | 84 (b) | |
Прибыль не увеличилась | 99 (c) | 210 (d) | |
Рассчитаем коэффициент ассоциации Пирсона:
Полученное значение показывает среднюю, прямую связь между исследуемыми признаками.
Рассчитаем коэффициент коллигации Юла:
Полученное значение показывает, что средняя связь между исследуемыми признаками прямая, средняя.
2.3 Метод аналитических группировок Этот метод позволяет определить взаимосвязи между двумя и более признаками.
В ходе построения аналитической группировки необходимо решить следующие вопросы:
1. выбор факторных признаков
2. определение числа групп
3. оценка линии регрессии
4. измерения тесноты связи Выбор факторных признаков Выбор основывается на всестороннем анализе изучаемого явления, экономической теории, опыте и знаниях исследователя и т. д.
Определение числа групп В принципе, чем больше число групп, тем точнее будет описана линия регрессии, но в месте с тем снижается точность расчета средних.
В данном вопросе необходимо, что бы увеличение числа групп, для более точного описания линия регрессии, не привело к утрате закономерного характера линии регрессии, из-за малочисленности групп.
Границы интервалов групп определяют, выделяя основные типы изучаемых явлений. При расчете величин интервалов возможно использование следующей формулы предложенной американским ученым Стерджессом.
(18)
где:
— максимальное значение признака в совокупности
— минимальное значение признака в совокупности
N — число единиц в совокупности.
При разбиении изучаемой совокупности рекомендуется соблюдение принципа равных частот, т. е. образование групп с примерно одинаковой численностью единиц.
Оценка линии регрессии Оценка линии регрессии в данном случае основывается на вычислении среднего значения признака для интервала значений признака .
В качестве группировочного признака, как правило, используется факторный признак.
Показатель, характеризующий влияние факторного признака на результативный признак называется показателем силы связи, который показывает, на сколько единиц изменится результативный признак, если факторный увеличится на одну единицу.
Если связь между признаками нелинейная, то есть, существенно изменяется при переходе от одной группе к другой, рассчитывается как:
(19)
Так, например, если совокупность разбита на четыре группы, рассчитывают
1); 2); 3)
где:
— средне-групповые значения результативного признака.
— средние значения (или середины интервалов) факторного признака.
Для группировочного признака, среднюю величину находят как середину интервала.
В случае линейной связи важным показателем является поазатель средней силы связи .
(20)
где:
— средние значения результативного признака в последней и первой группах соответственно;
— середины интервалов (или средние значения) факторного признака в последней и первой группах.
Измерение тесноты связи Измерение тесноты связи в аналитических группировках основано на правиле сложения дисперсий — общая дисперсия всегда равна сумме средней внутригрупповой и межгрупповой дисперсий:
(21)
где:
— общая дисперсия, характеризует вариацию признака во всей совокупности, сложившуюся под влиянием всех факторов и условий:
или (22)
где — общая средняя.
— средняя внутригрупповая дисперсия, оценивает вариацию признака, сложившуюся по влиянием других, неучтенных в данном исследовании факторов и независящую от фактора группировки. Она определяется как средняя из групповых дисперсий:
или (23)
— внутригрупповая (случайная) дисперсия,
или (24)
где — групповая средняя.
— межгрупповая (систематическая) дисперсия, измеряет систематическую вариацию, обусловленную влиянием фактора, по которому произведена группировка:
эконометрика корреляция коэффициент модель
(25)
Показателем тесноты связи между признаками в аналитической группировке служит корреляционное отношение:
(26)
Корреляционное отношение может принимать значения от 0 до 1. Принято считать, что до 0,3 связь слабая, от 0,3 до 0,7 связь средняя, свыше 0,7 связь сильная. Чем больше корреляционное отношение, тем больше фактор, положенный в основание группировки, оказывает влияние на общую вариацию результативного признака, то есть они более тесно взаимосвязаны.
Квадрат корреляционного отношения — коэффициент детерминации:
(27)
Показывает долю вариации результативного признака обусловленную включенным в модель фактором.
Пример 4. В таблице 9 приведены значения факторного признака — затраты на рекламу млн.руб. и результативного признака — прибыль млн. руб. и число предприятий в каждой группе .
Таблица 9.
Затраты на рекламу в месяц млн.руб. | Число предприятий, | Средняя прибыль за месяц млн. руб. | |
0,08−0,12 | 23,56 | ||
0,12−0,16 | 25,20 | ||
0,16−0,20 | 29,80 | ||
0,20−0,24 | 36,50 | ||
Необходимо рассчитать показатели силы связи.
Решение.
Рассчитаем среднее значение фактора как середину интервала, и изменение средней прибыли при переходе от одной группы к другой. Результаты занесем в таблицу 10.
Таблица 10
Затраты на рекламу в месяц млн.руб. | Число предприятий, | Средняя прибыль за месяц млн.руб. | Середина интервала млн.руб. | Изменение средней прибыли млн.руб. | |
0,08−0,12 | 23,56 | 0,10 | ; | ||
0,12−0,16 | 25,20 | 0,14 | 1,64 | ||
0,16−0,20 | 29,80 | 0,18 | 4,60 | ||
0,20−0,24 | 36,50 | 0,22 | 6,70 | ||
Изменение средней прибыли имеет существенные отличия при переходе от одной группы к другой, соответственно связь меду признаками нелинейная. Необходимо рассчитывать несколько показателей силы связи характеризующих взаимосвязи при переходе от одной группы к другой.
1);
Это значит, что при увеличении затрат на рекламу от 0,08 до 0,16 млн руб. средняя прибыль будет увеличиваться в среднем на 41 руб. на каждый дополнительно потраченный на рекламу рубль.
2) ;
Это значит, что при увеличении затрат на рекламу от 0,16 до 0,20 млн руб. средняя прибыль будет увеличиваться в среднем на 115 руб. на каждый дополнительно потраченный на рекламу рубль.
3) .
Это значит, что при увеличении затрат на рекламу от 0,20 до 0,24 млн руб. средняя прибыль будет увеличиваться в среднем на 167,5 руб. на каждый дополнительно потраченный на рекламу рубль.
Различия между показателями силы связи обусловлены тем, что сила влияния затрат на прибыль не постоянна, она возрастает при переходе от одной группы к другой.
Пример 5. По данным табл. 10 необходимо рассчитать показатели силы связи.
Таблица 11
Затраты на рекламу в месяц млн.руб. | Число предприятий, | Средняя прибыль за месяц млн.руб. | Середина интервала млн.руб. | Изменение средней прибыли млн.руб. | |
0,08−0,12 | 23,56 | 0,10 | ; | ||
0,12−0,16 | 25,20 | 0,14 | 1,64 | ||
0,16−0,20 | 26,86 | 0,18 | 1,66 | ||
0,20−0,24 | 28,51 | 0,22 | 1,65 | ||
Решение.
Изменения отличаются не существенно, то есть связь между признаками линейная, рассчитаем показатель средней силы связи.
.
Это значит, что для всей совокупности, увеличение затрат на рекламу в среднем увеличит среднюю прибыль на 41,25 руб. на каждый дополнительно затраченный рубль.
Пример 6. Имеются данные о средней прибыли на отдельных торговых точках и профессиональном разряде продавцов (табл. 11)
Таблица 12
Разряд | Средняя прибыль тыс.руб. | Число точек. | Разряд | Средняя прибыль тыс.руб. | Число точек. | ||
I | I | ||||||
I | I | ||||||
II | II | ||||||
II | II | ||||||
II | II | ||||||
I | II | ||||||
1. Рассчитаем общую дисперсию выборки (табл. 13):
Таблица 13
№ | Средняя прибыль тыс.руб. | Число точек. | ||||
— 8,673 077 | 75,222 265 | 376,111 323 | ||||
— 0,673 077 | 0,453 033 | 3,171 229 | ||||
— 1,673 077 | 2,799 187 | 11,196 747 | ||||
6,326 923 | 40,29 955 | 120,89 864 | ||||
2,326 923 | 5,414 571 | 27,72 853 | ||||
1,326 923 | 1,760 725 | 8,803 623 | ||||
— 3,673 077 | 13,491 495 | 40,474 484 | ||||
— 0,673 077 | 0,453 033 | 1,812 131 | ||||
5,326 923 | 28,376 109 | 141,880 543 | ||||
— 1,673 077 | 2,799 187 | 11,196 747 | ||||
3,326 923 | 11,68 417 | 33,205 250 | ||||
0,326 923 | 0,106 879 | 0,427 515 | ||||
Итого | 775,44 231 | |||||
Среднее | 68,673 077 | 14,912 352 | ||||
2. Рассчитаем дисперсию для каждой группы:
Таблица 14
№ | Средняя прибыль тыс.руб. | Число точек. | ||||
— 6,375 000 | 40,640 625 | 203,203 125 | ||||
1,625 000 | 2,640 625 | 18,484 375 | ||||
3,625 000 | 13,140 625 | 65,703 125 | ||||
— 1,375 000 | 1,890 625 | 5,671 875 | ||||
1,625 000 | 2,640 625 | 10,562 500 | ||||
Итого | 303,625 000 | |||||
Среднее | 66,375 | 12,651 042 | ||||
а) Группа с разрядом — I (табл. 14)
Таблица 15.
№ | Средняя прибыль тыс.руб. | Число точек. | ||||
— 3,642 567 | 13,268 294 | 53,73 177 | ||||
4,357 433 | 18,987 222 | 56,961 667 | ||||
0,357 433 | 0,1 277 583 | 0,6 387 917 | ||||
3,357 433 | 11,272 356 | 56,361 782 | ||||
— 3,642 567 | 13,268 294 | 53,73 177 | ||||
1,357 433 | 1,8 426 243 | 5,527 873 | ||||
— 1,642 567 | 2,6 980 263 | 10,792 105 | ||||
Итого | 236,42 857 | |||||
Среднее | 70,642 567 | 8,4 438 776 | ||||
б) Группа с разрядом равным II (табл. 15)
.
3. Рассчитаем среднюю внутригрупповую дисперсию:
.
4. Найдем межгрупповую дисперсию.
Проверим через правило сложения дисперсий
5. Рассчитаем корреляционное отношение:
.
То есть, фактор, положенный в основу группировки (разряд) оказывает среднее влияние на результат (среднюю прибыль).
6. Рассчитаем детерминационное отношение То есть вариация результативного признака на % обусловлена влиянием фактора — разряд продавца.
2.4 Корреляционно-регрессионный анализ Основные понятия Корреляция — взаимосвязь между признаками, заключается в изменении средней величины результативного признака в зависимости от значения фактора (факторов).
Регрессия — функция, позволяющая по величине одного корреляционно связанного признака вычислять средние значения другого.
Корреляция, регрессия парная — корреляция, регрессия между двумя признаками: результативным и факторным .
Корреляция, регрессия множественная — взаимосвязь между несколькими признаками (тремя и более), один из которых является результативным признаком, другие факторными признаками .
Корреляция линейная — корреляционная зависимость между признаками носящая линейный характер.
Корреляция нелинейная — корреляционная зависимость между признаками не носит линейный характер, а выражена соответствующей кривой — парабола, гипербола, экспонента, показательная функция и т. д.
Регрессия линейная — регрессионная функция, выраженная уравнение прямой.
Регрессия нелинейная — регрессионная функция выражена соответствующей нелинейной функцией — парабола, гипербола, экспонента, показательная функция и т. д.
Парная корреляционно-регрессионная модель строится для изучения взаимосвязи между результативным признаком и одним фактором. Применяется в случае доминирующего влияния на результат лишь одного фактора, остальные факторы оказывают на результат несущественное влияние. Модель парной регрессии имеет вид: .
Множественная корреляционно-регрессионная модель применяется, когда необходимо изучить влияние на результативный признак не одного, а нескольких факторных признаков. Множественная модель регрессии имеет вид:
2.4.1 Парная регрессия. Парная корреляция Если предполагается, что величина результативного признака сложилась, в основном, под влиянием лишь одного факторного признака, при исследовании взаимосвязей между ними используют парную модель функции регрессии.
(28)
Для того чтобы, построить парную корреляционно-регрессионную модель необходимо решить следующие задачи:
1. отбор фактора,
2. спецификация модели (выбор вида функции регрессии).
Отбор фактора в модель парной регрессии Фактор, который будет использован в парной модели, должен отвечать следующим требованиям: его влияние на результат должно быть таким, что влиянием всех остальных факторов можно пренебречь, но он не должен находиться в функциональной зависимости с результатом.
Число наблюдений фактора должно превышать число параметров при переменной в 6−7 раз. Так для модели вида необходимо не менее 6−7 наблюдений, а для модели потребуется не менее 12−14 наблюдений.
Спецификация модели парной регрессии В парной регрессии используют линейные и нелинейные функции:
— линейная функция
— полином второй степени
— полином третьей степени и т. д.
— равносторонняя гипербола
— степенная функция
— показательная функция и т. д.
Выбор вида функции в модели парной регрессии может быть осуществлен следующими методами:
Графический метод. В его основу положено построение и исследование графика «корреляционное поле», на основании которого делается вывод о виде функции описывающей взаимосвязь между явлениями.
Аналитический метод. Опирается на изучение природы взаимосвязи между исследуемыми явлениями.
Экспериментальный метод. Вид функции подбирается экспериментально через анализ качества подбора функции, путем сравнения остаточной дисперсии рассчитанной для разных моделей.
2.4.1.1 Парная линейная регрессия Парная линейная регрессия наиболее часто применяется в регрессионных моделях, в силу простоты расчета и интерпретирования результатов.
Расчет регрессионной модели данного вида заключается в нахождении уравнения вида:
(29)
или (30)
где;
— теоретическое значение результативного признака, рассчитанное по уравнению регрессии, показывающему взаимосвязь между и.
— фактическое значение результативного признака.
— случайная величина (возмущение, шум)
(31)
Показывает влияние не учтенных в модели факторов, а также случайных ошибок.
— параметры уравнения.
Решение уравнения регрессии заключается в расчете его параметров. Наибольшее распространение из методов расчета параметров уравнения получил метод наименьших квадратов (МНК). МНК позволяет получать такие значения, которые минимизируют сумму квадратов отклонений фактических значений от теоретических .
(32)
При расчете параметров уравнения при помощи МНК необходимо решить систему из двух нормальных уравнений.
(33)
Также используют и готовые уравнения.
Для расчета параметра :
; так как получим:
или (34)
где: (35)
(36)
Для расчета параметра :
(37)
Параметр — это теоретическое значение результативного признака при и только в этом случае имеет экономический смысл, если параметр экономического смысла не имеет. В геометрическом представлении означает координату точки пересечения линии регрессии с осью ординат.
Параметр называется коэффициентом регрессии. Коэффициент регрессии показывает, на сколько единиц, в среднем изменится результативный признак, если факторный признак увеличится на одну единицу. Например, если уравнение регрессии имеет вид:
где прибыль млн. руб. в месяц, а затраты на маркетинг тыс. руб. в месяц. Можно сказать, что при дополнительных затратах на маркетинг на 1 тыс. руб. прибыль в среднем возрастет на 0,02 млн руб.
Геометрически это тангенс угла наклона прямой регрессии .
Пример 7. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 21).
Построить линейное уравнение регрессии.
Таблица 21.
№ | |||
37,8 | 0,3 | ||
38,0 | 0,5 | ||
39,0 | 0,7 | ||
37,5 | 0,8 | ||
39,5 | 0,9 | ||
36,8 | 1,1 | ||
40,0 | 1,3 | ||
40,1 | 1,6 | ||
40,0 | 1,7 | ||
39,0 | 2,2 | ||
38,0 | 2,5 | ||
41,0 | 2,6 | ||
41,6 | 2,7 | ||
41,0 | 3,0 | ||
41,9 | 3,2 | ||
Решение. Для расчета параметров уравнения регрессии используем МНК. МНК в данном случае дает систему уравнений:
1. Рассчитаем, в таблице 22, все возможные значения и подставим в систему.
После подстановки данных получим систему:
1) Решим систему методом исключения параметра. Для этого первое уравнение разделим на 15, а второе на 25,10.
Далее из второго уравнения вычтем первое Рассчитаем коэффициент регрессии:
.
Подставим значение в первое уравнение системы и рассчитаем параметр .
Таблица 22
№ | ||||||
37,80 | 0,30 | 0,09 | 11,34 | 37,792 344 | ||
38,00 | 0,50 | 0,25 | 19,00 | 38,28 410 | ||
39,00 | 0,70 | 0,49 | 27,30 | 38,264 476 | ||
37,50 | 0,80 | 0,64 | 30,00 | 38,382 510 | ||
39,50 | 0,90 | 0,81 | 35,55 | 38,500 543 | ||
36,80 | 1,10 | 1,21 | 40,48 | 38,736 609 | ||
40,00 | 1,30 | 1,69 | 52,00 | 38,972 676 | ||
40,10 | 1,60 | 2,56 | 64,16 | 39,326 775 | ||
40,00 | 1,70 | 2,89 | 68,00 | 39,444 808 | ||
39,00 | 2,20 | 4,84 | 85,80 | 40,34 974 | ||
38,00 | 2,50 | 6,25 | 95,00 | 40,389 074 | ||
41,00 | 2,60 | 6,76 | 106,60 | 40,507 107 | ||
41,60 | 2,70 | 7,29 | 112,32 | 40,625 140 | ||
41,00 | 3,00 | 9,00 | 123,00 | 40,979 240 | ||
41,90 | 3,20 | 10,24 | 134,08 | 41,215 306 | ||
Сумма | 591,20 | 25,10 | 55,01 | 1004,63 | 591,199 993 | |
В среднем | 39,413 333 | 1,673 333 | 3,667 333 | 66,975 333 | ||
1,518 713 | 0,931 283 | 3,327 158 | 38,874 862 | |||
2,306 489 | 0,867 289 | 11,69 980 | 1511,254 918 | |||
2. Рассчитаем параметры уравнения, используя готовые уравнения.
Небольшие расхождения в расчете параметров разными методами объясняются ошибками округления.
Подставим полученные значения (возьмем значения полученные в Microsoft Excel, как наиболее точные. см. далее) в уравнение регрессии .
Коэффициент парной линейной регрессии показывает, что при увеличении фактора — «затраты на рекламу» на 1 единицу (1 млн руб.), результат — «средняя прибыль» увеличится, в среднем на 1,180 332 млн руб.
Далее подставляя значения фактора в уравнение регрессии, рассчитаем теоретические значения, занесем их в последний столбик таблицы 22.
2) Рассмотрим решение данной задачи в Microsoft Excel.
Первое. В новой книге Microsoft Excel внесем исходные данные (рис 1).
Рисунок 1.
Далее нажимаем кнопку Сервис и в открывшейся панели нажимаем кнопку Анализ данных.
В панели Анализ данных нажимаем Регрессия:
В панели регрессия вводим входной интервал, выделяя столбик, содержащий данные результативного признака, и входной интервал, выделяя столбик, содержащий данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис 2).
Рисунок 2.
Нажимаем ОК. Появится таблица, содержащая результаты регрессионного анализа (рис 3).
Рисунок 3.
Параметр в данной таблице находится на пересечении столбика «Коэффициенты» и строки «Y-пересечение», параметр — на пересечении столбика «Коэффициенты» и строки «Переменная Х1».
2.4.1.2 Парная линейная корреляция Простейшим методом определения наличия и формы взаимосвязи является построения корреляционной таблицы и графика «корреляционное поле».
Корреляционная таблица — таблица, в которой записываются частоты сочетаний результативного и факторного показателей. В настоящее время корреляционная таблица не используется для вычисления уравнения связи.
Пример 8. Имеются данные о себестоимости единицы продукции (руб.) и затратах на рекламу (млн. руб.) (табл. 23).
Таблица 23.
Составим корреляционную таблицу (табл. 24).
Таблица 24.
y x | Итого | |||||
Итого | ||||||
По корреляционной таблице можно сделать следующие выводы. Если и распложены по возрастанию, то расположение частот около диагонали таблицы слева вниз направо говорит о прямой форме связи, если по диагонали вверх направо, то связь обратная. Если частоты находятся равномерно по всей таблицы — связь слабая.
Корреляционное поле (графический метод изучения взаимосвязей) — точечный график, характеризующий единицу наблюдения по двум признакам. Факторный признак откладывается по оси абсцисс, результативный признак по оси ординат.
По данным примера 8 построим корреляционное поле (рис. 4).
Рисунок 4
Анализ корреляционного поля показывает, что имеется прямая связь.
Если связь между признаками обратная, то корреляционное поле будет иметь примерно такой вид (рис. 5).
Рисунок 5
Если корреляционное поле имеет следующий вид (рис. 6) можно сделать вывод об отсутствии выраженной взаимосвязи.
Рисунок 6
Корреляционная таблица и корреляционное поле показывают лишь наличие, отсутствие и направление связи. Но они не дают представления о тесноте, интенсивности связи между признаками.
Тесноту связи в парной линейной модели определяют, рассчитывая линейный коэффициент парной корреляции или просто коэффициент корреляции. Существуют формулы расчета:
(38)
или (39)
где: — коэффициент регрессии;
— среднее квадратическое значение факторного признака;
— среднее квадратическое значение результативного признака;
(40)
где — сумма квадратов отклонений обусловленная влиянием фактора ;
— общая сумма квадратов отклонений признака .
Коэффициент корреляции также можно рассчитать через значение признаков в стандартизованном масштабе:
(41)
где: — значения признаков в стандартизованном масштабе.
(42)
(43)
Коэффициент корреляции может принимать значения от до. В статистике говорят, что если значения коэффициента парной корреляции:
меньше 0,3 (-0,3)? связь положительная (отрицательная) слабая;
от 0,3 до 0,7 (от -0,3 до -0,7)? связь положительная (отрицательная) средняя;
свыше 0,7 (-0,7) связь положительная (отрицательная) сильная;
равен 1 (-1) связь функциональная положительная (отрицательная);
равен 0 — связь отсутствует.
Другой показатель тесноты связи — коэффициент парной детерминации. Он показывает часть вариации результативного признака, которая сложилась под влиянием включенного в парную модель фактора. Коэффициент парной детерминации рассчитывают, возводя в квадрат коэффициент парной корреляции или по формуле:
(44)
Коэффициент парной детерминации позволяет определять тесноту связи не только в линейных, но и в нелинейных моделях.
Коэффициент парной детерминации может принимать значения от до .
Пример 9. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли (табл. 25).
Таблица 25.
№ | |||
37,80 | 0,30 | ||
38,00 | 0,50 | ||
39,00 | 0,70 | ||
37,50 | 0,80 | ||
39,50 | 0,90 | ||
36,80 | 1,10 | ||
40,00 | 1,30 | ||
40,10 | 1,60 | ||
40,00 | 1,70 | ||
39,00 | 2,20 | ||
38,00 | 2,50 | ||
41,00 | 2,60 | ||
41,60 | 2,70 | ||
41,00 | 3,00 | ||
41,90 | 3,20 | ||
Сумма | 591,20 | 25,10 | |
В среднем | 39,413 333 | 1,673 333 | |
1,518 713 | 0,931 283 | ||
Рассчитать коэффициент парной линейной корреляции и коэффициент парной линейной регрессии .
Решение.
1) Так, как из примера 7 известно, что уравнение регрессии используем формулу:
Коэффициент парной корреляции показывает, что между исследуемыми признаками существует тесная положительная связь.
Возведя коэффициент корреляции в квадрат, получим коэффициент детерминации.
Коэффициент детерминации показывает, что 52% от всей вариации результативного признака обусловлено влиянием включенного в модель фактора, а 48% вариации вызвано влиянием всех остальных, не исследуемых в данной модели факторами.
2) Рассмотрим решение данной задачи в Microsoft Excel.
В новой книге Microsoft Excel внесем исходные данные (рис 7).
Далее нажимаем кнопку Сервис и в открывшийся панели нажимаем кнопку Анализ данных В панели Анализ данных нажимаем корреляция:
В панели корреляция вводим входной интервал, выделяя все столбики, содержащий и данные результативного признака и данные фактора. Ответ можно поместить на новом рабочем листе, в новой рабочей книге, или на листе, содержащем условия выбирая выходной интервал, для чего указываем графа-клетку начала размещения ответа (рис. 7).
Рисунок 7.
Нажимаем ОК.
Появится таблица парных линейных коэффициентов корреляции (рис. 8).
Рисунок 8.
На пересечении столбца 1 и столбца 2 и будет искомый коэффициент парной линейной корреляции.
2.4.1.3 Оценка надежности уравнения парной линейной регрессии, его параметров и коэффициента парной линейной корреляции Результаты корреляционно-регрессионного анализа необходимо проверить, проведя оценку существенности, как уравнения регрессии, так и его параметров и коэффициента корреляции.
Оценка существенности уравнения регрессии в целом проводится с помощью критерия Фишера — F-критерия.
При этом исходят из представления, что если между изучаемыми признаками и есть связь и уравнение парной линейной регрессии эту связь отражает, то вариация результативного признака, обусловленная влиянием факторного признака (факторная вариация) должна быть в несколько раз больше, чем вариация результативного признака, вызванная всеми другими факторами (остаточная вариация).
Для этого вначале проводят исследование дисперсии.
Общую сумму квадратов отклонений раскладывают на две части — «факторную» и «остаточную».
(45)
где: — общая сумма квадратов отклонений;
— факторная сумма квадратов отклонений;
— остаточная сумма квадратов отклонений.
Разделив каждую сумму квадратов отклонений на соответствующее число степеней свободы (для общей суммы, для факторной и для остаточной) получим дисперсию на одну степень свободы — .
(46)
(47)
(48)
Для расчета F-критерия сопоставим факторную и остаточную дисперсию;
(49)
Также F-критерий можно рассчитать по формуле:
(50)
Оценку существенности уравнения регрессии проводят, сравнивая полученное значение F-критерия () с табличным значением (), которое берут из таблиц критических значений F-отношений при определенном уровне значимости, как правило: или, и числе свободы:, (таблицы Снедекора-Фишера — приложение 2).
Если то уравнение регрессии значимо, если меньше незначимо.
Значимость параметров уравнения и коэффициента корреляции проверяют при помощи критерия Стьюдента — t-критерия.
Критерий Стьюдента для коэффициента регрессии рассчитывается как;
(51)
где; - коэффициент регрессии.
— стандартная ошибка коэффициента регрессии, рассчитывается как:
(52)
Учитывая, что
(53)
Критерий Стьюдента для параметра рассчитывается как;
(54)
где: — свободный член уравнения регрессии.
— стандартная ошибка параметра, рассчитывается как:
(55)
или (56)
Критерий Стьюдента для коэффициента корреляции рассчитывается как;
(57)
или (58)
где: — коэффициент парной линейной корреляции.
— стандартная ошибка коэффициента корреляции, рассчитывается как:
(59)
Кроме того, для парной линейной регрессии верно, что:
(60)
Полученные фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости, или, и числе степеней свободы (приложение 1), где — число единиц наблюдения, — число параметров уравнения регрессии. Если фактическое значение больше табличного соответствующий коэффициент статистически значим.
Пример 10. По данным примера 7 и примера 9 провести оценку существенности полученного уравнения регрессии, его параметров, и коэффициента корреляции .
Решение.
1. Оценка статистической значимости функции регрессии проводится при помощи критерия Фишера — F-критерия.
Рассчитаем для парной линейной регрессии. Расчет проведем по формуле:
Далее фактическое значение необходимо сравнить с табличным значением. Табличное значение берется из таблиц значения Фишера при разных уровнях значимости (приложение 2). При и числе степеней свободы, ,. Так как, можно сказать, что уравнение регрессии статистически значимо.
2. Оценка статистической значимости параметров уравнения регрессии и коэффициента парной линейной корреляции проводится при помощи критерия Стьюдента — t-критерия.
Для расчета критерия Стьюдента составим таблицу 26.
Таблица 26
№ | |||||||
37,80 | 0,30 | 0,09 | 37,792 344 | 0,59 | 1,886 044 | ||
38,00 | 0,50 | 0,25 | 38,28 410 | 0,807 | 1,376 710 | ||
39,00 | 0,70 | 0,49 | 38,264 476 | 0,540 996 | 0,947 377 | ||
37,50 | 0,80 | 0,64 | 38,382 510 | 0,778 824 | 0,762 711 | ||
39,50 | 0,90 | 0,81 | 38,500 543 | 0,998 914 | 0,598 044 | ||
36,80 | 1,10 | 1,21 | 38,736 609 | 3,750 454 | 0,328 711 | ||
40,00 | 1,30 | 1,69 | 38,972 676 | 1,55 395 | 0,139 378 | ||
40,10 | 1,60 | 2,56 | 39,326 775 | 0,597 877 | 0,5 378 | ||
40,00 | 1,70 | 2,89 | 39,444 808 | 0,308 238 | 0,711 | ||
39,00 | 2,20 | 4,84 | 40,34 974 | 1,71 171 | 0,277 378 | ||
38,00 | 2,50 | 6,25 | 40,389 074 | 5,707 675 | 0,683 378 | ||
41,00 | 2,60 | 6,76 | 40,507 107 | 0,242 944 | 0,858 712 | ||
41,60 | 2,70 | 7,29 | 40,625 140 | 0,950 352 | 1,54 045 | ||
41,00 | 3,00 | 9,00 | 40,979 240 | 0,431 | 1,760 045 | ||
41,90 | 3,20 | 10,24 | 41,215 306 | 0,468 806 | 2,330 712 | ||
Сумма | 591,20 | 25,10 | 55,01 | 591,199 992 | 16,472 942 | 13,9 333 | |
В среднем | 1,673 333 | ||||||
Фактически критерий Стьюдента для коэффициента регрессии рассчитывается как;
.
Значение стандартных ошибок, можно взять из результатов регрессионного анализа в Microsoft Excel — рисунок 3, столбец — стандартная ошибка.
Фактический критерий Стьюдента для свободного члена уравнение регрессии рассчитывается как:
.
.
Фактически критерий Стьюдента для коэффициента корреляции рассчитывается как;
Также верно, что
Полученные фактические критерии Стьюдента с табличным значением (приложение 1) при определенном уровне значимости и числе степеней свободы. Если фактические значения t-критерия превышают табличные можно принять, что соответствующее расчетное значение статистически значимо.
Для данного примера табличное значение, при и составит. Все фактические значения t-критерия превышают табличные. Можно сделать вывод о статистической значимости параметров уравнения регрессии и коэффициента парной линейной корреляции для парной линейной регрессии выраженной уравнением .
2) Расчет фактического критерия Фишера и критерия Стьюдента в Microsoft Excel.
Фактические значения критериев Фишера и Стьюдента представлены в итоговой таблице, содержащей результаты регрессионного анализа — пример 7, рис. 3.
Критерий Фишера расчетный обозначен в столбике F дисперсионного анализа, t-критерии для параметров уравнения в столбике t-статистика.
2.4.1.4 Парная нелинейная регрессия Естественно, что кроме линейных взаимосвязей между явлениями природы, и тем более общественного мира существуют связи нелинейные. Соответственно изучать нелинейные связи при помощи линейной регрессии было бы не верно, для этого необходимо использовать нелинейные регрессии.
Но использование нелинейных регрессий связанно следующим ограничением — так как, параметры уравнения регрессии находят при помощи МНК, решая систему нормальных уравнений, а этот метод позволяет оценивать параметры или линейных уравнений или уравнений приводимых к линейному виду, то выбор нелинейных регрессий ограничен — должна существовать возможность линеаризации данных функций.
Регрессии, приводимые к линейному виду, подразделяют на два класса:
I. нелинейные относительно включенного в модель фактора (независимой переменной), но линейны относительно результата (зависимой переменной).
К первому классу относятся такие функции как, например:
полиномы разных степеней;
— полином второй степени
— полином третьей степени и т. д.
равносторонняя гипербола: .
II. нелинейные относительно включенного в модель результата, но линейны относительно фактора.
Ко второму классу относятся такие функции как, например:
степенная функция: .
показательная: .
экспоненциальная: .
Рассмотрим линеаризацию наиболее часто применяемых функций.
Линеаризация полиномов разных степеней Проводится следующим образом.
В параболе второй степени,
(61)
заменяя переменные, получим двухфакторное линейное уравнение регрессии:
(62)
В параболе третьей степени,
(64)
заменяя переменные, получим трехфакторное линейное уравнение регрессии:
(65)
Аналогичным образом поступим с полиномами более высоких порядков.
Из полиномов наибольшее распространение получила парабола второго порядка.
МНК для оценки параметров функция регрессии по линеаризованной параболе второго порядка дает следующую систему уравнений:
(66)
Пример 11. Имеются данные о средней прибыли (млн. руб.) и затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятиях сферы торговли. Рассчитать функцию регрессии параболы второго порядка
Таблица 27
№ | |||
37,8 | 0,3 | ||
38,0 | 0,5 | ||
39,0 | 0,7 | ||
37,5 | 0,8 | ||
39,5 | 0,9 | ||
36,8 | 1,1 | ||
40,0 | 1,3 | ||
40,1 | 1,6 | ||
40,0 | 1,7 | ||
39,0 | 2,2 | ||
38,0 | 2,5 | ||
41,0 | 2,6 | ||
41,6 | 2,7 | ||
41,0 | 3,0 | ||
41,9 | 3,2 | ||
Решение. МНК для расчета параметров параболы второго порядка дает систему уравнений:
В таблице 28 рассчитаем все возможные значения:
Таблица 28
№ | |||||||||
37,80 | 0,30 | 0,09 | 0,027 | 0,0081 | 11,34 | 3,402 | 38,23 560 | ||
38,00 | 0,50 | 0,25 | 0,125 | 0,0625 | 19,00 | 9,500 | 38,158 005 | ||
39,00 | 0,70 | 0,49 | 0,343 | 0,2401 | 27,30 | 19,110 | 38,307 508 | ||
37,50 | 0,80 | 0,64 | 0,512 | 0,4096 | 30,00 | 24,000 | 38,387 907 | ||
39,50 | 0,90 | 0,81 | 0,729 | 0,6561 | 35,55 | 31,995 | 38,472 071 | ||
36,80 | 1,10 | 1,21 | 1,331 | 1,4641 | 40,48 | 44,528 | 38,651 694 | ||
40,00 | 1,30 | 1,69 | 2,197 | 2,8561 | 52,00 | 67,600 | 38,846 375 | ||
40,10 | 1,60 | 2,56 | 4,096 | 6,5536 | 64,16 | 102,656 | 39,166 634 | ||
40,00 | 1,70 | 2,89 | 4,913 | 8,3521 | 68,00 | 115,600 | 39,280 917 | ||
39,00 | 2,20 | 4,84 | 10,648 | 23,4256 | 85,80 | 188,760 | 39,908 803 | ||
38,00 | 2,50 | 6,25 | 15,625 | 39,0625 | 95,00 | 237,500 | 40,330 713 | ||
41,00 | 2,60 | 6,76 | 17,576 | 45,6976 | 106,60 | 277,160 | 40,478 879 | ||
41,60 | 2,70 | 7,29 | 19,683 | 53,1441 | 112,32 | 303,264 | 40,630 810 | ||
41,00 | 3,00 | 9,00 | 27,000 | 81,0000 | 123,00 | 369,000 | 41,109 192 | ||
41,90 | 3,20 | 10,24 | 32,768 | 104,8576 | 134,08 | 429,056 | 41,446 938 | ||
Итого | 591,20 | 25,10 | 55,01 | 137,573 | 367,7897 | 1004,63 | 2223,131 | 591,200 005 | |
Подставим эти значения в систему уравнений.
Разделим каждое из уравнений системы на число при, первое на 15, второе на 25,01 и третье на 55,01.
Далее вычтем из 5-го уравнения 4-е, и из 6-го уравнения 5-е. система примет вид:
Разделим каждое уравнение на число при, 7-е на 0,5183, а 8-е на 0,30 924
Вычтем из 10-го уравнения 9-е Значение параметра
Подставим значение параметра в уравнение (9) и найдем значение параметра
Подставим значение параметров в уравнение (1) и найдем значение параметра
Подставим параметры в уравнение Подставляя в полученное уравнение и рассчитаем теоретические значения, занесем их в последний столбик таблицы.
Линеаризацию равносторонней гиперболы
(67)
проводят, заменяя на, в результате получим уравнение линейной регрессии:
(68)
МНК для оценки параметров функция регрессии по линеаризованной равносторонней гиперболе дает следующую систему уравнений:
(69)
Также можно использовать уравнения:
(70)
(71)
Пример 12. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать функцию регрессии равносторонней гиперболы
Таблица 29
№ | |||
37,8 | 0,3 | ||
38,0 | 0,5 | ||
39,0 | 0,7 | ||
37,5 | 0,8 | ||
39,5 | 0,9 | ||
36,8 | 1,1 | ||
40,0 | 1,3 | ||
40,1 | 1,6 | ||
40,0 | 1,7 | ||
39,0 | 2,2 | ||
38,0 | 2,5 | ||
41,0 | 2,6 | ||
41,6 | 2,7 | ||
41,0 | 3,0 | ||
41,9 | 3,2 | ||
МНК для оценки параметров функция регрессии по линеаризованной равносторонней гиперболе дает следующую систему уравнений:
В таблице 30 рассчитаем все возможные значения:
Таблица 30
№ | |||||||
37,80 | 0,30 | 3,333 333 | 126,0 | 11,111 111 | 36,808 395 | ||
38,00 | 0,50 | 2,0 | 76,0 | 4,0 | 38,266 516 | ||
39,00 | 0,70 | 1,428 571 | 55,714 286 | 2,40 816 | 38,891 425 | ||
37,50 | 0,80 | 1,250 000 | 46,875 000 | 1,562 500 | 39,86 709 | ||
39,50 | 0,90 | 1,111 111 | 43,888 889 | 1,234 568 | 39,238 597 | ||
36,80 | 1,10 | 0,909 091 | 33,454 545 | 0,826 446 | 39,459 524 | ||
40,00 | 1,30 | 0,769 231 | 30,769 231 | 0,591 716 | 39,612 474 | ||
40,10 | 1,60 | 0,625 000 | 25,62 500 | 0,390 625 | 39,770 204 | ||
40,00 | 1,70 | 0,588 235 | 23,529 412 | 0,346 021 | 39,810 409 | ||
39,00 | 2,20 | 0,454 545 | 17,727 273 | 0,206 612 | 39,956 611 | ||
38,00 | 2,50 | 0,400 000 | 15,200 000 | 0,160 000 | 40,16 262 | ||
41,00 | 2,60 | 0,384 615 | 15,769 231 | 0,147 929 | 40,33 086 | ||
41,60 | 2,70 | 0,370 370 | 15,407 407 | 0,137 174 | 40,48 664 | ||
41,00 | 3,00 | 0,333 333 | 13,666 667 | 0,111 111 | 40,89 168 | ||
41,90 | 3,20 | 0,312 500 | 13,93 750 | 0,97 656 | 40,111 951 | ||
Итого | 591,20 | 25,10 | 14,269 937 | 552,158 190 | 22,964 285 | 591,199 995 | |
Подставим полученные значения в систему уравнений Разделим первое уравнение на 15, а второе на 14,269 937
Вычтем из второго уравнения первое Подставим значение параметра в первое уравнение и рассчитаем параметр
Уравнение регрессии примет вид Подставляя в полученное уравнение регрессии значение, рассчитаем .
Линеаризацию степенной функции
(72)
проводят путем логарифмирования обеих частей уравнения, получая уравнение вида:
(73)
Обозначив через, получим линейное уравнение регрессии:
(74)
МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:
(75)
Также можно использовать уравнения:
(76)
(77)
Рассчитав параметры, и составив линейное уравнение регрессии необходимо провести его потенцирование, что бы вернуться к степенной функции.
(78)
Пример 13. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать степенную функцию
Таблица 31.
№ | |||
37,8 | 0,3 | ||
38,0 | 0,5 | ||
39,0 | 0,7 | ||
37,5 | 0,8 | ||
39,5 | 0,9 | ||
36,8 | 1,1 | ||
40,0 | 1,3 | ||
40,1 | 1,6 | ||
40,0 | 1,7 | ||
39,0 | 2,2 | ||
38,0 | 2,5 | ||
41,0 | 2,6 | ||
41,6 | 2,7 | ||
41,0 | 3,0 | ||
41,9 | 3,2 | ||
Решение. Для расчета параметров данной функции проведем ее линеаризацию, прологарифмировав обе части уравнения
Обозначив через, получим линейное уравнение регрессии:
МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:
В таблице 32 рассчитаем все возможные значения:
Таблица 32
№ | |||||||
37,80 | 0,30 | 1,577 492 | — 0,522 879 | — 0,824 837 | 37,183 851 | ||
38,00 | 0,50 | 1,579 784 | — 0,301 030 | — 0,475 562 | 37,910 774 | ||
39,00 | 0,70 | 1,591 065 | — 0,154 902 | — 0,246 459 | 38,397 333 | ||
37,50 | 0,80 | 1,574 031 | — 0,96 910 | — 0,152 539 | 38,592 153 | ||
39,50 | 0,90 | 1,596 597 | — 0,45 757 | — 0,73 056 | 38,764 817 | ||
36,80 | 1,10 | 1,565 848 | 0,41 393 | 0,64 815 | 39,60 772 | ||
40,00 | 1,30 | 1,602 060 | 0,113 943 | 0,182 544 | 39,308 870 | ||
40,10 | 1,60 | 1,603 144 | 0,204 120 | 0,327 234 | 39,619 441 | ||
40,00 | 1,70 | 1,602 060 | 0,230 449 | 0,369 193 | 39,710 581 | ||
39,00 | 2,20 | 1,591 065 | 0,342 423 | 0,544 817 | 40,100 534 | ||
38,00 | 2,50 | 1,579 784 | 0,397 940 | 0,628 659 | 40,295 293 | ||
41,00 | 2,60 | 1,612 784 | 0,414 973 | 0,669 262 | 40,355 237 | ||
41,60 | 2,70 | 1,619 093 | 0,431 364 | 0,698 418 | 40,413 002 | ||
41,00 | 3,00 | 1,612 784 | 0,477 121 | 0,769 493 | 40,574 705 | ||
41,90 | 3,20 | 1,622 214 | 0,505 150 | 0,819 461 | 40,674 075 | ||
Итого | 591,20 | 25,10 | 23,929 804 | 2,37 398 | 3,301 443 | 590,961 438 | |
В среднем | 1,595 320 | 0,135 827 | 0,220 096 | ||||
0,89 930 | |||||||
Подставим полученные значения в уравнение Выполним потенцирование полученного уравнения Подставляя в полученное уравнение значение фактора, рассчитаем .
Линеаризацию показательной функции Показательная функция
(79)
также проводят путем логарифмирования обеих частей уравнения:
(80)
Обозначив через, получим линейное уравнение регрессии:
(81)
МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:
(82)
Также можно использовать уравнения:
(83)
(84)
Рассчитав параметры, и составив линейное уравнение регрессии необходимо провести его потенцирование, что бы вернуться к показательной функции.
(85)
Пример 14. Имеются данные о средней прибыли (млн. руб.) и затратах на затратах на рекламу (млн. руб.) за декаду, по выборке, равной 15-ти предприятий сферы торговли. Рассчитать показательную функцию
Таблица 33
№ | |||
37,8 | 0,3 | ||
38,0 | 0,5 | ||
39,0 | 0,7 | ||
37,5 | 0,8 | ||
39,5 | 0,9 | ||
36,8 | 1,1 | ||
40,0 | 1,3 | ||
40,1 | 1,6 | ||
40,0 | 1,7 | ||
39,0 | 2,2 | ||
38,0 | 2,5 | ||
41,0 | 2,6 | ||
41,6 | 2,7 | ||
41,0 | 3,0 | ||
41,9 | 3,2 | ||
Решение. Для расчета параметров данной функции проведем ее линеаризацию, прологарифмировав обе части уравнения Обозначив через, получим линейное уравнение регрессии:
МНК для оценки параметров функция регрессии по линеаризованной степенной функции дает следующую систему уравнений:
В таблице 34 рассчитаем все возможные значения:
Таблица 34
№ | ||||||
37,80 | 0,30 | 1,577 492 | 0,473 248 | 37,806 262 | ||
38,00 | 0,50 | 1,579 784 | 0,789 892 | 38,32 035 | ||
39,00 | 0,70 | 1,591 065 | 1,113 745 | 38,259 157 | ||
37,50 | 0,80 | 1,574 031 | 1,259 225 | 38,373 226 | ||
39,50 | 0,90 | 1,596 597 | 1,436 937 | 38,487 635 | ||
36,80 | 1,10 | 1,565 848 | 1,722 433 | 38,717 477 | ||
40,00 | 1,30 | 1,602 060 | 2,82 678 | 38,948 692 | ||
40,10 | 1,60 | 1,603 144 | 2,565 031 | 39,298 106 | ||
40,00 | 1,70 | 1,602 060 | 2,723 502 | 39,415 272 | ||
39,00 | 2,20 | 1,591 065 | 3,500 342 | 40,6 365 | ||
38,00 | 2,50 | 1,579 784 | 3,949 459 | 40,365 268 | ||
41,00 | 2,60 | 1,612 784 | 4,193 238 | 40,485 616 | ||
41,60 | 2,70 | 1,619 093 | 4,371 552 | 40,606 323 | ||
41,00 | 3,00 | 1,612 784 | 4,838 352 | 40,970 608 | ||
41,90 | 3,20 | 1,622 214 | 5,191 085 | 41,215 278 | ||
Итого | 591,20 | 25,10 | 23,929 804 | 40,210 718 | 590,987 319 | |
В среднем | 1,673 333 | 1,595 320 | 2,680 715 | |||
0,867 289 | ||||||
Получили линеаризованное уравнение Произведем потенцирование линейного уравнения для возврата к показательной функции.
Подставим в полученное уравнение значения фактора, рассчитаем значения .
2.4.1.5 Коэффициенты эластичности в парных моделях Коэффициенты регрессии выражены в натуральных единицах, то есть являются именованными величинами, поэтому коэффициенты регрессии, выраженные в разных единицах несопоставимы между собой. Для сопоставления разноименных коэффициентов корреляции линейных и нелинейных моделей удобно использовать коэффициент эластичности.
(86)
где:
— первая производная функции регрессии для соответствующей формы связи.
Так как коэффициент эластичности не всегда величина постоянная, а часто зависит от значения, обычно рассчитывают средний коэффициент эластичности.
(87)
Коэффициент средней эластичности для некоторых функций рассчитывается как:
уравнения прямой :
(88)
парабола второго порядка
уравнение равносторонней гиперболы :
(89)
степенного уравнения :
(90)
показательного уравнения :
(91)
Коэффициент средней эластичности показывает, на сколько процентов в среднем изменится результативный признак, если факторный признак увеличится на один процент.
Коэффициент средней эластичности позволяет ранжировать факторы по силе влияния на результат, чем больше коэффициент дляго фактора, тем сильнее данный фактор влияет на результат.
Пример 15. Исходя из рассчитанных уравнений регрессии (табл. 35) рассчитать коэффициенты средней эластичности для линейной функции, полинома второй степени, равносторонней гиперболы, степенной и показательной функций.
Таблица 35
Функция | Уравнение регрессии | ||
Линейная | 1,6713 | ||
Парабола второй степени | |||
Равносторонняя гипербола | |||
Степенная | |||
Показательная | |||
Рассчитать коэффициенты средней эластичности для каждого уравнения регрессии.
Решение.
1. Для линейной функции
2. Для полинома второй степени
3. Для равносторонней гиперболы
4. Для степенной функции
5. Для показательной функции
Пример 16. По группе предприятий, рассчитаны уравнения парной линейной регрессии, отражающие зависимость средней прибыли от уровня оплаты труда и затрат на маркетинг (табл. 36).
Таблица 36
Признак-фактор | Уравнение парной линейной регрессии | Среднее значение фактора | |
Уровень оплаты труда, | 62,4 | ||
Затраты на маркетинг, | 189,07 | ||
Используя коэффициенты средней эластичности определить степень влияния каждого из факторов.
Решение.
По формуле коэффициента средней эластичности для линейной функции рассчитаем данный коэффициент по каждому из факторов.
а) по фактору
б) по фактору
Исходя из рассчитанных коэффициентов средней эластичности, можно сказать, что фактор оказывает более сильное влияние на урожайность, чем фактор .
2.4.1.6 Парная нелинейная корреляция В нелинейных моделях для определения силы связи рассчитывают индекс корреляции:
(92)
где;
— остаточная дисперсия результативного признака.
— общая дисперсия результативного признака.
Отсюда: (93)
Величина индекса корреляции может принимать значения от до, то есть, он показывает только тесноту связи, но не показывает ее направление.
Квадрат индекса корреляции — индекс детерминации характеризует долю вариации результативного признака обусловленную влиянием включенного в модель фактора .
(94)
Величина индекса детерминации определяет качество подбора функции регрессии, чем индекс детерминации выше, тем «лучше» выбор формы уравнения регрессии.
Пример 17. По данным примера 12 (функция регрессии равносторонней гиперболы) рассчитать индекс корреляции, (табл. 37).
Решение.
1. Рассчитаем индекс корреляции Индекс множественной корреляции показывает, что между исследуемыми явлениями существует средняя связь.
Таблица 37
№ | |||||||
37,80 | 36,808 395 | — 1,6133 | 2,6027 | 0,9602 | 0,9220 | ||
38,00 | 38,266 516 | — 1,4133 | 1,9974 | — 0,2770 | 0,0767 | ||
39,00 | 38,891 425 | — 0,4133 | 0,1708 | 0,1071 | 0,0115 | ||
37,50 | 39,86 709 | 0,0867 | 0,0075 | 0,2649 | 0,0702 | ||
39,50 | 39,238 597 | — 1,9133 | 3,6607 | — 1,6938 | 2,8690 | ||
36,80 | 39,459 524 | — 2,6133 | 6,8293 | — 2,6529 | 7,0379 | ||
40,00 | 39,612 474 | 0,5867 | 0,3442 | 0,3964 | 0,1571 | ||
40,10 | 39,770 204 | 0,6867 | 0,4716 | 0,3409 | 0,1162 | ||
40,00 | 39,810 409 | 0,5867 | 0,3442 | 0,2013 | 0,0405 | ||
39,00 | 39,956 611 | — 0,4133 | 0,1708 | — 0,9428 | 0,8889 | ||
38,00 | 40,16 262 | — 1,4133 | 1,9974 | — 2,0016 | 4,0064 | ||
41,00 | 40,33 086 | 1,5867 | 2,5176 | 0,9984 | 0,9968 | ||
41,60 | 40,48 664 | 2,1867 | 4,7817 | 1,5664 | 2,4536 | ||
41,00 | 40,89 168 | 1,5867 | 2,5176 | 0,9265 | 0,8584 | ||
41,90 | 40,111 951 | 2,4867 | 6,1837 | 1,8040 | 3,2544 | ||
Сумма | 591,2000 | 34,5973 | 23,7596 | ||||
В среднем | 39,4133 | ||||||
Рассчитаем индекс детерминации Индекс детерминации показывает, что вариация результативного признака на 31% обусловлена влиянием включенного в модель фактора.
2.4.1.7 Оценка надежности параметров парной нелинейной регрессии и корреляции Как и в парной линейной регрессии, в регрессии нелинейной оценку надежности уравнения в целом проводят с помощью критерия Фишера, а оценку параметров уравнения и коэффициента детерминации проводят с помощью критерия Стьюдента.
Общая формула фактический F-критерия имеет вид;
(95)
где:
— индекс детерминации.
— число наблюдений.
— число параметров при переменных .
В случае нелинейной регрессии отлично для разных видов регрессии, и формула F-критерия различна для различных функций.
Например. Для степенной и показательной и:
(96)
Для параболы второго порядка и:
(97)
Для параболы третьего порядка и:
(98)
Как и в случае линейной регрессии, критерий Фишера фактический сравнивают с критерием Фишера табличным, при определенном уровне значимости или, и числе свободы —, (таблицы Снедекора-Фишера — приложение 2).
Значимость параметров уравнения парной нелинейной регрессии и индекса корреляции проверяется, аналогично парной линейной регрессии используя критерий Стьюдента (см. 2.3.1.3).
Критерий Стьюдента для коэффициента регрессии рассчитывается как;
(51)
где; - коэффициент регрессии.
— стандартная ошибка коэффициента регрессии, рассчитывается как:
(52)
Учитывая, что
(53)
Критерий Стьюдента для параметра рассчитывается как;
(54)
где: — свободный член уравнения регрессии.
— стандартная ошибка параметра, рассчитывается как:
(55)
или (56)
Критерий Стьюдента для индекса корреляции рассчитывается как;
(57)
или (58)
где: — индекс корреляции.
— стандартная ошибка индекса корреляции, рассчитывается как:
(59)
Качество подбора модели определяют, рассчитывая среднюю ошибку аппроксимации. Для расчета средней ошибки аппроксимации используют формулы:
(99)
(100)
где (101)
(102)
Чем меньше средняя ошибка аппроксимации, тем выше качество модели. Допустимый предел не более 10%.
Пример 18. Необходимо оценить существенность уравнения регрессии равносторонней гиперболы
при:
где: — индекс детерминации.
— число наблюдений.
Решение. Оценку существенности уравнения нелинейной регрессии проведем, используя критерий Фишера (F-критерий)
.
— число параметров при переменных .
Найдем критерий Фишера табличный, при уровне значимости, и числе свободы —, (таблицы Снедекора-Фишера — приложение 2) — .
Так как уравнение регрессии признаем статистически значимым.
Пример 19. По данным примеров 7; 11; 12; 13; 14 рассчитаем средние ошибки аппроксимации для линейной функции, функции параболы второй степени, равносторонней гиперболы, степенной и показательной функций.
Решение. Для расчета средней ошибки аппроксимации используем формулу:
где
Расчет произведем в таблице 38. Средние ошибки аппроксимации составили для:
линейной функции
параболы второго порядка
функции равносторонней гиперболы
степенной функции
показательной функции
Соответственно линейная функция наиболее качественно описывает существующую взаимосвязь между исследуемыми явлениями. Но все регрессии находятся в допустимых пределах (не более 10%).
Таблица 38
№ | Линейная | Парабола второго порядка | Гипербола | ||||||||
37,8 | 37,792 344 | 0,7 656 | 0,20 254 | 38,23 560 | 0,223 560 | 0,591 429 | 36,808 395 | 0,991 605 | 2,623 294 | ||
38,0 | 38,28 410 | 0,28 410 | 0,74 763 | 38,158 005 | 0,158 005 | 0,415 803 | 38,266 516 | 0,266 516 | 0,701 358 | ||
39,0 | 38,264 476 | 0,735 524 | 1,885 959 | 38,307 508 | 0,692 492 | 1,775 621 | 38,891 425 | 0,108 575 | 0,278 397 | ||
37,5 | 38,382 510 | 0,882 510 | 2,353 360 | 38,387 907 | 0,887 907 | 2,367 752 | 39,86 709 | 1,586 709 | 4,231 224 | ||
39,5 | 38,500 543 | 0,999 457 | 2,530 271 | 38,472 071 | 1,27 929 | 2,602 352 | 39,238 597 | 0,261 403 | 0,661 780 | ||
36,8 | 38,736 609 | 1,936 609 | 5,262 524 | 38,651 694 | 1,851 694 | 5,31 777 | 39,459 524 | 2,659 524 | 7,226 967 | ||
40,0 | 38,972 676 | 1,27 324 | 2,568 310 | 38,846 375 | 1,153 625 | 2,884 063 | 39,612 474 | 0,387 526 | 0,968 815 | ||
40,1 | 39,326 775 | 0,773 225 | 1,928 242 | 39,166 634 | 0,933 366 | 2,327 596 | 39,770 204 | 0,329 796 | 0,822 434 | ||
40,0 | 39,444 808 | 0,555 192 | 1,387 980 | 39,280 917 | 0,719 083 | 1,797 708 | 39,810 409 | 0,189 591 | 0,473 978 | ||
39,0 | 40,34 974 | 1,34 974 | 2,653 779 | 39,908 803 | 0,908 803 | 2,330 264 | 39,956 611 | 0,956 611 | 2,452 849 | ||
38,0 | 40,389 074 | 2,389 074 | 6,287 037 | 40,330 713 | 2,330 713 | 6,133 455 | 40,16 262 | 2,16 262 | 5,305 953 | ||
41,0 | 40,507 107 | 0,492 893 | 1,202 178 | 40,478 879 | 0,521 121 | 1,271 027 | 40,33 086 | 0,966 914 | 2,358 327 | ||
41,6 | 40,625 140 | 0,974 860 | 2,343 413 | 40,630 810 | 0,969 190 | 2,329 784 | 40,48 664 | 1,551 336 | 3,729 173 | ||
41,0 | 40,979 240 | 0,20 760 | 0,50 634 | 41,109 192 | 0,109 192 | 0,266 322 | 40,89 168 | 0,910 832 | 2,221 541 | ||
41,9 | 41,215 306 | 0,684 694 | 1,634 115 | 41,446 938 | 0,453 062 | 1,81 294 | 40,111 951 | 1,788 049 | 4,267 420 | ||
Итого | 591,2 | 32,182 820 | 33,206 244 | 38,323 509 | |||||||
В среднем | 2,145 521 | 2,213 750 | 2,554 901 | ||||||||
Продолжение табл. 38
№ | Степенная | Показательная | ||||||
37,8 | 37,183 851 | 0,616 149 | 1,630 024 | 37,806 262 | 0,6 262 | 0,16 566 | ||
38,0 | 37,910 774 | 0,89 226 | 0,234 805 | 38,32 035 | 0,32 035 | 0,84 303 | ||
39,0 | 38,397 333 | 0,602 667 | 1,545 300 | 38,259 157 | 0,740 843 | 1,899 597 | ||
37,5 | 38,592 153 | 1,92 153 | 2,912 408 | 38,373 226 | 0,873 226 | 2,328 603 | ||
39,5 | 38,764 817 | 0,735 183 | 1,861 223 | 38,487 635 | 1,12 365 | 2,562 949 | ||
36,8 | 39,60 772 | 2,260 772 | 6,143 402 | 38,717 477 | 1,917 477 | 5,210 535 | ||
40,0 | 39,308 870 | 0,691 130 | 1,727 825 | 38,948 692 | 1,51 308 | 2,628 270 | ||
40,1 | 39,619 441 | 0,480 559 | 1,198 401 | 39,298 106 | 0,801 894 | 1,999 736 | ||
40,0 | 39,710 581 | 0,289 419 | 0,723 548 | 39,415 272 | 0,584 728 | 1,461 820 | ||
39,0 | 40,100 534 | 1,100 534 | 2,821 882 | 40,6 365 | 1,6 365 | 2,580 423 | ||
38,0 | 40,295 293 | 2,295 293 | 6,40 245 | 40,365 268 | 2,365 268 | 6,224 389 | ||
41,0 | 40,355 237 | 0,644 763 | 1,572 593 | 40,485 616 | 0,514 384 | 1,254 595 | ||
41,6 | 40,413 002 | 1,186 998 | 2,853 361 | 40,606 323 | 0,993 677 | 2,388 647 | ||
41,0 | 40,574 705 | 0,425 295 | 1,37 305 | 40,970 608 | 0,29 392 | 0,71 688 | ||
41,9 | 40,674 075 | 1,225 925 | 2,925 835 | 41,215 278 | 0,684 722 | 1,634 181 | ||
Итого | 591,2 | 35,228 156 | 590,987 320 | 32,346 303 | ||||
В среднем | 2,348 544 | 2,156 420 | ||||||
2.4.1.8 Прогнозирование на основе парной модели регрессии Расчет доверительных интервалов для прогнозного значения, параметров уравнения регрессии и коэффициента (индекса) корреляции .
Парные модели регрессии позволяют прогнозировать значение результативного признака как точечный прогноз путем подстановки в уравнение регрессии соответствующего конкретного прогнозного значения .
Естественно, что полученное точечное значение рассчитанное для не может быть на 100% точным, поэтому необходим дополнительный расчет стандартной ошибки для функции регрессии и для индивидуальных значений зависимой переменной, и построение соответствующих интервалов которые с заданной вероятностью (- уровень значимости) накрывают неизвестное значение. Также доверительные интервалы рассчитываются для параметров уравнения регрессии и коэффициента (индекса) корреляции .
Расчет доверительного интервала для функции регрессии
Доверительный интервал для уравнения регрессии имеет вид:
(103)
где:
— предельная ошибка
(104)
— стандартная ошибка
(105)
— остаточное стандартное отклонение на одну степень свободы
(106)
— табличное значение критерия Стьюдента для числа степеней свободы и определенного уровня значимости .
Необходимо помнить, что прогноз значений результативного признака по уравнению регрессии тем точнее, чем значение фактора ближе к. Если же значение выходит за рамки обследованных значений результаты прогноза ухудшаются тем больше, чем больше разница между и .
Расчет доверительного интервала для индивидуальных значений результативного признака
При построение доверительного интервала для индивидуальных значений результативного признака, в отличие от доверительного интервала для функции регрессии необходимо учитывать вариацию вокруг линии регрессии. В результате стандартная ошибка индивидуальных значений при равна
(107)
Доверительный интервал примет вид:
(108)
где
— предельная ошибка
(109)
Точность интервала рассчитывают как отношение максимального значения интервала к минимальному значению
(110)
Чем меньше отношение, тем меньше интервал, то есть он более точен.
Расчет доверительных интервалов для параметров уравнения регрессии
Для свободного члена уравнения регрессии доверительный интервал имеет вид:
(111)
Где
— предельная ошибка
(112)
— стандартная ошибка
(55)
Для коэффициента регрессии доверительный интервал имеет вид:
(113)
где
— предельная ошибка
(114)
— стандартная ошибка
(52)
Пример 20. По данным примера 7 и примера 9, необходимо:
1. провести прогнозирование на основе парной линейной модели регрессии для индивидуального значения результативного признака при .
2. рассчитать доверительные интервалы для а) функции регрессии
б) индивидуального прогнозного значения, при
в) свободно члена уравнения регрессии
г) коэффициента регрессии
Решение.
1) Рассчитаем прогнозное значение результативного признака, подставив индивидуальное значение фактора в линейное уравнение регрессии
2) Рассчитаем доверительные интервалы
a) Доверительный интервал прогноза для функции регрессии рассчитаем как:
Где:
Для расчетов используем таблицу 39.
табличное значение критерия Стьюдента для числа степеней свободы и определенного уровня значимости .
Доверительный интервал прогноза показывает, что с вероятностью прогнозное значение средней прибыли по совокупности предприятий для конкретного значения фактора будет находиться в интервале от 35,187 403 до 41,223 517, не принимая нулевых значений, т. е. являются статистически значимыми.
Таблица 39
№ | |||||||
37,80 | 0,30 | 0,09 | 37,792 344 | 1,886 044 | 0,59 | ||
38,00 | 0,50 | 0,25 | 38,28 410 | 1,376 710 | 0,807 | ||
39,00 | 0,70 | 0,49 | 38,264 476 | 0,947 377 | 0,540 996 | ||
37,50 | 0,80 | 0,64 | 38,382 510 | 0,762 711 | 0,778 824 | ||
39,50 | 0,90 | 0,81 | 38,500 543 | 0,598 044 | 0,998 914 | ||
36,80 | 1,10 | 1,21 | 38,736 609 | 0,328 711 | 3,750 454 | ||
40,00 | 1,30 | 1,69 | 38,972 676 | 0,139 378 | 1,55 395 | ||
40,10 | 1,60 | 2,56 | 39,326 775 | 0,5 378 | 0,597 877 | ||
40,00 | 1,70 | 2,89 | 39,444 808 | 0,711 | 0,308 238 | ||
39,00 | 2,20 | 4,84 | 40,34 974 | 0,277 378 | 1,71 171 | ||
38,00 | 2,50 | 6,25 | 40,389 074 | 0,683 378 | 5,707 675 | ||
41,00 | 2,60 | 6,76 | 40,507 107 | 0,858 712 | 0,242 944 | ||
41,60 | 2,70 | 7,29 | 40,625 140 | 1,54 045 | 0,950 352 | ||
41,00 | 3,00 | 9,00 | 40,979 240 | 1,760 045 | 0,431 | ||
41,90 | 3,20 | 10,24 | 41,215 306 | 2,330 712 | 0,468 806 | ||
Итого | 591,20 | 25,10 | 55,01 | 591,199 992 | 13,9 333 | 16,472 942 | |
В среднем | 1,673 333 | ||||||
б) Рассчитаем доверительный интервал для индивидуального прогнозного значения, при
Доверительный интервал примет вид:
Доверительный интервал прогноза показывает, что с вероятностью прогнозное значение индивидуальной средней прибыли для конкретного значения фактора будет находиться в интервале от 35,148 114 до 41,262 806, не принимая нулевых значений, т. е. являются статистически значимыми.
в) Рассчитаем доверительный интервал для свободного члена уравнения .
где Доверительный интервал прогноза показывает, что с вероятностью значение параметра находится в интервале от 36,147 123 до 38,729 365, не принимая нулевых значений, т. е. являются статистически значимыми.
г) Для коэффициента регрессии доверительный интервал имеет вид:
где Доверительный интервал показывает, что с вероятностью прогнозное значение будет находиться в интервале от 0,505 907 до 0,674 425, не принимая нулевых значений, т. е. является статистически значимым.
2.4.2 Множественная регрессия. Множественная Корреляция
2.4.2.1 Множественная регрессия В тех случаях, когда известно, что на результативный признак существенное влияние оказывает не один, как в парной модели, а несколько факторов, причем их влиянием нельзя пренебречь рассчитывают функцию не парной, а множественной регрессии.
(115)
Множественная модель позволяет установить связь результативного признака с каждым отдельно взятым фактором, при условии неизменяемости других включенных в модель факторных признаков.
При построении функции множественной регрессии, как и в парной регрессии, необходимо решить две задачи:
1. отбор факторов,
2. спецификация модели.
Отбор факторов модели множественной регрессии Так как, во множественной регрессии исследуют влияние на результат нескольких факторов, то в отличии от парной модели, имеются особые требования к их отбору.
Все факторы должны быть выражены в количественных единицах. Качественные факторы, при включении их в модель, необходимо перевести в количественные, например, путем пересчета в баллы.
Факторы, включенные в модель не должны быть интеркоррелированы, то есть факторы во множественной модели не должны находится в сильной корреляционной связи между собой, сила связи между факторами не должна быть выше чем сила связи между каким то фактором и результатом. В статистике говорят, что факторы явно коррелированны если коэффициент корреляции между ними, а если связь между ними близка к функциональной, то наличие такой связи называется мультиколлинеарностью.
Спецификация модели множественной регрессии
Функция множественной регрессии может, как и парной регрессии, иметь линейный или нелинейный вид.
Наиболее широкое распространение получила линейная функция:
(116)
Но при значительной вариации признаков возможно применение нелинейных функций. Данные функции, так же, как и в парной регрессии должны иметь возможность свей линеаризации. Из всего множества нелинейных функций чаще всего используют:
Множественная степенная функция
(117)
2. Множественная показательная функция
(118)
3. Множественная экспонента
(119)
4. Множественная гипербола
(120)
5. Множественная парабола второго порядка
(121)
Выбор вида функции проводится аналитическим или экспериментальным методами.
Расчет параметров уравнения множественной регрессии Параметры множественной регрессии, как и параметры парной регрессии можно определить, используя МНК. Так для расчета параметров уравнения множественной линейной регрессии:
МНК даст систему уравнений:
(122)
Параметры уравнения находим как отношение частных определителей к определителю системы
, ,…, (123)
где
— определитель системы, находится, как:
(124)
— частные определители системы рассчитывают, заменяя соответствующий столбец матрицы определителя системы данными левой части системы.
Параметр во множественной регрессии называется свободным членом уравнения регрессии и также как в парной регрессии не имеет экономической интерпретации. Параметр — коэффициентом регрессии, он показывает, на сколько единиц, в среднем, изменится результативный признак, если соответствующий данному коэффициенту фактор увеличится на одну единицу при постоянной величине остальных факторов.
Коэффициенты регрессии можно рассчитать и используя уравнения регрессии в стандартизованном виде представив все переменные уравнения как центрированные и нормированные. Для этого выразим их как отношение их отклонений от средних величин на их стандартное отклонение:
(125)
где
— стандартизованные переменные:
(126)
(127)
— стандартизованные коэффициенты регрессии, показывают на сколько, в среднем, среднеквадратических отклонений изменится вариация результативного признака, если вариация соответствующего фактора увеличится на одно среднеквадратическое отклонение, при постоянной величине остальных факторов. Расчет параметров уравнения в стандартизированной форме более прост, так как, по сравнению с уравнением в натуральной форме отсутствует параметр .
МНК для уравнения множественной регрессии в стандартизированном масштабе даст следующую систему уравнений:
(128)
где
— коэффициент парной корреляции (38)
или (39)
Как, и в уравнении в натуральном масштабе параметры стандартизированного уравнения можно найти методом определителей:
(129)
где:
(130)
Определитель получается из определителя, заменой в нем соответствующего столбца столбцом свободных членов исходной системы.
Кроме того, можно рассчитать используя их взаимосвязь с коэффициентами парной линейной корреляции. Так, например, для двухфакторной линейной модели, выраженной в стандартизованном масштабе, рассчитываются, как:
(131)
Определив значение ?-коэффициентов и зная, что между ?-коэффициентами и коэффициентами регрессии в натуральном масштабе существует следующая взаимосвязь:
или (132)
От уравнения множественной регрессии в стандартизованном виде
(125)
перейдем к уравнению в натуральном масштабе
(116)
параметр, который мы не рассчитали в стандартизованном уравнении, рассчитаем, как
(133)
Расчет параметров нелинейных уравнений множественной регрессии ведется так же, как и в линейной модели используя МНК. Разница заключается в том, что нелинейные модели вначале линеаризуются, и расчет параметров проводится по преобразованным данным (см. парную регрессию).
2.4.2.2 Частные уравнения регрессии Частные уравнения регрессии, рассчитываются на основе множественного уравнения регрессии:
(116)
Они показывают изолированное влияние одного конкретного фактора на результативный признак, при зафиксированном, на среднем уровне, положении остальных, включенных в модель факторов. Влияния зафиксированных факторов в уравнениях частной регрессии присоединены к свободному члену уравнения регрессии .
Частные множественные регрессии записываются, как:
(134)
Обозначение показывает, что изучается влияние на результат, фактора, при зафиксированном на среднем уровне положении факторов. Обозначение показывает, что изучается влияние на результат, фактора, при зафиксированном на среднем уровне положении факторов, и т, д. Знак в нижнем индексе обозначения отделяет фактор влияния, которого исследуется, от факторов, влияние которых изолируется.
Частные уравнения множественной регрессии для линейной модели имеют вид:
(135)
На основе частных уравнений регрессии рассчитывают частные коэффициенты эластичности:
(136)
Частные коэффициенты эластичности отличаются от средних коэффициентов.
Частный коэффициент эластичности показывает, на сколько, в среднем, процентов изменится результат при подстановке в уравнение регрессии конкретного значения .
Средний коэффициент эластичности показывает, на сколько в среднем процентов изменится результат, если соответствующий данному коэффициенту фактор увеличится на 1%, при зафиксированных, на средних уровнях величин остальных, включенных в модель, факторов.
(137)
Пример 20. Имеются данные по 40 хозяйствам о средней урожайности (ц/га), качества почвы (балов), затратах труда (чел-час./1га.), внесение минеральных удобрений (ц.д.в. на 1га.), стоимость ОС (тыс. руб. на 100 га.) (табл. 42).
Таблица 42
№ | Урожайность, ц/га | Качество пашни, балов | Затраты труда чел.-час на 1 га | Внесение мин. удобрений на 1 га ц.д.в. | Стоимость ОФ на тыс.руб. 100 га | ||
10,49 | 15,45 | 0,76 | 18,21 | 10,48 113 | |||
8,57 | 16,13 | 1,06 | 19,17 | 9,601 560 | |||
10,95 | 17,59 | 1,06 | 20,42 | 11,593 826 | |||
9,23 | 18,84 | 0,52 | 20,00 | 8,633 346 | |||
11,97 | 18,43 | 0,99 | 20,37 | 11,524 121 | |||
8,56 | 12,44 | 0,67 | 21,04 | 8,887 059 | |||
12,18 | 15,50 | 1,02 | 20,25 | 9,800 000 | |||
7,93 | 16,34 | 0,44 | 17,68 | 7,427 264 | |||
15,75 | 17,13 | 1,22 | 28,19 | 14,929 855 | |||
13,61 | 17,10 | 0,72 | 22,63 | 11,502 371 | |||
13,99 | 27,16 | 1,59 | 40,16 | 15,194 027 | |||
12,57 | 14,92 | 1,23 | 21,12 | 13,414 848 | |||
10,93 | 18,17 | 0,82 | 26,01 | 11,506 605 | |||
9,86 | 17,24 | 0,98 | 17,99 | 9,461 020 | |||
7,39 | 14,64 | 0,41 | 21,90 | 7,917 362 | |||
9,23 | 14,70 | 0,79 | 20,47 | 9,804 117 | |||
15,40 | 28,81 | 1,20 | 29,01 | 15,372 985 | |||
13,14 | 21,87 | 0,99 | 23,40 | 13,824 023 | |||
13,12 | 16,88 | 0,91 | 25,53 | 13,217 642 | |||
10,27 | 16,65 | 0,83 | 21,18 | 10,512 752 | |||
9,12 | 16,10 | 0,81 | 20,24 | 9,395 289 | |||
13,42 | 18,02 | 1,21 | 20,22 | 12,140 147 | |||
10,29 | 16,91 | 0,78 | 24,89 | 11,485 126 | |||
11,55 | 14,90 | 0,86 | 20,86 | 11,101 097 | |||
15,26 | 17,64 | 1,21 | 28,42 | 14,808 601 | |||
12,35 | 14,41 | 1,20 | 19,73 | 12,305 857 | |||
8,24 | 12,62 | 1,07 | 18,57 | 8,749 497 | |||
10,41 | 18,13 | 0,79 | 21,07 | 10,573 475 | |||
9,62 | 17,30 | 0,77 | 24,46 | 9,806 811 | |||
10,76 | 17,16 | 0,82 | 20,46 | 10,532 588 | |||
8,35 | 14,65 | 0,63 | 22,82 | 8,842 748 | |||
10,31 | 13,66 | 0,79 | 19,89 | 10,941 740 | |||
9,38 | 12,07 | 0,73 | 22,92 | 9,174 913 | |||
14,93 | 14,38 | 1,05 | 33,99 | 13,502 339 | |||
12,46 | 14,53 | 1,03 | 22,95 | 12,436 891 | |||
10,45 | 16,54 | 0,92 | 23,20 | 10,534 678 | |||
12,38 | 21,64 | 0,95 | 21,64 | 12,955 222 | |||
7,74 | 10,27 | 0,65 | 16,87 | 9,872 332 | |||
14,49 | 19,44 | 1,05 | 24,49 | 14,236 792 | |||
8,50 | 15,05 | 0,56 | 17,89 | 7,582 986 | |||
Итого | 445,15 | 2657,00 | 671,41 | 36,09 | 900,31 | 445,152 022 | |
Среднее | 11,128 750 | 66,425 000 | 16,785 250 | 0,902 250 | 22,507 750 | ||
2,305 561 | 12,959 335 | 3,458 573 | 0,240 692 | 4,463 267 | |||
Необходимо построить уравнение множественной линейной регрессии, рассчитать парные коэффициенты регрессии, частные и средние коэффициенты эластичности, провести прогнозирование урожайности, при различных значениях факторов, то есть рассчитать:
максимально возможную урожайность, минимальную урожайность, урожайность для средних значений фактора, частные уравнения регрессии, при максимальном значении одного фактора и средних значениях двух других факторов.
Решение.
1) Уравнение множественной линейной регрессии для нашего примера имеет вид:
Для решения данного уравнения представим его в стандартизированном масштабе:
где: — стандартизованные переменные:
— стандартизованные коэффициенты регрессии МНК для решения множественного уравнения линейной регрессии в стандартизованном виде дает систему уравнений:
Для нашего примера:
Между стандартизированными переменными и коэффициентами парной корреляции существует следующая взаимосвязь:
2) Рассчитаем коэффициенты парной корреляции. Расчет проведем, используя программу Microsoft, таблица 43.
Таблица 43
Столбец 1 y | Столбец 2 x1 | Столбец 3 x2 | Столбец 4 x3 | Столбец 5 x4 | ||
Столбец 1 y | 1,0 | |||||
Столбец 2 x1 | 0,749 996 | 1,0 | ||||
Столбец 3 x2 | 0,545 459 | 0,188 222 | 1,0 | |||
Столбец 4 x3 | 0,731 053 | 0,474 013 | 0,466 501 | 1,0 | ||
Столбец 5 x4 | 0,640 037 | 0,223 318 | 0,549 570 | 0,539 163 | 1,0 | |
3) Подставим значения коэффициентов корреляции в систему.
Для решения системы уравнения воспользуемся методом Гаусса.
4). Составим матрицу, в которую внесем все числа (коэффициенты) при переменных, за горизонтальную черту вынесем итог по каждому уравнению:
— матрица 1
5) Далее необходимо привести к нулю первые коэффициенты строк 2,3,4, первая строка остается без изменений — рабочая строка. Для этого:
а) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту второй строки матрицы 1, т. е. на, получим суммируем полученную строку со второй строкой матрицы 1, получим расчетную строку 1.
б) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту третьей строки матрицы 1, т. е. на получим суммируем полученную строку с третьей строкой матрицы 1, получим расчетную строку 2.
в) Умножим первую (рабочую) строку на число противоположное 1-му коэффициенту четвертой строки матрицы 1, т. е. на получим суммируем полученную строку с четвертой строкой матрицы 1, получим расчетную строку 3.
6) Составим новую матрицу (матрица 2). Первой строкой данной матрицы будет первая строка матрицы 1, второй строкой (рабочей) — расчетная строка 1, третьей — строка 2, четвертой — строка 3.
— матрица 2
7) Далее, необходимо привести к нулю вторые коэффициенты строк 3 и 4 матрицы 2, первая строка остается без изменений, рабочей будет вторая строка. Для этого:
а) Найдем число, которое при умножении на второй коэффициент рабочей строки матрицы 2 —, даст число, противоположное (с другим знаком) второму коэффициенту третьей строки —. Для этого найдем отношение:, так как второй коэффициент третьей строки число положительное, полученное число возьмем со знаком минус и умножим на него вторую (рабочую) строку матрицы 2:
суммируем полученную строку с третьей строкой матрицы 2, получим расчетную строку 4:
б) Найдем число, которое при умножении на второй коэффициент рабочей строки матрицы 2 —, даст число, противоположное (с другим знаком) второму коэффициенту четвертой строки —. Для этого найдем отношение:, так как второй коэффициент четвертой строки число положительное, полученное число возьмем со знаком минус и умножим на него вторую (рабочую) строку матрицы 2:
суммируем полученную строку с четвертой строкой матрицы 2, получим расчетную строку 5:
8). Составим новую матрицу — 3. Первые две строки возьмем без изменений из матрицы два, третьей строкой (рабочей) будет расчетная строка 4, четвертой строкой — расчетная строка 5.
— матрица 3
9) Далее необходимо привести к нулю третий коэффициент строки 4. Для этого:
Найдем число, которое при умножении на третий коэффициент рабочей строки матрицы 3 —, даст число, противоположное (с другим знаком) третьему коэффициенту четвертой строки —. Для этого найдем отношение, так как третий коэффициент четвертой строки число положительное, полученное число возьмем со знакам минус и умножим на него третью (рабочую) строку матрицы 3.
суммируем полученную строку с четвертой строкой матрицы 3
10) Составим новую матрицу — 4. Первые три строки возьмем без изменений из матрицы три, а четвертой строкой — расчетная строка 6.
— матрица 4
11) Подставим полученные коэффициенты в систему
12) Рассчитаем значение стандартизированных коэффициентов регрессии .
а) Из четвертого уравнения системы рассчитаем:
б) Подставим полученное значения в третье уравнение системы и рассчитаем значение :
в) Подставим значения и во второе уравнения системы и получим значение :
г) Подставим значения, , во второе уравнения системы и получим значение :
13) Зная, что между ?-коэффициентами и коэффициентами регрессии в натуральном масштабе существует следующая взаимосвязь:
соответственно
а)
б)
в)
г)
Таким образом, используя метод Гаусса, рассчитали коэффициенты регрессии, параметр найдем по формуле:
14) Подставим рассчитанные параметры в уравнение множественной регрессии:
а) Коэффициент регрессии показывает, что при увеличении фактора — качество пашни на 1 балл, средняя урожайность в среднем возрастет на 0,96 083 ц/га., при фиксированном положении остальных факторов.
б) Коэффициент регрессии показывает, что при увеличении фактора — затраты труда на 1 чел.-час./га, средняя урожайность в среднем возрастет на 0,113 165 ц/га., при фиксированном положении остальных факторов.
в) Коэффициент регрессии показывает, что при увеличении фактора — внесение минеральных удобрений на 1 ц.д.в./га средняя урожайность в среднем возрастет на 2,243 155 ц/га., при фиксированном положении остальных факторов.
г) Коэффициент регрессии показывает, что при увеличении фактора — стоимость ОФ на одну тыс.руб./100га, средняя урожайность в среднем возрастет на 0,15 490 ц/га., при фиксированном положении остальных факторов.
15) Проведем прогнозирование средней урожайности на основе полученного уравнения множественной регрессии:
а) Рассчитаем максимально возможную урожайность, для этого по каждому из факторов, в уравнение подставим максимальное значение, если коэффициент регрессии для данного фактора положителен, или минимальное значение, если коэффициент регрессии для данного фактора отрицателен. В нашем примере все коэффициенты регрессии положительны, соответственно значения факторов берем максимальные, ,, , и подставляем в уравнение.
б) Рассчитаем минимально возможную урожайность, для этого по каждому из факторов, в уравнение подставим минимальное значение, если коэффициент регрессии для данного фактора положителен, или максимальное значение, если коэффициент регрессии для данного фактора отрицателен. В нашем примере все коэффициенты регрессии положительны, соответственно значения факторов берем минимальные, ,, , и подставляем в уравнение.
в) Рассчитаем среднюю возможную урожайность, для этого по каждому из факторов, в уравнение подставим средние значения, ,, .
16) Рассчитаем частные уравнения регрессии а) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .
б) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .
в) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .
г) Рассчитаем среднюю возможную урожайность при максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .
17) На основе частных уравнений регрессии рассчитаем частные коэффициенты эластичности:
а) При максимальном значении фактора, и зафиксированных на среднем уровне значении остальных факторов, , .
то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,64%, и зафиксированных на среднем уровне значении остальных факторов.
б) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .
то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,26%, и зафиксированных на среднем уровне значении остальных факторов.
в) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .
то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,28%, и зафиксированных на среднем уровне значении остальных факторов.
г) При максимальном значении фактора (учитывая знак коэффициента регрессии), и зафиксированных на среднем уровне значении остальных факторов, , .
то есть средняя урожайность в среднем возрастет, при подстановке в уравнение регрессии конкретного значения на 0,45%, и зафиксированных на среднем уровне значении остальных факторов.
18) Рассчитаем средние коэффициенты эластичности для каждого фактора:
а) Рассчитаем средний коэффициент эластичности для фактора
то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,57%, при фиксированном положении остальных факторов.
б) Рассчитаем средний коэффициент эластичности для фактора
то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,17%, при фиксированном положении остальных факторов.
в) Рассчитаем средний коэффициент эластичности для фактора
то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,18%, при фиксированном положении остальных факторов.
г) Рассчитаем средний коэффициент эластичности для фактора
то есть средняя урожайность, при увеличении фактора на 1%, в среднем возрастет на 0,31%, при фиксированном положении остальных факторов.
19) Коэффициенты средней эластичности позволяют ранжировать факторы по степени их влияния на результативный признак, для нашего примера:
1. — качество пашни, балов
2. — стоимость ОФ тыс.руб. на 100га
3. — внесение минеральных удобрений на 1га.тыс.руб.
4. — затраты труда, чел.-час.
20) Расчет множественной регрессионной модели в программе Microsoft Excel аналогичен расчету парной регрессии и рассмотрен в примере 1 (вводим входной интервал, выделяя все столбики содержащие факторы). Для данного примера приведем таблицу, содержащую результаты — рисунок 9.
Рисунок 9.
Параметр в данной таблице находится на пересечении столбика «Коэффициенты» и строки «Y-пересечение», параметр — на пересечении столбика «Коэффициенты» и строки «Переменная Х1», — строки «Переменная Х2», — строки «переменная Х3», — строки «Переменная Х4».
2.4.2.3 Множественная корреляция Силу связи во множественных моделях изучают с помощью показателя множественной корреляции и его квадрата — показателя множественной детерминации.
Показатель множественной корреляции — показывает тесноту связи между результативным признаком и всеми включенными в модель факторами. Может принимать значения от 0 до 1, то есть в отличие от парной модели не показывает направление связи.
Показатель множественной детерминации — показывает часть вариации результативного признака, которая сложилась под влиянием всех включенных в модель факторов.
В статистике и эконометрике показатель множественной корреляции (детерминации) принято называть индексом или коэффициентом множественной (совокупной) корреляции.
Для линейной множественной функции и для функций нелинейных по переменным (полиномы разных степеней, равносторонняя гипербола и т. п. функции) индекс множественной корреляции совпадает с коэффициентом множественной корреляции.
Коэффициент (индекс) множественной корреляции рассчитывают, используя следующие формулы:
(138)
где:
— остаточная дисперсия (139)
— общая дисперсия для признака (140)
(141)
Коэффициент множественной корреляции можно рассчитать и, как:
(142)
где:
— парные коэффициенты корреляции между результативным признаком и одним из факторов .
Для функций нелинейных по оцениваемым параметрам (степенная, показательная, экспоненциальная и т. п. функции) индекс множественной корреляции не совпадает с коэффициентом множественной корреляции. Его называют «» и определяют как
(143)
Коэффициенты (индексы) множественной детерминации получают, возводя коэффициенты (индексы) корреляции в квадрат, или по формулам.
(144)
(145)
(146)
Скорректированный индекс множественной детерминации Индекс множественной детерминации используют для определения качества регрессии, чем больше, к единице тем выше качество подбора регрессии.
Но использование только одного индекса детерминации для определения наилучшего уравнения регрессии недостаточно. Необходимо учитывать, что при увеличении факторов включенных в уравнение регрессии, при одном и том же числе наблюдений, при расчете показателей корреляции, за счет использования остаточной дисперсии появляется систематическая ошибка — чем больше число параметров в уравнении регрессии, при одном и том же числе наблюдений, тем больше получается расчетный показатель тесноты связи. Если число факторов приближается к числу наблюдений, то расчетный показатель корреляции будет близок к единице, то есть показывать тесную связь, даже если связь незначительна. Для того чтобы избежать этого рассчитывают скорректированный индекс множественной детерминации.
(147)
или
(148)
Скорректированный индекс множественной корреляции рассчитывают соответственно как:
(149)
или
(150)
где:
— для линейной множественной модели — число факторов включенных в регрессионную модель. Для нелинейной модели — число параметров при и их линеаризации (и так далее), которое может быть больше числа факторов.
— число наблюдений.
В силу сказанного выше необходимо понимать, что нельзя перегружать множественную модель факторами, так как снижается достоверность расчетов, принято считать, что на каждые 8−10 наблюдений в модель целесообразно включать один фактор.
2.4.2.4 Частная корреляция Множественный коэффициент (индекс) корреляции показывает тесноту связи между результатом и всеми включенными в модель факторами, для того, чтобы изучить силу связи между результатом и только одним из включенных в модель факторов, рассчитывают частные коэффициенты корреляции, для каждого из факторов включенных в модель.
Частный коэффициент корреляции показывает тесноту связи между результативным признаком и только одним фактором при элиминировании (устранении) влияния всех остальных включенных в модель факторов.
В зависимости от того, влияние скольких факторов необходимо исключать различают частные коэффициенты разных порядков: нулевого, первого, второго, третьего и т. д. Так, например:
Коэффициенты частной корреляции нулевого порядка — коэффициенты парной корреляции, так как нет необходимости устранять влияние даже одного фактора.
Коэффициенты частной корреляции первого порядка — коэффициенты частной корреляции, в которых элиминируется влияние одного фактора (, и т. д.).
Коэффициенты корреляции второго порядка — коэффициенты частной корреляции, в которых элиминируется влияние двух факторов (, и т. д.) и так далее.
Коэффициенты частной корреляции более высоких порядков рассчитываются через коэффициенты корреляции более низких порядков. Коэффициенты первого порядка через коэффициенты нулевого порядка, второго порядка через коэффициенты первого порядка и т. д. Рекуррентная формула для расчета коэффициентов частной корреляции порядка имеет вид:
(151)
Коэффициенты частной корреляции могут принимать значения в пределах от -1 до 1.
Также частные коэффициенты корреляции можно рассчитать через множественные коэффициенты детерминации. Так коэффициент частной корреляции второго порядка рассчитывается как:
или и т. д. (152)
В общем виде уравнение для расчета коэффициентов частной корреляции порядка имеет вид:
(153)
где
— коэффициент множественной детерминации для всех факторов.
— коэффициент множественной детерминации без включения в модель фактора .
Рассчитанные через множественные коэффициенты детерминации частные коэффициенты корреляции могут принимать значения в интервале от 0 до 1.
Кроме того, частные коэффициенты корреляции можно рассчитать через. Так, например, частные коэффициенты корреляции первого порядка для двухфакторной линейной модели, выраженной в стандартизованном масштабе :
(131)
Отсюда:
и (154)
Возводя в квадрат коэффициенты частной корреляции, получают коэффициенты частной детерминации.
Частные коэффициенты корреляции используют при формировании корреляционно-регрессионной модели, для отбора факторов. При этом из модели исключают факторы несущественные по критерию Стьюдента.
Коэффициент частной детерминации показывает долю вариации результативного признака дополнительно сложившуюся при включении в модель фактора, в вариации признака, не объясненную включенными до этого в модель факторами. Можно рассчитать по формуле на основе коэффициентов множественной детерминации.
(155)
где
— коэффициент множественной детерминации для всех факторов.
— коэффициент множественной детерминации без включения в модель фактора .
Зная коэффициенты частной детерминации, последовательно нулевого, первого, второго и более высоких порядков, определяют коэффициент множественной корреляции.
(156)
Пример 21. По данным примера 20 необходимо рассчитать:
1. линейный индекс множественной корреляции, детерминации
2. линейные коэффициенты частной корреляции первого и второго порядков, детерминации.
Решение.
1. Рассчитаем индекс множественной корреляции по формуле:
В таблице 44 рассчитаем все возможные значения.
Таблица 44
№ | |||||
10,49 | 0,408 002 | 10,48 113 | 0,195 264 | ||
8,57 | 6,547 202 | 9,601 560 | 1,64 116 | ||
10,95 | 0,31 952 | 11,593 826 | 0,414 512 | ||
9,23 | 3,605 252 | 8,633 346 | 0,355 996 | ||
11,97 | 0,707 702 | 11,524 121 | 0,198 808 | ||
8,56 | 6,598 477 | 8,887 059 | 0,106 968 | ||
12,18 | 1,105 127 | 9,800 000 | 5,664 400 | ||
7,93 | 10,232 002 | 7,427 264 | 0,252 743 | ||
15,75 | 21,355 952 | 14,929 855 | 0,672 638 | ||
13,61 | 6,156 602 | 11,502 371 | 4,442 100 | ||
13,99 | 8,186 752 | 15,194 027 | 1,449 681 | ||
12,57 | 2,77 202 | 13,414 848 | 0,713 768 | ||
10,93 | 0,39 502 | 11,506 605 | 0,332 473 | ||
9,86 | 1,609 727 | 9,461 020 | 0,159 185 | ||
7,39 | 13,978 252 | 7,917 362 | 0,278 111 | ||
9,23 | 3,605 252 | 9,804 117 | 0,329 610 | ||
15,40 | 18,243 577 | 15,372 985 | 0,730 | ||
13,14 | 4,45 127 | 13,824 023 | 0,467 887 | ||
13,12 | 3,965 077 | 13,217 642 | 0,9 534 | ||
10,27 | 0,737 452 | 10,512 752 | 0,58 929 | ||
9,12 | 4,35 077 | 9,395 289 | 0,75 784 | ||
13,42 | 5,249 827 | 12,140 147 | 1,638 024 | ||
10,29 | 0,703 502 | 11,485 126 | 1,428 326 | ||
11,55 | 0,177 452 | 11,101 097 | 0,201 514 | ||
15,26 | 17,67 227 | 14,808 601 | 0,203 761 | ||
12,35 | 1,491 452 | 12,305 857 | 0,1 949 | ||
8,24 | 8,344 877 | 8,749 497 | 0,259 587 | ||
10,41 | 0,516 602 | 10,573 475 | 0,26 724 | ||
9,62 | 2,276 327 | 9,806 811 | 0,34 898 | ||
10,76 | 0,135 977 | 10,532 588 | 0,51 716 | ||
8,35 | 7,721 452 | 8,842 748 | 0,242 801 | ||
10,31 | 0,670 352 | 10,941 740 | 0,399 095 | ||
9,38 | 3,58 127 | 9,174 913 | 0,42 061 | ||
14,93 | 14,449 502 | 13,502 339 | 2,38 216 | ||
12,46 | 1,772 227 | 12,436 891 | 0,534 | ||
10,45 | 0,460 702 | 10,534 678 | 0,7 170 | ||
12,38 | 1,565 627 | 12,955 222 | 0,330 880 | ||
7,74 | 11,483 627 | 9,872 332 | 4,546 840 | ||
14,49 | 11,298 002 | 14,236 792 | 0,64 114 | ||
8,50 | 6,910 327 | 7,582 986 | 0,840 915 | ||
Итого | 445,150 000 | 212,624 438 | 445,152 025 | 29,602 363 | |
В среднем | 11,128 750 | ||||
Рассчитаем индекс множественной корреляции по формуле:
Значение стандартизованных коэффициентов регрессии и коэффициенты корреляции из примера 21.
Индекс множественной корреляции показывает, что между результативным признаком и всеми тремя включенными м модель факторами существует тесная связь (направление связи индекс множественной корреляции не определяет).
Индекс множественной детерминации:
Индекс множественной детерминации показывает, что 86% вариации результативного признака обусловлено влиянием включенных в модель факторов.
Расчет множественного индекса корреляции и множественного индекса детерминации произведем в программе Microsoft Excel рассмотрен в примере 20, рисунок 9.
2. Рассчитаем частные коэффициенты корреляции по рекуррентной формуле:
Для этого воспользуемся матрицей парных коэффициентов корреляции из примера 20, (табл. 45).
Таблица 45
Столбец 1 y | Столбец 2 x1 | Столбец 3 x2 | Столбец 4 x3 | Столбец 5 x4 | ||
Столбец 1 y | 1,0 | |||||
Столбец 2 x1 | 0,749 996 | 1,0 | ||||
Столбец 3 x2 | 0,545 459 | 0,188 222 | 1,0 | |||
Столбец 4 x3 | 0,731 053 | 0,474 013 | 0,466 501 | 1,0 | ||
Столбец 5 x4 | 0,640 037 | 0,223 318 | 0,549 570 | 0,539 163 | 1,0 | |
а) Рассчитаем частные коэффициенты корреляции и детерминации первого порядка.
коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :
коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :
коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :
коэффициенты частной корреляции и детерминации первого порядка между результативным признаком и фактором :
коэффициенты частной корреляции первого порядка между факторами (для расчета частных коэффициентов второго порядка):
б) Рассчитаем частные коэффициенты корреляции и детерминации второго порядка.
коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :
коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :
коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :
коэффициенты частной корреляции и детерминации второго порядка между результативным признаком и фактором :
Коэффициенты частной корреляции третьего порядка рассчитываем аналогичным образом через частные коэффициенты корреляции второго порядка.
2.4.2.5 Оценка надежности параметров множественной регрессии и корреляции Оценка значимости множественного уравнения регрессии в целом проводится с помощью, (критерия Фишера).
(157)
где:
— факторная дисперсия (158)
— остаточная дисперсия (159)
F-критерий можно рассчитать и по формуле:
(160)
где:
— для линейной множественной модели — число факторов включенных в регрессионную модель. Для нелинейной модели — число параметров при и их линеаризации (и так далее), которое может быть больше числа факторов
— число наблюдений Если расчетный превышает табличный при определенном уровне значимости или, и числе свободы —, (таблицы Снедекора-Фишера — приложение 2) можно сказать, что уравнение множественной регрессии статистически значимо.
Величина позволяет также оценить статистическую значимость и коэффициента (индекса) множественной корреляции .
Кроме оценки уравнения в целом, большое практическое значение имеет статистическая оценка значимости каждого отдельно включенного в модель фактора, через частные критерии Фишера, (). Данная оценка позволяет оценить целесообразность включения в модель множественной регрессии каждого из факторов после введения в модель остальных факторов.
Расчет частного, для фактора проводится по формуле:
(161)
— коэффициент множественной детерминации для модели, включающей все факторы
— коэффициент множественной детерминации для модели, без включения фактора
Расчета частного в общем виде, для фактора проводится по формуле:
(162)
Расчета частного, для оценки значимости влияния фактора после включения в модель других факторов проводится по формуле:
(163)
Если величина расчетного частного превышает величину табличного при определенном уровне значимости или, и числе свободы —, (таблицы Снедекора-Фишера — приложение 2), можно сказать, что включение в модель фактора, после введения в модель остальных факторов, целесообразно. Если величина расчетного частного меньше табличного значения, можно сказать, что включение в модель фактора, после введения в модель остальных факторов, статистически неоправданно, и его необходимо исключить из рассматриваемой модели.
Зная величину частного критерия Фишера, рассчитывают частные критерии Стьюдента, для определения значимости каждого из коэффициентов чистой регрессии .
(164)
Критерий Стьюдента также можно рассчитать по формуле:
(165)
где:
— коэффициент чистой регрессии для фактора
— стандартная ошибка (166)
где:
— коэффициент детерминации множественного уравнения регрессии
— коэффициент множественной детерминации зависимости фактора со всеми остальными факторами уравнения множественной регрессии
— среднеквадратическое отклонение результативного признака
— среднеквадратическое отклонение факторного признака
Полученные фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости, или, и числе степеней свободы (приложение 1). Если фактическое значение больше табличного соответствующий коэффициент регрессии статистически значим.
Фактические значения критерия Стьюдента сравнивают с табличными значениями при определенном уровне значимости, или, и числе степеней свободы, где — число исключенных переменных (приложение 1). Если фактическое значение больше табличного соответствующий коэффициент частной корреляции статистически значим.
Пример 22. По данным примеров 20 и 21 необходимо:
1. провести оценку существенности уравнения регрессии и его параметров:
2. рассчитать частные. Оценить с их помощью статистическую значимость включения факторов, ,, решить вопрос включения в регрессионную модель одних факторов после включения других.
Решение.
1. Оценку существенности множественного уравнения проведем, используя критерий Фишера (F-критерий)
.
где:
— число факторов включенных в регрессионную модель.
— число наблюдений Табличное значение для данной модели при уровне значимости, и числе свободы —, (значение 35 в приложении 2 отсутствует, возьмем ближайшее значение 30) будет равно 2,69.
Расчетное значение значительно больше табличного, соответственно множественное уравнение регрессии признается статистически значимым.
Расчет фактического, в программе Microsoft Excel — рисунок 9.
2. Рассчитаем частные для оценки значимости влияния фактора после включения в модель других факторов Табличное значение при уровне значимости, и числе свободы —, будет равно 4,12.
а)
Фактическое значение больше табличного. Значит включение в модель фактора после факторов, статистически значимо.
б)
Фактическое значение больше табличного. Значит включение в модель фактора после факторов, , статистически значимо.
в)
Фактическое значение больше табличного. Значит включение в модель фактора после факторов, статистически значимо.
г)
Фактическое значение больше табличного. Значит включение в модель фактора после факторов, статистически значимо.
где: — коэффициент множественной детерминации для множественной регрессионной модели со всеми включенными в нее факторами.
— коэффициент множественной детерминации для множественной регрессионной модели без фактора .
— коэффициент множественной детерминации для множественной регрессионной модели без фактора .
— коэффициент множественной детерминации для множественной регрессионной модели без фактора .
— коэффициент множественной детерминации для множественной регрессионной модели без фактора .
Значения коэффициентов, ,, , рассчитаем в программе Microsoft Excel, методика расчета рассмотрена в примере 20 рисунок 9.
3. Статистическую оценку значимости коэффициентов регрессии по Стьюдента. Зная частные воспользуемся следующей формулой:
а)
б)
в)
г)
Табличное значение критерия Стьюдента при, и числе степеней свободы (значение 35 в приложении 1 отсутствует, возьмем ближайшее значение 30) равно 2,0423. Все фактические значения критерия Стьюдента больше табличного, то есть можно сделать вывод о статистической значимости всех коэффициентов регрессии .
Расчет и критериев Стьюдента для в программе Microsoft Excel приведен на рисунке 9. обозначен как F, а критерии Стьюдента как t-статистика.
Литература
Айвазян С. А., Иванова С. С. Эконометрика. Краткий курс: учеб. пособие / С. А. Айвазян, С. С. Иванова. — М.: Маркет ДС, 2007. — 104 с.
Бородич С. А. Вводный курс эконометрики: Учебное пособие. — Мн.: БГУ, 2010. — 354 с.
Бывшев В. А. Эконометрика: учеб. пособие / В. А. Бывшев. — М.: Финансы и статистика, 2008. — 480 с.
Доугерти Кристофер.
Введение
в эконометрику: Учебник для экон. спец. вузов / Пер. с англ. Е. Н. Лукаш и др. — М.: ИНФРА-М, 2007. — 402 с.
Дубров А.М., Мхитарян В. С., Трошин Л. И. Многомерные статистические методы: Учебник. — М.: Финансы и статистика, 2013. — 352 с.
Дуброва Т. А. Прогнозирование социально-экономических процессов. Статистические методы и модели: учеб. пособие / Т. А. Дуброва. — М.: Маркет ДС, 2007. — 192 с.
Магнус Я.Р., Катышев П. К., Пересецкий А. А. Эконометрика. Начальный курс: Учебник. -3-е изд., перераб. и доп. — М.: Дело, 2010. 400 с.
Методы математической статистики в обработке экономической информации: учеб. пособие / Т. Т. Цымбаленко, А. Н. Баудаков, О. С. Цымбаленко и др.; под ред. проф. Т. Т. Цымбаленко. — М.: Финансы и статистика; Ставрополь: АРГУС, 2007. — 200 с.
Палий И. А. Прикладная статистика: Учебное пособие. — М.: Издательско-торговая корпорация «Дашков и К», 2008. — 224 с.
Порядина О. В. Эконометрическое моделирование линейных уравнений регрессии: Учебное пособие. — Йошкар-Ола: МарГТУ, 2005. — 92 с.
Практикум по эконометрике: Учеб. пособие / И. И. Елисеева, С. В. Курышева, Н. М. Гордеенко и др.; Под ред. И. И. Елисеевой. — 2-е изд., перераб. и доп. — М.: Финансы и статистика, 2007. — 344 с.
Прикладная статистика. Основы эконометрики: Учебник для вузов: В 2 т. 2-у изд., испр. — Т. 2: Айвазян С. А. Основы эконометрики. — М.: ЮНИТИ-ДАНА, 2001. — 432 с.
Симчера В. М. Методы многомерного анализа статистических данных: учеб. пособие. — М.: Финансы и статистика, 2008. — 400 с.
Чураков Е. П. Прогнозирование эконометрических временных рядов: учеб. пособие / Е. П. Чураков. — М.: Финансы и статистика, 2008. — 208 с.
Эконометрика: учеб. / под ред. д-ра экон. наук, проф. В. С. Мхитаряна. — М.: Проспект, 2008. — 384 с.
Эконометрика: учеб. / под ред. И. И. Елисеевой. — М.: Проспект, 2009. — 288 с.
Эконометрика: Учебник/И.И. Елисеева, С. В. Курышева, Т. В. Костеева и др., Под ред. И. И. Елисеевой. — 2-е изд., перераб. и доп. — М.: Финансы и статистика, 2005. — 576 с.