Бакалавр
Дипломные и курсовые на заказ

Построение регрессионной модели экономической деятельности компаний нефтегазовой отрасли

КонтрольнаяПомощь в написанииУзнать стоимостьмоей работы

Оценка качества построенной модели через коэффициент детерминации, средней относительной ошибки аппроксимации и F — критерия Фишера Для оценки качества модели множественной регрессии вычисляют коэффициент множественной корреляции Rи коэффициент детерминации R2. Значение коэффициентов детерминации и множественной корреляции можно вычислить по формулам: Осуществите прогнозирование среднего значения… Читать ещё >

Построение регрессионной модели экономической деятельности компаний нефтегазовой отрасли (реферат, курсовая, диплом, контрольная)

Федеральное государственное образовательное бюджетное учреждение высшего профессионального образования Финансовый университет при Правительстве Российской Федерации Владимирский филиал финансового университета Заочный факультет экономики Кафедра «Математика и информатика»

Контрольная работа

По дисциплине «Эконометрика»

Студент: Ашуралиев Ф.Х.

Курс: 3, группа: ЗБ3-ЭК301

Преподаватель: Бутковский О.Я.

Владимир 2015

На основании данных, приведенных в табл. 1:

1. Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных.

2. Осуществите двумя способами выбор факторных признаков для построения регрессионной модели:

а) на основе анализа матрицы коэффициентов парной корреляции, включая проверку гипотезы о независимости объясняющих переменных (тест на выявление мультиколлинеарности Фаррара-Глоубера);

б) с помощью пошагового отбора методом исключения.

3. Постройте уравнение множественной регрессии в линейной форме с выбранными факторами. Дайте экономическую интерпретацию коэффициентов модели регрессии.

4. Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, и? коэффициентов.

5. Рассчитайте параметры линейной парной регрессии для наиболее подходящего фактора Хj.

6. Оцените качество построенной модели с помощью коэффициента детерминации, средней относительной ошибки аппроксимации и F-критерия Фишера.

7. Проверьте выполнение условия гомоскедастичности.

8. Используя результаты регрессионного анализа, ранжируйте компании по степени эффективности.

9. Осуществите прогнозирование среднего значения показателя Y при уровне значимости = 0,1, если прогнозное значение фактора Хj составит 80% от его максимального значения. Представьте на графике фактические данные Y, результаты моделирования, прогнозные оценки и границы доверительного интервала.

10. Составьте уравнения нелинейной регрессии:

а) гиперболической;

б) степенной;

в) показательной.

11. Приведите графики построенных уравнений регрессии.

12. Для нелинейных моделей найдите коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравните модели по этим характеристикам и сделайте вывод о лучшей модели.

Таблица 1

Добыча сырой нефти и природного газа; предоставление услуг в этих областях

№ пп.

Прибыль (убыток)

Оборотные активы

Дебиторская задолженность (краткосрочная)

Запасы готовой продукции и товаров для перепродажи

Y

X3

х5

х6

Аганнефтегазгеология, открытое акционерное общество, многопрофильная компания

4 920 199

Азнакаевский горизонт, открытое акционерное общество

Акмай, открытое акционерное общество

18 903

Аксоль, открытое акционерное общество, производственно-коммерческая фирма

13 398

Акционерная нефтяная Компания Башнефть, Открытое акционерное общество

63 269 757

АЛРОСА — Газ, Открытое акционерное общество

367 880

Арктическая газовая компания, открытое акционерное общество

— 780 599

3 933 712

Барьеганнефтегаз, Открытое акционерное общество

5 910 831

Белкамнефть, Открытое акционерное общество

5 325 806

Белорусское управление по повышению нефтеотдачи пластов и капитальному ремонту скважин, открытое акционерное общество

705 877

Битран, Открытое акционерное общество

2 964 277

Богородскнефть, Открытое акционерное общество

624 661

Братскэкогаз, Открытое акционерное общество

— 20 493

46 728

Булгарнефть, Открытое акционерное общество

582 581

Варьеганнефть, Открытое акционерное общество

3 463 511

Верхнечонскнефтегаз, Открытое акционерное общество

5 891 049

Восточная транснациональная компания, Открытое акционерное общество

299 286

Восточно-Сибирская нефтегазовая компания, Открытое акционерное общество

— 564 258

801 276

Геологоразведочный исследовательский центр, Открытое акционерное общество

257 633

ГРОЗНЕФТЕГАЗ, ОАО

1 566 040

Губкинский газоперерабатывающий комплекс, открытое акционерное общество

528 912

ДАГНЕФТЕГАЗ, ОАО

167 297

Елабуганефть, Открытое акционерное общество

52 042

Иделойл, Открытое акционерное общество

188 662

Избербашнефть, Открытое акционерное общество

— 468

130 350

ИНВЕСТИЦИОННАЯ НЕФТЯНАЯ КОМПАНИЯ, ОАО

585 017

Инга, Открытое акционерное общество

— 61 237

344 398

КАББАЛКНЕФТЕТОППРОМ, ОАО

— 540

36 641

Калининграднефть, Открытое акционерное общество

215 106

КАМЧАТГАЗПРОМ, ОАО

998 875

Кировское нефтегазодобывающее управление, ОАО

— 210

1 702

Когалымнефтепрогресс, Открытое акционерное общество

807 686

Комнедра, Открытое акционерное общество

1 567 998

Кондурчанефть, Открытое акционерное общество

128 256

Корпорация югранефть, открытое акционерное общество

7 720 298

Краснодарское опытноэкспериментальное управление по повышению нефтеотдачи пластов и капитальному ремонту скважин, ОАО

— 33 030

14 412

Ленинградсланец, открытое акционерное общество

921 832

Меллянефть, Открытое акционерное общество

233 340

МНКТ, Общество с ограниченной ответственностью

361 672

Мохтикнефть, Открытое акционерное общество

458 233

Научно-производственное объединение СПЕЦЭЛЕКТРОМЕХАНИКА, ОАО

619 452

Научно-производственное предприятие БУРСЕРВИС, ОАО

119 434

НГДУ Пензанефть, Открытое акционерное общество

257 140

НЕГУСНЕФТЬ, ОАО

НЕНЕЦКАЯ НЕФТЯНАЯ КОМПАНИЯ, ОАО

324 968

НЕФТЕБУРСЕРВИС, ОАО

81 960

Нефтегазовая компания Славнефть, ОАО

35 232 071

Нефтеразведка, ОАО

76 430

Нефть, ОАО

21 132

Нефтьинвест, ОАО

79 930

1. Постройте диаграммы рассеяния, представляющие собой зависимости Y от каждого из факторов Х. Сделайте выводы о характере взаимосвязи переменных Построенные диаграммы рассеяния, зависимости Yот X3 (рис.1), от X5 (рис. 2), от X6 (рис.3). По характеру распределения данных, можно сделать предположение, что существует некоторая тенденция прямой линейной связи между значениями объясняемой переменной и факторами X3 и X5 и отсутствия с фактором X6.

Рис. 1

Рис. 2

Рис. 3

2. Осуществите двумя способами выбор факторных признаков для построения регрессионной модели а) на основе анализа матрицы коэффициентов парной корреляции, включая проверку гипотезы о независимости объясняющих переменных (тест на выявление мультиколлинеарности Фаррара-Глоубера);

Для проведения корреляционного анализа используем инструмент Корреляция (Анализ данных в Excel). В результате получаем матрицу коэффициентов парной корреляции (Табл. 2).

Таблица 2

Анализ матрицы коэффициентов парной корреляции начинаем с ее первого столбца, где расположены коэффициенты корреляции, отражающие тесноту связи зависимой переменной Y «прибыль (убыток)» с включенными в анализ факторами. Анализ показывает, что зависимая переменная Y, имеет тесную связь с долгосрочными обязательствами (ry,x3 = 0,912) и с запасами готовой продукции для перепродажи (ry,x6= 0,842). Фактор Х5имеет слабую связь с зависимой переменной и его не рекомендуется включать в модель (исключим его в пошаговом методе).

Затем переходим к анализу остальных столбцов матрицы с целью выявления мультиколлинеарности. Факторы X1и X6нетесно связаны между собой (rx3,x6= 0,756), что не свидетельствует о наличии мультиколлинеарности.

Таким образом, на основе анализа только корреляционной матрицы остаются два фактора — Долгосрочные обязательства и Запасы готовой продукции для перепродажи (n = 50, k =2).

1. Проверка наличия мультиколлинеарности всего массива переменных Построим матрицу межфакторных корреляций R1 (табл. 4.3) и найдем ее определитель det [R1] = 0,373 с помощью функции МОПРЕД.

Таблица 3

Вычислим наблюдаемое значение статистики Фаррара — Глоубера по формуле:

=-((50−1-(1/6)*(2*3+5))*(-0,37) = 17,5

где n = 50 — количество наблюдений;

k = 3 -количество факторов.

Фактическое значение этого критерия FGнабл сравниваем с табличным значением X2c ½k (k-1) = 3 степенями свободы и уровнем значимости б=0,05. Табличное значение X2 находим с помощью функции ХИ2.ОБР.ПХ. FGкр = 0,352.

Так как FGнабл>FGкр (17,5>0,352), следовательно в массиве объясняющих переменных существует мультиколлинеарность.

б) с помощью пошагового отбора методом исключения.

Пошаговый отбор методом исключения. Построение модели регрессии с помощью инструмента Регрессия (Анализ данных в Excel) приведено в таблице 4.

1-й шаг — модель регрессии по всем факторам:

Таблица 4

Линейное уравнение трехфакторной модели регрессии имеет вид:

Проверим значимость коэффициентов парной корреляции по критерию Стьюдента. Расчетное значение критерия Стьюдента приведены в графе t-статистика.

Для параметра при, — параметр при факторе значим.

Для параметра при, — параметр при факторе значим.

Для параметра при, -параметр при факторе значим.

Исключаем фактор Х5.

2-й шаг — модель регрессии по двум факторам:

Таблица 5

Линейное уравнение двухфакторной модели регрессии имеет вид:

Проверим значимость коэффициентов парной корреляции по критерию Стьюдента. Расчетное значение критерия Стьюдента приведены в графе t-статистика.

Для параметра при, -параметр при факторе значим.

Для параметра при, — параметр при факторе значим.

3. Постройте уравнение множественной регрессии в линейной форме с выбранными факторами. Дайте экономическую интерпретацию коэффициентов модели регрессии На основании пункта 2. б из модели фактор X2 исключаем, тогда уравнение зависимости прибыли (убытка) можно записать в следующем виде:

Уравнение регрессии показывает, каково будет в среднем значение переменной , если переменные X примут конкретные значения.

коэффициент регрессии j показывает, на какую величину в среднем изменится результативный признак Y, если переменную xj увеличить на единицу измерения, т. е. j является нормативным коэффициентом.

В данном случае =0,179 показывает, что при увеличении долгосрочной задолженности на 1 тыс. руб. прибыль увеличится на 179 тыс. руб.

В данном случае а3=3,172показывает, что при увеличении запасов готовой продукции для перепродажи на 1 тыс. руб. прибыль увеличится на 3712 тыс. руб.

4. Дайте сравнительную оценку силы связи факторов с результатом с помощью коэффициентов эластичности, и? коэффициентов факторный регрессионный экономический матрица Учитывая, что коэффициент регрессии невозможно использовать для непосредственной оценки валяния факторов на зависимую переменную из-за различия единиц измерения и разной колеблемости факторов, используем коэффициенты эластичности, бетаи дельтакоэффициенты.

Для коэффициента регрессии вычислим коэффициент эластичности и бета-коэффициент по формулам:

0,1 472 321 364,22/842 311,451=0,388 099 821

Прибыль увеличится на 38,81%, если фактор долгосрочные обязательства увеличатся на 1%.

4,27 476 620,02/842 311,451=0,1739

Прибыль увеличится на 17,39%, если фактор запасы готовой продукции увеличатся на 1%.

a) -коэффициент:

Коэффициент показывает, что при увеличении долгосрочных обязательств на 8 995 832,256 тыс. руб. Прибыль увеличится на 1 322 387,342 тыс. руб. (0,47*2 813 269,802)

Коэффициент показывает, что при увеличении запасов готовой продукции для перепродажи на 72 567 008 373 тыс. руб. Прибыль увеличится на 3,10151E+11 тыс. руб. (0,039*2 813 269,802)

b) -коэффициент:

Вывод: изменение результата У (прибыль) происходит под влиянием фактора (долгосрочные обязательства), включенного в модель, на 47%.

Изменение результата У (прибыль) происходит под влиянием фактора (запасы готовой продукции), включенного в модель, на 3,7%.

5. Рассчитайте параметры линейной парной регрессии для наиболее подходящего фактора Хj

В нашем случае это фактор Х1 (долгосрочные обязательства) Таблица 5

Линейное уравнение трехфакторной модели регрессии имеет вид:

6. Оценка качества построенной модели через коэффициент детерминации, средней относительной ошибки аппроксимации и F — критерия Фишера Для оценки качества модели множественной регрессии вычисляют коэффициент множественной корреляции Rи коэффициент детерминации R2. Значение коэффициентов детерминации и множественной корреляции можно вычислить по формулам:

Коэффициент детерминации R2 (R-квадрат):

=0,831,

где у? — среднее значение определяемой переменной, а у? — расчетное значение определяемой переменной.

Коэффициент детерминации можно найти в результатах регрессионного анализа (табл. 5).

Он показывает долю вариации результативного признака под воздействием изучаемых факторов. Следовательно, около 83,1% вариации зависимой переменной учтено в модели и обусловлено влиянием включенного фактора.

Коэффициент множественной корреляции, индекс корреляции (множественный R):

= 0,912

Он показывает высокую тесноту связи зависимой переменной Y с включенным в модель объясняющим фактором.

Проверка значимости уравнения регрессии производится на основе вычисления F — критерия Фишера:

= (0,831/1) / ((1−0,831)/(50−1-1)) = 236,46,

где n — количество наблюдений (компаний);

а k — количество факторов (переменных анализа).

Расчетное значение F — критерия берем из результатов регрессионного анализа (табл. 5).

Табличное значение F — критерия при доверительной вероятности 0,95 при v1 = k = 1 и v2 = n — k — 1 = 50 — 1 — 1 = 48 составляет 4,04. Табличное значение F — критерия можно найти с помощью функции F.

Поскольку F>F, уравнение регрессии следует признать значимым, т. е. его можно использовать для анализа и прогнозирования.

Уровень точности модели характеризует степень отклонения в среднем фактических значений результативной переменной Y от ее значений, полученных по модели регрессии.

Точность модели оценим с помощью средней ошибки аппроксимации:

Модель считается неточной, т.к. > 5%.

Таблица 6

у

х1

yt

et

4 920 199

163 190,1

163 190,1

0,127 803

40 788,62

— 35 642,6

35 642,62

0,873 837

18 903

32 692,08

— 19 080,1

19 080,08

0,58 363

13 398

31 294,64

— 30 330,6

30 330,64

0,969 196

63 269 757

— 3 424 272

— 0,21 283

367 880

121 279,8

— 92 306,8

92 306,81

0,761 106

— 780 599

3 933 712

— 1 807 064

1,760 473

5 910 831

0,699 973

5 325 806

— 751 757

751 757,1

0,544 812

705 877

207 080,3

— 177 876

177 876,3

0,858 973

2 964 277

780 374,6

1,49 311

624 661

186 463,6

179 706,4

179 706,4

0,963 761

— 20 493

46 728

39 755,45

— 60 248,5

60 248,45

1,515 476

582 581

175 781,6

205 776,4

205 776,4

1,170 637

3 463 511

0,351 451

5 891 049

1,162 354

299 286

103 867,2

312 748,8

312 748,8

3,11 043

— 564 258

801 276

231 297,3

— 795 555

795 555,3

3,439 536

257 633

93 293,64

127 900,4

127 900,4

1,370 944

1 566 040

425 432,4

275 602,6

275 602,6

0,647 817

528 912

162 157,7

— 99 957,7

99 957,75

0,616 423

167 297

70 361,86

53 078,14

53 078,14

0,754 359

52 042

41 104,41

14 423,59

14 423,59

0,350 901

188 662

75 785,36

346 284,6

346 284,6

4,569 281

— 468

130 350

60 982,88

— 61 450,9

61 450,88

1,7 674

585 017

49 052,01

49 052,01

0,278 073

— 61 237

344 398

115 318,9

— 176 556

176 555,9

1,531 023

— 540

36 641

37 194,87

— 37 734,9

37 734,87

1,14 518

215 106

82 498,17

— 41 910,2

41 910,17

0,508 013

998 875

281 457,7

— 228 276

228 275,7

0,811 048

— 210

1 702

28 325,61

— 28 535,6

28 535,61

1,7 414

807 686

232 924,5

— 169 866

169 866,5

0,729 277

1 567 998

425 929,5

771 266,5

771 266,5

1,810 785

128 256

60 451,32

160 725,7

160 725,7

2,658 762

7 720 298

— 438 921

438 921,4

0,22 082

— 33 030

14 412

31 552,04

— 64 582

64 582,04

2,46 842

921 832

261 900,4

— 226 971

226 971,4

0,866 633

233 340

87 126,86

28 720,14

28 720,14

0,329 636

361 672

119 703,9

— 84 505,9

84 505,91

0,705 958

458 233

144 215,9

644 351,1

644 351,1

4,467 962

619 452

185 141,3

123 911,7

123 911,7

0,669 282

119 434

58 211,85

— 49 659,9

49 659,85

0,853 088

257 140

93 168,49

79 910,51

79 910,51

0,857 699

129 031,4

129 031,4

0,117 517

324 968

110 386,6

591 341,4

591 341,4

5,357 003

81 960

48 699,09

— 30 772,1

30 772,09

0,631 882

35 232 071

— 6 413 848

0,71 491

76 430

47 295,3

— 47 295,3

47 295,3

21 132

33 257,91

— 27 851,9

27 851,91

0,837 452

79 930

48 183,77

— 7186,77

7186,773

0,149 153

3E-09

59,56 649

827 545,2

2 082 587,52

7. Проверьте выполнение условия гомоскедастичности Рис. 4. Графики остатков по фактору однофакторной модели Из графиков, представленных на рис. 4.3, видно, что дисперсия остатков более всего нарушена по отношению к фактору Х3.

Проверим наличие гомоскедастичности в остатках однофакторной модели на основе теста Гольдфельда-Квандта.

1. Упорядочим переменные Y и X1 по возрастанию фактора Х3(в Excel для этого можно использовать команду Данные — Сортировка по возрастанию Х3):

Данные, отсортированные по возрастанию Х3 (Рис. 5)

1. Убираем из середины упорядоченной совокупности C=¼*50 = 12 значений. В результате получили две совокупности по Ѕ (50−12) = 19 значений соответственно с малыми и большими значениями X3.

2. Для каждой совокупности выполним регрессионный анализ (табл. 7−8).

Рис. 5

Таблица 7

Таблица 8

3. Находим отношение полученных остаточных сумм квадратов

R = 3,47E+12/8,92Е+13= 0,039

4. Вывод о наличии гомоскедастичности остатков делаем с помощью Fкритерия Фишера с уровнем значимости и двумя одинаковыми степенями свободы к = 18 (k=(n-C-2*p)/2,

где р — число коэффициентов в уравнении регрессии).

Fтабл. = 2,21

Так как Fтабл

8. Используя результаты регрессионного анализа, ранжируйте компании по степени эффективности Для ранжирования компаний по степени эффективности, построим доверительные интервалы для результирующей переменной.

Доверительный интервал для отдельных значений переменной можно определить рассчитав вначале ошибку моделирования:

Где Х — матрица факторов.

Можно применить упрощенную формулу одинаковую для всех уровней:

Верхняя граница доверительного интервала:

Нижняя граница доверительного интервала:

Таблица 9

у

х1

Предсказанное Y

Остатки

4 920 199

163 190,1

40 788,62

— 35 642,6

18 903

32 692,08

— 19 080,1

13 398

31 294,64

— 30 330,6

63 269 757

367 880

121 279,8

— 92 306,8

— 780 599

3 933 712

— 1 807 064

5 910 831

5 325 806

— 751 757

705 877

207 080,3

— 177 876

2 964 277

780 374,6

624 661

186 463,6

179 706,4

— 20 493

46 728

39 755,45

— 60 248,5

582 581

175 781,6

205 776,4

3 463 511

5 891 049

299 286

103 867,2

312 748,8

— 564 258

801 276

231 297,3

— 795 555

257 633

93 293,64

127 900,4

1 566 040

425 432,4

275 602,6

528 912

162 157,7

— 99 957,7

167 297

70 361,86

53 078,14

52 042

41 104,41

14 423,59

188 662

75 785,36

346 284,6

— 468

130 350

60 982,88

— 61 450,9

585 017

49 052,01

— 61 237

344 398

115 318,9

— 176 556

— 540

36 641

37 194,87

— 37 734,9

215 106

82 498,17

— 41 910,2

998 875

281 457,7

— 228 276

— 210

1 702

28 325,61

— 28 535,6

807 686

232 924,5

— 169 866

1 567 998

425 929,5

771 266,5

128 256

60 451,32

160 725,7

7 720 298

— 438 921

— 33 030

14 412

31 552,04

— 64 582

921 832

261 900,4

— 226 971

233 340

87 126,86

28 720,14

361 672

119 703,9

— 84 505,9

458 233

144 215,9

644 351,1

619 452

185 141,3

123 911,7

119 434

58 211,85

— 49 659,9

257 140

93 168,49

79 910,51

129 031,4

324 968

110 386,6

591 341,4

81 960

48 699,09

— 30 772,1

35 232 071

— 6 413 848

76 430

47 295,3

— 47 295,3

21 132

33 257,91

— 27 851,9

79 930

48 183,77

— 7186,77

9. Осуществите прогнозирование среднего значения показателя Y при уровне значимости = 0,1, если прогнозное значение фактора Хj составит 80% от его максимального значения. Представьте на графике фактические данные Y, результаты моделирования, прогнозные оценки и границы доверительного интервала

1. Точечный прогноз фактора:

Xпрог = 0,8*52 034 182 = 41 627 345,6

2. Точечный прогноз прибыли:

При значении долгосрочных обязательств41 627 345,6 тыс. руб. прибыль составит в среднем 11 614 177,2 тыс. руб.

3. Интервальный прогноз прибыли:

Найдем ошибку прогнозирования по формуле:

Которая зависит от стандартной ошибки Sе, удаления Xпр от своего среднего значения, количества наблюдений n, заданного уровня вероятности попадания в интервал прогноза.

t (0,1;48) = 1,6772

Se = 1 414 240,697

Xср = 2 082 587,52

Нижняя граница интервала

Yпр — U = 11 614 177,2 — 5 036 306,495 = 6 577 870,695

Верхняя граница интервала

Yпр + U = 11 614 177,2 + 5 036 306,495 = 16 650 483,68

Вывод: при значении долгосрочных обязательств 41 627 345,6 тыс. руб. прибыль будет колебаться в пределах от 6 577 870,695 тыс. руб. до 16 650 483,68 тыс. руб. Графическое представление результатов моделирования по парной регрессии отражено на рис. 5.

10. Составьте уравнения нелинейной регрессии Используя MS Excel и VSTAT, подберите для данных своего варианта наилучшую трендовую модель и выполните прогнозирование по лучшей модели на два ближайших периода. Представьте в отчете соответствующие листинги с комментариями.

· Щёлкните правой кнопкой мыши на ряде динамики

· Выберите команду Добавить линию тренда из контекстного меню

· Выберите тип регрессии. При выборе типа Полиноминальная введите значение степени в поле Степень

· В параметрах отметить:

— показывать уравнение на диаграмме

— поместить на диаграмму величину достоверности аппроксимации

· Щелкните Ок.

а) гиперболической;

б) степенной;

Степенная функция не построена (не идентифицирована) в) показательной

11. Приведите графики построенных уравнений регрессии Графики приведены в 10 п.

12. Для нелинейных моделей найдите коэффициенты детерминации и средние относительные ошибки аппроксимации. Сравните модели по этим характеристикам и сделайте вывод о лучшей модели Таблица 10

Сравнение нелинейных моделей

Модель

R2

Еотн.ср.

Показательная

0,0539

0,45

Гиперболическая

0,0766

7,855

Наилучшей трендовой моделью считается гиперболическая, так как у нее большее значение коэффициента детерминации. Ее то мы и возьмем в качестве лучшей для построения прогноза.

Показать весь текст
Заполнить форму текущей работой