Пример решения задачи. Эконометрические модели
Условие задачи
По 20
предприятиям региона изучается зависимость выработки продукции на одного
работника
(тыс.руб.) от ввода в действие новых основных
фондов
(% от стоимости фондов на
конец года) и от удельного
веса рабочих высокой квалификации в общей численности рабочих
(смотри таблицу своего варианта).
Требуется:
- Построить линейную модель множественной регрессии. Записать стандартизированное
уравнение множественной регрессии. На основе стандартизированных коэффициентов
регрессии и средних коэффициентов эластичности ранжировать факторы по степени
их влияния на результат.
- Найти коэффициенты парной, частной и множественной корреляции. Проанализировать их.
- Найти скорректированный коэффициент множественной детерминации. Сравнить его с
нескорректированным (общим) коэффициентов детерминации.
- С помощью
–критерия Фишера оценить статистическую
надежность уравнения регрессии и коэффициента детерминации

- С
помощью частных
–критериев Фишера оценить целесообразность
включения в уравнение множественной регрессии фактора
после
и фактора
после
.
- Составить уравнение линейной парной регрессии, оставив лишь один значащий
фактор.
№
|
|
|
|
№
|
|
|
|
1
|
7
|
3.7
|
9
|
11
|
10
|
6.8
|
21
|
2
|
7
|
3.7
|
11
|
12
|
11
|
7.4
|
23
|
3
|
7
|
3.9
|
11
|
13
|
11
|
7.8
|
24
|
4
|
7
|
4.1
|
15
|
14
|
12
|
7.5
|
26
|
5
|
8
|
4.2
|
17
|
15
|
12
|
7.9
|
28
|
6
|
8
|
4.9
|
19
|
16
|
12
|
8.1
|
30
|
7
|
8
|
5.3
|
19
|
17
|
13
|
8.4
|
31
|
8
|
9
|
5.1
|
20
|
18
|
13
|
8.7
|
32
|
9
|
10
|
5.6
|
20
|
19
|
13
|
9.5
|
33
|
10
|
10
|
6.1
|
21
|
20
|
14
|
9.7
|
35
|
Решение задачи
Для
удобства проведения расчетов поместим результаты промежуточных расчетов в
таблицу:
№
|
|
|
|
|
|
|
|
|
|
1
|
7
|
3.7
|
9
|
25.9
|
63
|
33.3
|
13.69
|
81
|
49
|
2
|
7
|
3.7
|
11
|
25.9
|
77
|
40.7
|
13.69
|
121
|
49
|
3
|
7
|
3.9
|
11
|
27.3
|
77
|
42.9
|
15.21
|
121
|
49
|
4
|
7
|
4.1
|
15
|
28.7
|
105
|
61.5
|
16.81
|
225
|
49
|
5
|
8
|
4.2
|
17
|
33.6
|
136
|
71.4
|
17.64
|
289
|
64
|
6
|
8
|
4.9
|
19
|
39.2
|
152
|
93.1
|
24.01
|
361
|
64
|
7
|
8
|
5.3
|
19
|
42.4
|
152
|
100.7
|
28.09
|
361
|
64
|
8
|
9
|
5.1
|
20
|
45.9
|
180
|
102
|
26.01
|
400
|
81
|
9
|
10
|
5.6
|
20
|
56
|
200
|
112
|
31.36
|
400
|
100
|
10
|
10
|
6.1
|
21
|
61
|
210
|
128.1
|
37.21
|
441
|
100
|
11
|
10
|
6.8
|
21
|
68
|
210
|
142.8
|
46.24
|
441
|
100
|
12
|
11
|
7.4
|
23
|
81.4
|
253
|
170.2
|
54.76
|
529
|
121
|
13
|
11
|
7.8
|
24
|
85.8
|
264
|
187.2
|
60.84
|
576
|
121
|
14
|
12
|
7.5
|
26
|
90
|
312
|
195
|
56.25
|
676
|
144
|
15
|
12
|
7.9
|
28
|
94.8
|
336
|
221.2
|
62.41
|
784
|
144
|
16
|
12
|
8.1
|
30
|
97.2
|
360
|
243
|
65.61
|
900
|
144
|
17
|
13
|
8.4
|
31
|
109.2
|
403
|
260.4
|
70.56
|
961
|
169
|
18
|
13
|
8.7
|
32
|
113.1
|
416
|
278.4
|
75.69
|
1024
|
169
|
19
|
13
|
9.5
|
33
|
123.5
|
429
|
313.5
|
90.25
|
1089
|
169
|
20
|
14
|
9.7
|
35
|
135.8
|
490
|
339.5
|
94.09
|
1225
|
196
|
Сумма
|
202
|
128.4
|
445
|
1384.7
|
4825
|
3136.9
|
900.42
|
11005
|
2146
|
Ср.знач.
|
10.100
|
6.420
|
22.250
|
69.235
|
241.250
|
156.845
|
45.021
|
550.250
|
107.300
|
Найдем
средние квадратические отклонения признаков:



Линейное уравнение множественной регрессии
Для
нахождения параметров линейного уравнения множественной регрессии:

необходимо
решить следующую систему линейных уравнений относительно неизвестных параметров
:

либо
воспользоваться готовыми формулами:

Рассчитаем
сначала парные коэффициенты корреляции:



Таким
образом, получили следующее уравнение множественной регрессии:

Стандартизированное уравнение множественной регрессии
То есть
уравнение будет выглядеть следующим образом:

Так как
стандартизованные коэффициенты регрессии можно сравнивать между собой, то можно
сказать, что ввод в действие новых основных фондов оказывает большее влияние на
выработку продукции, чем удельный вес рабочих высокой квалификации.
Коэффициенты эластичности
Сравнивать
влияние факторов на результат можно также при помощи средних коэффициентов
эластичности:

Вычисляем:

Т.е.
увеличение только основных фондов (от своего среднего значения) или только
удельного веса рабочих высокой квалификации на 1% увеличивает в среднем
выработку продукции на 0,503% или 0,214% соответственно. Таким образом,
подтверждается большее влияние на результат
фактора
, чем фактора
.
Коэффициенты парной корреляции
Коэффициенты парной корреляции мы уже нашли:

Они
указывают на весьма сильную связь каждого фактора с результатом, а также
высокую межфакторную зависимость (факторы
и
явно коллинеарны, так как
). При такой сильной
межфакторной зависимости рекомендуется один из факторов исключить из
рассмотрения.
Частные коэффициенты корреляции
Частные
коэффициенты корреляции характеризуют тесноту связи между результатом и
соответствующим факторов при элиминировании (устранении влияния) других
факторов, включенных в уравнение регрессии.
При двух
факторах частные коэффициенты корреляции рассчитываются следующим образом:


Если
сравнить коэффициенты парной и частной корреляции, то можно увидеть, что из-за
высокой межфакторной зависимости коэффициенты парной корреляции дают завышенные
оценки тесноты связи. Именно по этой причине рекомендуется при наличии сильной
коллинеарности (взаимосвязи) факторов исключать из исследования тот фактор, у
которого теснота парной зависимости меньше, чем теснота межфакторной связи.
Коэффициент множественной корреляции
Коэффициент
множественной корреляции определить по формуле:

Коэффициент
множественной корреляции показывает на весьма сильную связь всего набора
факторов с результатом.
Нескорректированный коэффициент множественной детерминации
оценивает долю вариации результата за счет
представленных в уравнении факторов в общей вариации результата. Здесь эта доля
составляет 98.4% и указывает на высокую степень обусловленности вариации
результата вариацией факторов, иными словами – на весьма тесную связь факторов
с результатом.
Скорректированный
коэффициент множественной корреляции:

определяет
тесноту связи с учетом степеней свободы общей и остаточной дисперсий. Он дает
такую оценку тесноты связи, которая не зависит от числа факторов и поэтому
может сравниваться по разным моделям с разным числом факторов. Оба коэффициента
указывают на высокую (более 95%) детерминированность результата
в модели факторами
и
.
Критерий Фишера
Оценку
надежности уравнения регрессии в целом и показателя тесноты связи
дает
–критерий Фишера:

В нашем
случае фактическое значение
–критерия Фишера:

Получили,
что
(при
), то есть вероятность
случайно получить такое значение
– критерия не превышает допустимый уровень
значимости 5%. Следовательно, полученное значение не случайно, оно
сформировалось под влиянием существенных факторов, то есть подтверждается
статистическая значимость всего уравнения и показателя тесноты связи
.
Получили,
что
. Следовательно, включение
в модель фактора
после того, как в модель включен фактор
статистически нецелесообразно: прирост
факторной дисперсии за счет дополнительного признака
оказывается незначительным, несущественным;
фактор
включать в уравнение после фактора
не следует.
Если
поменять первоначальный порядок включения факторов в модель и рассмотреть
вариант включения
после
, то результат расчета
частного
–критерия для
будет иным.
, то есть вероятность его
случайного формирования меньше принятого стандарта
. Следовательно, значение
частного
– критерия для дополнительно включенного
фактора
не случайно, является статистически значимым,
надежным, достоверным: прирост факторной дисперсии за счет дополнительного
фактора
является существенным.
Фактор
должен присутствовать в уравнении, в том числе в варианте, когда он
дополнительно включается после фактора
.