close

Вход

Забыли?

вход по аккаунту

код для вставкиСкачать
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ.
Краткие теоретические сведения.
Множественная регрессия – уравнение связи с несколькими независимыми переменными:
y  f  x 1 , x 2 ,..., x s 
где y – зависимая переменная (результативный признак);
x 1 , x 2 ,..., x s – независимые переменные (факторы).
Множественная регрессия применяется в ситуациях, когда из множества факторов, влияющих на
результативный признак, нельзя выделить один доминирующий фактор и необходимо учитывать влияние
нескольких факторов.
Заметим, что факторы не должны быть взаимно коррелированны и тем более находиться в точной
функциональной связи. Если между факторами существует высокая корреляция, то нельзя определить их
изолированное влияние на результативный показатель, и параметры уравнения регрессии оказываются не
интерпретируемыми.
Основная цель множественной регрессии – построить модель с большим числом факторов, определив при
этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.
Постановка задачи множественной регрессии.
По имеющимся данным n наблюдений за совместным изменением параметров y , x 1 , x 2 ,..., x s необходимо
определить аналитическую зависимость y  f  x 1 , x 2 ,..., x s  , наилучшим образом описывающую данные
наблюдений.
Как и в парной зависимости, возможны разные виды уравнений множественной регрессии: линейные и
нелинейные.
Ввиду четкой интерпретации параметров наиболее широко используются линейная и степенная функции.
В уравнении линейной множественной регрессии
y  a 1 x 1  a 2 x 2  ...  a s x s  b
коэффициенты a i называются коэффициентами «чистой» регрессии. Они характеризуют среднее изменение
результата с изменением соответствующего фактора на единицу при неизмененном значении других
факторов, закрепленных на среднем уровне.
В уравнении степенной функции
y  a  x1
b1
 x2
b2
 ...  x s
bs
коэффициенты b i являются коэффициентами эластичности. Они показывают, на сколько процентов
изменяется в среднем результат с изменением соответствующего фактора на 1 % при неизменности действия
других факторов. Этот вид уравнения регрессии получил наибольшее распространение в производственных
функциях, в исследованиях спроса и потребления.
Линейная регрессионная двухфакторная зависимость.
Рассмотрим основные числовые характеристики линейной корреляционной зависимости между признаком Y и
факторами X1, X2.
r X 1Y 
X 1Y  X 1  Y

X1
Y
, r X 2Y 
X 2Y  X 2  Y

X2
Y
a1 
, rX 1 X 2 
r X 1Y  r X 2 Y r X 1 X 2
1  rX 1 X 2
2
X1X 2  X1  X 2


X1
Y


- коэффициенты парной корреляции.
X2
, a2 
r X 21Y  r X 1Y r X 1 X 2
X1
1  rX 1 X 2
2

Y

X2
- коэффициенты чистой регрессии. Коэффициент a i показывает, на сколько увеличится (уменьшится)
значение признака Y при увеличении фактора X i на единицу.
Коэффициенты частной корреляции:
r x1 y ( x 2 ) 
r X 1Y  r X 2 Y r X 1 X 2
1  r
2
x1 x 2
  1  r 
2
x2 y
, r x 2 y ( x1 ) 
r X 2 Y  r X 1Y r X 1 X 2
1  r
2
x1 x 2
  1  r 
2
x1 y
Эти коэффициенты характеризуют тесноту связи между результатом и соответствующим фактором при
устранении
влияния другого фактора, включенного в уравнение регрессии. Они широко используются при решении
проблемы отбора факторов: целесообразность включения того или иного фактора в модель доказывается
величиной показателя частной корреляции.
Уравнение множественной регрессии в естественном виде
Y  Y  a1 ( X 1  X 1 )  a 2 ( X 2  X 2 )
В случае, когда рассматриваемые признаки имеют различную природу или различную размерность, уравнение
множественной регрессии ищут в стандартизированной форме:
Y Y
Y
Y Y
Y
,
X1  X1

X1
,
X2  X2

-
 X  X
1
1
 1
 
X1

стандартизированные

 X  X
   2
2

 
X2


2




переменные.
Коэффициенты
i
называются
X2
стандартизированными коэффициентами регрессии. Стандартизованные коэффициенты регрессии
показывают, на сколько сигм (средних квадратических отклонений) изменится в среднем результат, если
соответствующий фактор x i изменится на одну сигму при неизменном среднем уровне других факторов. В
силу того, что все стандартизированные переменные заданы как центрированные и нормированные,
стандартизованные коэффициенты регрессии  i сравнимы между собой. Сравнивая их друг с другом, можно
ранжировать факторы по силе их воздействия на результат. В этом основное достоинство стандартизованных
коэффициентов регрессии в отличие от коэффициентов «чистой» регрессии, которые несравнимы между
собой.
Связь коэффициентов чистой регрессии a i со стандартизованными коэффициентами  i описывается
соотношениями:
ai   i
Э Xi  ai 
Xi
Y


y
,  i  ai
xi


xi
y
- средний коэффициент эластичности по переменной X i . Он показывает, на сколько процентов
в среднем по совокупности изменится результат Y от своей величины при изменении фактора X i на 1 % от
своего значения при неизменном значении другого фактора.
Коэффициент множественный корреляции:
R 
r X 1Y
2
 2  r X 1 X 2  r X 1Y  r X 2 Y  r X 2 Y
1  rX 1X 2
2
2
При этом, если полученный коэффициент близок к единице, то можно делать вывод о тесной линейной связи
между всеми рассматриваемыми переменными.
2
R
- коэффициент множественной детерминации
Задание.
Имеются данные о значениях Y , X 1, X 2 .
1. Найти коэффициенты парной корреляции. Найти коэффициенты чистой регрессии и пояснить их смысл.
2. Рассчитать коэффициенты частной корреляции и пояснить их смысл
3. Составить уравнение множественной регрессии в естественной форме и привести его к виду
Y  a1 X 1  a 2 X 2  b .
4. Вычислить стандартизированные коэффициенты регрессии и пояснить их смысл
5. Составить уравнение множественной регрессии в стандартизированной форме
6. Найти средние коэффициенты эластичности по каждому из признаков и пояснить их смысл.
7. Найти множественной коэффициент корреляции и коэффициент множественной детерминации и сделать
вывод о силе связи всех рассматриваемых признаков.
Образец выполнения работы.
Y
X1
X2
-4,73
1
-1
-3,45
2
0,8
-6,48
3
1,1
-6,64
4
2,4
-9,91
5
2,2
1.Вычислим коэффициенты парной корреляции.
Y
X1
X2
X1^2
X2^2
Y^2
X1X2
X1Y
X2Y
-4,73
1
-1
1
1
22,419
-1
-4,73484
4,735
-3,45
2
0,8
4
0,64
11,891
1,6
-6,89675
-2,759
-6,48
3
1,1
9
1,21
41,999
3,3
-19,442
-7,129
-6,64
4
2,4
16
5,76
44,027
9,6
-26,541
-15,92
-9,91
5
2,2
25
4,84
98,206
11
-49,5495
-21,8
-31,21
15
5,5
55
13,45
218,54
24,5
-107,164
-42,88
-6,24
3
1,1
11
2,69
43,708
4,9
-21,43
-8,57
Предпоследняя строка таблицы – суммы столбцов, последняя – средние значения соответствующих величин

X1

2
X1  X1
2

11  3
Y 
Y
Y
2
, X 
 1 . 41
2
2
X
2

2
 X
2
43 . 708  (  6 . 24 )
2

2
2
2 . 69  1 . 1  1 . 2166
2
,
 2 . 179 .
Коэффициенты парной корреляции:
r X 1Y 
r X 2Y 
X 1Y  X 1  Y

X1
Y
X 2Y  X 2  Y

X2
 21 . 43  3  (  6 . 24 )

Y
1 . 41  2 . 179
 8 . 57  1 . 1  (  6 . 24 )


X1

  0 . 645 ,
1 . 2166  2 . 179
X1X 2  X1  X 2
rX 1X 2 
  0 . 8786
X2

4 .9  3  1 .1
1 . 41  1 . 2166
 0 . 93
Вычислим коэффициенты чистой регрессии:
a1 
r X 1Y  r X 2 Y r X 1 X 2
1  rX 1 X 2
2

Y

r X 21Y  r X 1Y r X 1 X 2
  3 . 178 , a 2 
1  rX 1X 2
X1
2

Y

 2 . 281
X2
Таким образом, при увеличении переменной X1 на единицу и сохранении X2 на среднем уровне, значение
переменной Y в среднем уменьшится на 3.178. При увеличении переменной X2 на единицу и сохранении X1 на
среднем уровне, значение переменной Y в среднем увеличится на 2.281
2.Вычислим коэффициенты частной корреляции.
r x1 y ( x 2 ) 
r x 2 y ( x1 ) 
r X 1Y  r X 2 Y r X 1 X 2
1  r
2
x1 x 2
  1  r 
x2 y
r X 2 Y  r X 1Y r X 1 X 2
1  r
2
x1 x 2
  0 . 992 ,
2
  1  r 
 0 . 98
2
x1 y
Следовательно, при устранении влияния фактора X 2 , между переменными X 1 и Y будет наблюдаться тесная
обратная связь. При устранении влияния фактора X 1 , между переменными X 2 и Y будет наблюдаться
тесная прямая связь.
Наконец, поскольку оба коэффициента по абсолютной величине близки к единице, то оба фактора оказывают
значительное влияние на формирование результативного признака, и при построении модели целесообразно
учитывать оба этих фактора.
3. Составим уравнение регрессии в естественной форме:
Y  Y  a1 ( X 1  X 1 )  a 2 ( X
2
 X 2 ),
Y  6 . 24   3 . 178 ( X 1  3 )  2 . 281 ( X
 1 . 1)
2
Преобразуем его к виду:
Y   3 . 178 X 1  2 . 281 X
2
 0 . 784
4.Найдем стандартизированные коэффициенты регрессии:
 1  a1


x1
  2 . 063 ,  2  a 2


y
x2
 1 . 273
y
Первый коэффициент показывает, что, если фактор X 1 увеличится на одну сигму  X  1 . 41 (при неизменном
1
уровне X 2 ), то результирующий признак уменьшится на 2 . 063  Y . Если фактор X 2 увеличится на одну
сигму  X  1 . 126 (при неизменном уровне X 1 ), то результирующий признак увеличится на 1 . 273  Y . Таким
2
образом, можно сделать вывод, что влияние первого фактора на результирующий признак более значительно.
5.Уравнение множественной регрессии в стандартизированной форме:
 X  X
1
1
 1
 
X1

Y Y
Y

 X  X
   2
2

 
X2






2
 X1  3
 X 2  1 .1 
  2 . 063 
  1 . 273 
,
 1 . 41 
 1 . 217 
Y  6 . 24
2 . 179
t y   2 . 063 t 1  1 . 273 t 2
где t y 
Y Y
Y
, t1 
X1  X1

, t2 
X2  X2

X1
- стандартизированные переменные
X2
6.Вычислим средние коэффициенты эластичности по каждому фактору.
Э X1  a1 
X1
Y
  1 . 53 , Э X 2  a 2 
X
2
 0 .4
Y
При увеличении фактора X 1 на 1% (и неизменном значении фактора X 2 ), результат Y в среднем по
совокупности уменьшится на 1.53%
При увеличении фактора X 2 на 1% (и неизменном значении фактора X 1 ), результат Y в среднем по
совокупности увеличится на 0.4%
7.Найдем множественный коэффициент корреляции и коэффициент множественной детерминации:
R 
R
2
r X 1Y
2
 2  r X 1 X 2  r X 1Y  r X 2 Y  r X 2 Y
1  rX1X 2
2
 0 . 995
2
 0 . 991
Полученные значения близки к единице. Можно сделать вывод о тесной линейной связи между изучаемыми
величинами.
8.Проверим значимость уравнения множественной регрессии с помощью критерия Фишера. Число
параметров при факторных переменных m=2.
F факт 
R
2
1 R
2

n  m 1
m

0 . 991
1  0 . 991
F табл   0 . 05 ; k 1  2 ; k 2  2   19

5  2 1
 110 . 11
2
Поскольку F табл  F факт , то оцениваемое уравнение статистически значимо и надежно.
Индивидуальные задания.
X1
X2
1
2
3
4
5
-1
0,8
1,1
2,4
2,2
X1
X2
1
2
3
4
5
-1
0,8
1,1
2,4
2,2
1
3,62
3,76
5,68
6,43
8,6
6
-4,65
-1,01
-2,16
-0,22
-2,85
Y
Вариант №
2
3
4
-0,72
3,08
4,46
-4,14
3,79
5,51
-7,06
5,95
8,06
-9,56
7,37 10,21
-11,67
9
13,21
Y
Вариант №
7
8
9
2,11
-3,96 5,33
7,58
0,42
2,47
10,47
1,26
2,76
14,76
3,4
1,34
17,56
2,18
3,75
5
-0,24
6,58
9,62
16,09
17,51
10
4,03
3,31
4,79
4,06
5,8
1/--страниц
Пожаловаться на содержимое документа