close

Вход

Забыли?

вход по аккаунту

Наши анонсы вы можете увидеть и услышать;pdf

код для вставкиСкачать
Lunds tekniska högskola
Matematikentrum
EXEMPEL: (biljettpris, forts). En linjär regressionsmodell anpassas
Matematisk statistik
FMS035: Matematisk statistik för M
OH-bilder på föreläsning 10, 2014-05-07
Linear Regression
avgiftsökning (%)
minskning i resor (%)
avgiftsökning (%)
minskning i resor (%)
5
35
20
15
4
6
18
23
1.5
12.0
7.5
6.3
1.2
1.7
7.2
8.0
38
8
12
17
17
13
7
23
11.1
3.6
3.7
6.6
4.4
4.5
2.8
8.0
20
15
resandeminskning
EXEMPEL: Hur myket kunder förlorar vi om vi höjer biljettpriset? I en undersökning i USA k 16 bussbolag ange sin
senaste ökning (%) av biljettpriset samtidigt som de noterade
minskningen i resandeantal (%).
10
5
0
−5
Linear Regression
0
5
10
15
14
Residuals
2
12
0.95
0.90
1
10
resandeminskning (%)
20
25
30
35
40
avgiftsokning
Normplot of Residuals
0.75
0
8
0.50
0.25
−1
6
0.10
0.05
−2
4
0
10
20
30
40
−2
−1
0
1
2
2
0
0
5
10
15
20
avgiftsokning (%)
25
30
35
40
(a) Hur stor proentandel av kunderna förlorar vi för varje ny
proentandels ökning av biljettpriset?
(b) I bussbolag B tänker man höja biljettpriset med 10%. Ange
ett intervall där kundförlusten för detta bolag med 95%
säkerhet kommer att nnas.
ii
EXEMPEL: I ett radhusområde nns radhus av fyra olika hustyper med olika bostadsyta. Vid en undersökning av energiförbrukningen ett visst år hos dessa utvaldes två hus av vardera
typen oh man k följande värden:
EXEMPEL: energiförbrukning (forts).
En linjär regressionsmodell anpassas.
Bostadstyp
A
A
B
B
C
C
D
D
Bostadsyta (m2 )
96
96
116
116
136
136
146
146
25
20.0
18.0
22.8
20.8
24.1
21.5
24.3
24.0
24
energiforbrukning
Förbr (MWh)
Linear Regression
25
24
23
energiforbrukning
Linear Regression
23
22
21
20
19
22
18
90
100
110
21
120
bostadsyta
Residuals
130
140
150
Normplot of Residuals
2
20
0.95
0.90
1
0.75
19
0
18
90
100
110
120
bostadsyta
130
140
150
En naturlig modell är att förbrukningen beror linjärt av bostadsytan bortsett från oberoende slumpfel.
(a) Hur stor är energiökningen per m2? Gör inte enbart en
skattning av ökningen utan även ett kondensintervall.
(b) Gör ett 95% kondensintervall för förväntad förbrukning i
hus av typ B med användande av samtliga data.
0.50
0.25
−1
0.10
0.05
−2
80
100
120
140
160
−2
−1
0
1
2
EXEMPEL: energiförbrukning (forts).
Kondensintervall för linjen (strek-prikat),
prediktionsintervall för observationer (strekat).
Intressanta frågeställningar, enkel linjär regression:
•
I: Skatta α oh β i regressionslinjen α + β · x
Skatta okså σ 2 i modellen, dvs variationen kring linjen.
Linear Regression
28
Beräkna Iα oh Iβ , är det troligt att β =0, dvs att X inte
påverkar Y ?
26
energiforbrukning
24
biljettpris: Hur stor proentandel av kunderna förlorar vi för varje ny proentandels ökning av biljettpriset? Om β =0 innebär det att kundtillströmning inte påverkas av biljettpris.
energiforbr: Hur stor är energiökningen per m2?
22
20
18
•
16
14
90
100
110
120
bostadsyta
130
140
150
Kondensintervall för linjens läge:
q
Iµ0 = (α∗ + β ∗x0 ± ta/2(n − 2)s n1 +
(x0 −¯
x)2
P
(xi −¯
x)2
biljettpris: Vad är den förväntade kundförlusten (proent) om vi höjer priset
med 10 %?
energiförbr Vad är förväntad energiförbrukning i radhus med bostadsyta 120
m2?
•
)
För x0=120 m2 blir ett 95% intervall (20.6, 22.7) MWh.
Prediktionsintervall för ett enstaka värde:
q
IY (x0 ) = (α∗ + β ∗x0 ± tp/2 (n − 2)s 1 +
1
n
+
(x0 −¯
x)2
P
(xi −¯
x)2
)
För x0 =120 m2 blir ett 95% prediktionsintervall (18.5, 24.7)
MWh.
II: Förväntat Y -värde: Givet ett x0, vad är det förväntade
värdet på Y ? Vi söker alltså µ0 = α + β · x0, linjens läge i
punkten x0. Beräkna ett intervall för µ0 .
III: Prognos (prediktion): Givet ett x0 , var kan en enstaka
(ofta framtida observation) av Y hamna? Om denna observation beteknas Y (x0), gör ett prediktionsintervall för
Y (x0).
biljettpris I bussbolag B tänker man höja biljettpriset med 10%. Ange ett
intervall där kundförlusten för detta bolag med 95% säkerhet
kommer att nnas.
energiförbr Mitt hus är på 120 m2. Vad är energiförbrukningen för just detta
hus? Ange ett intervall där energiförbrukningen för mitt hus med
95% säkerhet kommer att nnas.
•
IV: Hur bra passar modellen till data?
•
V: Hur myket av den totala variationen i y-led har vi förklarat med modellen?
vi
v
Anpassa modellen yi = β1 xi + β2 x2i + ǫi . Inte bra ty variansen
ökar med x.
EXEMPEL: Residualanalys används för att hitta rätt modell!
Anpassa modellen yi = α + β1 xi + ǫi . Inte bra ty trend i residualerna.
Linear Regression
300
250
200
Linear Regression
1.2
150
y
1
0.8
100
0.6
y
50
0.4
0
0.2
0
0.05
0
0.1
0.15
0.2
x
−0.2
−1.5
−1
−0.5
0
x
0.5
Residuals
1
0.3
0.35
0.4
Normplot of Residuals
1.5
Normplot of Residuals
0.999
0.997
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
0.003
0.001
100
1
0.95
0.90
0.5
0.75
0
0.50
0
0.25
−100
0.10
0.05
−0.5
−1
0.25
Residuals
200
−0.5
0
0.5
1
−0.5
0
0.5
0
0.1
0.2
0.3
0.4
−100
0
100
200
1
Anpassa istället modellen yi = α + β1 xi + β2 x2i + ǫi . Nu blev det
bättre!
Anpassa istället modellen ln yi = α + β1 ln xi + ǫi . Myket bättre!
Linear Regression
6
Linear Regression
1.2
5
1
4
0.8
lny
3
0.6
y
2
0.4
1
0.2
0
0
−0.2
−1.5
−1
−0.5
0
x
0.5
Residuals
1
1.5
−1
−3.5
−3
0
0.25
0.10
0.05
−0.5
0
0.5
1
−0.2
−1
−0.5
0.999
0.997
0.99
0.98
0.95
0.90
0.75
0.50
0.25
0.10
0.05
0.02
0.01
0.003
0.001
0.50
−0.1
−0.2
−1
−1.5
Normplot of Residuals
1
0.75
0
−2
lnx
2
0.95
0.90
0.1
−2.5
Residuals
Normplot of Residuals
0.2
−1
−0.1
0
0.1
0.2
−2
−3
−2.5
−2
−1.5
−1
−2
−1
0
1
2
1/--страниц
Пожаловаться на содержимое документа