close

Вход

Забыли?

вход по аккаунту

- Иткина Анна Яковлевна

код для вставкиСкачать
РГУ нефти и газа имени И.М. Губкина
Метод наименьших
квадратов (МНК)
и его применение
Иткина Анна Яковлевна,
ст. преподаватель кафедры ЭНиГП
Список лекций
Метод наименьших квадратов и его
применение
Проверка гипотез о качестве уравнения
регрессии
Адекватность регрессионной модели
Проблемы автокорреляции и
гетероскедастичности. Методы обнаружения
Коррекция гетероскедастичности. Метод
взвешенных наименьших квадратов
Облако точек
60
Вы хотите узнать, что
влияет на цену
40
20
мобильного телефона?
0
0
5
10
15
Вам интересно понять, на
сколько упадет спрос на
20
10
0
0
10
20
30
жвачку при росте цены на
нефтепродукты?
Вам требуется оценить
скорость падения добычи
нефти из скважины и
необходимость
проведения МУН?
добыча
30
20
10
0
0
2
4
6
8
Вы можете сделать это на взгляд?
10
годы
МЕТОД НАИМЕНЬШИХ
КВАДРАТОВ (МНК) –
это ИНСТРУМЕНТ
построения модели
Цель – описать наблюдения
с помощью уравнения
Простейшие виды моделей
y
модели с одной
20
неизвестной
10
y = const
0
0
10
20
30
x
20
30
x
y
y = const
30
не описывают рост, не
подходят для прогноза
20
10
0
0
10
Простейшие виды моделей
y = k*x + b
y
модели с двумя
30
20
параметрами
10
0
0
y
10
20
30
x
30
x
y
y = k*lg(x ) + b
y = a*e b*x
30
30
20
20
10
10
0
0
2
4
6
8
10
x
0
0
10
20
Наши предположения
Существует зависимость
между спросом на товар N
и его ценой
Существует зависимость
между дебитом скважины
и сроком ее эксплуатации
Но нам она неизвестна!
Наши предположения
Мы думаем, что знаем
вид зависимости
Мы думаем, что знаем,
какой фактор влияет на y
Мы знаем, что есть другие
факторы, влияющие на y
Мы знаем, что есть ошибки
измерений; выборка ограничена; …
Наши предположения
Думаем, что зависимость
имеет вид
y
f ( x)
Оцениваем ее: y
где
f ( x)
M ( y | x)
нам неизвестны!
f ( x)
Парная линейная регрессия
y
Ищем лучшую кривую
60
40
y
20
60
0
0
5
10
15
x
40
20
Или прямую
0
0
5
10
15
x
Отклонения модели
(xi,yi)
y
–
случайные
отклонения
i
– неизвестны
ei
(xi,ŷi)
x
ei
yi yi – остатки модели
Меры близости:
10
15 отклонения
min максимального
min суммы отклонений
min суммы модулей
min суммы квадратов отклонений и другие
Метод наименьших квадратов
Разные меры – разные линии.
Какая лучше?
n
n
ei
2
min , т.е.
( yi yi )2
i 1
i 1
МНК – самый простой.
При выполнении некоторых условий
линия МНК – лучшая.
min
Вычисление наилучшей константы
Пусть y
y
y = const
20
a – const
Тогда
10
S
0
0
10
20
30
x
2
const
( y1 a)
2
( y2 a)
2
... ( yn a)
d S 2 const
da
Вычисляем a как решение уравнения:
n
2( y1 a) 2( y2 a) ... 2( yn a) 0
n
yi
i 1
2
0
a
n
i 1
yi
a
i 1
n
y
Обозначения
n
S2 regr = ( yi yi ) 2 – остаточная сумма квадратов (RSS)
i 1
n
S2const = ( yi y ) 2 – общая сумма квадратов (TSS)
i 1
k, b – параметры (коэффициенты) линейной
модели y k x b
Вычисление параметров линейной
модели
y
y =kx +b
S
60
2
( y1 (kx1 b))
regr
2
... ( yn (kxn b))
40
20
0
0
5
S
10
15
x
Неизвестные k и b – решение
системы уравнений
2
regr
k
S 2 regr
b
0,
0;
nb+k
b
xi
xi k
k
yi ,
xi2
xi yi ;
xy x y
x2 x
b y k x.
2
,
2
ПРИМЕР
Имеются ежемесячные
данные по дебиту скважины.
20
k
10
0.35,
Найти, когда дебит упадет
ниже 8 т/сутки?
b 19.38;
0
0
5
10
15
Какой будет добыча через
2.5 года?
15b
135k 172.4,
135b 1495k 1437.3;
k
0.41,
b 15.18;
продолжение ПРИМЕРА
flow = – 0.41month + 15.18
20
10
–0.41month – падение среднесуточного дебита на 0.41 т за
месяц.
k
0.35,
b 19.38;
0
0
5
10
15
15.18 – предполагаемый дебит
в нулевой момент времени.
8 0.41 month 15.18
month 17.5
f low
0.41 30 15.18
f low 2.88
Кривая добычи в
целом нелинейна.
Нет оснований
строить прогноз на
2.5 года вперед!
Оценка качества модели
R2 – коэффициент детерминации
R
2
RSS
1
TSS
1
2
regr
2
const
S
S
Регрессия в Excel
СПАСИБО ЗА ВНИМАНИЕ!
1/--страниц
Пожаловаться на содержимое документа