Цель разработки;pdf

Лекция 3
Описательная статистика
Нормальное распределение
КОЭФФИЦИЕНТ ВАРИАЦИИ (изменчивости)
Станд. отклонение генер.
совокупности
МX
Матем. ожидание генер.
совокупности
Служит безразмерной оценкой разброса выборки.
СТАТИСТИЧЕСКИЙ КОЭФФИЦИЕНТ ВАРИАЦИИ
(оценка по выборке)
ст
S
X
На практике желательно, чтобы
Оценка
стандартного
отклонения по
выборке
Оценка матем.
ожидания по
выборке
<=33%.
МОДА (MODE)
Наиболее вероятное значение. Графически –
значение случайной величины в точке максимума
функции плотности вероятности.
МОДА (для непрерывной плотности
распределения)
p(x)
max плотности
x
МЕДИАНА (MEDIAN)
Геометрически - делит площадь под
кривой плотности распределения пополам.
Для выборки – количество значений,
меньших медианы, равно количеству
значений, больших медианы.
(Если длина выборки четная, в
качестве медианы берется полусумма
значений, стоящих посредине).
Мода, медиана и математическое
ожидание
• График плотности несимметричного
распределения
Пример
В
т
а
б
л
и
ц
е
п
р
и
в
е
д
е
н
ы
д
а
н
н
ы
е
п
о
п
о
р
и
с
т
о
с
т
и
(
m
)
э
к
с
п
л
у
а
т
а
ц
и
о
н
н
о
г
о
о
б
ъ
е
к
т
а
.
Т
а
б
л
и
ц
а
.
2 3 4 5 6 78 9 1
0
1
11
2
№
с
к
в
а
- 1
ж
и
н
ы
m
2
3
,
32
2
,
02
5
,
02
1
,
8
1
2
,
8
2
5
,
0
2
12
3
,
3
2
5
,
0
2
3
2
5
,
7
1
3
Мода – 25,0.
Нахождение медианы.
Вариационный ряд: 12.8 13 21 21.8 22
25.0 25.7.
Медиана=(23.0+23.3)/2=23.15.
23 23.3 23.3 25.0 25.0
Стандартная ошибка (не путать со стандартным
отклонением)
Оценка по выборке
s
n
Длина выборки
ЭКСЦЕСС (KURT)
Для генеральной совокупности
Ex=
Ех
4/
М [( xi - X
4
s
4-3
4
Для выборки
3
Положительный эксцесс обозначает относительно
остроконечное распределение. Отрицательный эксцесс
обозначает относительно сглаженное распределение.
Коэффициент асимметрии (СКОС, SKEW)
Для СВ
3
As
M[ (x i -X ) ]
s3
Для выборки
(оценка)
Положительный коэффициент асимметрии
указывает на отклонение распределения в
сторону меньших значений.
Отрицательный коэффициент асимметрии
указывает на отклонение распределения в
сторону больших значений.
Асимметрия
Асимметричные ряды распределения.
а – с правосторонней асимметрией
б – с левосторонней асимметрией
ПРОГРАММА «Описательная статистика»
• Анализ данных->Описательная
статистика
1. Установка надстройки «Пакет анализа» :
Щелкните значок «Кнопка Microsoft Office», затем щелкните параметры
Excel.
Перейдите на вкладку «Надстройки», затем в поле «Управление»
выберите «Надстройки Excel»
Нажмите кнопку «Перейти»
В поле «Доступные надстройки» установите флажок «Пакет анализа» и
нажмите «Ok»
2. Расчет описательных статистик:
На вкладке «Данные» в группе «Анализ» выберите «Анализ данных»
В появившемся списке выберите «Описательная статистика»
Задайте диапазон данных и отметьте пункт «Итоговая статистика»
ПРОГРАММА «Описательная
статистика»
Трафик
9,7
8,7
10,2
11,3
11,2
11,7
7,8
9,8
11,1
8,9
9,3
8,3
8,2
9,0
9,2
7,9
9,4
9,6
10,1
9,6
Трафик
Среднее
Стандартная ошибка
Медиана
Мода
Стандартное отклонение
Дисперсия выборки
Эксцесс
Асимметричность
Интервал
Минимум
Максимум
Сумма
Счет
Наибольший(1)
Наименьший(1)
Уровень надежности(95,0%)
9,56
0,25
9,51
#Н/Д
1,14
1,29
-0,58
0,32
3,92
7,82
11,73
191,17
20,00
11,73
7,82
0,53
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (или РАСПРЕДЕЛЕНИЕ
ГАУССА)
Сумма большого числа независимых (или слабозависимых)
случайных величин, подчиненных каким угодно законам
распределения, подчинена НОРМАЛЬНОМУ закону.
Примеры нормальных распределений
скорости фильтрации песков;
дебит добывающих скважин;
давление закрученного потока газа в трубе;
размер детали, изготовленной на станке.
28.09.2014
16
НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ (или
РАСПРЕДЕЛЕНИЕ ГАУССА)
Непрерывная случайная величина
1
p( x )
e
σ 2π
Стандартное
отклонение
28.09.2014
Матем. ожидание
1 (x μ)
2 σ2
2
дисперсия
- < x<
17
Параметры
•
•
•
•
•
•
•
•
μ – коэффициент сдвига
σ2 > 0 – коэффициент масштаба
Математическое ожидание μ
Медиана μ
Мода μ
Дисперсия σ2
Коэффициент асимметрии 0
Коэффициент эксцесса 0
28.09.2014
18
ПЛОТНОСТЬ РАСПРЕДЕЛЕНИЯ
28.09.2014
19
ФУНКЦИЯ РАСПРЕДЕЛЕНИЯ
28.09.2014
20
Стандартное нормальное
распределение
• называется нормальное распределение
с математическим ожиданием 0 и
стандартным отклонением 1.
Обозначение N(0,1)
ИЗ N(0,1) МОЖНО ПОЛУЧИТЬ НОРМАЛЬНОЕ РАСПРЕДЕЛЕНИЕ С
ЛЮБЫМИ ПАРАМЕТРАМИ
28.09.2014
21
Свойства нормального распределения
• с вероятностью 68.2% такая случайная величина
принимает значения в интервале (μ - , μ + )
• c вероятностью 95.46% такая случайная величина
принимает значения в интервале (μ -2 , μ+2 );
• c вероятностью 99.7% такая случайная величина
принимает значения в интервале (μ -3 , μ +3 ).
28.09.2014
22
Функции в Excel (OpenOffice), связанные
с нормальным распределением
•
•
•
•
28.09.2014
НОРМРАСП (NORMDIST)
НОРМОБР (NORMINV)
НОРМСТРАСП (NORMSDIST)
НОРМСТОБР (NORMSINV)
23
Генерация псевдослучайных чисел
• Сервис->Анализ данных – >Генерация
случайных чисел
28.09.2014
24
Литература
Н.В. Макарова В.Я. Трофимец
Статистика в Excel М. Финансы и статистика.
https://sites.google.com/site/expdata09/ucebnoe-posobie
Гусейнзаде М.А., Калинина Э.В., Добкина М.Б.
Методы математической статистики в
нефтяной и газовой промышленности
28.09.2014
25