close

Вход

Забыли?

вход по аккаунту

код для вставкиСкачать
Лекция № 8
Тема: Статистическое изучение взаимосвязи социально-экономических
явлений
План:
1. Сущность и задачи корреляционного анализа.
2. Установление вида и формы корреляционной связи.
3. Коэффициент корреляции (линейная, ранговая), его значение.
1.Сущность и задачи корреляционного анализа
При изучении общественного здоровья и здравоохранения в научных и
практических целях исследователю часто приходится проводить
статистический анализ связей между факторными и результативными
признаками статистический совокупности (причинно-следственная связь)
или определение зависимости параллельных изменений нескольких
признаков этой совокупности от какой либо третьей величины (от общей их
причины). Необходимо уметь изучать особенности этой связи, определять ее
размеры и направление, а также оценивать ее достоверность. Для этого
используются методы корреляции.
Первоначальное значение термина "корреляции" - взаимная связь.
При исследовании корреляционных зависимостей решается широкий
круг вопросов: 1) предварительный анализ свойств изучаемой совокупности;
2) установленные факта наличия связи, определение ее направления и
формы; 3) измерение степени тесноты связи между признаками; 4)
нахождение аналитического (математического) выражения связи или
построение регрессионной модели; 5) оценка адекватности модели, ее
интерпретации и практическое использование.
Поэтому задачи корреляционного анализа сводятся к измерению
тесноты связи между признаками, определению неизвестных причинных
связей и оценке факторов, оказывающих наибольшее влияние на
результативный признак.
2.Установление вида и формы корреляционной связи
Виды проявления количественных связей между признаками
 функциональная связь
 корреляционная связь
Функциональная связь — такой вид соотношения между двумя
признаками, когда каждому значению одного из них соответствует строго
определенное значение другого (площадь круга зависит от радиуса круга и
45
т.д.). Функциональная связь характерна для физико-математических
процессов.
Корреляционная связь — такая связь, при которой каждому
определенному значению одного признака соответствует несколько значений
другого взаимосвязанного с ним признака (связь между ростом и массой тела
человека; связь между температурой тела и частотой пульса и др.).
Корреляционная связь характерна для медико-биологических процессов.
При сравнении функциональных и корреляционных зависимостей
следует иметь в виду, что при наличии функциональной зависимости между
признаками можно, зная величину факторного признака, точно определить
величину результативного признака. При наличии же корреляционной
зависимости устанавливается лишь тенденция изменения результативного
признака при изменении величины факторного признака. В отличие от
жесткости функциональной связи, корреляционные связи характеризуются
множеством причин и следствий, и устанавливаются лишь их тенденции.
Корреляционные связи различаются по форме, направлению и степени
(силе).
По направлению связи бывают:
– прямыми (положительными), когда зависимая переменная растет с
увеличением факторного признака;
– обратными (отрицательными), при которых рост факторного
признака сопровождается уменьшением функции.
По силе различаются сильные и слабые связи, либо полное их
отсутствие. Эта формальная характеристика выражается конкретными
величинами и интерпретируется в соответствии с общепринятыми
критериями силы связи для конкретных показателей.
46
Сила связи не зависит от ее направленности и определяется по
абсолютному значению коэффициента корреляции.
прямая взаимосвязь
обратная взаимосвязь
отсутствие взаимосвязи
Относительно своей аналитической формы связи бывают линейными и
нелинейными. В первом случае между признаками в среднем проявляются
линейные соотношения. Нелинейная взаимосвязь выражается нелинейной
функцией, а переменные связаны между собой в среднем нелинейно.
Существует еще одна достаточно важная характеристика связей с
точки зрения взаимодействующих факторов. Если характеризуется связь
двух признаков, то ее принято называть парной. Если изучаются более чем
две переменные — множественной.
Связь между результативным и факторным признаками может быть
прямолинейной и криволинейной (по параболе, гиперболе).
47
В случае прямолинейной формы связи результативный признак
изменяется под влиянием факторного равномерно.
В случае криволинейной формы – равномерное увеличение факторного
признака ведет к изменению результативного признака с ускорением.
Методы оценки тесноты связи подразделяются на:
– параметрические (корреляционные);
– непараметрические.
Параметрические (корреляционные) основаны на использовании
оценок нормального распределения и применяются в случаях, когда
изучаемая совокупность состоит из величин, которые подчиняются закону
нормального распределения.
Непараметрические методы не накладывают ограничений на законы
распределения изучаемых величин.
Непараметрические методы не накладывают ограничений на закон
распределения изучаемых величин. Их преимуществом является и простота
вычислений: Коэффициент ранговой корреляции Спирмена
3. Коэффициент корреляции (линейная, ранговая), его значение
Наиболее
совершенным
методом
выявления
и
измерения
корреляционной связи является расчет коэффициентов корреляции.
Математической мерой корреляции двух случайных величин
(факторов) служит корреляционное отношение, либо коэффициент
корреляции. В случае, если изменение одной случайной величины не ведёт к
закономерному изменению другой случайной величины, но приводит к
изменению другой статистической характеристики данной случайной
величины, то подобная связь не считается корреляционной, хотя и является
статистической. Для измерения тесноты связи между факторными и
результативными показателями исчисляется коэффициент корреляции.
Методы определения коэффициента корреляции:
 метод квадратов (метод Пирсона)
 ранговый метод (метод Спирмена)
Методические
требования
к
использованию
коэффициента
корреляции:
 измерение связи возможно только в качественно однородных
совокупностях (например, измерение связи между ростом и весом в
совокупностях, однородных по полу и возрасту)
 расчет может производиться с использованием абсолютных или
производных величин
48
 для вычисления коэффициента корреляции используются не
сгруппированные вариационные ряды (это требование применяется
только при вычислении коэффициента корреляции по методу
квадратов)
 число наблюдений менее 30
Линейный коэффициент корреляции (коэффициент Пирсона)
Теснота корреляционной связи между факторными и результативными
признаками может исчисляться с помощью линейного коэффициента
корреляции. Линейный коэффициент корреляции (r) был впервые введен в
начале 90-х гг. XIX века Пирсоном, Эджвортом и Велдоном и характеризует
тесноту и направление связи между двумя коррелируемыми признаками в
случае наличия между ними линейной зависимости.
Рекомендации к применению метода квадратов (метод Пирсона):
 когда требуется точное установление силы связи между признаками
 когда признаки имеют только количественное выражение
49
Методика и порядок вычисления коэффициента корреляции методом
квадратов:
 построить вариационные ряды для каждого из сопоставляемых
признаков, обозначив первый и второй ряд чисел соответственно х и у;
 определить для каждого вариационного ряда средние значения (М1 и М2);
 найти отклонения (dх и dy) каждого числового значения от среднего
значения своего вариационного ряда;
 полученные отклонения перемножить (dx*dy)
 каждое отклонение возвести в квадрат и суммировать по каждому ряду
(Σ dx2 и dy2)
 подставить полученные значения в формулу расчета коэффициента
корреляции:
 при наличии вычислительной техники расчет производится по формуле:
Коэффициент ранговой корреляции Спирмена
Рекомендации по применению метода ранговой корреляции :
 когда нет необходимости в точном установлении силы связи, а
достаточно ориентировочных данных
 когда признаки представлены не только количественными, но и
атрибутивными значениями
 когда ряды распределения признаков имеют открытые варианты
(например, стаж работы до 1 года и др.)
Методика вычисления:
 составить два ряда из парных сопоставляемых признаков, обозначив
первый и второй ряд соответственно х и у. При этом представить первый
ряд признака в убывающем или возрастающем порядке, а числовые
значения второго ряда расположить напротив тех значений первого ряда,
которым они соответствуют
 величину признака в каждом из сравниваемых рядов заменить
порядковым номером (рангом). Рангами, или номерами, обозначают
места показателей (значения) первого и второго рядов. При этом
числовым значениям второго признака ранги должны присваиваться в
том же порядке, какой был принят при раздаче их величинам первого
признака. При одинаковых величинах признака в ряду ранги следует
50
определять как среднее число из суммы порядковых номеров этих
величин
 определить разность рангов между х и у (d): d = х — у
 возвести полученную разность рангов в квадрат (d2)
 получить сумму квадратов разности (Σ d2) и подставить полученные
значения в формулу:
Схема оценки корреляционной связи по коэффициенту корреляции
Сила связи
Сильная
Средняя
Слабая
1.
2.
3.
4.
5.
6.
Направление связи
прямая (+)
обратная (-)
от + 1 до +0,7
от - 1 до - 0,7
от + 0,699 до + 0,3
от - 0,699 до - 0,3
от + 0,299 до 0
от - 0,299 до 0
Контрольные вопросы для закрепления:
Какие виды связи существуют между явлениями или признаками?
Является ли функциональная связь характерной для медикобиологических явлений?
Что такое корреляционная связь?
Что является критерием оценки характера и силы корреляции?
Можно ли утверждать, что коэффициент корреляции дает представление о
наличии и направлении корреляционной связи?
Можно ли утверждать, что диапазон значений коэффициента корреляции
находится в пределах от -1 до +1?
Литература:
1. Лекции по статистике [электронный ресурс] URL: http://statistiks.ru/lekcii
2. Применение методов статистического анализа для изучения
общественного здоровья и здравоохранения: учебное пособие для
практических занятий/ под ред. В. З. Кучеренко. -4-е изд., перераб.и доп.
–М.: ГЭОТАР-Медиа, 2011.-256 с.
3. Статистика. Учебное пособие. [электронный ресурс] URL: http://www.hiedu.ru/e-books/xbook096/01/part-011.htm
51
1/--страниц
Пожаловаться на содержимое документа