планирование эксперимента. проведение бивалентного и

ДНЕПРОПЕТРОВСКАЯ ГОСУДАРСТВЕННАЯ
МЕДИЦИНСКАЯ АКАДЕМИЯ
КАФЕДРА МЕДИКО-БИОЛОГИЧЕСКОЙ ФИЗИКИ И ИНФОРМАТИКИ
Методическое пособие для студентов IV курса специальности
" Фармация ", "Клиническая фармация"
по теме:
“ПЛАНИРОВАНИЕ ЭКСПЕРИМЕНТА.
ПРОВЕДЕНИЕ БИВАЛЕНТНОГО И
МУЛЬТИВАЛЕНТНОГО ЭКСПЕРИМЕНТОВ.
СПОСОБЫ ПРЕДСТАВЛЕНИЯ РЕЗУЛЬТАТОВ
ЭКСПЕРИМЕНТА“
Составитель:
преп. Каземир В.С.
ДНЕПРОПЕТРОВСК
2013
Цель
работы:
Составить
математическую
модель
эксперимента.
Получить уравнение регрессии, отобрав значимые коэффициенты регрессии.
Проверить адекватность модели по критерию Фишера.
Теоретическая часть
Экспериментальные исследования начинаются с формулировки цели
эксперимента, перечня влияющих факторов и их уровней, выбора показателя, по
которому будут оценивать результаты эксперимента. Составляется план
эксперимента, математическая модель.
1. ПЛАНИРОВАНИЕ И ОБРАБОТКА ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ
В медицинских исследовательских задачах, в которых необходимо
проведение большого числа опытов при учете нескольких факторов и их
комбинаций, очень полезными могут оказаться специальные планы эксперимента,
основанные на комбинаторных конфигурациях. Применяя специальные планы
(используя латинский куб второго порядка), задачу можно решить с помощью
меньшего количества опытов. При этом полученный экспериментальный материал
будет удовлетворять всем требованиям.
Задачи такого типа характерны для весьма многих областей исследования.
Это и поиск новых лекарственных препаратов, удобрений, кормов, строительных
материалов, сплавов, смазочных масел и многих других смесей.
Планирование и анализ эксперимента представляют собой важную ветвь
статистических методов, разработанную для обнаружения и проверки причинных
связей между входными переменными (факторами) и выходными (откликами).
2. ПРОСТЫЕ ДВУХУРОВНЕВЫЕ ПЛАНЫ
Под планированием эксперимента понимается процедура выбора числа
опытов и условий их проведения, необходимых для решения поставленной задачи
с требуемой точностью. Все факторы, определяющие процесс, изменяются
одновременно
по
специальным
правилам,
а
результаты
эксперимента
представляются в виде математической модели, обладающей некоторыми
«хорошими» статистическими свойствами. При этом можно выделить следующие
этапы:
-
сбор и анализ априорной информации;
-
выбор входных и выходных переменных, области
экспериментирования;
-
выбор математической модели, с помощью которой будут
представляться экспериментальные данные;
-
выбор критерия оптимальности и плана эксперимента;
-
определение метода анализа данных;
-
проведение эксперимента;
-
проверка статистических предпосылок для полученных
экспериментальных данных;
-
обработка результатов;
-
интерпретация и рекомендации.
Входные переменные (факторы) определяют состояние объекта. Факторы
могут быть количественными и качественными. Выходные переменные - это
реакции (отклики) на воздействие входных переменных (см. Методическое
пособие “Применение дисперсионного анализа в фармации”). Обозначим
наблюдаемый отклик через у, а факторы - через х1 , х2,...хк. Выбор модели зависит
от наших знаний об объекте, целей исследования и математического аппарата. При
изучении
кинетики
химических
процессов
принято
пользоваться
дифференциальными уравнениями. Химические равновесия часто описываются
дробно-рациональными функциями, а колебательные процессы в химических
реакторах - тригонометрическими. Если вид функции неизвестен, то полезным
оказывается ее представление в виде разложения в степенные ряды.
Пользуясь результатами эксперимента, можно получить лишь оценки
параметров этой модели:
y
b0
bi x i
bij x i x j
...
где у - значение отклика, предсказанного этим уравнением. Оценки
коэффициентов обычно получают с помощью метода наименьших квадратов.
Чтобы убедиться в приемлемости такой оценки, нужно провести статистический
анализ, задача которого- оценить параметры генеральной совокупности по данным
выборки,
учитывая
экспериментального
неопределенность,
материала.
вносимую
При статистическом
3
ограниченностью
анализе проверяется
значимость
коэффициентов
регрессии
и адекватность линейной модели
(соответствие модели экспериментальным данным по выбранному критерию).
Планированию
экспериментов
предшествует
этап
выбора
области
экспериментирования, центра эксперимента и интервалов варьирования факторов.
При этом оцениваются границы областей определения факторов, задаваемых
принципиальными ограничениями либо технико-экономическими соображениями.
Построение наиболее простых планов сводится к выбору экспериментальных
точек, симметричных относительно центра эксперимента. Мы будем здесь
рассматривать именно такие симметричные двухуровневые планы. В этом случае
все к факторов изменяются на двух уровнях и план эксперимента носит название
плана типа 2 k . Интервалом варьирования факторов называется некоторое число
(свое для каждого фактора), прибавление которого к основному уровню дает
верхний уровень, а вычитание - нижний. Чтобы упростить и унифицировать запись
условий опытов и облегчить обработку экспериментальных данных, масштабы по
осям задаются в виде кодированных значений +1 и -1.
Пусть в эксперименте по ускоренному старению лекарственных форм
исследуется два фактора: температура хранения препарата без упаковки и
продолжительность хранения. Изменяются два фактора на двух уровнях: x1 температура и х2 - время хранения. Для x1 основным уровнем является 600С, а
интервал варьирования составляет 100С. Тогда для 700С будет верхним уровнем, а
500С нижним. Верхнему значению приписываем +1, нижнему -1.
Эксперимент, в котором реализованы все возможные сочетания уровней
факторов, называется полным факторным (ПФЭ). Для п уровней это будет ПФЭ
типа пк. Условия эксперимента представляются в виде таблицы - матрицы
планирования. Вот пример матрицы планирования с учетом свободного члена b0 и
эффекта взаимодействия b12
Номер опыта
1
2
3
4
x0
x1
x2
x1 x2
у
+1
+1
+1
+1
-1
+1
-1
+1
-1
+1
+1
-1
+1
+1
-1
-1
у1
у2
у3
у4
Этот план соответствует модели: y b0 b1 x1 b2 x 2 b12 x1 x 2 . Полное число
всех возможных эффектов равно N - числу опытов ПФЭ.
Для более сложных моделей выбираются планы с числом уровней, большим
2.
3.
РЕГРЕССИОННЫЙ
АНАЛИЗ
ДЛЯ
ОРТОГОНАЛЬНЫХ
ДВУХУРОВНЕВЫХ ПЛАНОВ
Рассмотрим 3-х факторный эксперимент. Нас будут интересовать линейные
эффекты
y
b0
b1 x1
и
b2 x 2
парные
b3 x 3
взаимодействия.
b12 x1 x 2
Модель
b23 x 2 x 3 .
b13 x1 x 3
объекта
Наиболее
имеет
простой
вид:
план,
допускающий оценку всех коэффициентов этой модели - полный факторный
эксперимент 23. Для оценки ошибки воспроизводимости все опыты дублировались.
Оценка дисперсий среднего арифметического.
n
yi ) 2
( y ik
S i2
k 1
n 1
,
где yik- результат отдельного опыта, y i - среднее значение отклика по повторным
опытам, п - количество параллельных опытов, q - номер параллельного опыта, i номер строки матрицы плана, i = 1... N.
Проверка однородности дисперсий с помощью критерия Кохрена. Критерий
Кохрена определяется отношением максимальной дисперсии к сумме всех
дисперсий:
2
S max
S i2
Y
Гипотеза
об
однородности
дисперсий
не
отвергается,
если
экспериментальное значение критерия Кохрена не превысит табличного.
Оценка
усредненной
дисперсии
воспроизводимости.
рассчитывается, если дисперсии однородны:
S cp
2
Вычисление коэффициентов уравнения.
5
S i2
N
Эта
оценка
N
N
x ji y i
bj
i 1
x ji x ki y i
, b jk
N
i 1
N
где xji - значение j-го фактора в i-ом опыте, которые умножаются на средние
значения отклика в i–ом опыте.
Проверка гипотезы об адекватности модели. Проверка основана на расчетах
дисперсии адекватности S A2 и критерия Фишера (F-критерия).
N
( yi
S A2
yˆ i ) 2
i 1
N
m
S A2
S cp2
,F
где yˆ i - рассчитанное по уравнению регрессии значение отклика, m - число
значимых
коэффициентов
регрессии.
Рассчитанное
значение
F-критерия
сравнивается с табличным значением, определяемым числами степеней свободы Nm и N. Если экспериментальная величина F-критерия не превышает табличного
значения, то гипотеза об адекватности модели не отвергается.
Проверка значимости коэффициентов регрессии. Поскольку план
ортогонален, коэффициенты регрессии определяются с одной и той же дисперсией:
S2
S cp2
N
. Далее для коэффициентов регрессии рассчитывается доверительный
интервал с некоторой доверительной вероятностью:
коэффициент Стьюдента для уровня значимости
t(
N ) S . t( , N ) -
. Коэффициент значим, если его
абсолютная величина больше доверительного интервала.
Незначимые коэффициенты регрессии исключаются и вновь проводится
проверка адекватности модели со значимыми коэффициентами.
Статистический анализ завершается интерпретацией модели в терминах
объекта исследования.
Практическая часть.
Оценка комплексного влияния нескольких факторов на содержание
активного фармацевтического ингредиента (АФИ) при ускоренном старении
лекарственных форм.
Этапы планирования эксперимента:
1.
Выбор входных переменных (факторов): х1 х2, ..., х п .
2.
Определение области экспериментирования.
3.
Выбор выходной переменной (отклика): у .
4.
Выбор математической модели, с помощью которой будут
представляться экспериментальные данные - функции взаимосвязи у и х1, х2, ..., х п .
5.
Выбор плана эксперимента.
6.
Кодирование факторов, построение матрицы планирования.
7.
Проведение эксперимента.
8.
Статистический анализ результатов эксперимента.
9.
Интерпретация и рекомендации.
Порядок выполнения работы:
Факторы:
х 1 - температура;
х2 – время хранения;
х3 – облучение видимым светом.
Фак
тор
Обозна
чение
Содержа
ние
Единицы
измерения
Основной Интервал
уровень варьирования
Ниж Верхний
ний
1
х1
°С
60
10
50
70
2
х2
температу
ра
облучение
ч. в сут.
7
7
0
14
3
х3
время
дней
14
7
7
21
Количество факторов 3. Количество уровней 2.
Отклик: у – содержание примеси сульфамида в %.
Математическая модель процесса:
y
b0
b1 x1
b2 x 2
b3 x 3
b12 x1 x 2
b13 x1 x 3
b23 x 2 x 3
(линейная зависимость)
План эксперимента - полный факторный эксперимент. Количество опытов:
N=23.
7
№
Аддитивная
постоянная
Матрица
планирования
х0
1
2
3
4
5
6
7
8
х1
+1
+1
+1
+1
+1
+1
+1
+1
х2
-1
-1
-1
-1
+1
+1
+1
+1
Векторы-столбцы
взаимодействия
х3
-1
+1
-1
+1
-1
+1
-1
+1
1
-1
-1
1
-1
-1
1
1
1
-1
1
-1
-1
1
-1
1
1
1
-1
-1
1
-1
-1
1
у
у1
у2
у3
у4
у5
у6
у7
у8
проведен
два
раза
(для
оценки
-1
+1
+1
-1
-1
-1
+1
+1
х1х2
х1х3
Эксперимен–
тальный отклик
х2х3
Проведение эксперимента.
Каждый
опыт
был
ошибки
воспроизводимости). Получены следующие экспериментальные данные:
Номер опыта
N
1
2
3
4
5
6
7
8
х1
-1
-1
-1
-1
+1
+1
+1
+1
Факторы
х2
-1
+1
+1
-1
-1
-1
+1
+1
х3
-1
+1
-1
+1
-1
+1
-1
+1
у1
2,4
2,25
0,4
0,7
3,2
0,7
2,25
1,65
Отклики
у2
2,05
2,05
0,65
0,8
3,55
0,4
2,55
1,15
Статистический анализ результатов эксперимента.
Проверка воспроизводимости эксперимента по критерию Кохрена.
Перед проведением дисперсионного анализа необходимо убедиться в
однородности дисперсий. В случае одинакового числа повторных опытов для
оценки однородности дисперсии применяется критерии Кохрена (У) – отношение
максимальной дисперсии к сумме всех дисперсий:
Y
2
S max
S i2
Дисперсии вычисляются, как показано на рисунке выше или с помощью
формулы =ДИСП.В(диапазон).
Максимальная дисперсия Smax = 0,125 Критерий Кохрена: УЭКСП=0,31746.
Определить Утабл. (табличное значение критерия Кохрена). Табличное
значение берется для f=2-1=1 (число измерений в каждом опыте), N = 8 (число
опытов) и выбранного уровня значимости а = 0,05. Критерий Кохрена
Утабл= У (0,05;1;8) =0,6798 (см. Приложение 1).
Сравнить Утабл. и Уэксп, и сделать вывод. Если Уэксп < Утабл , то эксперимент
воспроизводим (гипотеза об однородности дисперсий подтверждается) и можно
приступать к дисперсионному анализу экспериментальных данных.
Дисперсия воспроизводимости равна среднему значению дисперсий:
S cp
2
S i2
N
9
Вычисление коэффициентов уравнения линейной регрессии (математической
модели).
Для остальных 8 экспериментов проводят аналогичные вычисления, все
значения в каждом столбце складываются и делятся на N=8.
Проверка значимости коэффициентов по критерию Стъюдента. Критерий
N
N
Стъюдента для уровня значимости 0,05 и числа опытов N = 8 рассчитывается с
помощью функции СТЬЮДРАСПОБР. Коэффициент Стъюдента t( , N ) =
2,306004.
Интервал значимости
N ) * S cp2 / N =0,180876.
t(
Все коэффициенты, большие по модулю, чем
, значимы.
Уравнение регрессии:
Ут е ор=b 0 x 0 +b 1 x 1 +b 3 x 3 +b 1 3 x 1 x 3 +b 2 3 x 2 x 3
Ут е ор=1,67 +0,26 x 1 – 0 , 4 6 x 3 –0,50 x 1 x 3 +0,62 x 2 x 3
Проверка адекватности модели по критерию Фишера.
N
( yi
S
2
A
yˆ i ) 2
i 1
N
m
,F
S A2
S cp2
где yˆ i - рассчитанное по уравнению регрессии значение отклика, m - число
значимых коэффициентов регрессии. m=5.
11
Дисперсию адекватности находим по формуле:
N
( yi
S A2
yˆ i )2
i 1
N
m
Дисперсия адекватности 0,07653. Критерий Фишера Fэксп= S A2 / S cp2 = 1,555026
Табличное значение критерия Фишера определяем для уровня значимости
=0,05 с помощью функции =F.ОБР.ПХ(0,05;3;8)=4,06618
Если Fэксп<Fтабл, то гипотеза об адекватности модели не отвергается.
Интерпретация и рекомендации.
Необходимо установить, в какой мере каждый из факторов влияет на
параметр оптимизации. Величина коэффициента регрессии - количественная мера
этого влияния. Чем больше коэффициент, тем сильнее влияет фактор. О характере
влияния факторов говорят знаки коэффициентов. Значимых коэффициентов
регрессии пять:
Модуль коэффициента b3 больше модуля коэффициента b1. Время хранения
влияет существеннее, чем температура.
b3 < 0 => Со временем процентное содержание АФИ уменьшается.
b1 >0 => С увеличением температуры процентное содержание АФИ
увеличивается.
b2<
=> Влияние облучения не существенно.
Контрольные вопросы
1) Как произвести проверку воспроизводимости эксперимента?
2) Какой вывод можно сделать, сравнивая табличное значение критерия
Кохрена со значением, полученным в эксперименте?
3) Какова формулировка гипотезы H 0 , проверяемой по F–критерию?
4) Как определить значимость коэффициентов уравнения регрессии?
5) Как проверить адекватность модели?
6)
Если
экспериментальное
значение
критерия
Фишера
меньше
табличного, то о чем это свидетельствует?
7) Привести математическую линейную модель процесса.
8) Какие выводы можно сделать при анализе полученных коэффициентов
математической модели?
Литература
1) Компьютерные технологии исследования лекарственных средств / Н.И.
Лазарев, О.С. Островский, С.В. Бельма, Т.Д. Нессонова.
–Харьков: Изд-во
НФаУ «Золотые страницы», 2003. – 99 с.
2) Адлер Ю.П. Предпланирование экасперимента. – М.:Знание, 1978. – 72с.
3) Румшинский Л.З. Математическая обработка результатов эксперимента.
– М.: Наука, 1971. – 192с.
4) Грошовый Т.А., Маркова Е.В., Головкин В.А. Математическое
моделирование
эксперимента
в
фармацевтической
технологии
(планы
дисперсионного анализа). – Киев: Высш. шк., 1992. – 187с.
5) Шеффе Г. Дисперсионный анализ. Пер. с англ.
–М.: Наука, 1980. –
512с.
6) Дягилева Ф.Г., Тиманюк В.А., Горбуненко Б.Ф. Учебное пособие по
математической статистике. – Харьков: Основа, 1988. – 65 с.
13