Новая Университетская Библиотека

Íîâàÿ
Óíèâåðñèòåòñêàÿ
Áèáëèîòåêà
Ïðàêòè÷åñêàÿ ÷àñòü õèìèè ñîñòîèò
â èñòîðè÷åñêîì ïîçíàíèè ñìåøàííîãî òåëà.
Òåîðåòè÷åñêàÿ ÷àñòü õèìèè ñîñòîèò
â ôèëîñîôñêîì ïîçíàíèè ñìåøàííîãî òåëà.
Èñòèííûé õèìèê äîëæåí áûòü òåîðåòèêîì è ïðàêòèêîì
Ì.Â. Ëîìîíîñîâ. Ýëåìåíòû ìàòåìàòè÷åñêîé õèìèè
À.Þ. Çàêãåéì
ÎÁÙÀß ÕÈÌÈ×ÅÑÊÀß ÒÅÕÍÎËÎÃÈß
ÂÂÅÄÅÍÈÅ Â ÌÎÄÅËÈÐÎÂÀÍÈÅ
ÕÈÌÈÊÎ-ÒÅÕÍÎËÎÃÈ×ÅÑÊÈÕ ÏÐÎÖÅÑÑÎÂ
Ðåêîìåíäîâàíî Ó÷åíûì ñîâåòîì
Ìîñêîâñêîé ãîñóäàðñòâåííîé àêàäåìèè òîíêîé õèìè÷åñêîé òåõíîëîãèè
â êà÷åñòâå ó÷åáíîãî ïîñîáèÿ ïî êóðñàì «Îáùàÿ õèìè÷åñêàÿ òåõíîëîãèÿ»
è «Ìîäåëèðîâàíèå õèìèêî-òåõíîëîãè÷åñêèõ ïðîöåññîâ» äëÿ ñòóäåíòîâ
âûñøèõ ó÷åáíûõ çàâåäåíèé, îáó÷àþùèõñÿ ïî íàïðàâëåíèÿì
«Õèìè÷åñêàÿ òåõíîëîãèÿ è áèîòåõíîëîãèÿ» è «Ìàòåðèàëîâåäåíèå»
Èçäàíèå 3-å, ïåðåðàáîòàííîå è äîïîëíåííîå
Ìîñêâà
Ëîãîñ
2012
ÓÄÊ 66-93(075.8)
ÁÁÊ 35.11
Ç18
Ñåðèÿ îñíîâàíà â 2003 ãîäó
Ðåöåíçåíò
È.À. Ãèëüäåíáëàò, êàíäèäàò òåõíè÷åñêèõ íàóê, ïðîôåññîð
Ç18
Çàêãåéì À.Þ.
Îáùàÿ õèìè÷åñêàÿ òåõíîëîãèÿ: ââåäåíèå â ìîäåëèðîâàíèå
õèìèêî-òåõíîëîãè÷åñêèõ ïðîöåññîâ: ó÷åá. ïîñîáèå / À.Þ. Çàêãåéì. – 3-å èçä., ïåðåðàá. è äîï. – Ì.: Ëîãîñ, 2012. – 304 ñ. –
(Íîâàÿ óíèâåðñèòåòñêàÿ áèáëèîòåêà).
ISBN 978-5-98704-497-1
Ðàññìîòðåíû âîïðîñû ñîçäàíèÿ ìàòåìàòè÷åñêèõ ìîäåëåé õèìèêî-òåõíîëîãè÷åñêèõ ïðîöåññîâ, â õîäå êîòîðûõ îñóùåñòâëÿþòñÿ õèìè÷åñêèå ïðåâðàùåíèÿ. Êðàòêî èçëîæåíû àñïåêòû ìàòåìàòè÷åñêîãî ìîäåëèðîâàíèÿ:
âûáîð èëè ðàçðàáîòêà àëãîðèòìîâ.
Äëÿ ñòóäåíòîâ âûñøèõ ó÷åáíûõ çàâåäåíèé, îáó÷àþùèõñÿ ïî íàïðàâëåíèÿì «Õèìè÷åñêàÿ òåõíîëîãèÿ è áèîòåõíîëîãèÿ» è «Ìàòåðèàëîâåäåíèå».
ÓÄÊ 66-93(075.8)
ÁÁÊ 35.11
ISBN 978-5-98704-497-1
© Çàêãåéì À.Þ., 2010
© Ëîãîñ, 2010, 2012
ОГЛАВЛЕНИЕ
ОТ АВТОРА ................................................................................................................................ 7
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ ........................................................................................ 9
ГЛАВА 1. ОСНОВНЫЕ ПОНЯТИЯ МЕТОДА МОДЕЛИРОВАНИЯ ........... 11
1.1. Моделирование и модели .................................................................................... 11
1.2. Общие вопросы математического описания процессов ........................ 20
1.3 Некоторые особенности моделей и задач математического
моделирования .................................................................................................................32
ГЛАВА 2. ЭЛЕМЕНТЫ ТЕОРИИ ЭКСПЕРИМЕНТА ........................................42
2.1. Случайные события и случайные величины ...............................................43
2.2. Статистические оценки и проверка гипотез ...............................................53
2.3. Метод наименьших квадратов ...........................................................................66
2.4. Планирование эксперимента .............................................................................78
ГЛАВА 3. МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ ХИМИЧЕСКИХ
РЕАКЦИЙ ............................................................................................................................. 105
3.1. Стехиометрия и равновесие химических реакций ................................. 105
3.2. Формальная химическая кинетика............................................................... 122
ГЛАВА 4. АНАЛИЗ И ОПИСАНИЕ ПРОЦЕССОВ В ПОТОКЕ .................. 134
4.1. Потоки в аппаратах непрерывного действия ........................................... 134
4.2. Модели идеальных потоков ............................................................................. 139
4.3. Статистика времени пребывания в потоке ............................................... 159
4.4. Модели неидеальных потоков ........................................................................ 177
ГЛАВА 5. ЯВЛЕНИЯ ПЕРЕНОСА В ХИМИКО-ТЕХНОЛОГИЧЕСКИХ
ПРОЦЕССАХ, ИХ АНАЛИЗ И ОПИСАНИЕ ...................................................... 189
5.1. Механизмы переноса .......................................................................................... 189
5.2. Тепловые явления................................................................................................. 206
5.3. Внешнедиффузионное торможение ............................................................ 211
5.4. Внутридиффузионное торможение .............................................................. 219
5.5. Процессы с межфазным массообменом ..................................................... 233
ГЛАВА 6. МОДЕЛИРОВАНИЕ ПРОЦЕССОВ С УЧЕТОМ ВОЗМОЖНОЙ
НЕСТАЦИОНАРНОСТИ............................................................................................... 244
6.1. Математические модели нестационарных процессов .......................... 244
6.2. Параметрическая чувствительность и устойчивость процессов. ..... 247
6
Оглавление
ГЛАВА 7. ОПТИМИЗАЦИЯ ХИМИКО-ТЕХНОЛОГИЧЕСКИХ
ПРОЦЕССОВ ...................................................................................................................... 261
7.1. Формулирование задачи оптимизации ....................................................... 261
7.2. Оптимизация методом дифференциального исчисления .................. 270
7.3. Поиск оптимума численными методами .................................................. 277
7.4. Экспериментальный поиск оптимума ........................................................ 287
ЗАКЛЮЧЕНИЕ .................................................................................................................. 293
ЛИТЕРАТУРА ...................................................................................................................... 295
ПРИЛОЖЕНИЕ. ТАБЛИЦЫ КРИТИЧЕСКИХ ЗНАЧЕНИЙ
СТАТИСТИЧЕСКИХ КРИТЕРИЕВ ........................................................................ 298
ОТ АВТОРА
Предлагаемая книга представляет собой третье издание учебного пособия автора «Введение в моделирование химико-технологических процессов». Предыдущие издания опубликованы соответственно в 1973 и 1982 гг.
издательством «Химия» и широко использовались в учебном процессе ряда
высших учебных заведений. В третьем издании текст переработан с учетом
как развития данной области науки, так и изменения программ обучения.
Книга содержит семь глав. В главе 1 рассматриваются основные понятия
метода моделирования: физическое и математическое моделирование, построение математических моделей процессов, особенности моделей и задач
моделирования (теоретически обоснованные и эмпирические модели, формы уравнений – конечные и дифференциальные и т.д.). В главе 2 описываются элементы теории эксперимента – применение вероятностных понятий
к анализу случайных ошибок, нахождение статистических оценок, проверка
статистических гипотез, работа с методом наименьших квадратов, основы
планирования эксперимента. Глава 3 посвящена формальному анализу стехиометрии, равновесия и кинетики сложных химических реакций. В главе 4
анализируется протекание химических реакций в потоках. Даются основы
описания процессов, протекающих в потоках, в приближении идеального
вытеснения и идеального смешения, рассмотрено использование распределения времени пребывания для анализа структуры потока, описаны простейшие модели неидеальных потоков – ячеечная и однопараметрическая
диффузионная. В главе 5 рассматриваются особенности явлений переноса в химико-технологических процессах и отражения этих особенностей
в математических моделях. Сопоставляются молекулярный и конвективный переносы, их взаимодействие и учет его в математических описаниях.
Рассматриваются особенности макрокинетики процессов: тепловых режимов, внешне- и внутридиффузионного торможения реакций, межфазного
массопереноса, и их отражение в описаниях. В главе 6 дается краткое описание нестационарных процессов (кратко, поскольку подробно вопросы рассматриваются в курсах автоматизации) и излагается проблема устойчивости
стационарных режимов работы работы химических процессов. В главе 7
освещаются вопросы оптимизации химических процессов: формулирование задачи оптимизации; основные подходы к нахождению оптимума с использованием аналитических, поисковых и экспериментальных методов.
При работе с книгой важно учесть следующее. В ней использован простой математический аппарат, но именно тот, который нужен по существу. Во
многих случаях смысл излагаемого нельзя до конца понять, не разобравшись
в сущности приводимых математических выкладок – одних результатов мало.
Хочу также обратить внимание читателя на роль, которую играют в книге
примеры, вопросы и задачи. Их назначение состоит не только в том, чтобы
проиллюстрировать рассматриваемые вопросы и повторить пройденное, но
и в первую очередь стимулировать самостоятельную работу над материалом.
В частности, автор старался придать вопросам нестандартный характер.
Выражаю глубокую признательность В.И. Ксензенко, К.Ю. Одинцову
и А.И. Мартюшкину за неоценимую помощь в работе. Особая благодарность – моему учителю, незабвенному Виталию Максимовичу Рамму.
ОСНОВНЫЕ ОБОЗНАЧЕНИЯ
а – стехиометрический коэффициент; коэффициент температуропроводности
а – стехиометрическая матрица
А – предэкспонента уравнения Аррениуса
А, В, С, ..., J, ..., А1, А2, А3, … – символы веществ
b – коэффициент регрессии
с – концентрация (мольная)
С – дифференциальная функция распределения времени пребывания
Ст – теплоемкость
d – диаметр
D – дисперсия; коэффициент диффузии
Е – энергия активации
f – плотность вероятности (дифференциальная функция распределения);
удельная поверхность
F – площадь; целевая функция; критерий Фишера
g – количество вещества (число молей)
G – расход газа (пара); критерий Кокрена
h – атомная матрица
H – статистическая гипотеза
H0 – нуль-гипотеза
H1 – альтернативная гипотеза
k – константа скорости химической реакции
К – константа равновесия; коэффициент скорости процесса переноса
L – характерное значение длины; расход жидкости
m – коэффициент межфазного равновесия
М – математическое ожидание
n – порядок реакции; параметр ячеечной модели
р – количество факторов; давление
Р – вероятность
q – количество факторов
q – вектор потока
Q – количество тепла
Qр – тепловой эффект реакции
r – скорость химической реакции; выборочный коэффициент корреляции;
критерий грубой ошибки
R – универсальная газовая постоянная; радиус
Основные обозначения
9
– выборочное среднее квадратическое отклонение
– выборочная дисперсия
– время; критерий Стьюдента
– температура
– расход жидкости (газа)
– объем
– скорость жидкости (газа)
– регулируемый входной фактор; мольная доля вещества в жидкости
– матрица плана эксперимента
– выходная величина; отклик в эксперименте; мольная доля вещества
в газе (паре)
Y – вектор результатов опытов
z – неконтролируемое воздействие
э – коэффициент эквивалентности
α – уровень значимости; коэффициент теплоотдачи
β – коэффициент массоотдачи
δ – интервал; толщина пограничного слоя
∆ – приращение
∇ 2 – лапласиан
ε – доля свободного объема
ζ – химическая переменная
κ – приведенная константа скорости реакции
η – выход продукта
µ – коэффициент динамической вязкости
ν – коэффициент кинематической вязкости
ρ – плотность
σ – селективность
σ2 – дисперсия
τ – приведенное (безразмерное) время
s
s2
t
Т
v
V
w
х
Х
у
Индексы
0 – начальные условия
а – аппарат
А, В, С, …, J, ... – вещества А, В, С и т.д.
выт – вытеснения
з
– зерно катализатора
и
– индикатор
к
– конечные условия
кг – квазигомогенный
м
– массообмен
макс – максимум
мин – минимум
опт – оптимум
Основные обозначения
10
п
– поверхность
поп – поперечный
р
– химическая реакция
сл – слой
см – смешение
т
– теплообмен
тейл – тейлоровская
тн – теплоноситель
турб – турбулентная
э
– элементарный
я
– ядро потока
i, j – номер
l
– продольное смешение
Штрих вверху – эффективный: k ′ – эффективная константа скорости
Звездочка вверху – равновесный
Черта вверху – средний:
t
Тильда вверху – расчетный:
– среднее время пребывания
y – расчетное значение отклика
ГЛАВА 1.
ОСНОВНЫЕ ПОНЯТИЯ МЕТОДА
МОДЕЛИРОВАНИЯ
Моделирование – один из важнейших методов, широко применяемых в современной науке, в первую очередь в ее прикладных областях. Моделирование позволяет ускорить технический прогресс,
существенно сократить сроки освоения новых производств. В эпоху
научно-технической революции особенно бурно развивается одно
из новых направлений – математическое моделирование. Его развитие теснейшим образом связано с развитием информатики и вычислительной техники.
1.1. Моделирование и модели
Моделирование – один из важнейших методов почти любой науки. Суть его заключается в следующем. Мы хотим исследовать поведение какого-либо объекта (оригинала) в тех или иных условиях.
Но вместо оригинала исследуем поведение другого объекта – модели,
а затем распространяем выводы такого исследования на оригинал –
заключаем, как будет вести себя он.
Пример 1.1. Прежде чем строить и запускать в воздух самолет, конструкторы подвешивают в аэродинамической трубе модель самолета и обдувают
ее струей воздуха. Здесь моделью является не только малая геометрическая
копия, подобная будущему оригиналу, но и воздух, движение которого моделирует движение самолета в атмосфере (поскольку движение относительно, то безразлично, летит ли аппарат в воздухе или воздух обтекает его).
В примере 1.1 модели – некоторые материальные объекты, поведение которых «похоже» на поведение оригинала (аналогично ему).
Необходимо только знать правило, по которому результаты эксперимента с моделью можно пересчитать на параметры, характеризующие оригинал (правило традукции). Такие модели обычно называют
материальными. Но есть еще один класс моделей. Мы можем составить в уме схему (описание) нашего оригинала и затем, производя
12
Глава 1. Основные понятия метода моделирования
с этим описанием какие-либо преобразования, прийти к выводам,
допускающим традукцию на оригинал. В таких случаях говорят
о мысленных моделях. Здесь важнейший для практики вариант – тот,
в котором описание дается на языке математики (математическая
модель). В этом смысле любое математическое описание какого-либо
процесса является его математической моделью. Чаще всего такая
модель представляет собой уравнение или систему уравнений.
В наше время важнее всего использовать моделирование в тех
случаях, когда математические модели сложны и их исследование
(решение систем уравнений) производится с помощью компьютеров. Существенная особенность: компьютер, решающий уравнения
математической модели, ведет себя как материальная модель. В него
можно вводить условия функционирования оригинала, и он покажет, как тот поведет себя в заданных условиях.
Пример 1.2. Для овладения навыками управления сложными системами – от космических кораблей и самолетов до химико-технологических
установок – эффективно используется имитационное моделирование, когда
обучающийся находится в обстановке, воспроизводящей оригинал (такая
же кабина, такой же пульт управления, такие же приборы), и «управляет»
процессом. При этом показания приборов достаточно точно соответствуют
тому, что было бы в реальном процессе. Различие лишь в том, что оператор
управляет не процессом, а его компьютерной моделью. Блестящее художественное описание такого моделирования – рассказ С. Лема «Испытание».
П р и м е ч а н и е . В предыдущих изданиях этого пособия [16, 17] в качестве отличительной особенности метода моделирования указывалось наличие
материальной модели. В случаях, когда модель – математическая, в процессе
ее исследования (математического моделирования) материальной моделью
как раз и служит компьютер. Дальнейшее развитие идей и методов моделирования свидетельствует о том, что это утверждение не точно. Математическую
модель, если она простая, можно исследовать и на бумаге, а иногда даже
в уме. Главное, что отличает моделирование, это не просто вывод или решение уравнений, а исследование поведения объекта в различных условиях.
Здесь отмечу следующее. Назвать мысленную схему объектом не
вполне корректно. Более строгие формулировки получаются, если
для оригинала и модели использовать термин системы.
Система – совокупность каких-либо элементов, связанных, взаимодействующих друг с другом. Причем характер связей (взаимодействий) не менее важен для существования системы, чем сам набор
элементов. Совокупность связей называют структурой системы.
Пример 1.3. Комплект оборудования для работы химического производства, лежащий на складе, системой еще не является. После того как это
оборудование соединили в соответствии со структурой процесса и оно заработало (связи актуализированы), тот же набор аппаратов, машин, коммуникаций стал системой.
1.1. Моделирование и модели
13
Элементами системы необязательно являются некие изделия, как
в предыдущем примере, или вообще какие-то материальные предметы. Для нас важно рассматривать в качестве системы процесс,
элементами которого являются более простые процессы (стадии).
Так, химико-технологический процесс – система, которую можно
мысленно разбить на стадии химического взаимодействия, процессов тепло- и массообмена, движения потоков и т.д. Ни понять
смысл процесса, ни управлять им невозможно, не понимая, как эти
стадии связаны друг с другом, как они влияют друг на друга. В иных
задачах фигурируют системы, элементами которых могут быть математические выражения (например, система уравнений), мысли
(например, система взглядов), слова (любой текст есть система)
и т.д. Выделяют системы статические, не меняющиеся во времени
(система уравнений, система слов в древнем тексте), и динамические. Типичная динамическая система «живет», все время взаимодействуя с окружающим миром и изменяясь. Чаще всего элементы
данной системы сами являются системами. Такие элементы называют подсистемами.
Пример 1.4. Один из важнейших элементов любого процесса биотехнологии – жизнедеятельность микроорганизмов, осуществляющих потребные
нам реакции. Но жизнедеятельность любого организма сама по себе – сложнейший процесс, обладающий всеми чертами системы. Стало быть, она является подсистемой технологического процесса.
В огромном числе систем существует иерархия подсистем: система состоит из подсистем первого уровня, каждая из них образована
подсистемами второго уровня и т. д., причем количество уровней
может быть очень велико. В таких случаях часто бывает удобно анализировать закономерности поведения системы, начиная с наинизшего уровня и переходя затем на более высокие. Так, для химикотехнологического процесса используется иерархическая структура
математической модели, предложенная М. Г. Слинько. Модель строится путем последовательного перехода в описании процесса с одного уровня на другой.
1. Молекулярный уровень – описание процессов, протекающих
в масштабе порядка расстояния между молекулами. Их закономерности – это прежде всего закономерности химической кинетики.
2. Уровень малого объема, на котором объектом описания является, например, процесс на одном зерне катализатора или в пузырьке
газа, поднимающемся в барботажном слое, и в обтекающей его жидкости, или на одном элементе насадки в насадочной колонне и т.д.
Здесь закономерностей предыдущего уровня уже недостаточно, необходимо дополнить их закономерностями существенных в этом
14
Глава 1. Основные понятия метода моделирования
масштабе процессов тепло- и массопереноса. Анализ кинетических
закономерностей в условиях одновременного протекания процессов
переноса – предмет научного направления, называемого макрокинетикой
3. Уровень рабочей зоны аппарата (слой катализатора, барботажный слой, насадочный слой и т. д.), на котором необходимо учитывать эффекты, связанные с характером движения потока. В ряде случаев (например, при гомогенных реакциях) на этот уровень можно
перейти прямо с первого.
4. Уровень аппарата, при переходе на который учитывают число,
конфигурацию, взаимную связь и взаимное расположение рабочих
зон. Например, аппарат может содержать несколько слоев катализатора, между которыми располагаются промежуточные теплообменники.
5. Уровень агрегата, где учитываются взаимные связи между аппаратами.
Модель каждого высшего уровня содержит модели низших уровней и соотношения, описывающие переход с одного уровня на другой. Такой подход часто позволяет анализировать и моделировать
процесс по частям, что существенно упрощает анализ; в то же время
при этом не упускается из виду структура – характер связей уровней.
Внешние связи системы. Определяя понятие «система», я уже
говорил об исключительной важности связей между ее элементами.
Для динамических систем не менее важны внешние связи – взаимодействия системы с окружающим ее миром. Внешние связи бывают
двух основных классов: воздействия мира на систему – входы системы и воздействия системы на мир – ее выходы, результат функционирования системы. Особый случай – обратные связи: выход системы
оказывает влияние на ее вход. Существуют положительные обратные
связи, когда усиление выходного сигнала усиливает сигнал на входе,
и отрицательные обратные связи, когда с усилением выходного сигнала входной ослабляется. Как правило, действие положительных
обратных связей приводит к возбуждению системы, интенсификации ее деятельности; в неблагоприятных случаях это может привести
к тому, что система «пойдет вразнос». Наоборот, отрицательные обратные связи стабилизируют состояние системы.
Пример 1.5. Теплокровные животные, в том числе и люди, все время сохраняют почти постоянную температуру тела. Это обеспечивается рядом
отрицательных обратных связей. Если окружающая температура понижается, включаются процессы, препятствующие охлаждению тела: например
встает дыбом шерсть, снижая теплоотдачу; возникает дрожь, и при работе
дрожащих мышц выделяется тепло (у человека шерсти нет, но механизм
ее подъема еще сохранился – на коже появляются мурашки – напряжение
1.1. Моделирование и модели
15
микромышц, поднимавших волосы у наших предков). Если же температура
слишком велика, усиливается выделение пота, его испарение забирает излишек тепла. Эта система обратных связей обеспечивает гомеостаз – свойство
очень многих систем поддерживать свое состояние в таких пределах значений параметров, которые не угрожают существованию системы.
Пример 1.6. Как происходит взрыв атомной бомбы? Влетевший в массу
урана или плутония нейтрон (например, возникший при действии космических лучей) вызывает распад ядра с образованием более чем одного нейтрона. Это положительная обратная связь. Часть нейтронов вылетает наружу –
это отрицательная обратная связь. Если масса металла меньше критической,
превалируют отрицательные связи и система стабильна. Если критическая
масса превзойдена, система идет вразнос – происходит взрыв.
О классификации входов системы. Входные воздействия (чаще
всего будем называть их факторами, влияющими на систему) можно подразделить на две основные группы. Первая – контролируемые
факторы. Это те воздействия, величины которых мы знаем или по
крайней мере можем узнать, когда это потребуется. В свою очередь,
эта группа факторов подразделяется на регулируемые и нерегулируемые. Регулируемые (управляющие) факторы те, значения которых мы
сознательно меняем (регулируем) с целью управлять процессом –
улучшать его показатели. Значения нерегулируемых факторов мы
можем знать, но не изменяем, либо оставляя постоянными, либо
мирясь с тем, что они как-то меняются помимо нашей воли, и лишь
приспосабливаясь к этим изменениям. Существуют, по крайней мере,
три причины, по которым фактор может оказаться нерегулируемым:
1) его изменение практически невозможно – например, это размер
установленного аппарата; 2) его можно изменить, но это слишком
дорого – например, это состав поступающего сырья; 3) он слабо влияет на процесс и его нецелесообразно регулировать – например, это
содержание аргона в воздухе, поступающем в топку.
Пример 1.7. В большинстве технологических процессов температура и
влажность окружающего воздуха не регулируются. Однако при изготовлении синтетических тканей эти факторы заметно влияют на качество продукции и их необходимо регулировать (кондиционировать воздух).
Кроме контролируемых факторов в любом процессе наличествует бесчисленное множество факторов неконтролируемых, причем мы
можем даже не знать о их существовании. Почему так может быть?
Во-первых, мы иногда не знаем, что данный фактор заметно влияет на наш процесс. В таких случаях приходится говорить, что процесс недостаточно изучен, и зачастую без дальнейших исследований
его нельзя реализовать. Но есть и иная причина, действующая даже тогда, когда процесс изучен хорошо. В любом реальном случае
имеется огромное, практически бесконечное число очень слабых
16
Глава 1. Основные понятия метода моделирования
воздействий. Каждое из них нет смысла контролировать, потому что
оно слабое. Все – нельзя потому, что их слишком много. В то же время совокупное действие этого множества уже не мало, оно заметно
влияет на функционирование системы.
Это влияние обладает одной важной особенностью. Не контролируя входы, мы не можем знать, каково оно в данный момент и каким
окажется впоследствии. Поэтому воздействие неконтролируемых
факторов носит случайный характер. При измерениях оно выражается в случайных погрешностях, в эксперименте – в случайных ошибках,
при протекании любого процесса – в случайных возмущениях.
Случайные неконтролируемые воздействия могут не только приходить извне, но и возникать внутри системы. Однако чаще всего нет
смысла подробно разбираться, откуда они исходят: случайные колебания, случайные отклонения в процессе целесообразно рассматривать как нечто единое. Часто это единое обозначают термином шум.
Условия моделирования. При организации моделирования возникают важнейшие вопросы: какие условия обеспечат традукцию и
какова возможность распространения полученных данных на поведение оригинала? Эти условия различны в физическом и математическом моделировании.
Традуктивность при физическом моделировании обеспечивается
подобием оригинала и модели. Теория подобия – важнейшая часть
теоретического фундамента науки о процессах и аппаратах химической технологии и подробно рассматривается в соответствующих
курсах [1]. Очень коротко можно сказать так: если два объекта (две
системы) физически подобны друг другу, то процесс в каждом из
этих объектов может быть описан набором безразмерных характеристик – чисел подобия, и в соответствующих точках обоих объектов
числа подобия имеют равные значения. При этом те же самые числа играют роль критериев подобия – признаков, по которым можно
установить, что подобие существует. А именно: если краевые и начальные условия процесса, выраженные через числа подобия, для
одной системы – количественно такие же, как для другой, то процессы в обеих системах протекают подобным образом, системы все время остаются подобными друг другу. Набор необходимых критериев
подобия определяют либо исходя из дифференциальных уравнений,
описывающих процесс, либо основываясь на анализе размерностей.
Метод подобия оказался высокоэффективным при моделировании гидромеханических процессов (течение жидкостей в каналах,
фильтрация через пористые среды, движение морских и воздушных
судов), процессов переноса тепла и вещества. Значительные трудности возникли при попытках моделировать на основе подобия хими-
1.1. Моделирование и модели
17
ческие процессы – процессы, основным содержанием которых являются химические превращения (реакции). Многолетний анализ этих
трудностей показал, что во многих случаях они непреодолимы. Дело
в том, что при изменении размеров объекта (масштабировании) разные критерии подобия могут предъявлять противоречащие друг другу
требования к условиям проведения процесса в модели. Рассмотрим
вначале сравнительно простой случай, когда еще не учитывается химическая реакция.
Пример 1.8. Подобие процессов течения при взаимодействии потока с
поверхностью какого-либо тела (обтекание препятствий, течение в каналах)
определяется критерием Рейнольдса Re, а подобие течения жидкости со
свободной поверхностью – критерием Фруда Fr:
Re =
wL
;
ν
Fr =
gL
,
w2
(1.1)
где w – линейная скорость течения; L – размер; g – ускорение силы тяжести;
ν – коэффициент кинематической вязкости.
Рассмотрим достаточно распространенный случай, когда в процессе течения существенны оба критерия. Будем считать, что при моделировании
нецелесообразно идти на экзотические приемы – изменение в несколько
раз g и ν. Тогда при размерах модели в n раз меньших, чем размеры оригинала, для равенства критерия Рейнольдса в оригинале и модели потребуется увеличить скорость течения в n раз, а для равенства критерия Фруда –
уменьшить скорость в n1/2 раз. Одновременное соблюдение обоих условий
возможно только при n = 1, когда модель равна по размерам оригиналу.
В примере 1.8 подобие определяется лишь двумя критериями
(и еще, разумеется, геометрическим подобием). Но большинство
химических процессов – это системы, подсистемами которых является целый ряд процессов, каждый из которых требует своих условий подобия. Очень часто реакция – сложная, и каждая из ее стадий
по-своему зависит от концентраций и температуры; на ход реакции
сильно влияют выделение (или поглощение) и перенос тепла, перенос вещества, движение потоков. Лишь в некоторых достаточно простых случаях удается сформулировать условия проведения процесса
так, что масштабирование оказывается возможным. Чаще всего так
бывает при проведении достаточно медленных реакций в аппаратах
с мешалками. В большинстве остальных случаев добиться подобия
при масштабировании не удается.
Действительно, сопоставим протекание химической реакции в геометрически подобных оригинале и модели при следующих условиях:
в реакторе проводится экзотермическая реакция, выделяющееся
тепло отводится с наружной поверхности, причем концентрации
18
Глава 1. Основные понятия метода моделирования
и температура в рассматриваемом отрезке реактора одинаковы для
оригинала и модели (различия в этих параметрах по-разному влияют на разные стадии реакции, а чтобы не нарушалось подобие, они
должны быть одинаковыми).
Количество выделяющегося в единицу времени тепла в этих условиях пропорционально объему, в котором идет реакция, количество
отводимого тепла – поверхности теплообмена. Соотношение между
отводом и выделением тепла определяется отношением поверхности
к объему – удельной поверхностью. Поверхности подобных фигур пропорциональны квадратам их размеров, а объемы – кубам размеров.
Поделив квадрат размера на куб, увидим, что удельная поверхность
обратно пропорциональна размеру тела. У оригинала большого размера она намного меньше, чем у маленькой модели. При проведении
процесса в модели одна из главных наших забот будет заключаться
в том, чтобы не потерять слишком много тепла с большой удельной
поверхности, не переохладить реакционную смесь. А в оригинале мы
будем озабочены тем, чтобы не перегреть реактор: малой удельной
поверхности не хватит для отвода большого количества выделившего
тепла.
Пример 1.9. Связь удельной поверхности с размером играет большую
роль в природе. Теплокровные животные не могут быть слишком маленькими, иначе их удельная поверхность окажется столь велика, что никакой пищи не хватит для восполнения потерь тепла в окружающую среду. Поэтому
в разных классах и отрядах таких животных самые мелкие представители
(карликовые землеройки, карликовые летучие мыши, мыши-малютки, колибри) имеют близкие размеры – массу около 5 г и некоторые общие черты: густой пух для снижения теплоотдачи, а также большую прожорливость.
Колибри поедает в день нектар цветов – высококалорийный сахарный сироп – в количестве, равном 1/3 массы ее тела.
А если тело очень велико, то его малая удельная поверхность сильно ограничивает мощность отдаваемой энергии. Температура поверхности Солнца –
около 6000 К, а температура человеческого тела – около 300 К. Мощность
излучения с единицы поверхности пропорциональна Т 4, т.е. каждый квадратный сантиметр поверхности светила излучает приблизительно в 160000
раз большую мощность, чем квадратный сантиметр поверхности нашего тела. Но если рассчитать удельную мощность обоих нагревателей – мощность,
отнесенную к единице массы, – то окажется, что по этому показателю мы
раз в 5 превосходим нашу звезду. Каждый килограмм нашего тела вырабатывает в 5 раз большую тепловую мощность, чем килограмм вещества Солнца.
Так что к расхожему штампу журналистов о «чудовищной мощи термоядерных реакций, бушующих в недрах Солнца», можно относиться критически.
Сложности, связанные с нарушением подобия при масштабировании, явились причиной того, что в середине прошлого века моделирование химических процессов находилось в глубоком кризи-
1.1. Моделирование и модели
19
се. Выход из него нашелся – это математическое моделирование,
где трудности, сопряженные с обеспечением подобия, снимаются.
Здесь есть лишь одно главное требование: математическое описание
моделируемой системы должно быть адекватным. Необходимо, чтобы все основные количественные закономерности достаточно точно
воспроизводились в математической модели, остальное – уже дело
вычислительных методов и вычислительной техники. А первое и самое главное – хорошо составленное математическое описание.
Эффективность математического моделирования связана с замечательной особенностью многих систем – аналогией между ними.
Аналогия – понятие, более широкое, чем подобие, о котором шла
речь выше. Это определенное сходство между разными системами,
причем физическое содержание этих систем может очень различаться. Важнейшее для практики свойство аналогичных систем – общность их математических описаний. Разные системы оказываются
одинаково описанными, и их математическое моделирование осуществляется однообразно. В этом проявляется замечательная особенность математики – быть универсальной моделью, моделью любых
систем.
Пример 1.10. Очень многие физические процессы могут быть описаны
уравнениями, общая форма которых такова:
q = – θ grad x,
(1.2)
где q – векторная величина, которую обычно можно трактовать как поток некоторой субстанции; θ – коэффициент, характеризующий свойства
объекта; x – скалярная величина; grad – градиент, векторный оператор.
Физический смысл переносимой субстанции и величины х бывает различным, но вид зависимости – один и тот же. Приведу несколько важных физических законов.
1. Закон Дарси – Вейсбаха (фильтрация сквозь пористую среду):
w = –k grad p,
(1.3)
где w – скорость фильтрации; k – коэффициент фильтрации; p – давление.
2. Закон Ньютона (вязкое течение):
τ = –µ grad wх,
(1.4)
где τ – касательное напряжение вязкости, которое можно рассматривать как
поток импульса (см. разд. 5.1); µ – коэффициент вязкости; grad wх – градиент продольного компонента скорости.
3. Уравнение Фурье (теплопроводность):
(1.5)
qт = –λ grad T,
где qт – поток тепла; λ – коэффициент теплопроводности; Т – температура.
4. Уравнение Фика (диффузия):
(1.6)
qм = –D grad c,
где qм – поток массы; D – коэффициент диффузии; с – концентрация.
20
Глава 1. Основные понятия метода моделирования
5. Закон Ома (электрический ток в трехмерном проводнике):
i = –κ grad u,
(1.7)
где i – плотность тока; κ – удельная проводимость; u – потенциал.
С точки зрения математики уравнения (1.3) – (1.7) отличаются друг от
друга только буквенными обозначениями. По сути это одно уравнение (1.2),
и при равных численных значениях параметров любое из них даст одно и то
же решение.
В этой книге рассматривается почти исключительно математическое моделирование химических процессов и химических реакторов –
аппаратов, в которых такие процессы протекают, и в первую очередь
стадия получения математического описания математической модели. Моделирование гидравлических, тепло- и массообменных процессов подробно излагается в учебном курсе «Процессы и аппараты
химической технологии» и здесь затрагивается лишь в отдельных
случаях. Особый вопрос – техника моделирования: используемые
в нем математические методы, особенности применения компьютеров. Эти вопросы настолько специфичны, что в рамках общих курсов их целесообразно преподавать отдельно. Подробное их изложение см. в [3].
1.2. Общие вопросы математического
описания процессов
Два подхода к описанию систем. Что значит, описать поведение
системы? Что мы понимаем под ее поведением? На систему воздействуют изменяющиеся входные факторы, и система отвечает на
их изменения изменением выходных величин (откликов системы
на воздействия). Для сокращения записи используем понятие «вектор»: вектор – упорядоченная последовательность величин (например, последовательность значений всех факторов или всех выходов
системы в данный момент, записанная в строку или в столбец).
Векторы (а в дальнейшем и матрицы) будем обозначать полужирными буквами. Так, вектор факторов Х – это записанные по порядку значения х1, х2, х3, …, хn, где n – число факторов. Тогда математическое описание для любого из выходов системы имеет наиболее
общий вид
yi= Φi (X,Z),
(1.8)
где i – номер выходной величины; X – вектор контролируемых факторов; Z – вектор неконтролируемых факторов. Но пользоваться
уравнением (1.8) или хотя бы установить его вид невозможно. Ввиду
1.2. Общие вопросы математического описания процессов
21
неконтролируемости Z нет возможности даже составить список аргументов функции. В большинстве случаев удается упрощенно записать эту функцию в виде
yi=Fi (X)+Ψi (Z) ,
(1.9)
разбив ее на два слагаемых: зависимость Fi (X) и шум Ψi (Z). Тогда задача получения математического описания разбивается на две: установить вид каждой из зависимостей Fi и оценить шум Ψi. Это разные
задачи. Для Fi необходимо получить аналитическое выражение, а для
Ψi – случайной величины – лишь оценку, указывающую, в каких
пределах и с какой вероятностью может колебаться шум. Вопросы
оценки шума рассмотрены в гл. 2, здесь же мы обсудим подходы
к описанию зависимостей, составляющих математические модели
процессов. Чаще всего математической моделью называют именно
набор функций F :
yi=Fi (X),
(1.10)
полагая, что это и есть «истинная» зависимость, а наличие шума
лишь искажает ее.
Два подхода к описанию системы. Вид функций (1.10) можно
установить путем двух разных подходов. Первый можно назвать
структурным. Суть его заключается в следующем. Для создания математической модели системы прежде всего исследуем ее структуру – составляющие систему элементы и характер их взаимодействия.
Применительно к технологическому процессу это означает расшифровку его механизма. В результате получается схема процесса – его
мысленная модель. Для химико-технологического процесса мысленная модель на физическом языке содержит прежде всего представления о механизмах реакций, характере движения потоков, процессах
переноса тепла и вещества и о взаимном влиянии химизма, гидравлики, тепло- и массопереноса. Записав эту схему на языке математики,
получаем некую систему уравнений, описывающих процесс. Обычно
на этом этапе уравнения получаются в общем виде – в них входят некоторые пока неизвестные коэффициенты (константы скоростей
реакций, коэффициенты тепло- и массоотдачи и др.). Эти коэффициенты называют параметрами модели. Для определения параметров
ставится эксперимент (на моделях, а иногда и на оригинале, если таковой имеется), результаты которого позволяют получить математическое описание в полном виде, со всеми коэффициентами.
Второй подход к описанию системы – эмпирический. Другое его
распространенное название – метод черного ящика. Предположим,
что структура интересующей нас системы скрыта от нас (как бы заключена в «черный ящик»). Значит ли это, что о системе ничего невозможно узнать и, главное, что нельзя ею управлять? Нет, не значит.
22
Глава 1. Основные понятия метода моделирования
Как бы черен ни был ящик, у системы есть важные контакты, которыми можно воспользоваться для ее анализа и управления ею. Эти
контакты – входы и выходы системы.
Будем изменять значения входов и определять, как при этом изменяется отклик. Каждый такой акт – изменение входов и определение отклика – есть не что иное, как эксперимент. Проведя определенное число экспериментов, опишем их результаты эмпирическим
уравнением или системой эмпирических уравнений. Эти уравнения
и будут математической моделью, которой можно воспользоваться
для моделирования данной системы.
Долгое время в науке господствовало убеждение, что истинно
научным является лишь структурный подход, а подход эмпирический – это нечто неполноценное, второстепенное, вспомогательное, нечто такое, что пригодно в практических задачах, а также на
начальном этапе научного исследования; истинная же наука начинается с установления механизма, с расшифровки структуры. Одним
из плодотворных положений кибернетики является утверждение
того, что во многих задачах метод черного ящика может оказаться
основным способом исследования, что это полноправный научный
метод и что в каждом конкретном случае надо оценить преимущества и недостатки обоих подходов.
Необходимо подчеркнуть следующее важнейшее обстоятельство.
Будучи противоположностями, оба подхода образуют тесное единство. При этом в любом реальном случае наличествуют элементы и
того, и другого подхода. Ни абсолютно структурное, ни абсолютно
эмпирическое описание невозможны.
В любом сколько-нибудь серьезном случае все описание объекта,
как бы хорошо он ни был изучен, нельзя построить на чисто теоретической основе. Какие-то параметры всегда придется определять из
опытов и опытным же путем проверять адекватность модели – достаточную точность ее соответствия оригиналу.
В то же время, каким бы черным ни был наш ящик, мы обязательно имеем какие-то представления о его структуре. Без этого
вряд ли удастся выделить контролируемые входы и понять, каких
откликов можно ожидать от системы. Любое эмпирическое описание отражает, хотя и в неявной форме, механизм процесса. Иногда
это отражение оказывается настолько характерным и точным, что
анализ эмпирического уравнения прямо приводит к раскрытию механизма. Вспомним, что уравнения Кеплера или Бальмера были чисто эмпирическими, пока работы Ньютона и Бора их не объяснили.
Эмпирическое уравнение обязательно содержит в себе структуру, но
только структуру нерасшифрованную. Поэтому четкое противопо-
1.2. Общие вопросы математического описания процессов
23
ставление обоих подходов носит характер методический, а не прикладной. В практических задачах наблюдаются самые разнообразные соотношения между уровнями структурности и эмпиричности
применяемых методов.
Гидромеханическую задачу можно исследовать, решая для частного случая уравнение Навье – Стокса. Это будет наиболее структурный вариант, но и здесь скорее всего придется вносить эмпирические поправки. Уравнения Навье – Стокса можно использовать
только для вывода критериев подобия, а дальше перейти к экспериментальному изучению процесса. Можно совсем не прибегать к
этому уравнению, а выводить критерии подобия на основе метода
размерностей – структурность подхода будет еще слабее. Наконец,
при обработке опытных данных можно отказаться и от критериальной формы, усилив тем самым эмпиричность подхода.
Тем не менее чаще всего подход к решению той или иной конкретной задачи можно охарактеризовать как в основном структурный или эмпирический. Поэтому целесообразно оценить сильные и
слабые стороны обоих подходов.
Главное достоинство эмпирического подхода – простота. Особенно
существенно оно сказывается при изучении очень сложных процессов. Главная его слабость – малая надежность экстраполяции. В пределах изменения переменных, изученных в опытах, предсказание
поведения процесса (интерполяция) обычно может проводиться достаточно точно. Но закон изменения функций отклика за изученными пределами нам неизвестен и можно допустить серьезную ошибку,
полагая, что процесс по-прежнему обязательно будет подчиняться
выведенным эмпирическим уравнениям.
Пример 1.11. Некоторое свойство у вещества зависит от температуры.
Не зная механизма зависимости, мы провели опыты и получили следующие
данные.
Т, К
y
280
1000
300
997
320
989
340
980
360
968
По этим данным нетрудно рассчитать зависимость у = f (Т). В изученных
пределах ее можно выразить уравнением
y = 1000 – 9,62·10–2 (Т–278) – 3,75·10 –3 (Т – 278)2.
Рассчитаем по этому уравнению значения у при T = 350; 370; 380 К.
Получим соответственно y =0,974; 0,959; 0,942. В действительности значения при этих температурах составляют: y = 0,974; 0,960; 0,00056.
Для двух первых точек получено вполне удовлетворительное согласование, для третьей – разительное несходство. Если бы мы заранее знали, что
у – плотность воды при атмосферном давлении, т. е. достаточно хорошо
представляли структуру объекта, то никаких неожиданностей не было бы.
24
Глава 1. Основные понятия метода моделирования
Разумеется, ситуация упрощена: в столь ясных случаях чисто эмпирический подход вряд ли стоит применять. Но пример не столь уж
бессмыслен. Именно температурные зависимости очень часто плохо
поддаются экстраполяции.
В практике моделирования одним из важнейших случаев экстраполяции является масштабирование: предсказание того, как изменятся параметры процесса при переходе от малой модели к большому оригиналу. На основе эмпирических зависимостей эта задача, как
правило, решается гораздо хуже, чем при структурном подходе.
Главное достоинство данных, полученных на основе структурного
подхода, – их большая прогностическая мощность. Зная достаточно
полно механизм какого-либо процесса, можно с большой степенью
достоверности предсказывать ее поведение в самых разнообразных
условиях. Поэтому, как гласит известный афоризм, «нет ничего
практичнее хорошей теории».
Слабое место подхода – трудность создания хорошей теории
сложных процессов. Если выделить лишь один элемент химикотехнологического процесса – его гидродинамику, то приходится
считаться с отсутствием на сегодня сколько-нибудь удовлетворительной общей теории турбулентности. Далее, современная химия
охватывает сотни тысяч веществ, и если задаться целью всерьез
расшифровать механизмы реакций получения всех этих веществ,
то вряд ли удастся достичь этой цели в обозримый срок. Подобные
затруднения встречаются на каждом шагу. Понятно, что рассчитать
эмпирические уравнения, как правило, бывает проще, чем получить
информацию, достаточную для расшифровки механизма процесса.
Можно выделить области, где подход в основном приобретает
черты той или иной противоположности. Во-первых, эмпирические
модели лежат в фундаменте науки: исходные ее данные, ее аксиомы суть эмпирические модели. Далее, метод «черного ящика» часто
оказывается целесообразным применительно к очень сложным системам, на пути расшифровки структуры которых могут возникнуть
непреодолимые трудности. Наконец, эмпирический подход имеет
смысл применять при исследовании систем, которые не представляют для нас большой важности и на исследование структуры которых
нет смысла затрачивать много сил. Лучше быстро описать такой объект эмпирической зависимостью и использовать ее для управления.
Объекты, представляющие для нас значительный интерес, длительный во времени, целесообразно исследовать на базе структурного подхода. Так, для важнейших процессов химической технологии, таких как синтез аммиака или каучуков, нужно как можно
подробнее исследовать механизм, создать математические модели,
1.2. Общие вопросы математического описания процессов
25
отражающие все детали структуры. Результаты окупят затраты. Тот
же подход оптимален для сравнительно простых процессов. В то же
время некоторые «малые» органические синтезы, например синтезы
ряда лекарств, не стоит и пытаться полностью описать с этих позиций: процесс столь сложен, что пока мы расшифруем его кинетику,
лекарство морально устареет и будет заменено. Здесь лучше быстро
научиться управлять процессом, считая его черным ящиком.
Если процесс и важен, и сложен, то его изучение часто бывает полезно разбить на этапы: на первом – исследовать его эмпирически,
что облегчает быстрое освоение; на втором – проводить углубленный анализ механизма, который позволит улучшить результаты, полученные ранее.
Структура математического описания при структурном подходе. Процессы, применяемые в химической технологии, крайне
разнообразны по механизмам. Поэтому дать общую схему математического описания процесса весьма затруднительно. Однако некоторые весьма общие черты описания можно отметить. Большинство
математических моделей химико-технологических процессов основываются на уравнениях баланса. Эти уравнения устанавливают соотношения между прибылью и убылью различных субстанций в рассматриваемой системе.
П р и м е ч а н и е . В предыдущем издании [17] уравнения баланса связывались с наличием законов сохранения. Например, существованием закона
сохранения массы объяснялась возможность составления материального
баланса. Утверждения о такой связи встречаются в ряде источников до сих
пор. Однако более тщательное рассмотрение показало, что наличие закона
сохранения здесь необязательно. Достаточно, чтобы количества субстанции
обладали аддитивностью, чтобы их можно было складывать и вычитать. Так,
не существует закона сохранения денег: государство может напечатать или
начеканить деньги, деньги могут быть уничтожены. Тем не менее баланс денег (бюджет) вполне можно составить.
Что нужно для составления уравнения баланса? Прежде всего,
нужно выбрать три вещи. Не определить теоретически, не вычислить, а именно выбрать. В зависимости от выбора для одного и того
же процесса можно составить много правильных уравнений баланса. Выбор должен определяться тем, какие уравнения нам наиболее
удобны, лучше всего подходят к нашей задаче.
Первое – следует выбрать субстанцию. Что именно будем балансировать? Субстанцией может быть, например, вещество. Тогда
имеем уравнение материального баланса. Если субстанция – тепло,
то получим уравнение теплового баланса. Обратим внимание вот на
что: закона сохранения тепла не существует, оно может возникать
(из других форм энергии), может исчезнуть, перейдя в другие фор-
26
Глава 1. Основные понятия метода моделирования
мы, но это не препятствует определению баланса. Что же касается
материального баланса, то здесь встречаются два основных случая.
Один – когда в качестве субстанции выбрана вся совокупность веществ, проходящих через систему. В этом случае действует закон
сохранения массы, что учитывается при записи уравнения. Другой
случай: субстанция – одно из веществ (в этой книге будут рассмотрены почти исключительно такие балансы). Для конкретного вещества
нет закона сохранения. Оно может возникать как продукт реакции,
может исчезать, превращаясь в другие вещества.
Второе – следует выбрать контур, ограничивающий в пространстве систему или ее часть (подсистему), для которой будет составляться баланс. Контур может охватывать рассматриваемый нами
аппарат либо совокупность нескольких связанных между собой аппаратов, либо только одну рабочую зону аппарата. Каждый раз получим иное уравнение баланса. Особый случай – когда контур охватывает бесконечно малый элементарный объем. Часто такой подход
является самым плодотворным. Заметим, что при этом, вследствие
бесконечной малости объема, математическая модель получится
в виде дифференциального уравнения или системы дифференциальных уравнений. И еще один особый вариант – когда контур «разорван» в пространстве (многосвязен). Так, дальше при рассмотрении задач стехиометрического анализа в некоторых случаях контур
«охватывает» все молекулы данного сорта, не включая иные молекулы, при этом такая особенность контура может быть специально не
оговорена, приходится о ней догадываться.
Третье – необходимо выбрать интервал времени, за который составляется баланс. Здесь тоже возможен ряд вариантов. В качестве
интервала можно принять единицу времени: составить баланс за секунду, за год… Можно рассмотреть баланс за бесконечно малый интервал времени dt. При этом, как и в случае бесконечно малого элементарного объема, упрощаются многие закономерности, и также
получается математическая модель в форме дифференциальных
уравнений.
Возможен и такой выбор: наш интервал – время операции, без явного соотнесения его с единицей времени. Например, мы вправе
рассматривать баланс химического синтеза за полное время синтеза,
сколько бы оно не длилось, или, скажем, в периодическом процессе
отдельно составить баланс за время загрузки, отдельно – за время
протекания реакции и т.д.
Наконец, часто баланс относят к базе расчета. Например, при рассмотрении процесса синтеза аммиака в качестве базы расчета можно
принять получение 1000 т аммиака или переработку 1 000 000 м3 азо-
1.2. Общие вопросы математического описания процессов
27
товодородной смеси. Несложно установить связь между понятиями
«интервал времени» и «база расчета»: интервалом окажется время, за
которое получается 1000 т продукта, или то, за которое перерабатывается 1 млн м3 исходной смеси. Но если выбрана база расчета, пересчитывать ее на время не нужно, и баланс относят непосредственно
к этой базе.
После того как выбор произведен, можно приступать к составлению уравнений баланса. Уравнения эти содержат пять составных
частей (пять статей баланса). Четыре первых схематически показаны
на рис. 1.1. Сокращенно каждая статья обозначена первой буквой.
Овал обозначает контур.
Рис. 1.1. Схема статей баланса
Что изображено на рисунке? В (вход) – количество субстанции,
входящей снаружи в систему на протяжении выбранного интервала
времени; У (уход) – количество субстанции, уходящей за тот же интервал наружу; И (источник) – количество субстанции, возникающей
(образующейся) за интервал времени внутри системы; С (сток) – количество субстанции, исчезающей (расходуемой) внутри системы за
тот же интервал.
П р и м е ч а н и е . К сожалению, у разных авторов названия этих статей
баланса различаются. В учебнике [1] величина В названа «приход», остальные названия – такие же, как здесь. В пособиях [2,16,17] термином «приход»
названа сумма В+И, термином «расход» – сумма У+С. Такая ситуация часто
возникает в науке: одни и те же понятия называют разными словами, а различные понятия – одинаковыми. Ни одна из попыток полной унификации
научной терминологии не завершилась решительным успехом. Читая научную литературу, обязательно учитывайте это и всякий раз продумывайте, что
значит то или иное слово.
Пятая статья баланса – накопление Н – на схеме не обозначена. Ее
можно определить так. В каждый момент внутри системы находится какое-то количество субстанции. Накопление – это его приращение за интервал времени, разность между количеством субстанции
28
Глава 1. Основные понятия метода моделирования
в системе к концу интервала и количеством, которое было в начале.
Из такого определения следует, что накопление может быть положительным (количество субстанции увеличилось), отрицательным
(ее количество уменьшилось) и равным нулю (к концу интервала
оно такое же, как было в начале). Отметим один важнейший случай.
В стационарном процессе накопление равно нулю. Определение стационарного процесса будет дано ниже (см. разд. 1.3).
Запишем общий вид уравнения баланса:
В + И – (У + С) = Н.
(1.11)
В случае стационарного процесса Н = 0 и уравнение получает вид
В + И – (У + С) = 0.
(1.12)
Замечу, что соблюдение уравнения (1.12) необязательно означает, что процесс стационарен. Возможны случаи, когда и в нестационарных процессах накопления некоторых субстанций равны нулю.
Но это случается достаточно редко, и в нашем рассмотрении они
встречаться не будут. Вообще, часто, в зависимости от особенностей
баланса, можно заранее сказать, что некоторые статьи равны нулю.
Так, если действует закон сохранения, то, очевидно, И = 0; С = 0.
Некоторые другие случаи рассмотрены в следующем примере.
Пример 1.12. Составим три баланса, из которых третий не вполне серьезен, но зато отражает особенности некоторых нестандартных случаев.
1. Баланс по реагенту в необратимой реакции А → В, протекающей в реакторе непрерывного действия. Субстанция – вещество А, контур охватывает весь аппарат, интервал времени – 1 с. Вход: количество А, вносимое
в реактор за секунду входящим потоком. Уход: количество непрореагировавшего А, уносимое за секунду из реактора потоком. Источник равен нулю: в необратимой реакции А не может образоваться. Сток – количество А,
вступившее за секунду в реакцию.
2. Такой же баланс для реактора периодического действия. В этом случае
нет ни входящего, ни выходящего потока. Значит, вход и уход А равны нулю
и в балансе останутся только сток и накопление.
3. В качестве шутки составим баланс умных мыслей в голове студента.
Условно примем, что в любой момент можем сосчитать, сколько их там сейчас. За интервал времени примем один день. Тогда вход – число мыслей, полученных за день от преподавателей, из книг, от товарищей и усвоенных этим
студентом. Источник – число мыслей, до которых он в этот день дошел сам.
Сток – число мыслей, увы, забытых. А вот уход принципиально равен нулю:
если мы передаем свою мысль другому, она не исчезает в нашей голове.
Итак, математическое описание химических процессов в большинстве случаев состоит из уравнений баланса – прежде всего
материального и теплового. Значения отдельных статей баланса
обусловлены закономерностями процесса. Вход вещества определяется расходом входящего потока и концентрацией данного вещества
1.2. Общие вопросы математического описания процессов
29
в нем; вход тепла зависит от энтальпии входящей жидкости, ее расхода и от передачи тепла снаружи через стенки. Источники и стоки
тепла и вещества пропорциональны скоростям реакций в рабочей
зоне и т.д. Какими уравнениями будет описан процесс – конечными,
обычными дифференциальными или дифференциальными в частных производных – зависит от выбора контура и интервала времени,
а те в свою очередь – от особенностей потоков в рабочей зоне и стационарности или нестационарности процесса. Более сложные случаи, когда описание процессов получают в форме интегральных или
интегро-дифференциальных уравнений, рассматриваться не будут.
Эмпирические модели. Проводя опыты с использованием эмпирического подхода, мы не знаем, в каком виде следует получать
функцию отклика. Если у зависит только от одного х и вид зависимости достаточно прост, то можно судить об этом виде на глаз, по
графику. Если аргументов несколько или если график сложен, то для
нахождения вида функции обычно пользуются тем, что большинство
функций, с которыми приходится иметь дело на практике, можно
разложить в ряд Тейлора (степенной ряд). Если ограничиться несколькими первыми членами ряда, то функция будет представлена
многочленом (полиномом). Этот многочлен есть приближенное выражение неизвестной функции F(X); качество приближения определяется величиной остатка ряда – той его части, которую мы отбрасываем. Чтобы приближение удовлетворительно описывало процесс,
остаток должен быть невелик по сравнению с шумом. Тогда дальнейшее уточнение функции теряет смысл: мы не сможем выявить,
действительно ли следующие члены отражают уточненную функцию
или они связаны лишь со случайными ошибками опыта.
Обычно вначале рассчитывают более простые многочлены; отклонение опытных точек от расчетных значений сравнивают со случайной ошибкой эксперимента. Если обе величины одного порядка,
то описание считают удовлетворительным. Если отклонение нельзя
объяснить случайной ошибкой, рассчитывают более сложный многочлен.
Рассмотрим случай, когда у зависит от трех переменных: x1, х2 и
х3. Первое возможное предположение: у на самом деле не зависит от
контролируемых входов и все его отклонения от среднего значения у
объясняются случайными ошибками:
y = b0.
(1.13)
Здесь и далее b —эмпирический коэффициент.
Если проверка покажет, что отклонения у от значения b0 действительно имеют тот же порядок, что и случайная ошибка опытов, то
в дальнейшем можно пользоваться формулой (1.13) и считать у кон-
30
Глава 1. Основные понятия метода моделирования
стантой. Если различия между опытными и расчетными значениями
у нельзя объяснить случайными ошибками, то уравнение неадекватно и нужно проверить следующее приближение – линейное:
y =b0 + b1x1 + b2x2 + b3x3.
(1.14)
Проверка производится снова. Если неадекватно и выражение
(1.14), то обрабатывают результаты в виде многочлена 2-го порядка:
y = b0 + b1x1 + b2x2 + b3x3 + b12 x1x2 + b13 x1x3 + b23x2x3 +
(1.15)
+ b x 2+ b x 2 + b x 2.
11 1
22 2
33 3
При неадекватности этого уравнения можно проверить многочлен 3-го порядка и т. д. Обратите внимание на то, как записаны индексы при коэффициентах b. Индекс показывает, какие аргументы
перемножаются в данном члене уравнения. Так, b12 – коэффициент
при произведении x1 и x2, b33 – коэффициент при произведении x3 и
x3, т.е. при x32, и т.д.
По мере увеличения порядка многочлена точность описания возрастает, но одновременно усложняется интерпретация модели –
анализ влияния каждого фактора и различных сочетаний разных
факторов. Кроме того, чем больше коэффициентов содержит уравнение, тем больше опытов необходимо провести для их нахождения:
минимальное число опытов равно числу коэффициентов, а для возможности оценки адекватности нужно провести больше опытов,
чем предполагаемое число коэффициентов. Таким образом, для получения линейной модели (1.7) опытов должно быть не менее 4, для
модели (1.8) – нe менее 10, а для модели 3-го порядка с тремя аргументами – уже как минимум 20. Уравнения порядка выше 3-го (при
более чем одном аргументе) на практике встречаются редко.
Представление эмпирических зависимостей многочленами (полиномиальными формулами) встречается наиболее часто. Это связано с
тем, что поскольку математические свойства таких приближенных
формул хорошо изучены, с ними удобно обращаться. Правда, некритическое использование полиномиальных формул не всегда приводит к успеху. Некоторые свойства объекта часто удобнее отражать
при помощи формул, содержащих функции иных классов. Так, при
описании колебательных процессов, несомненно, лучше использовать тригонометрические функции. Если пределы изменения аргумента невелики, такой процесс можно описать и многочленом, но
описание окажется неоправданно сложным.
В химии и химической технологии нередко встречаются зависимости с асимптотами: при неограниченном росте аргумента функция асимптотически приближается к некоторой постоянной величине (рис. 1.2).
1.2. Общие вопросы математического описания процессов
31
1
2
1
Рис. 1.2. Асимптотические зависимости:
1 – падающая, 2 – возрастающая
Зависимость, представленная на рис. 1.2 кривой 1, может быть
связана с исчерпанием количества какой-либо субстанции (например, с расходованием реагента на реакцию); зависимость, показанная кривой 2, часто возникает при приближении к равновесию.
Ни одна полиномиальная формула не воспроизводит зависимостей
с асимптотами; на небольшом интервале значений x описание может получиться довольно точным, но при расширении интервала
полином неизбежно исказит характер зависимости. Поэтому в таких
случаях целесообразнее искать другие формы уравнений. Например,
для кривой 1 достаточно часто подходит уравнение
y = be–kx,
(1.16)
а для кривой 2 – либо формула
y = b(1– e–kx),
(1.17)
либо
bx
y= 1 .
(1.18)
1 + b2 x
Еще один наиболее встречающийся случай – зависимость от
одного или нескольких аргументов, когда при стремлении к нулю
любого из аргументов функция также стремится к нулю. Такие зависимости характерны для ряда выражений, определяющих связь
между безразмерными числами подобия. Такова, например, зависимость числа Нуссельта (Nu) от чисел Рейнольдса (Re) и Прандтля
(Pr). Часто оказывается, что и проще, и точнее всего ее описывает
степенной одночлен:
(1.19)
Nu = ВRem Prn ,
где m и n – эмпирические коэффициенты, как правило не целые.
Заметим, что если прологарифмировать обе части выражения (1.19),
то получим линейное уравнение – простейший вариант многочлена.
32
Глава 1. Основные понятия метода моделирования
1.3. Некоторые особенности моделей и задач
математического моделирования
О точности моделей. Ни одна модель в принципе не способна
отразить оригинал полностью и всесторонне. Это положение вытекает из общефилософских соображений и одинаково верно как для
материальных, так и для мысленных моделей. Более того, часто оказывается, что на практике целесообразнее пользоваться менее «совершенной» моделью, отражающей только отдельные черты оригинала и совсем не похожей на оригинал с других точек зрения. В ряде
случаев целесообразно один оригинал моделировать с помощью разных моделей, не похожих одна на другую. Рассмотрим этот вопрос
на примитивном примере.
Пример 1.13. Предположим, надо смоделировать лабораторный стол
для размещения опытных установок. Как должна выглядеть модель стола?
Это зависит от того, какие вопросы желательно решать при помощи моделирования. Если это вопрос о механической прочности (скажем, на установках ожидаются удары большой силы), то основное требование — иметь
возможность рассчитать силу удара, разрушающего оригинал. На этом этапе
модель, возможно, воспроизведет только каркас, принимающий на себя нагрузки. Если решается вопрос о коррозионной стойкости материалов того
же стола при воздействии веществ, которые могут выделиться при проведении опытов, то моделью будут служить просто кусочки материалов, погруженные в соответствующие среды. Хотя их моделью обычно не называют,
но с точки зрения данного нами определения это тоже модель. Если же мы
хотим заранее решить вопрос о наиболее удобном размещении нашего стола
в тесной лаборатории, то роль модели с успехом может выполнить бумажный прямоугольник, который мы двигаем по плану лаборатории.
Сходная особенность характерна и для мысленных моделей. Как
и любая стадия познания, мысленная модель содержит в себе объективную истину, но не является абсолютной истиной. Вследствие
сложности и многогранности любого явления природы во многих
случаях оказывается целесообразным описывать и анализировать
одно и то же явление, один и тот же объект в разных случаях при помощи разных моделей.
Важная особенность мысленных моделей заключается в том, что,
как правило, имеет смысл пользоваться упрощенной моделью даже тогда, когда существует более совершенная модель. Это связано
с тем, что чем проще модель, тем обычно проще сделать на ее основе количественные выводы. Зачастую бывает, что уточнение, получаемое при использовании более сложной модели, не оправдывает
усложнения. Иногда этим уточнением вообще можно пренебречь.
В таких случаях целесообразно пользоваться упрощенными моделями. Примеров тому множество.
1.3. Некоторые особенности моделей и задач математического моделирования
33
В большинстве технологических расчетов свойств газов мы исходим из модели идеального газа, отлично зная, что реальные газы
можно описать гораздо совершеннее. Но это ни к чему, поскольку
для нас достаточна точность, даваемая простейшей моделью. И лишь
при высоких давлениях, вблизи температуры конденсации или при
высокоточных расчетах возникает необходимость в усложненных
уравнениях – например в формуле Ван-дер-Ваальса.
Сегодня существуют модели молекулы гораздо более совершенные, чем модель Бутлерова. Несмотря на это, обычно молекулы
изображают «по Бутлерову». И лишь когда требуется рассчитать
энергетику молекулы или когда речь идет о веществах со сложными формами химической связи, насущно необходимыми становятся
другие модели.
Разумеется, если нужно достаточно точно описать сложный объект, то следует применить сложную модель. В этих случаях получение
полноценного математического описания – трудная задача, требующая большой работы. Но результат может оправдать все затраты.
Далее в этом разделе будет рассмотрен вопрос о сложности моделей, записываемых уравнениями или системами уравнений. Такие
случаи встречаются наиболее часто (хотя, разумеется, модель может
содержать и иные математические структуры – неравенства, алгоритмы, таблицы и т.д.). Сложность уравнений может проявляться
в разных формах. Во-первых, это число уравнений в системе. Вовторых, это тип применяемых уравнений. Дифференциальные уравнения решать, как правило, сложнее, чем алгебраические; уравнения
в частных производных – сложнее, чем обыкновенные дифференциальные уравнения. Значительные сложности возникают при переходе от линейных уравнений к нелинейным. Системы линейных
алгебраических или обыкновенных дифференциальных уравнений
можно решить аналитически в общем виде (по крайней мере, когда
этих уравнений не слишком много). Всякая нелинейность усложняет процедуру решения.
Параметры модели. Чаще всего простота или сложность математической модели связаны с тем, сколько в нее входит параметров –
коэффициентов, учитывающих те или иные особенности объекта.
Значения параметров характеризуют свойства данного конкретного объекта, отличающие его от других объектов того же класса. Чем
больше параметров входит в модель, тем подробнее удается охарактеризовать его и тем точнее описать.
На одном полюсе здесь выступают предельно идеализированные модели, такие, как идеальный газ, абсолютно упругое тело и др.
Уравнения при этом либо вообще не содержат параметров, включая
34
Глава 1. Основные понятия метода моделирования
лишь универсальные константы (идеальный газ), либо их число минимальное (модуль упругости в законе Гука). Эти идеализированные
модели почти полностью игнорируют конкретные свойства объектов. На другом полюсе — сложные многопараметрические модели,
учитывающие много конкретных свойств. Так как мы всегда хотим
иметь максимально точное описание объекта, с этой точки зрения
сложные модели обладают несомненными преимуществами.
Но у сложных моделей есть и недостатки. Прежде всего такую модель трудно обрабатывать. Если данная модель входит как составная
часть в сложные модели более высоких иерархических уровней, то
в конце концов может получиться такое громоздкое описание, что
его не удастся обсчитать. К тому же, чем сложнее зависимость, тем
труднее представить себе, как она выглядит в целом. Хотя такая наглядность, возможность составить общее представление о характере
зависимости не обязательно нужна при моделировании, но обычно
она заметно облегчает анализ.
Еще одна трудность, связанная с применением многопараметрических моделей, — это чувствительность к ошибкам опытов. Чем
больше параметров, тем более точный эксперимент требуется, чтобы
достаточно хорошо оценить эти параметры. Если модель построена
на основе структурного подхода, а эксперимент не очень точен, то
возникает специфическая опасность потери физического смысла:
можно получить неверные значения параметров, хотя модель в целом будет давать приемлемое совпадение с опытными данными.
Это происходит потому, что ошибки в значениях разных параметров
взаимно компенсируются. Модель остается пригодной для количественного описания объекта (в достаточно узких пределах), но физический смысл искажается — мы получаем превратное представление
о величинах эффектов, связанных с параметрами. В конце концов
физический смысл теряется и параметры модели получают смысл
подгоночных параметров, назначение которых — лишь привести
в соответствие данные и модель. Уравнение становится эмпирическим, о чем исследователь может не знать. Проиллюстрировать это
можно даже на примере достаточно простого двухпараметрического
уравнения Ван-дер-Ваальса.
Пример 1.14. В модели Ван-дер-Ваальса параметр а оценивает интенсивность межмолекулярного взаимодействия; параметр b — объем, занимаемый
молекулами. Уравнение, разрешенное относительно давления, имеет вид
p=
RT
a
−
.
V −b V2
1.3. Некоторые особенности моделей и задач математического моделирования
35
Наиболее точные значения параметров для СО2 таковы [18]: a = 0,3652
Па·м6/моль; b = 4,28·10–5 м3/моль. По опытным данным получены ошибочные значения: а = 0,5755; b = 10–4. Сравним данные расчета давления р при
верных и ошибочных значениях параметров, а также данные расчета в приближении идеального газа (см. таблицу).
T, К
V, м3/моль
300
300
400
400
0,0005
0,001
0,0005
0,001
pверн
Давление, МПа
pошиб
pид
3,995
2,241
5,814
3,110
3,933
2,196
6,013
3,120
4,989
2,495
6,652
3,325
Несмотря на большое завышение величин параметров, полученные значения отличаются от посчитанных по точному уравнению максимально на
3,5%. Это гораздо лучше, чем расчет с помощью уравнения для идеального
газа, где расхождение достигает 22%. Таким образом, пользоваться моделью
для расчетов можно, но физический смысл искажен: оценки силы взаимодействия и объема молекул завышены соответственно в 1,5 и 2,3 раза, причем завышение одного из параметров происходит при обработке данных
неизбежно – это обусловлено компенсацией ошибки, содержащейся во втором параметре.
Если произошла утрата физического смысла, начинает проявляться
еще одна отрицательная особенность многопараметрических моделей:
ненадежность экстраполяции. Уравнение, которое хорошо описывает
объект в области, изученной экспериментально, становится крайне
неточным уже при небольшом выходе за ее пределы. Разумеется, та
же особенность присуща и чисто эмпирическим моделям.
Пример 1.15. Экспериментатор изучал зависимость отклика у от фактора х. Полученные им данные приведены в таблице.
x
y
–2
5,21
–1
7,47
0
10,95
1
13,67
2
13,32
Экспериментатор знал, что кривая зависимости у от х почти прямолинейная, быть может лишь слегка искривленная. Поэтому он обработал данные
уравнением прямой с помощью метода наименьших квадратов и получил
следующее выражение: у = 10,124 – 2,242x (прямая на рис. 1.3).
На этом обработку можно было окончить, поскольку довольно значительный разброс данных не позволяет учесть тонкие особенности поведения
объекта (или же нужно поставить дополнительные опыты для уточнения зависимости). Но недостаточно опытный исследователь захотел иметь более
точное описание и применил многочлен 4-й степени, при этом он получил
уравнение
y = 10,96 + 3, 4575x – 0,36625x2 – 0,3575x3 – 0,001375x4
(см. кривую на рис. 1.3).
Глава 1. Основные понятия метода моделирования
36
15
10
5
-4
-2
0
2
Рис. 1.3. Прямая и парабола 4-й степени, построенные по данным опытов
В исследованных пределах х парабола 4-й степени хорошо соответствует
опыту – она проходит через все экспериментальные точки, но даже близкая
экстраполяция, до значений х = ±3, дает результаты, явно не соответствующие ожидаемому ходу зависимости. Это происходит потому, что вследствие
недостаточной точности эксперимента члены высших степеней оценены
неточно. А их влияние быстро нарастает при удалении от области эксперимента.
П р и м е ч а н и е . Признаюсь, что этим экспериментатором был я (в начале самостоятельной работы, пока еще не хватало опыта).
Основной вывод из сказанного: если необходима высокая точность описания, следует применять многопараметрические модели,
но при этом эксперимент должен отличаться высокой точностью и
большим объемом. Если же требования не столь велики, чаще всего целесообразно использовать простейшую из моделей, обеспечивающих нужную точность. Впрочем, в конкретных случаях требуется конкретное рассмотрение. Бывает и так, что из двух возможных
моделей мы выберем несколько более сложную, зато более ясную
физически. Дать непогрешимый рецепт на все случаи жизни невозможно.
Модели сплошных сред и квазигомогенные модели. Одна из замечательных особенностей процесса познания – упрощение модели,
связанное со сменой языка описания. Часто бывает так, что по мере
1.3. Некоторые особенности моделей и задач математического моделирования
37
усложнения системы ее описание постепенно усложняется, а затем в какой-то момент резко упрощается, причем последнее связано с тем, что система теперь описывается по-иному, на другом
языке.
Пример 1.16. Описать движение одной молекулы, помещенной в сосуд не
слишком сложной формы, не так уж трудно. Если молекул – 2, то сложность
описания возрастает, как минимум, вдвое. Если молекул – 100, то описание
становится уже очень сложным; «уследить» за траекторией всех 100 молекул
очень трудно. Если же число молекул составляет 1020, то описание становится предельно простым: pV = RT. Но это будет описание не на языке молекул,
а на языке газовой фазы.
Многие читатели, вероятно, давно уже обращали внимание на
особенность некоторых отраслей науки, таких, как гидромеханика,
термодинамика, теория теплопроводности и диффузии, формальная
химическая кинетика и др. Свойства вещества в них описываются
так, как будто оно не состоит из молекул. Так, когда в гидродинамике
рассматривают движение жидкости, речь идет вовсе не о движении
отдельных молекул. Более того, и физическая схема, и математическое описание в этом случае существенно опираются на представление о том, что параметры текущей жидкости (например, скорость)
непрерывно меняются от точки к точке: непрерывность необходима,
если используется процедура дифференцирования.
Разделы физики (и примыкающие разделы химии), исходящие из
модели вещества как среды, параметры которой меняются непрерывно, объединяют названием физика сплошных сред. Предмет каждого
из этих разделов в принципе можно описать и на основе молекулярных представлений. Но описание при этом получается неизмеримо
более сложным. Модель сплошной среды удобна для использования
такого мощного математического аппарата, как дифференциальное
и интегральное исчисления. Даже в случаях, когда наряду с моделью
сплошной среды существует хорошо разработанная молекулярная
модель, вторая не вытесняет, а дополняет первую (сравните термодинамику и статистическую физику).
Удобства, получаемые при использовании модели сплошной среды, столь велики, что таким же образом часто рассматривают объекты, состоящие не из молекул, а из гораздо более крупных частиц. Мы
описываем, например, течение эмульсии в трубе как течение однородной жидкости, характеризующейся некоей эффективной вязкостью, которая сложным образом зависит от свойств и соотношения
фаз, а также от размеров и формы частиц. В гл. 5 дается описание
зерна катализатора (сложного конгломерата, по порам которого
диффундирует вещество, реагирующее на стенках пор) как некото-
38
Глава 1. Основные понятия метода моделирования
рой однородной среды. Подобные схемы, упрощенно представляющие многофазную систему как однородную, называют квазигомогенными моделями.
П р и м е ч а н и е . В предыдущем издании [17] я использовал менее удачный термин «псевдогомогенные модели». У меня нет сомнения, что латинское «quasi» – «как бы» – здесь гораздо уместнее, чем греческое «ψευδω» –
«лже».
Лимитирующие стадии. Многие интересующие нас процессы многостадийны, т. е. распадаются на ряд стадий (этапов, путей).
Описание и анализ многостадийного процесса удается существенно
упростить в тех случаях, когда одна из стадий лимитирует процесс.
Лимитирование важно учитывать не только при описании. Если
мы хотим воздействовать на такой процесс, то воздействие должно
оказываться именно на лимитирующую стадию, влияние на нелимитирующие стадии практически не скажется на процессе в целом.
То, какая именно стадия может лимитировать процесс, определяется, с одной стороны, соотношением скоростей (или производительностей, мощностей) разных стадий, а с другой – их взаимным
расположением. Если стадии последовательны, то лимитирует самая
медленная (наименее производительная), если стадии параллельны,
то лимитирует самая производительная.
Наконец, случается, что ни медленная, ни быстрая стадия не могут лимитировать процесс. Это бывает, когда, казалось бы, нелимитирующая стадия влияет на протекание той стадии, которая должна
была бы лимитировать.
Пример 1.17. Рудный концентрат доставляется с обогатительной фабрики на химический завод по железной дороге. Кроме того, при оказии некоторое количество концентрата перевозят на автомашинах. Эти два этапа
(перевозка по железной дороге и автотранспортом) осуществляются параллельно. Поэтому, например, при расчете плана перевозок маломощным
этапом (автоперевозки) зачастую можно пренебречь, поскольку лимитирует
железная дорога. С другой стороны, железнодорожная доставка разбивается
на последовательные этапы: погрузка (около 2 ч), перевозка (около 3 сут.)
и выгрузка (около 2,5 ч). Здесь лимитирует самый продолжительный этап.
Ускоряя погрузочно-разгрузочные работы, существенного выигрыша получить нельзя, а при ускорении перевозки выигрыш будет существенным. Но
если оказывается, что задержка в погрузке может сорвать график движения
и задержать отправление эшелона на сутки, то даже небольшое ускорение
этого «быстрого» этапа существенно скажется на итоге: перевозка уже не лимитирует, важны обе стадии.
Рассмотрим еще некоторые особенности математических описаний, отражающие важные для практики особенности объектов.
1.3. Некоторые особенности моделей и задач математического моделирования
39
Стационарные и нестационарные процессы. Простейшим для
анализа случаем является стационарный процесс. Его параметры (во
всяком случае те параметры, которые важны в рамках данного рассмотрения) не меняются во времени, поэтому время как переменная
исчезает из описания. В частности, в соответствующих уравнениях
отсутствуют производные по времени. По сути своей стационарные
процессы непрерывны, а значит, они обязательно проходят в открытых системах, т. е. системах, обменивающихся веществом с окружающей средой. Именно этот обмен – ввод исходных материалов и
вывод продуктов – и поддерживает непрерывность. В аппарате, в котором идет непрерывный процесс, обязательно движется поток.
Нестационарные процессы характеризуются изменением параметров во времени. Нестационарными являются все периодические
процессы. Кроме того, нестационарно может работать и аппарат
непрерывного действия. Это происходит во время переходных процессов, заключающихся в переходе от одного стационарного режима
к другому. Переходные процессы возникают при пуске, остановке,
переналадке режима, а также вследствие случайных возмущений – колебаний процесса под воздействием неконтролируемых факторов.
Нестационарный процесс может протекать как в замкнутой системе, не обменивающейся веществом с окружающей средой (например,
в автоклаве), так и в открытой системе (периодическая ректификация, переходный процесс в аппарате непрерывного действия и т. д.).
В некоторых случаях один и тот же процесс можно описать и как
стационарный, и как нестационарный – в зависимости от системы
переменных, в которой проводится описание. Так, процесс в потоке
может рассматриваться как стационарный при описании его в координатах, неподвижных относительно аппарата: в данной точке
аппарата концентрации и температура не меняются во времени. Но
если тот же процесс описать в координатах, движущихся с потоком,
описание окажется нестационарным: по мере движения в потоке
концентрации меняются вследствие протекания реакции.
В этой книге основное внимание уделяется наиболее простым –
стационарным процессам. Анализ нестационарных процессов подробно рассматривается в курсах автоматизации [13].
Объекты с сосредоточенными и распределенными параметрами.
Эти понятия являются пространственными аналогами стационарности и нестационарности. Если объект таков, что можно пренебречь
различием параметров процесса в разных точках и считать, что все
они (концентрации, температура и др.) полностью выровнены по
объему, то это объект с сосредоточенными параметрами. В описании
такого объекта отсутствуют производные по координатам (все они
40
Глава 1. Основные понятия метода моделирования
равны нулю), что сильно упрощает модель. В некотором смысле объект с сосредоточенными параметрами можно рассматривать как точку, в которой происходит процесс, поскольку во всех других точках
все происходит точно так же. Описание в этом случае будет наиболее
простым.
Если параметры процесса существенно меняются от точки к точке, то это объект с распределенными параметрами. В его описании
возникают производные, по крайней мере, по одной координате,
а возможно, и по всем трем. Поэтому описание и анализ здесь сложнее, чем в случае сосредоточенных параметров.
Конечные и дифференциальные уравнения. Математическая модель может содержать как конечные уравнения, не содержащие операторов дифференцирования, так и дифференциальные уравнения.
Конечные уравнения возникают, например, при описании стационарных процессов в объектах с сосредоточенными параметрами.
Они могут быть алгебраическими либо трансцендентными. В последние входят трансцендентные функции от неизвестных. Так, трансцендентны уравнения, содержащие аррениусовы члены (учитывающие влияние температуры на скорости реакций).
Обыкновенные дифференциальные уравнения содержат функции
лишь одной независимой переменной. Линейные уравнения (и их
системы) могут быть решены аналитически. Нелинейные уравнения
чаще всего целесообразно решать на компьютере.
Дифференциальные уравнения в частных производных появляются в
задачах, где имеется более одной независимой переменной. Решение
их чаще всего представляет собой сложную математическую задачу и
обычно требует применения компьютера.
Задачи Коши и краевые задачи. При численном решении систем
обыкновенных дифференциальных уравнений встречаются два
основных случая, связанные с характером задания начальных условий. Первый – все начальные условия заданы при одном и том же
значении независимой переменной. Это задача Коши. Например,
протекание сложной реакции, в которой участвуют в качестве реагентов и продуктов n веществ, описано п дифференциальными уравнениями; начальные условия заданы в виде п начальных концентраций веществ в момент времени t = 0. Численное решение задач Коши
сводится к той или иной расчетной схеме, в которой осуществляется
расчет зависимых переменных при движении от начального до конечного значения независимой переменной.
Значительно сложнее расчет в том случае, когда начальные (точнее, краевые) условия заданы при различных значениях независимой переменной. Здесь мы имеем дело с краевой задачей. Краевые
1.3. Некоторые особенности моделей и задач математического моделирования
41
задачи часто возникают, например, при описании процессов с противотоком фаз. Процедуры решения для краевых задач, как правило,
значительно сложнее, чем для задач Коши.
Теперь рассмотрим некоторые задачи, которые различаются тем,
относительно каких величин, входящих в математическую модель,
следует разрешать уравнения.
Прямые и обратные задачи. Обратимся к уравнению (1.10). Более
подробно это уравнение (общий вид уравнения математической модели) может быть представлен как
yi = Fi (X,B),
(1.20)
где B = (b0, b1,…., bp) – вектор параметров. Запись (1.20) отражает тот
факт, что в модель обязательно входят параметры. Возможны два
основных класса задач, связанных с уравнениями вида (1.20).
Задача первого класса. Нам заданы X, В. В этих условиях следует
определить yi. Это прямая задача. В такой формулировке она сводится к расчету функции, заданной в явной форме. Если рассмотреть
переменные Х, то решение данной задачи дает изменение величины
y, или распределение y в пространстве факторов.
Задача второго класса. Нам задано распределение (как правило,
в виде совокупности экспериментальных данных) y в пространстве
факторов X и известен общий вид функции (1.20). Требуется определить параметры b0, ..., bр. Это обратная задача. Одному из важнейших
подходов к решению таких задач – математической статистике – посвящена гл. 2.
Проектные и поверочные расчеты. Указанные два типа расчетов
в химической технологии различаются величинами, которые выбирают в качестве рассчитываемых. Проектным расчетом называют
такой, цель которого состоит в определении требуемых размеров
аппарата, при которых могут быть достигнуты заданные показатели.
Поверочным расчетом называют такой, в котором мы задаемся размерами аппарата и находим, какие показатели могут быть при этом
достигнуты.
Во многих случаях целесообразно свести проектный расчет к совокупности поверочных: задаться рядом типоразмеров аппаратов,
для каждого из них рассчитать достижимые показатели, после чего
выбрать наилучший размер. Особенно простой такая процедура получается при использовании компьютера.
ГЛАВА 2.
ЭЛЕМЕНТЫ ТЕОРИИ ЭКСПЕРИМЕНТА
Во второй половине ХХ века интенсивно развивалась математическая теория эксперимента – общие методы, позволяющие повысить эффективность эксперимента практически во всех областях
науки. Эта теория основана на двух концепциях.
1. Концепция случайной ошибки. Нельзя ни грамотно поставить
эксперимент, ни корректно обработать его результаты, если не учитывать, что результаты любого эксперимента, за ничтожным исключением, содержат случайные ошибки.
Предположим, мы хотим поставить два опыта, чтобы через полученные точки провести прямую. Если не учитывать ошибок, то безразлично, как расположены абсциссы этих точек (при каких значениях аргумента ставятся опыты): через любые две точки можно провести прямую
и притом только одну. Но учет ошибок немедленно приводит к выводу,
что точки следует раздвинуть по оси абсцисс как можно дальше: если
точки близки и, значит, результаты опытов мало отличаются один от
другого, то влияние ошибок очень сильно исказит ход прямой.
2. Концепция модели. В подавляющем числе случаев, чтобы хорошо организовать эксперимент, необходимо заранее знать (или хотя
бы предполагать), в каком виде мы хотим получить описание объекта
эксперимента, какую математическую модель будем строить по его
результатам.
Таким образом, для эффективного проведения эксперимента нужно заранее выбрать общий вид модели (1.21) и сформулировать цель
эксперимента как оценку параметров модели и величины шума.
П р и м е ч а н и е . Математическая модель не обязательно должна задаваться уравнениями. В некоторых случаях, особенно если переход от модели
общего вида (1.20) к виду (1.21) невозможен или труден, имеет смысл применять и более простые модели. Примером может служить модель классификации: по результатам опытов мы хотим узнать, к какому классу относится наш
объект – скажем, обладает данное вещество свойствами лекарства или нет.
Важнейшая роль, отводимая в теории эксперимента случайным
ошибкам, требует привлечения методов теории вероятностей и математической статистики. Поскольку эти вопросы изучаются в курсе математики, здесь лишь кратко изложены основные сведения.
2.1. Случайные события и случайные величины
43
2.1. Случайные события и случайные величины
Случайные события. Пусть возникли или созданы нами условия,
при которых может произойти (а возможно, и не произойдет) некоторое событие. Будем называть возникновение таких условий испытанием. Если до испытания мы не можем точно знать, произойдет
или не произойдет событие, такое событие называют случайным.
Пример 2.1. Я надеюсь сегодня получить письмо. Ожидание на протяжении дня – испытание; получение письма – случайное событие. Случайное
потому, что заранее я не знаю точно, придет оно или нет.
Частота и вероятность. Основное понятие теории – вероятность. Строгое его определение очень непросто, поэтому ограничимся описанием не вполне строгим, но достаточным для наших целей.
Теория вероятностей занимается такими событиями, которые, вопервых, могут происходить при многих испытаниях (массовые события), а во-вторых, обладают следующим свойством. Пусть проведено n испытаний, причем в m из них событие произошло, а в (n – m)
нет. Отношение m/n назовем частотой события. Скажем, если из
пяти дней два дня письма приходили (см. пример 2.1), а три нет, то
частота составила 2/5=0,4. Естественно, в какие-то другие дни частота вполне может оказаться иной. Так вот, в очень многих случаях
при росте числа испытаний (когда n→∞) частота все более приближается к некоторому пределу, характеризующему данную величину.
Этот предел и называют вероятностью.
Пример 2.2. Студент переписывается по e-mail со своим другом.
Испытание – ожидание письма на протяжении дня, событие – получение
письма. В зависимости от числа дней n, за которые рассчитана частота, имеем данные (дни отсчитываются от начала года, число событий m – количество писем, которые пришли за весь этот срок), приведенные в таблице.
7
14
21
28
35
70
140
210
350
n
2
2
5
7
12
28
41
53
131
m
0,286
0,143
0,238
0,250
0,343
0,280
0,290
0,250
0,262
n/m
При расчете частоты за несколько недель она колеблется достаточно
сильно, но затем колебания уменьшаются. Видимо, вероятность близка
к 0,25 – 0,27.
Если в любом испытании событие наверняка произойдет (достоверное событие), то для него вероятность Р = 1; если событие невозможно, то Р = 0.
Обратное не всегда верно; ниже будут рассмотрены возможные события
с нулевой вероятностью.
Случайные величины. Случайной величиной называется та, точное
значение которой в предстоящем подсчете или измерении невозможно предсказать. Практически случайные величины появляются
Глава 2. Элементы теории эксперимента
44
двумя путями. В ряде задач величина случайна, так сказать, по сути.
Например, случайно количество радиоактивных распадов в секунду
для образца, обладающего низкой активностью. В других задачах мы
обычно трактуем величину в основном как неслучайную (детерминированную), но становящуюся случайной вследствие того, что при
измерении на нее накладывается случайная ошибка. Однако провести четкую границу между теми и другими случайными величинами
удается не всегда. В теории вероятностей различия между ними не
делают.
Замечу, что понятия «случайные события» и «случайные величины» тесно связаны между собой и обычно могут рассматриваться
как разные способы описания одних и тех же ситуаций. Так, можно
сказать: «Событие, заключающееся в том, что случайная величина
приняла значение 0,4». В то же время каждому событию можно поставить в соответствие случайную величину, например: если событие
произошло, величине придается значение 1, если не произошло, – 0.
В дальнейшем изложении, как правило, не буду оговариваться, идет
речь о событии или величине, если это понятно по смыслу.
Главная характеристика случайной величины так же, как и случайного события, – вероятность. Вероятность Р есть число, заключенное между 0 и 1 и характеризующее среднюю частоту появления
в измерениях того или иного значения случайной величины. По способу задания вероятности случайные величины делятся на два больших класса.
Пример 2.3. В опытном цехе установлены четыре печи для выращивания
кристаллов сапфира. Посменный анализ работы цеха за предыдущий год
(915 рабочих смен) дал следующие результаты.
Число работавших печей
4
3
2
1
0
Число смен
401
276
89
79
70
В текущем году условия работы не изменились. Какова вероятность того,
что сейчас работают три печи? Какова вероятность того, что печь, включенная сегодня утром, проработает до остановки ровно 24 ч?
Ответим сначала на первый вопрос. Если 915 испытаний достаточно много и можно приравнять оценку вероятности к частоте, то
P{N = 3} ≈
276
= 0,30 .
915
Ответ на второй вопрос однозначен, но несколько неожидан – вероятность равна нулю: P{t = 24} = 0 .
Данный пример требует разъяснения. Две рассмотренные в нем
случайные величины относятся к двум классам. Число работающих
печей – дискретная случайная величина. Ее возможные значения от-
2.1. Случайные события и случайные величины
45
делены одно от другого интервалами: могут работать одна, две, три,
но не 0,6 или 3,87 печи. Для каждого значения дискретной величины
можно тем или иным способом оценить соответствующую вероятность:
P {U=u} = P(u).
(2.1)
Здесь Р — символ вероятности; U – обозначение случайной величины, которая может принимать разные значения; и – какое-либо конкретное ее значение. В фигурных скобках записано событие, заключающееся в том, что U приняла значение u. Правая часть означает,
что искомая вероятность зависит от и: каждому значению и соответствует своя вероятность. В рассматриваемом примере Р(3) ≈ 0,30.
Время работы печи – непрерывная случайная величина, в определенных пределах она может принять любое значение. В сколь угодно
малом интервале заключено бесконечное число ее возможных значений. Поэтому вероятность того, что непрерывная случайная величина точно примет заданное значение, равна нулю. Замеренное значение обязательно отклонится от предсказанного хоть на ничтожно
малую величину.
Но из сказанного выше не следует, что нельзя говорить о вероятности применительно к непрерывным величинам. Действительно,
включаемая печь явно вероятнее проработает до остановки 24 ч, чем
24 с или 24 года. Дело в том, что для определения вероятности значение непрерывной случайной величины нужно задать с допуском.
Если бы в примере вопрос был поставлен так: какова вероятность
того, что продолжительность работы примет какое-либо значение
в пределах от 24 ч до 24 ч 5 мин, т. е. был бы задан допуск, то вероятность составила бы определенную величину, отличную от нуля.
Формально для этого случая полагают: вероятность того, что непрерывная случайная величина U примет какое-либо значение в интервале от и до u + du, равна
P {u ≤ U ≤ u+du} = f (u) du.
(2.2)
Функция f(u) называется плотностью вероятности, или дифференциальной функцией распределения величины U. Ясно, что в нашем
примере величина f(u) при u = 24 ч значительно больше, чем при
u = 24 с или u = 24 года.
Основные свойства функции f(u). Вероятность того, что U примет
какое-либо значение в интервале от u1 до u2, равна
u2
P{u1 ≤ U ≤ u2 } =
∫ f (u )du .
u1
(2.3)
Глава 2. Элементы теории эксперимента
46
Можно рассмотреть случай, когда u1= – ∞, т. е. вероятность того,
что U окажется не больше и2,
u2
P{U ≤ u2 } =
∫
f (u )du .
(2.4)
−∞
Часто имеет смысл рассматривать верхний предел интеграла (2.4)
как переменную. Тогда соответствующая вероятность становится
функцией этого переменного верхнего предела:
u
F (u ) =
∫
f (u )du .
(2.5)
−∞
Функцию F(и) называют интегральной функцией распределения
случайной величины U. Дифференциальная функция есть производная от интегральной:
f (u ) =
dF (u ) .
du
(2.6)
Поэтому в принципе безразлично, какой из этих функций характеризовать случайную величину U, поскольку всегда можно перейти
от одной функции к другой. Выбор f(u) или F(u) определяется удобством.
Если верхние пределы интегралов (2.4), (2.5) положить равными
+ ∞, получим вероятность того, что величина U иметь хоть какоелибо значение между – ∞ и + ∞. Это произойдет наверняка, поэтому
∞
F (∞ ) =
∫
f (u )du ≡ 1 .
(2.7)
−∞
Нормальные случайные величины. В теории ошибок чаще всего
встречаются случайные величины с нормальным законом распределения.
Этот закон задается дифференциальной функцией распределения
( u − a )2
−
1
2
(2.8)
f (u ) =
e 2σ .
σ 2π
Числа а и σ являются параметрами закона, показывающими, чем
одна нормально распределенная (нормальная) величина отличается
от другой. Смысл параметров рассмотрен немного ниже.
То, что нормальный закон распределения встречается столь часто, связано с тремя обстоятельствами. Во-первых, в тех задачах,
где ошибка получается как сумма большого числа слабых неконтролируемых влияний, распределение ошибки должно быть нормаль-
2.1. Случайные события и случайные величины
47
ным (по центральной предельной теореме теории вероятностей).
Во-вторых, нормальный закон распределения является в некотором
смысле самым простым и к тому же наиболее изученным; работать с
ним удобнее всего. В-третьих, есть много задач, в которых хотя закон
и отличается от нормального, но искажение от принятия его нормальным оказывается небольшим и им удается пренебречь. Поэтому
почти во всех случаях, когда закон распределения ошибок неизвестен и нет возможности его проверить, их распределение принимают
нормальным.
Тем не менее полезно знать, что в некоторых практически важных
случаях ошибки распределяются по другим законам. Так, довольно
часто измеряемая величина существенно неотрицательна: в опытах
могут получаться значения, очень близкие к нулю, но меньше нуля
они быть не могут. Назову такие величины величинами с естественным нулем; к ним, например, относятся масса, концентрация, абсолютная температура, электрическое сопротивление и множество
других. Здесь принятие нормального закона распределения ошибок
может существенно исказить картину, так как он предполагает возможность заметных отрицательных отклонений. Но если истинное
значение а близко к нулю, то отрицательное отклонение, превосходящее –а, невозможно.
В таких измерениях чаще встречается логарифмически нормальное
распределение: нормально распределена ошибка не самой величины,
а ее логарифма. Однако если значение а велико по сравнению с величиной σ, то вероятность «выхода» измеряемого значения в отрицательную область ничтожно мала и принятие нормального закона
не должно привести к большим искажениям. Практически можно
пользоваться таким правилом: если в измерениях наибольший результат превышает наименьший менее чем в 1,1 раза, приемлемо
нормальное распределение; если это превышение в 2 раза или более, то скорее мы имеем дело с логарифмически нормальным (логнормальным) распределением.
П р и м е ч а н и е . Сказанное в последних двух абзацах – результат моего исследования, и за его правильность я несу ответственность. Разумеется,
речь идет о величинах с естественным нулем.
В вероятностных задачах, не относящихся к теории ошибок, возможны и другие законы распределения, например те, которые описаны в разд. 4.3.
Числовые характеристики. Закон распределения дает исчерпывающую информацию о случайной величине: поскольку она случайна, ничего большего, чем распределение вероятностей, о ней заранее
сказать нельзя. Но для многих задач это – слишком сложная инфор-
Глава 2. Элементы теории эксперимента
48
мация. Как правило, исследователю достаточно знать, каково среднее значение случайной величины и насколько сильно ее значения
разбросаны относительно этого среднего. Такие сведения содержатся
в числовых характеристиках случайной величины.
Первая важнейшая числовая характеристика, которая определяет
среднее значение случайной величины, называется математическим
ожиданием или, просто, средним значением. Математическое ожидание M(U), как нетрудно показать, является обобщением понятия
«среднее арифметическое». Оно получается сложением всех возможных значений случайной величины (от – ∞ до +∞), причем каждое
значение умножается на соответствующую ему вероятность. Для
дискретной величины
∞
M (U ) = ∑ uP{U = u} .
(2.9)
−∞
Для непрерывной случайной величины сложение заменяется интегрированием:
M (U ) =
∞
∫ uf (u )du .
(2.10)
−∞
Вторая числовая характеристика – дисперсия – определяет средний разброс значений случайной величины относительно ее математического ожидания (точнее, среднее значение квадрата разброса).
Дисперсия D (U) вычисляется по следующим формулам:
для дискретной случайной величины
∞
D(U ) = ∑ (u − M (U )) 2 ;
(2.11)
−∞
для непрерывной случайной величины
D(U ) =
∞
∫ (u − M (U ))
−∞
2
f (u )du .
(2.12)
Пример 2.4. Масса гири аналитического разновеса – величина случайная: как бы хорошо ее ни изготовили, она на какую-то малую величину отклонится от номинального значения. Если гири изготовлены правильно, то
можно считать, что математическое ожидание массы равно номиналу. Таким
образом, математическое ожидание для однограммовой гири в 10 раз меньше математического ожидания для 10-граммовой гири.
Масса гири технического разновеса – тоже случайная величина, и ее математическое ожидание также равно номиналу. Но дисперсия в этом случае во
много раз больше: для гири с номиналом 1 г допустимы значительно большие
отклонения от этого значения, чем для гири 1 г аналитического разновеса.
2.1. Случайные события и случайные величины
49
Квадратный корень из дисперсии есть среднее квадратическое отклонение случайной величины. Если речь идет о случайной ошибке,
то это – средняя квадратическая ошибка.
Для нормально распределенной случайной величины (см. уравнение (2.7)) математическое ожидание равно а, дисперсия равна σ2.
Часто дисперсию любой случайной величины обозначают σ2. Для
среднего квадратического отклонения соответственно применяют
обозначение σ:
σ (U ) = D(U ) .
(2.13)
Основные свойства математического ожидания и дисперсии
определяются рядом теорем, которые здесь приводятся без доказательств.
Математическое ожидание неслучайной величины А (величины, которая всегда имеет одно и то же значение) равно А:
M(A) = A.
(2.14)
При сложении случайной и неслучайной величин неслучайное слагаемое можно вынести из-под знака математического ожидания:
M(A+U) = A+M(U ).
(2.15)
Это свойство позволяет рассматривать математическое ожидание
ряда измерений как сумму истинного значения А и математического ожидания ошибки Ψ, причем если отсутствует систематическая
ошибка, то M(Ψ) = 0: случайные ошибки с одинаковой вероятностью
могут происходить и в сторону завышения, и в сторону занижения
измеряемой величины, а в среднем равны нулю. Поэтому в теории
ошибок обычно отождествляют математическое ожидание и истинное значение.
Свойство, аналогичное предыдущему, существует и для произведения:
M(AU) = AM(U ).
(2.16)
И наконец, математическое ожидание суммы случайных величин
равно сумме их математических ожиданий:
M(U + V + …..+Z ) = M(U ) + M(V ) + ….+M(Z ).
(2.17)
Для дисперсии соответствующие свойства – несколько иные.
Дисперсия неслучайной величины равна нулю:
D(A) = 0.
(2.18)
Дисперсия суммы случайной и неслучайной величин равна дисперсии случайного слагаемого:
D(A+U ) = D(U ).
(2.19)
Глава 2. Элементы теории эксперимента
50
Это свойство также важно для теории ошибок: истинное значение
не влияет на дисперсию измеряемой величины, которая определяется исключительно дисперсией ошибки.
Неслучайный множитель можно выносить из-под знака дисперсии, но при этом он возводится в квадрат, так как дисперсия имеет
размерность квадрата величины:
D (AU) = A2D (U ).
(2.20)
Еще одно свойство дисперсии верно не для любых, а лишь для независимых случайных величин. О независимости скажем чуть позже,
а сейчас определим это свойство. Дисперсия суммы независимых случайных величин равна сумме их дисперсий:
D(U + V + … + Z ) = D (U ) + D (V ) + …+ D(Z ).
(2.21)
Из свойств (2.20) и (2.21) вытекает важное следствие, определяющее дисперсию среднего арифметического: если имеется ряд измерений x1, х2, ..., хn, причем ошибки каждого из них независимы друг
от друга и характеризуются одинаковой дисперсией σ2, то дисперсия
среднего арифметического из этих измерений D( x ) меньше, чем
дисперсия одного измерения, в п раз. Действительно, запишем выражение для дисперсии среднего арифметического:
⎛ x + x + ... + xn ⎞ .
D( x ) = D ⎜ 1 2
⎟⎠
⎝
n
Преобразуем это выражение с учетом формул (2.20) и (2.21): вынесем за знак дисперсии знаменатель, возведя его в квадрат, и запишем дисперсию суммы, стоящей в числителе, с учетом равенства
дисперсий всех слагаемых:
D( x ) =
nσ 2 σ 2
=
.
n2
n
(2.22)
Соответственно
σ ( x ) = D( x ) =
σ ( x) .
n
(2.23)
Формулы (2.22) – (2.23) показывают, как возрастает точность при
увеличении числа параллельных измерений. Но эти формулы верны
только в случае независимых ошибок измерения.
Зависимые и независимые случайные события и величины. Рассмотрим два интересующих нас события, для которых нам известны
вероятности. Пусть в некотором испытании одно из них произошло,
а относительно другого мы не знаем. Если при этом вероятность второго события для нас не изменилась, события независимы, если изменилась, – зависимы.
2.1. Случайные события и случайные величины
51
Пример 2.5. Предприятие получает один из требуемых видов сырья с обогатительной фабрики, расположенной за горным хребтом. Обычно с вероятностью 0,85 ежедневно прибывает машина с сырьем. Однако с вероятностью
0,02 может испортиться погода, и тогда перевал станет труднопроходимым.
Известно, что сегодня погода испортилась. Оценка вероятности того, что
машина придет, несомненно, уменьшилась – оба рассматриваемых события
зависимы.
Похожим образом определяется зависимость и для случайных
величин, для которых заранее известны законы распределения.
Предположим, что мы определили значение одной из них в каких-то
условиях. Если от этого закон распределения второй не изменился,
то величины независимы; если изменился, – зависимы.
Пример 2.6. На завод ежедневно поступает рудный концентрат. Содержание ценного компонента в нем колеблется по нормальному закону: а = 8,65%;
σ = 0,63%.
Рассмотрим пару анализов концентрата в двух вариантах: № 1 – один
анализ делаем сейчас, другой – через неделю; № 2 – первый анализ делаем
сейчас, второй – через полчаса. Пусть первый анализ дал результат 7,31%.
В варианте № 1 это никак не повлияет на нашу информацию о результате
второго анализа. Для него, пока мы его не сделали, по-прежнему остаются те
же значения а и σ. В варианте № 2 положение иное. Здесь материал на этот
анализ будет, видимо, отобран из той же партии, что и на первый анализ.
Поэтому следует ожидать, что если при первом анализе полученное значение заметно меньше, чем а, то же будет и при втором анализе. В варианте
№ 1 результаты измерений независимы, в варианте № 2 – зависимы.
Один из существеннейших источников зависимости ошибок измерений – временной дрейф, т.е. систематическое изменение во времени влияния неконтролируемых факторов. Накладываясь на изучаемые нами зависимости, дрейф искажает их.
Пример 2.7. Исследуется влияние температуры на ход химической реакции. Каждый опыт занимает 1 ч. Исследователь запланировал семь опытов – при 20, 25, 30, 35, 40, 45, 50 °С, причем делает их в указанном порядке
за 1 день. Но он не учел, что на ход реакции несколько влияет концентрация
СО2 в воздухе, которая на протяжении дня непрерывно растет вследствие
дыхания людей и работы горелок, а между тем влияние растущей концентрации налагается на влияние температуры, искажая его.
Дрейф может быть непрерывным (см. пример 2.7) и дискретным
(в примере 2.6, в котором смену одной партии сырья другой естественно рассматривать как дрейф).
В любом хорошо организованном эксперименте необходимо предусмотреть меры для обеспечения независимости ошибок измерений. Одной
из важнейших мер такого рода является рандомизация (от англ. random – наугад, случайно, беспорядочно). Рандомизация заключается
52
Глава 2. Элементы теории эксперимента
в том, что планируемые опыты выписываются в логическом порядке, а затем их номера перемешиваются случайным образом и именно в таком случайном порядке опыты производят. При этом важно,
чтобы при наличии параллельных опытов каждому из них присваивали свой номер и номера всех опытов (и параллельных, и различных) рандомизовали совместно. В примере 2.7 рандомизованный
(по таблице случайных чисел) порядок изменения температуры от
опыта к опыту может иметь, например, такой вид: 25; 50; 30; 40; 35;
20; 45 °С.
Рандомизация приводит к тому, что влияние дрейфа теряет свойства систематической ошибки и становится ошибкой случайной.
После этого ошибку можно уменьшить хорошо известными методами – прежде всего, увеличивая число измерений, на основе свойства, описываемого уравнениями (2.22) – (2.23).
Корреляция является важнейшим типом взаимной зависимости
случайных величин. Это такая связь между двумя величинами X и Y,
при которой с ростом одной из них в среднем растет (или убывает)
другая. Теснота корреляционной связи определяется коэффициентом корреляции ρ, который может принимать значения от –1 до +1.
При ρ = ±1 одна из величин X или Y является линейной функцией
второй. При ρ = 0 корреляционная связь отсутствует. В таких случаях могут существовать иные формы зависимости между X и Y, отличные от корреляции; но если обе величины имеют нормальный
закон распределения, то отсутствие корреляции означает их независимость.
На рис. 2.1 приведены корреляционные графики для двух величин: X и Y. Каждая точка показывает значения х и у для некоторого
объекта. Рисунок 2.1,а соответствует слабой отрицательной корреляции между X и Y (ρ ≈ – 0,3); рис. 2.1,б – сильной положительной
корреляции (ρ ≈ +0,99); рис. 4.1, в – отсутствию корреляции (ρ ≈ 0).
Если ρ = + 1 или ρ = – 1, то величины х и у связаны точной линейной
зависимостью
y = a + bx.
(2.24)
Формула для расчета коэффициента корреляции дана в разд. 2.2.
В ряде задач анализ корреляции позволяет установить существенные связи, ценные для практики. Так, установив высокую положительную корреляцию между содержаниями в рудах цинка и галлия,
мы определяем перспективный источник редкого элемента. Но во
многих случаях корреляция связана с влиянием несущественных
факторов и ее наличие может даже помешать анализу сущности изучаемого явления.
2.2. Статистические оценки и проверка гипотез
53
Рис. 2.1. Корреляционные графики для величин X и У
Пример 2.8. На рис. 2.2 представлен корреляционный график для величин
X (содержание примесей в реактиве) и Y (количество бумаги, пошедшей на
обертку банки реактива). Очевидно, что, по существу, эти величины не связаны. Однако расчет дал значение коэффициента корреляции, близкое к +1.
График проясняет, в чем здесь дело. Точки группируются в два «облака»,
в пределах каждого из которых корреляции практически нет, но оба «облака»
в совокупности соответствуют возрастанию Y с ростом X. Это объясняется
тем, что банки с реактивом поступили с двух разных заводов. На одном из
них реактив чище, а бумагу тратят экономнее; на другом — качество реактива ниже, но зато не жалеют обертку. Существенной связи здесь нет. Наивной
была бы попытка очищать реактив путем уменьшения расхода бумаги.
у
30
25
20
0
0,1
0,2
х
Рис. 2.2. Корреляционный график:
x – содержание примесей в реактиве;
y – расход бумаги на обертку банки
2.2. Статистические оценки и проверка гипотез
Теория вероятностей не занимается вопросом о том, как по опытным данным находить вероятности, законы распределения или численные характеристики случайных величин. Это – предмет математической статистики. Рассмотрим некоторые ее вопросы.
54
Глава 2. Элементы теории эксперимента
Генеральная совокупность и выборка. Эти понятия относятся
к числу важнейших в статистике. В науке измерения, как правило,
производятся таким образом, что из всей интересующей нас совокупности объектов (генеральной совокупности) измеряется только лишь
некоторое сравнительно небольшое их число (выборка). Связано это
либо с тем, что генеральная совокупность слишком велика – обычно
теоретически она бесконечна, и измерить все объекты невозможно,
либо с тем, что процесс измерения разрушает объекты и проведение
измерений на всей генеральной совокупности бессмысленно: она
окажется полностью уничтоженной, так что результаты измерений
не к чему будет прилагать.
Исследование выборки проводится для того, чтобы его результаты
применить к генеральной совокупности. В данном смысле выборка
есть модель генеральной совокупности, а проводимые измерения
позволяют в дальнейшем осуществить традукцию. В статистике это
формулируется так: выборка должна быть представительной (репрезентативной), т. е. давать возможность правильно судить о свойствах
генеральной совокупности. Поэтому необходимо рассмотреть вопрос о том, насколько данные, получаемые по выборке, соответствуют генеральной совокупности.
Рассчитываемые по результатам выборочных измерений числовые характеристики не совпадают в точности с соответствующими
характеристиками генеральной совокупности. Кроме того, они –
величины случайные, так как случаен сам отбор измеряемых объектов. Две выборки из одной и той же генеральной совокупности дадут несколько различающиеся значения числовых характеристик.
Выборочные характеристики являются не точными значениями, а
оценками характеристик генеральной совокупности; если источник
случайности – ошибки измерений, то значения выборочных характеристик считают оценками истинных значений.
Чтобы традукция оказалась правильной и по выборочным измерениям можно было верно судить о свойствах генеральной совокупности, рассчитываемые оценки должны обладать рядом свойств. Не давая
строгих определений, расскажу о практическом смысле этих свойств.
Первое свойство – состоятельность. Состоятельной является
оценка, которая при увеличении объема выборки сходится к генеральному значению : чем больше измерений, тем точнее наша оценка
характеризует истинное значение. При очень большом их числе оно
может быть оценено со сколь угодно высокой точностью.
Второе свойство – несмещенность. Несмещенная оценка при небольшом числе измерений может, разумеется, заметно отклоняться
от оцениваемой величины, но в среднем она ей равна. В отличие от
2.2. Статистические оценки и проверка гипотез
55
нее смещенная оценка при малом числе измерений систематически
отклоняется от оцениваемой величины (завышена или занижена),
хотя при увеличении объема выборки может и стремиться к истинному значению, т. е. быть состоятельной.
Несмещенность оценок очень важна в химии и химической технологии, где чаще всего эксперимент дорог и желательно работать
с малыми выборками.
Третье свойство оценок – эффективность : эффективная оценка
точнее, чем любая другая оценка той же характеристики, полученная
по той же выборке.
На практике иногда приходится пользоваться оценками, не обладающими всеми этими свойствами (разумеется, если несостоятельность, смещенность и неэффективность достаточно малы), но этого
желательно по возможности избегать. Подробнее и строже требования к оценкам изложены в [6, 8].
Оценкой математического ожидания М(Х) случайной величины X
является среднее арифметическое
x + x + ... + xm
x= 1 2
.
(2.25)
m
Нетрудно заметить, что формулы (2.25) и (2.9) аналогичны. В подавляющем большинстве случаев эта оценка – состоятельная, несмещенная и эффективная.
Если теперь построить оценку дисперсии аналогично формуле
(2.11), то она окажется, хотя и состоятельной, но смещенной: при
малых выборках она занижена. Несмещенная оценка дисперсии,
обычно обозначаемая s2 и называемая выборочной дисперсией, отличается знаменателем:
s2 =
( x1 − x ) 2 + ( x2 − x ) 2 + ... + ( xm − x ) 2
.
m −1
(2.26)
В этой формуле величину m – 1 называют числом степеней свободы f :
f = m – 1.
(2.27)
В статистике число степеней свободы определяют как общее число
измерений за вычетом числа оценок, уже рассчитанных по этим измерениям и применяемых при расчете рассматриваемой характеристики.
В данном случае уже рассчитана и используется в формуле (2.2) величина x , поэтому f на единицу меньше, чем m.
Выборочное среднее квадратическое отклонение s рассчитывается так же, как σ:
s = s2 .
(2.28)
Глава 2. Элементы теории эксперимента
56
Выборочный коэффициент корреляции r определяется по формуле
m
∑ (( x − x )( y − y ))
i
r=
i
.
i =1
m
m
∑ (x − x ) × ∑ ( y − y)
2
i
(2.29)
2
i
i =1
i =1
Здесь рассматриваются m объектов, причем каждый i-й объект характеризуется значениями xi и уi; x и y – средние значения х и у по
всем объектам. Число степеней при этом равно m – 2
Пример 2.9. Рассчитаем оценки х и у, характеризующие содержание в семи образцах подземных рассолов [19] соответственно КСl, % и Вr, кг/м3.
В таблице помимо значений х и у приведены разности и их произведения,
нужные для расчетов по формулам (2.25), (2.26), (2.29), а в нижней строке –
суммарные значения по столбцам.
x
y
( x − x ) ⋅102
( y − y ) ⋅102
( x − x ) 2 ⋅104
( y − y ) 2 ⋅104
( x − x )( y − y ) ⋅104
0, 04
0, 03
0, 09
0, 07
0,13
0, 23
0, 29
0, 25
0,37
0, 79
−2, 4
−3, 4
+2, 6
+0, 6
+6, 6
−14, 4
−8, 4
−12, 4
−0, 4
41, 6
5, 76
11,56
6, 76
0,36
43,56
207,36
70,56
153, 76
0,16
1730,56
34,56
28,56
−32, 24
−0, 24
274,56
0, 005 0, 09
0, 08 0,55
−5,9
+1, 6
−28, 4
17, 6
34.81
2,56
806,56
309, 76
167,56
28,16
105,37
3278, 72
500,92
0, 445 2, 62
Расчет дает:
x=
0, 445
= 0, 064,
7
s 2 ( y) =
y=
2, 62
= 0,374,
7
0,327872
= 0, 05465,
7 −1
r=
s 2 ( x) =
0, 010537
= 0, 001756,
7 −1
0, 050092
= 0,852 .
0, 010537 ⋅ 0,327872
Близость величины r к единице означает, что бром в рассолах сопутствует
хлориду калия.
Интервальные оценки. Оценки, задаваемые формулами (2.25),
(2.26), (2.27), являются числами, которые можно представить точками на числовой оси. Их называют точечными оценками. Но такие
значения не всегда нас устраивают. Дело в том, что, как уже сказано,
каждая из этих оценок – случайная величина, не равная истинному
2.2. Статистические оценки и проверка гипотез
57
(генеральному) значению характеристики. И часто возникает следующая постановка вопроса: мы хотим задать такой интервал значений интересующей нас характеристики, чтобы истинное значение
оказалось в этом интервале. В таком случае говорят об интервальной оценке, а задаваемый интервал называют доверительным интервалом. При этом важнейшим вопросом будет такой: какова должна
быть ширина доверительного интервала? Ведь если принять слишком узкий интервал, мы рискуем, что истинное значение не попадет
в него. А если он слишком широк, значит, истинное значение определено очень неточно. Сложность состоит в том, что в подавляющем
большинстве случаев невозможно установить такой доверительный
интервал, в который истинное значение попадет наверняка. Как бы
он ни был широк, существует вероятность (тем меньшая, чем он
шире), что истинное значение все же окажется за его пределами.
Поэтому мы хотим установить такую ширину доверительного интервала, чтобы вероятность попадания истинного значения в него
(доверительная вероятность Рдов) была достаточно велика, а вероятность того, что мы ошибемся и истинное значение окажется за
его пределами (вероятность ошибочного решения α = 1 – Рдов), была мала. И вот здесь – главная сложность, суть которой находится
вне математики: какую доверительную вероятность можно считать
достаточно большой, какую вероятность ошибки можно считать
малой?
Пример 2.10. Рассмотрим три ситуации.
Первая ситуация. Я иду в театр и твердо рассчитываю на то, что сегодня
буду наслаждаться спектаклем, хотя знаю, что существует вероятность (порядка 0,01), что по какой-нибудь причине спектакль отменят и придется
менять свои планы. Но вероятность неудачи настолько мала, что я ею пренебрегаю и не строю запасных планов.
Вторая ситуация. Мне нужно полететь на самолете в дальний город.
Авиакомпания предложила билет на экспериментальный самолет. Билет
очень дешевый, но компания предупреждает: пока риск аварии составляет 0,01. При такой огромной вероятности неудачи я лучше куплю дорогой
билет, но рисковать не стану. Вероятность неудачи и здесь никогда не равна
нулю, но авиация может нормально работать только, если эта вероятность
не больше 10–7.
Третья ситуация. Есть такое понятие – венчурные проекты. Речь идет вот
о чем. Разрабатывается достаточно большое количество технических решений (например, изобретений), характеризующихся следующими особенностями. Риск того, что любое из решений окажется неудачным, велик. Но
если хотя бы одно из них реализуется, ожидаемая выгода столь велика, что
оправдает все затраты на неудачные попытки. В таком случае для каждого из
венчурных проектов может оказаться, что вероятность неудачи 0,9 не слишком велика.
58
Глава 2. Элементы теории эксперимента
Случаи, описанные в примере, можно обобщить приблизительными значениями α, которые можно считать малыми в зависимости
от ситуации. Исключая крайние случаи, для которых к тому же оценки вероятностей всегда крайне ненадежны, можно принимать такие
значения α как достаточно малые: в неответственных технических
задачах α = 0,1…0,2; в стандартных случаях α = 0,05; в задачах повышенной ответственности α = 0,002…0,01.
Теперь перейдем к вопросу о том, как рассчитать интервальную
оценку. Я рассмотрю лишь один класс таких оценок – интервальные
оценки для математического ожидания (среднего, истинного значения), поскольку именно эти оценки наиболее часты на практике.
При этом будем считать, что закон распределения случайной величины – нормальный.
Для начала проанализируем случай, когда нам известно значение σ для данного закона распределения. В таком случае, исходя из
свойств нормального закона, можно установить следующее: вероятность того, что значение случайной величины отклонится от математического ожидания а на величину большую, чем σ, равна 0,3174 (эта
вероятность относится к любому знаку отклонения – безразлично,
окажется ли значение больше или меньше а); вероятность отклонения более, чем на 2σ, равна 0,0448; вероятность отклонения более,
чем на 3σ, составляет 0,0028.
Таким образом, если удовольствоваться вероятностью ошибки
α ≈ 0,3, то можно принять доверительный интервал δ = σ; если хотим
получить оценку с вероятностью α ≈ 0,05, то интервал δ должен быть
равен приблизительно 2σ. Вероятность отклонения, превышающего
3σ, настолько мала, что такое отклонение считают практически невозможным – это так называемое правило «трех сигм». Уточню, что
здесь речь идет о двустороннем доверительном интервале: он откладывается от полученной точечной оценки как в сторону увеличения, так
и уменьшения. А слово «ошибка» в данном случае означает, что истинное значение среднего оказалось вне доверительного интервала.
Но практически использовать сказанное выше удается редко.
Дело в том, что приведенные вероятности относятся к отклонениям, измеренным в единицах σ. Для их оценки необходимо знать генеральное значение дисперсии σ2, тогда как почти всегда известна
лишь оценка s2 и пользоваться приведенными значениями вероятностей нельзя.
На протяжении XIX века считалось, что достаточно надежно оценить доверительный интервал можно только в случае, если оценка
дисперсии получена по большому количеству измерений (десяткам или даже сотням) и можно принять приближенно, что s2 = σ2.
2.2. Статистические оценки и проверка гипотез
59
Лишь в начале ХХ века В.С. Госсет опубликовал под псевдонимом
Стьюдент (студент) работу, позволившую получать оценки доверительного интервала для среднего по данным малых выборок.
По Стьюденту, доверительный интервал рассчитывается по формуле
δ = ts.
(2.30)
Здесь t – коэффициент Стьюдента, причем t = t(α, f): его значение
определяется принятой допустимой вероятностью ошибки и числом
степеней свободы, по которому оценена дисперсия. Таблицы, в которых приведены значения t, широко распространены. Краткая таблица дана в конце книги.
Пример 2.11. В результате проведения ряда анализов рудного концентрата на предмет содержания ценного компонента получены следующие
данные, %: 6,83; 6,94; 6,77; 6,59; 6,82. Определить доверительный интервал для среднего значения с доверительной вероятностью 0,95 (вероятностью ошибки 0,05).
Рассчитаем среднее значение х и дисперсию:
x=
s2 =
6,83 + 6,94 + 6, 77 + 6,59 + 6,82
= 6, 79% ;
5
(6,83 − 6, 79) 2 + (6,94 − 6, 79) 2 + ... + (6,82 − 6, 79) 2
= 1, 635 ⋅10−2 .
4
Число 4 = 5 – 1 в знаменателе – число степеней свободы.
Рассчитаем также оценки дисперсии среднего и среднего квадратического отклонений: s 2 ( x ) =
1, 635 ⋅10−2
= 3, 27 ⋅10−3 ;
5
s ( x ) = 0, 0572 .
Теперь вычислим доверительный интервал для среднего. Имеем f = 4; приняли α = 0,05; по таблице t = 2,78. По формуле находим (2.6) δ = 2,78·0,0572=
= 0,159.
С доверительной вероятностью 0,95 можно утверждать, что среднее значение концентрации лежит в пределах 6,79 ± 0,16%.
Проверка статистических гипотез. Очень часто результаты эксперимента удается интерпретировать в терминах проверки гипотез.
Обычная формулировка задачи здесь такова. Сопоставляются две
выборки (или одна выборка сопоставляется с генеральной совокупностью). Выдвигаются две гипотезы:
1. Нуль-гипотеза Н0: между обеими выборками нет существенной
разницы, обе они принадлежат одной генеральной совокупности, а
имеющиеся различия обусловлены случайным характером выборок,
например влиянием случайных ошибок. В этом случае любые оценки, рассчитанные по этим двум выборкам, будут оценками одних и
тех же генеральных (истинных) значений. Тогда в большинстве таких случаев имеет смысл объединить обе выборки в одну, увеличив
тем самым число степеней свободы.
60
Глава 2. Элементы теории эксперимента
Если сравниваются между собой выборка и генеральная совокупность, нуль-гипотеза выглядит так: данная выборка принадлежит
к интересующей нас генеральной совокупности, отличия ее характеристик от генеральных обусловлены случайными ошибками.
2. Противоположная, или альтернативная, гипотеза H1: различия объясняются не случайностью, а существом дела. Выборки относятся к разным генеральным совокупностям. Либо же рассматриваемая выборка относится не к данной генеральной совокупности,
а к какой-то иной. В последнем случае выражение «какая-то иная»
может означать либо некоторую определенную совокупность, либо
соответствовать формулировке «мы не знаем, какая, но знаем, что не
та, которая задана».
Пример 2.12. Рассмотрим несколько задач в терминах проверки гипотез.
1. Сравниваются показания двух приборов, измеряющих одну и ту же
величину. Сопоставляемые выборки – совокупности показаний первого и
второго приборов. Нуль-гипотеза: точность обоих приборов одинакова; альтернативная гипотеза: один из приборов менее точен.
2. Оценивается качество партии продукции. Выборка – результаты анализов отобранных проб – сравнивается с генеральной совокупностью, т.е.
всеми мыслимыми результатами, которые можно получить на продукции
заданного качества. Нуль-гипотеза: данная партия удовлетворяет требованиям по качеству; альтернативная: партия бракованная.
3. Сопоставляются стандартный и вновь разрабатываемый катализаторы.
Выборки – результаты опытов на том и другом катализаторах. Нуль-гипотеза:
новый катализатор не лучше (но и не хуже) стандартного; альтернативная:
новый катализатор отличается по активности. Другая, вероятно более интересная альтернативная гипотеза: новый катализатор активнее стандартного,
т. е. не просто отличается, а отличается в лучшую сторону.
4. Выдвинуты две гипотезы о механизме химической реакции. Согласно
первой, скорость реакции пропорциональна концентрации реагента в степени n = 1, согласно второй n = 0,7. В этом случае нуль-гипотеза: n = 1; альтернативная: n = 0,7.
При проверке гипотез мы судим о сравниваемых выборках на
основе характеристик, подверженных случайным колебаниям от
выборки к выборке. Поэтому здесь возможны четыре ситуации:
1) верна нуль-гипотеза, и мы ее принимаем; 2) верна альтернативная
гипотеза, и мы ее принимаем. В этих двух случаях наше решение правильно; в двух других мы принимаем неверное решение (совершаем
ошибку). Если верна нуль-гипотеза, а мы ее отвергнем и примем альтернативную, то это ошибка 1-го рода. Если нуль-гипотеза неверна, а
мы примем ее, то это ошибка 2-го рода.
Пример 2.13. В задачах примера 2.12 могут быть допущены следующие
варианты ошибок.
2.2. Статистические оценки и проверка гипотез
61
1. При сравнении показаний двух приборов ошибка 1-го рода будет совершена, если мы забракуем один из приборов как неточный, тогда как на
деле оба одинаково точны; ошибка 2-го рода – если один из приборов недостаточно точен, а мы сочтем его пригодным.
2. При оценке качества продукции ошибка 1-го рода будет допущена, если забраковать годную партию продукции; ошибка 2-го рода – если счесть
годной бракованную продукцию.
3. При исследовании нового катализатора ошибкой 1-го рода будет не заметить, что синтезированный катализатор активнее имеющегося; ошибкой
2-го рода – начать внедрять новый катализатор, который, по существу, ничем не лучше старого.
4. При исследовании механизма реакции ошибка 1-го рода – принятие
второго механизма, хотя на самом деле верен первый; ошибка 2-го рода –
принятие первого механизма в случае, когда верен второй.
Разумеется, мы всегда хотим принять верное решение. Однако
в подавляющем большинстве случаев невозможно полностью исключить вероятность ошибки. Теоретически решение может быть
совершенно безошибочным лишь тогда, когда окажется изученной
вся генеральная совокупность, что может потребовать бесконечного
числа измерений. Поэтому наша задача – не исключить полностью
ошибку, а сделать ее вероятность как можно меньшей.
Наиболее действенный, но и самый дорогой способ уменьшения
ошибок – увеличение объема выборки, числа измерений. Чем больше
измерений, тем надежнее наши выводы. Если же количество измерений ограничено определенным числом, то имеется иной способ влияния на вероятность ошибок. Этот способ состоит в задании уровня
строгости испытаний, по которым принимается решение о принятии либо Н0, либо Н1. При этом характерно следующее. Чем строже
наше испытание, тем больше вероятность ошибки 1-го рода и тем
меньше – ошибки 2-го рода. Очень строгое испытание с большой вероятностью забракует даже годный объект, если по случайным причинам выборочные данные отклонятся от генерального значения.
Напротив, при малой строгости мы редко бракуем годные объекты и
относительно часто считаем годными плохие.
Практически обычно строгость испытания устанавливают исходя из вероятности ошибки 1-го рода. Эту вероятность называют
уровнем значимости α. Так, α = 0,1 означает, что в данных условиях
в среднем 10% всех годных объектов будет забраковано. Разумеется,
было бы желательно одновременно оценивать и вероятность ошибки 2-го рода β. Но, к сожалению, на практике почти не встречаются
задачи, в которых оценка β была бы возможна. Приходится ориентироваться на строгость испытания, учитывая, что чем она выше,
тем меньше β.
Глава 2. Элементы теории эксперимента
62
Чаще всего применяют уровень значимости 0,05. Если для нас
особенно нежелательно допускать ошибки 2-го рода, можно применить более строгое испытание – на уровне значимости 0,1 или даже 0,2. В любом случае, если нуль-гипотеза может быть принята на
высоком уровне значимости, доверие к результату такой проверки –
выше, чем при невысоком уровене значимости.
Обычная процедура проверки гипотез заключается в следующем. По выборочным данным рассчитывается критерий проверки.
Полученное значение критерия сравнивают с критическим значением, приведенным в таблицах. Критическое значение каждого
конкретного критерия определяется уровнем значимости и числом
степеней свободы, по которому были рассчитаны величины, входящие в критерий. Таблицы критических значений имеются в многочисленных книгах по статистике и теории эксперимента, например
[7, 8], краткие таблицы даны в конце этой книги. Таблицы обычно
содержатся и в составе программ для компьютерной обработки данных.
Рассмотрим четыре часто встречающихся критерия проверки гипотез. Эти критерии строго применимы к измерениям, ошибки которых имеют нормальный закон распределения. Как уже сказано,
обычно те же критерии применяют и в случаях, когда закон распределения неизвестен, но можно допустить, что он – нормальный.
Критерий исключения грубой ошибки. Часто оказывается так, что
в ряду измерений одной и той же величины один результат резко
отличается от остальных: он заметно больше или заметно меньше.
Можно предположить, что этот результат появился вследствие грубой ошибки, существенно превосходящей по абсолютной величине
обычные случайные ошибки. Тогда данное измерение относится
к иной генеральной совокупности – не к той, к которой относятся
остальные. Но возможно, что грубой ошибки нет. Ведь нормально
распределенная случайная величина может, хотя и редко, значительно отклониться от математического ожидания. Поэтому нульгипотеза имеет вид: подозрительный результат относится к той же
генеральной совокупности, что и остальные. Альтернативная гипотеза: этот результат порожден грубой ошибкой и должен быть исключен из дальнейшей обработки данных.
Критерий проверки r имеет вид
r=
xпод − x
n −1
s
n
,
(2.31)
2.2. Статистические оценки и проверка гипотез
63
где xпод — «подозрительный» результат (наибольший или наименьший); x – среднее, полученное по формуле (2.25); s рассчитано по
формулам (2.26) и (2.27). При этом в расчет x и s включается и «подозрительный» результат: пока еще он не забракован. Для этого критерия
f = n–2. Пример проверки по критерию r дан ниже (см. пример 2.15).
Сравнение двух оценок дисперсии — часто встречающаяся задача, зачастую равносильная сопоставлению точности двух рядов измерений. Обычно критерием проверки служит отношение большей
оценки дисперсии к меньшей, это критерий Фишера F :
F=
s12
.
s22
(2.32)
При поиске критического значения в таблицах следует учитывать,
что оно зависит от трех аргументов: f1 – числа степеней свободы при
оценивании числителя s12; соответствующего числа f2 для знаменателя и α – уровня значимости. Сравнение по критерию F рассмотрено
в примере 2.15.
Сравнение ряда оценок дисперсии. Если число сравниваемых оценок больше двух, то можно взять наибольшую и наименьшую из них
и сравнить по критерию F. Если для этих двух оценок может быть
принята нуль-гипотеза, то все остальные подавно можно считать
относящимися к той же генеральной совокупности. Но оказывается, что для более двух дисперсий проверка по F-критерию слишком
строга; фактический уровень значимости превышает тот, который
приведен в таблицах.
Для сравнения ряда дисперсий можно использовать несколько
критериев, один из которых – критерий Кокрена G. Он очень прост,
однако пользоваться им можно только в случае, если все оценки дисперсии si2 рассчитаны по одному и тому же числу степеней свободы
(число измерений во всех сериях одинаково). Критерий равен отношению наибольшей из дисперсий к сумме их всех:
G=
2
sмакс
.
s12 + s22 + ... + sN2
(2.33)
Здесь s2макс – наибольшая выборочная дисперсия; N – общее число
сравниваемых оценок дисперсии. Критическое значение G зависит
от числа степеней свободы f при оценке каждой из si2, от числа сравниваемых оценок N и от α.
Пример 2.14. Проверялась точность поддержания температуры в аппарате
при различных настройках регулятора. При каждой из четырех настроек проделано по три измерения температуры. В приведенной ниже таблице каждый столбец
данных соответствует одной настройке; температура приведена в кельвинах.
Глава 2. Элементы теории эксперимента
64
Т1
Т2
Т3
Т4
392
388
391
477
471
475
553
560
549
640
635
631
Расчет средних и дисперсий по формулам (2.25) и (2.26) дает для четырех столбцов следующие значения:
T1 = 390,33; s12 = 4,33; T2 = 474,33; s22 = 9,33;
T3 = 554; s32 = 31; T4 = 635,33; s42 = 20,33.
Как представляется, имеется тенденция возрастания s2 c ростом Т. Но можно ли считать, что эта тенденция подтверждается статистикой? Рассчитываем
критерий Кокрена:
G=
31
= 0, 477 .
4,33 + 9,33 + 31 + 20,33
По таблице Gкp = 0,768 при N = 4; f = 2; α = 0,05. Поскольку G < Gкp, у нас
нет оснований отвергать нуль-гипотезу и считать, что с ростом температуры
увеличиваются ее колебания.
Следует обратить внимание на следующее: мы не доказали, что
колебания не растут, а установили лишь, что наши данные не доказывают факт такого роста. Возможно, дальнейшие исследования
приведут к иному выводу.
Если проверка по критерию (2.32) или (2.33) показывает, что для
оценок дисперсий можно принять нуль-гипотезу, оценки называют
однородными; эту процедуру часто именуют проверкой однородности
дисперсий. Однородные оценки можно усреднить – найти единую
оценку дисперсии по всей совокупности измерений. Для этого пользуются формулой
s2 =
s12 f1 + s22 f 2 + ... + sN2 f N
.
f1 + f 2 + ... + f N
(2.34)
При этом число степеней свободы для оценки s2 оказывается
равным сумме f1 + f2 +…+ fN , т.е. степени свободы складываются.
Поэтому такое усреднение оценок приводит к увеличению числа f,
что всегда желательно, поскольку наши выводы тем надежнее, чем
больше степеней свободы лежит в их основе. Так, в примере 2.14 все
fi = 2, поэтому формула (2.34) превратится в обычную формулу среднего арифметического:
s2 =
4,33 + 9,33 + 31 + 20,33
= 16, 25 .
4
Число степеней свободы при этом равно 4 × 2 = 8.
(2.35)
2.2. Статистические оценки и проверка гипотез
65
Сравнение средних. Задача сравнения средних значений также одна из самых распространенных. Нуль-гипотеза в этом случае такова:
средние значения в двух сериях измерений являются оценками одного и того же генерального значения (математического ожидания, истинного значения).
Необходимо заметить, что если серии измерений, в которых получены средние, сделаны с разной точностью (с разными дисперсиями), то процедура сравнения средних резко усложняется. В этих случаях можно рекомендовать специальные методы, описанные в книге
[20]. Здесь мы будем предполагать, что дисперсии однородны и найдена общая оценка по уравнению (2.34).
Тогда проверка проводится по критерию Стьюдента t :
t=
x1 − x2
2
s (1/ n1 + 1/ n2 )
,
(2.36)
где n1 и n2 — числа измерений в первой и второй сериях; s2 находится
с помощью уравнения (2.34). Критическое значение t зависит от f и α.
Пример 2.15. Сравнивается два метода анализа. Из одного и того же раствора взято 11 проб. Из них пять проанализированы известным надежным
методом, а шесть – новым, сопоставляемым с известным. Результаты анализа приведены в таблице.
Метод
Известный
Новый
25,9
25,7
26,3
26,9
Результаты анализа, г/л
26,0
25,8
26,5
26,4
26,2
26,5
–
26,7
Вспомним, что эти данные должны быть получены с применением рандомизации: пробы отправляли на анализ тем или другим методом в случайном порядке. По этим данным получаются средние: x1 = 26,1; x2 = 26, 4 ;
s12 = 0, 085; s22 = 0,176 . Значения как x , так и s2, естественно, различны. Необходимо выяснить, можем ли мы считать эти различия связанными со случайным характером ошибок или же они объясняются различиями в точности обоих методов. Действительно, большее значение х2 по сравнению с x1
может означать систематическое завышение результатов по новому методу,
большее значение s22 – повышенный разброс данных (большую случайную
ошибку). Кроме того, результат первого измерения новым методом больше
всех остальных отличается от среднего – можно заподозрить грубую ошибку.
Гипотезы необходимо проверять в следующем порядке. Вначале – гипотезу
о грубой ошибке: если окажется, что ошибка – грубая, этот результат придется исключить из дальнейшей обработки. Затем – гипотезу об однородности дисперсий: иначе сильно усложнилось бы сравнение средних. И в заключение – гипотезу о средних.
Чтобы проверить, имеется ли грубая ошибка, рассчитаем r по формуле (2.31):
Глава 2. Элементы теории эксперимента
66
r=
25, 7 − 26, 4
0,176
5
6
=1,828.
Критическое значение rкр = 2,07 при f = 4; α = 0,05. Поскольку r < rкр, у нас
нет оснований утверждать, что данная точка получена с грубой ошибкой.
Даже на уровне значимости α = 0,2 критическое значение равно 1,89, что
больше полученного.
Проверяем гипотезу об однородности дисперсий:
F = 0,176/0,085 = 2,071; Fкp = 6,26 при f1 = 5, f2 = 4, α = 0,05; F < Fкр.
Даже проверка по весьма высокому уровню значимости α = 0,25 не дает
оснований отвергнуть нуль-гипотезу: Fкp= 2,07 при f1 = 5, f2 = 4, α = 0,25.
Таким образом, наш опытный материал не дает оснований считать разброс,
получаемый при использовании нового метода, существенно большим, чем
имевшийся ранее.
Найдем оценку дисперсии из обеих серий опытов по формуле (2.34):
s2 =
4 ⋅ 0, 085 + 5 ⋅ 0,176
= 0,136 ,
4+5
причем число степеней свободы равно уже 9. Наконец, сопоставим средние.
Рассчитаем t по формуле (2.36):
t=
26,1 − 26,4
0,136 (1/ 5 + 1/ 6)
=1,344.
Критическое значение tкр= 2,26 при f = 9, α = 0,05, что много больше полученного. Расхождение средних незначимо даже по уровню значимости 0,2
(tкр= 1,38). Таким образом, у нас нет оснований считать среднее, полученное
новым методом, значимо отличающимся от того, что дал известный метод.
Обратите внимание, что, как и в примере 2.14, нельзя считать доказанным отсутствие расхождений между данными, полученными разными методами. Можно лишь утверждать, что эти данные не противоречат гипотезе
о равной точности обоих методов. Если суждение о точности нового метода достаточно важно, то, очевидно, следует продолжить сравнение, набрав
больший объем данных, т.е. больше степеней свободы.
2.3. Метод наименьших квадратов
Метод наименьших квадратов играет важнейшую роль при решении обратных задач моделирования (см. разд. 1.3). Он отвечает следующей постановке задачи. Вид уравнений математического
описания задается. Он может вытекать из структуры объекта либо
соответствовать, например, многочлену 1, 2 или 3-й степени при
эмпирическом подходе. Важно, что обработка опытных данных про-
2.3. Метод наименьших квадратов
67
водится для определенного вида уравнений. Неизвестны лишь коэффициенты этих уравнений – параметры модели, которые и надо
определить. В общем виде уравнение можно записать так:
y = F (x1, x2, …, xp, b0, b1, b2, …, bq),
(2.37)
где (х1, х2, …, xp) – вектор контролируемых факторов; (b0, b1, …, bq) –
вектор параметров (коэффициентов). Например, в уравнении (1.8)
вектор факторов – (x1, x2, х3); вектор параметров – (b0, b1, b2, b3, b11,
b22, b33, b12, b13, b23). Задача состоит в том, чтобы по опытным данным
наилучшим образом оценить значения параметров b.
Обратим внимание на то, что в каждом эксперименте допускается
случайная ошибка, поэтому получаемые значения параметров будут оценками истинных значений. Проведенный эксперимент можно рассматривать как выборку, при этом генеральная совокупность
мыслится как бесконечное число возможных опытов на данном объекте. Поэтому к такой задаче целесообразно применить аппарат математической статистики.
Рассмотрим метод наименьших квадратов в наиболее обычном и
простом варианте: примем, что в опытах значения факторов х задавались с пренебрежимо малой ошибкой, т.е. практически точно. Но
значения отклика у получались со случайными ошибками. Кроме
того, будем считать, что все ошибки имеют одинаковый закон распределения и различаются только случайным образом (все измерения сделаны с одинаковой точностью).
В этом случае метод наименьших квадратов сводится к следующему: наилучшими будут те значения параметров b, при которых сумма
квадратов отклонений расчетных величин у от опытных окажется
наименьшей.
Пусть функция задана в виде (2.37). Запишем условия всех опытов
в виде таблицы – матрицы плана эксперимента:
⎛ x11
⎜x
12
X=⎜
⎜ ...
⎜x
⎝ 1n
x21 ... x p1 ⎞
x22 ... x p 2 ⎟
⎟.
... ... ... ⎟
x2 n ... x pn ⎟⎠
(2.38)
Здесь каждая строка – условия одного опыта; каждый столбец – значения одного фактора в разных опытах; xij – значение i-гo фактора
в j-м опыте. (В линейной алгебре обычно первый индекс при х обозначает номер строки, второй – номер столбца. Однако в этой главе
принят порядок обозначений, распространенный в литературе по
теории эксперимента).
Глава 2. Элементы теории эксперимента
68
Рассмотрим также вектор-столбец результатов эксперимента:
⎛ y1 ⎞
⎜y ⎟
2
Y=⎜ ⎟.
⎜ ... ⎟
⎜⎝ y ⎟⎠
n
(2.39)
Расчетное значение y для j-й строки матрицы X будет иметь вид
y j = F ( x1 j , x2 j ,..., x pj , b0 , b1 ,..., bq ) .
(2.40)
Приведенное выше определение метода наименьших квадратов
может быть записано формулой
n
S = ∑ ( y j − y j ) 2 = min .
(2.41)
1
Те значения b, при которых сумма S окажется минимальной, и будут
наилучшими.
Как известно, для отыскания минимума функции нескольких переменных нужно приравнять нулю ее частные производные по всем
аргументам.
Обратите внимание на то, что в данном случае S следует дифференцировать по коэффициентам b. Действительно, факторы х сейчас
выступают как постоянные величины: это условия уже сделанных
опытов, изменять их мы не можем. Именно коэффициенты суть те
величины, от которых зависит значение S. Таким образом, наилучшие значения могут быть найдены как решение системы уравнений
⎧∂S / ∂b0 = 0,
⎪ ∂S / ∂b = 0,
1
⎪⎪
⎨∂S / ∂b2 = 0,
⎪ ..................
⎪
⎪⎩ ∂S / ∂bq = 0.
(2.42)
Уравнения (2.42) называются нормальными.
Отмечу, что если ошибки определения у – независимые нормально распределенные случайные величины с нулевым математическим
ожиданием и одинаковыми (хотя и не известными нам) дисперсиями, то решение системы (2.43) даст состоятельные, несмещенные и
эффективные оценки коэффициентов b, т. е. действительно наилучшие с точки зрения математической статистики.
Проще всего расчет методом наименьших квадратов осуществлять в случае, когда уравнение (2.37) линейно относительно коэффициентов b. Это значит, что его можно записать в следующем
виде (в отличие от уравнения (2.37) здесь факторы обозначены
буквой u):
2.3. Метод наименьших квадратов
69
y=b0+b1φ1(u1,u2, …, up)+b2φ2(u1, u2, …, up)+…+bqφq(u1, u2, …, up), (2.43)
причем каждая функция φ(u1 , …, up) должна быть известна заранее полностью, т. е. не включать никаких оцениваемых параметров.
Параметры b входят в формулу только как множители при этих функциях. В этом случае говорят о линейном оценивании параметров.
Пример 2.16. Функция
y = b0 + b1 sin u1 + b2 eu2
линейна относительно b0, b1 и b2, поскольку те функции от u1 и u2, на которые
они множатся, не содержат неизвестных параметров.
Функция
k = Ae
−
E
RT
нелинейна, поскольку параметр E входит в показатель степени. Правда, если мы прологарифмируем левую и правую части, то получим функцию, линейную относительно ln A и E :
E
.
RT
Следует учитывать, что если ошибки определения k распределены нормально, то ошибки ln k имеют уже не нормальный закон распределения,
что может привести к смещению оценок параметров. Но в данном случае
положение иное. Вспомните, что говорилось в разд. 2.1 о величинах с естественным нулем и о возникающем для таких величин соотношении между
нормальным и лог-нормальным распределениями. Если это так, то с точки
зрения теории корректнее обрабатывать кинетический эксперимент именно
в логарифмированной форме.
Функция
ln k = ln A −
y=
u1 + b1u2
b2u1 + b3u2
нелинейна относительно параметров, и, по-видимому, нет преобразования,
которое сделало бы ее линейной.
Функцию (2.43) можно записать в виде
y = b0x0+b1x1+…+bqxq ,
(2.44)
где xi = φi(ui, .., up), поскольку мы вправе обозначить каждую из функций φ буквой х. В формулу (2.44) для симметрии введена величина х0,
которая всегда равна 1, и, таким образом, b0x0≡b0. Поэтому x0 иногда
называют фиктивной переменной. Такое формальное добавление не
меняет смысла и результатов, но делает более удобными некоторые
преобразования.
Как уже отмечалось, при расчете минимума S значения xi фигурируют как постоянные числа – элементы матрицы X. Поэтому совершенно безразлично, получены ли эти числа как «исходные» неза-
Глава 2. Элементы теории эксперимента
70
висимые переменные и или как функции x этих переменных – лишь
бы можно было их рассчитать до начала решения системы (2.42).
Рассмотрим расчет коэффициентов для данного случая. Матрица X
будет иметь вид:
⎛ x01
⎜x
02
X=⎜
⎜ ...
⎜x
⎝ 0n
x11 ... xq1 ⎞
x12 ... xq 2 ⎟
⎟.
... ... ... ⎟
x1n ... xqn ⎟⎠
(2.45)
По формулам (2.43) и (2.45) квадрат разности для j-го опыта запишется так:
(2.46)
( y j − y j ) 2 = ( y j − b0 x0 j − b1 x1 j − ... − bq xqj ) 2 .
При дифференцировании S по bi применим, во-первых, теорему
о производной суммы: производная ∂S/∂bi равна сумме производных
по bi от каждого квадрата (2.46). Во-вторых, каждый квадрат продифференцируем по формуле производной от сложной функции: вначале продифференцируем «по скобке» как квадрат, получим удвоенное
выражение, стоящее в скобках в правой части уравнения (2.46), а затем умножим на производную от этого выражения по bi. Эта последняя производная равна –xij, поскольку все члены в скобках, кроме
bi xij, не зависят от bi и при дифференцировании дадут нули:
∂( y j − y j ) 2
= −2( y j − b0 x0 j − b1 x1 j − ... − bq xqj ) xij =
∂bi
(2.47)
= 2(− xij y j + b0 x0 j xij + b1 x1 j xij + ... + bq xij xqj ) .
Как уже сказано, чтобы получить ∂S/∂bi , нужно сложить производные, полученные по приведенной выше формуле, для всех опытов
(для всех значений j):
n
∂S
= 2∑ (− xij y j + b0 x0 j xij + b1 x1 j xij + ... + bq xij xqj ) .
∂bi
j =1
Выражения, стоящие в скобках, будем суммировать по j почленно: сначала первые члены, затем вторые и т. д. При этом для всех
членов, содержащих множитель bi, он – один и тот же при всех j, следовательно, его можно вынести за знак суммы:
n
n
n
⎛ n
⎞
∂S
= 2 ⎜ − ∑ xij y j + b0 ∑ x0 j xij + b1 ∑ x1 j xij + ... + bq ∑ xij xqj ⎟ . (2.48)
∂bi
⎝ j =1
⎠
j =1
j =1
j =1
Приравняв производную к нулю, сократим на 2, раскроем скобки
и перенесем сумму, содержащую у, в правую часть:
2.3. Метод наименьших квадратов
71
n
n
n
n
J =1
j =1
j =1
j =1
b0 ∑ x0 j xij + b1 ∑ x1 j xij + ... + bq ∑ xij xqj = ∑ xij y j .
(2.49)
Это и есть общая формула нормального уравнения для рассматриваемого случая.
В первом уравнении системы нормальных уравнений i = 0, во втором i = 1 и т. д. В целом получаем:
n
n
n
⎧ n 2
⎪b0 ∑ x0 j + b1 ∑ x0 j x1 j + ... + bq ∑ x0 j xqj = ∑ x0 j y j ,
j =1
j =1
j =1
⎪ j =1
n
n
n
⎪ n
2
⎪ b0 ∑ x0 j x1 j + b1 ∑ x1 j + ... + bq ∑ x1 j xqj = ∑ x1 j y j ,
⎨ j =1
j =1
j =1
j =1
⎪ .............................................................................
⎪
n
n
n
⎪ n
2
⎪ b0 ∑ x0 j xqj + b1 ∑ x1 j xqj + ... + bq ∑ xqj = ∑ xqj y j .
j =1
j =1
j =1
⎩ j =1
(2.50)
Это – система (q+1)-го уравнения 1-й степени с (q+1) неизвестным b0, b1, ..., bq. При малом числе неизвестных записать и решить ее
несложно. В общем виде целесообразно использовать для решения
аппарат линейной алгебры.
Нетрудно убедиться, что матрица коэффициентов левых частей
системы равна произведению матрицы X справа на транспонироТ
ванную матрицу Х :
⎛ n 2
x0 j
⎜ ∑
⎜ j =1
⎜ n
⎜ ∑ x0 j x1 j
T
X X = ⎜ j =1
⎜ ...
⎜ n
⎜
⎜⎝ ∑ x0 j xqj
j =1
n
x
0 j 1j
j =1
n
∑x
2
1j
j =1
...
n
∑x
x
1 j qj
j =1
⎞
x ⎟
j =1
⎟
n
⎟
... ∑ x0 j xqj ⎟
.
j =1
⎟
...
... ⎟
⎟
n
2 ⎟
... ∑ xqj ⎟
⎠
j =1
n
∑x
...
∑x
0 j qj
(2.51)
Вектор-столбец правых частей системы (2.50) равен произведеТ
нию X Y, где Y – вектор (2.39):
⎛ n
⎞
x0 j y j ⎟
⎜∑
j =1
⎜
⎟
⎜ n
⎟
⎜ ∑ x1 j y j ⎟ .
XT Y = ⎜ j =1
⎟
⎜ ...... ⎟
⎜ n
⎟
⎜
⎟
x
y
⎜⎝ ∑ qj j ⎟⎠
j =1
(2.52)
Глава 2. Элементы теории эксперимента
72
Число неизвестных b равно числу уравнений (поскольку каждое уравнение получено дифференцированием S по одному из bi).
Поэтому матрица (2.51) – квадратная. Это значит, что если определитель этой матрицы не равен нулю, то система (2.50) имеет единственное решение – единственный наилучший набор коэффициентов.
В случае, когда этот определитель равен нулю, матрица вырождена,
получается бесконечно много решений, тогда по данным опытным
точкам нельзя однозначно определить параметры модели.
В матричных обозначениях решение системы (2.50) имеет вид
(2.53)
B = ( XT X) −1 XT Y ,
где верхний индекс –1 есть символ обращения матрицы; В – вектор
искомых параметров. В форме уравнения (2.53) расчет удобно программировать для компьютера.
Пример 2.17. Рассмотрим три задачи, в которых применен метод наименьших квадратов.
По опытным данным построим зависимость плотности жидкости от температуры в виде параболы 2-й степени.
Т, К
ρ, кг/м3
273
875
283
871
293
868
303
867
Для упрощения расчетов переменные удобно преобразовать так, чтобы
они выражались малым числом цифр. Так, вместо Т можно использовать величину x = (Т – 288)/5, вместо ρ использовать y = ρ – 870. Тогда зависимость
получает вид
y = b0+b1x+b11x2,
где опытные данные таковы:
x
y
–3
5
–1
1
1
–2
3
–3
В первом столбце матрицы плана во всех строках стоят значения x0 = 1;
во втором столбце – значения х, в третьем – значения х2. Окончательно эта
матрица имеет вид:
⎛1 −3 9⎞
⎜1 −1 1⎟
⎜
⎟
⎜1 1 1⎟ .
⎜⎝1 3 9⎟⎠
Система нормальных уравнений получится по формулам (2.50):
⎧ 4b0 + 0 ⋅ b1 + 20b11 = 1,
⎪
⎨0 ⋅ b0 + 20b1 + 0 ⋅ b11 = −27 ,
⎪ 20b + 0 ⋅ b + 164b = 17 ,
0
1
11
⎩
2.3. Метод наименьших квадратов
73
откуда b0 = − 0, 6875; b1 = − 1,35; b11 = 0,1875 , что при пересчете дает
ρ = 1569, 2 − 4,59T + 0, 0075T 2 .
2. Описать зависимость выхода продукта у от давления р, МПа, и температуры Т, гК, линейным уравнением по трем опытным точкам:
p
1
3
2
Т
5
5
7
y
0,53
0,68
0,64
Уравнение имеет вид: y = b0 + b1p + b2T. Здесь для получения матрицы плана к двум первым столбцам опытных данных нужно приписать слева столбец х0, т. е. в каждой строке записать +1.
Система нормальных уравнений запишется в виде
⎧ 4b0 + 0 ⋅ b1 + 20b11 = 1,
⎪
⎨0 ⋅ b0 + 20b1 + 0 ⋅ b11 = −27 ,
⎪ 20b + 0 ⋅ b + 164b = 17 ,
0
1
11
⎩
откуда находим:
y = 0,3675 + 0,075p + 0,0175T.
3. Исследовать влияние факторов x1, x2 и x3 на отклик у, предположив, что
зависимость имеет вид y = b0 + b1x1 + b2x2 + b3x3.
Матрица плана и столбец у таковы:
x0
1
1
1
1
x1
1
2
3
4
x2
2
7
3
1
x3
4
11
9
9
y
14
12
8
11
Рассчитываем матрицу коэффициентов системы нормальных уравнений:
⎛4
⎜ 10
X X=⎜
⎜ 13
⎜⎝ 33
T
10 13 33 ⎞
30 29 89 ⎟
⎟.
29 63 121⎟
89 121 299⎟⎠
Определитель матрицы X X равен нулю. Таким образом, имеющихся данных недостаточно для расчета зависимости.
T
Последняя задача примера 2.17 показывает, что не всегда опытные данные пригодны для расчета параметров. Прежде всего, число
опытных точек должно быть не меньше числа рассчитываемых параметров. В противном случае число степеней свободы, равное разности
между числом точек и числом параметров, окажется отрицательным,
а расчет – невозможным. Но и при неотрицательном числе степеней
свободы (как в рассмотренной задаче) матрица системы нормальных
уравнений может оказаться вырожденной.
Глава 2. Элементы теории эксперимента
74
Вырождение матрицы связано со взаимной корреляцией факторов,
хотя не всегда с той простой формой корреляции, которая рассмотрена в разд. 2.1 и 2.2.
Необходимо отметить, что и во многих случаях, когда определитель матрицы нормальных уравнений отличен от нуля, корреляция
факторов затрудняет использование зависимостей, полученных методом наименьших квадратов. При этом не всегда удается понять,
какой из факторов определяет изменение отклика, поскольку, например, увеличение значения одного из них сопровождается ростом
другого. В разд. 2.1 отмечалось, что наличие корреляции между характеристиками какой-либо системы во многих случаях позволяет
обнаружить имеющиеся в ней связи. Однако если закоррелированными оказываются факторы, влияющие на систему, то это чаще всего затрудняет анализ и может привести к неверным выводам: исследователь сочтет, что влияет некий фактор, а на деле окажется, что
иной, коррелированный с данным.
Пример 2.18. Спортивный физиолог хочет установить, как на результат
некоторого упражнения влияют два фактора: масса тела и рост. Он случайным образом отбирает некоторое количество испытуемых и просит их
выполнить упражнение. Результаты такого исследования практически наверняка окажутся сомнительными. Масса и рост сильно коррелированы:
в среднем более высокий человек весит больше, хотя, разумеется, иногда
бывает и иначе. При случайной выборке оба фактора в основном будут возрастать или убывать одновременно, не позволяя понять, увеличение какого
из них оказывает то или иное влияние на результат.
При обработке данных методом наименьших квадратов корреляция факторов влечет за собой два неприятных последствия. Вопервых, в таких случаях оказывается, что определитель матрицы коэффициентов системы нормальных уравнений очень мал по модулю
(точнее, мал по сравнению с некоторыми из элементов матрицы).
Такая матрица называется плохо обусловленной. Результаты расчетов
при плохо обусловленных матрицах ненадежны – на них сильно
влияют малые ошибки в данных. Во-вторых, корреляция факторов
влечет за собой корреляцию оценок (параметров, получаемых как решение нормальных уравнений).
Пример 2.19. Исследована зависимость у от двух переменных: x1 и x2.
Получены следующие данные.
x1
х2
у
0
1
2
2
–7
–2
2
5
0,3
0,3
0,2
0,5
2.3. Метод наименьших квадратов
75
По этим данным методом наименьших квадратов получено уравнение
y = 1 − 0,5 x1 + 0,1x2 .
Дальнейшее исследование привело к выводу, что х2, по существу, не влияет на величину у, которая зависит только от х1. Тогда по тем же данным было
рассчитано (также методом наименьших квадратов) уравнение, связывающее у с x1:
y = 0, 29 + 0, 027 x1 .
Оба уравнения, полученные по одному и тому же опытному материалу,
совершенно по-разному описывают влияние x1 на у: согласно первому из
них рост x1 ведет к уменьшению у, согласно второму – наоборот.
Противоречие это объясняется коррелированностью x1 и х2 в опытах. Нетрудно увидеть, что в данном случае возрастание х1 сопровождается ростом х2. Коэффициент корреляции для величин факторов
очень высок: r = 0,97. Поэтому практически невозможно отделить
влияние одного фактора от влияния другого. Исключение из рассмотрения какого-либо фактора заставляет полностью пересмотреть
вопрос о влиянии всех других факторов, с ним коррелированных.
Проверка гипотез относительно уравнений регрессии. Уравнения,
полученные методом наименьших квадратов, называют уравнениями
регрессии. Получив уравнение регрессии, исследователь интерпретирует его – выясняет смысл результата. Важнейший этап интерпретации – проверка гипотез, или регрессионный анализ. Желательно
проверить две гипотезы: во-первых, гипотезу об адекватности уравнения – это значит выяснить, достаточно ли точно данное уравнение отвечает опытным данным; во-вторых, гипотезу о значимости
коэффициентов уравнения (коэффициентов регрессии). Дело в том,
что коэффициенты b – выборочные оценки и, стало быть, содержат
случайные ошибки. Может оказаться так, что влияние какого-то
фактора пренебрежимо мало, истинное значение соответствующего коэффициента регрессии равно нулю, но вследствие случайных
ошибок оценка не равна истинному значению. Такой коэффициент называют незначимым. Если принять гипотезу о незначимости
какого-то коэффициента, то соответствующий член исключается из
уравнения. Тогда, во-первых, математическая модель упрощается и
соответственно упрощается ее анализ. Во-вторых, принимая bi = 0,
мы исключаем из рассмотрения рассчитанную оценку величины bi и
тем самым увеличиваем на единицу число степеней свободы.
К сожалению, корреляция факторов и обусловленная ею корреляция оценок, как правило, не позволяет проверить гипотезу о значимости. Эта проверка возможна в случаях, рассмотренных в разд. 2.4,
когда корреляция исключается выбором плана эксперимента.
Глава 2. Элементы теории эксперимента
76
Гипотеза об адекватности проверяется путем сравнения разброса
опытных данных относительно уравнения регрессии с величиной
случайной ошибки эксперимента. Мерой разброса опытных данных
2
относительно уравнения является остаточная дисперсия sост , равная
отношению минимальной суммы квадратов отклонений S (см. формулу (2.41)) к числу степеней свободы. Последнее равно разности
между числом опытных точек п и числом оцененных по этим точкам параметров, равным q + 1 (см. уравнение (2.63)). Окончательно
имеем:
2
sост
=
S
.
n − q −1
(2.54)
При этом следует учитывать, что n – число разных опытных точек.
Если два или несколько значений y получены при одном и том же
наборе значений x (в параллельных опытах), их наличие увеличивает
n лишь на единицу.
Чтобы оценить величину случайной ошибки, рассчитывают дисперсию воспроизводимости s2(y). Для этого проводят одну или несколько серий параллельных опытов; в каждой такой серии значения контролируемых факторов от опыта к опыту не меняются. Затем
находят s2(y) по формуле (2.38), подразумевая в этом расчете под m
число опытов в серии. Если серий параллельных опытов несколько,
то для каждой рассчитывают дисперсию, проверяют однородность
оценок дисперсии (если все п равны, то по критерию Кокрена) и находят s2(y) по формуле (2.34).
Адекватность проверяют по критерию Фишера
F=
2
sост
s 2 ( y)
(2.55)
так, как это описано в разд. 2.3. Если при каждом из значений х
(в каждом режиме) сделано одинаковое число параллельных опытов, то регрессионный анализ проводят, принимая в качестве значений у средние по каждой серии параллельных опытов, а в качестве
дисперсии воспроизводимости – дисперсию среднего (см. уравнение (2.22)).
Пример 2.20. Изучена зависимость у от х. Данные опыта сведены в следующую таблицу.
№ опыта
х
у
1
–2
0,0
2
–1
0,0
3
0
1,0
4
1
1,0
5
2
3,0
2.3. Метод наименьших квадратов
77
Для оценки воспроизводимости проведено четыре опыта при x = 0, данные которых сведены в таблицу.
0
1,3
х
у
0
0,8
0
0,9
0
1,0
(
y =1,0)
Адекватно ли линейное уравнение?
Найдем его коэффициенты из опытных данных методом наименьших
квадратов (в этом и следующем примерах результаты опытов, используемые
для оценки воспроизводимости, не включены в расчет коэффициентов регрессии. Так поступают достаточно часто, хотя их включение в определенном смысле предпочтительно. Впрочем, в указанных примерах оба расчета
дадут близкие результаты). Получим:
у = 0,2 + 0,8х.
Отклонения опытных данных от расчетных (остатки) составят – 0,4;
2
+0,4; +0,2; 0; – 0,2. В соответствии с формулой (2.54), sост
= 0,133 . Из ре2
зультатов опытов при х = 0 по формуле (2.38) находим : s (y) = 0,075. Отсюда
F= 0,133/0,075 = 1,8.
Числа степеней свободы: f1 = 5 – 2 = 3; f2 = 4 – 1 = 3. По таблице Fкр = 9,3;
F < Fкр (при α = 0,05). Даже при чрезвычайно высоком уровне значимости
α = 0,25 имеем Fкр = 2,36, что больше полученного значения F. Следовательно,
уравнение адекватно.
Пример 2.21. Адекватно ли линейное уравнение, полученное в предыдущем примере, если опытные данные те же, но при оценке воспроизводимости имеем иные результаты, представленные в следующей таблице.
х
у
0
0,95
0
0,90
0
1,05
0
1,10
2
Уравнение регрессии не изменяется, sост
= 0,133 , но точность опытов
2
иная: s (у) = 0,00834; F = 15,9 > Fкр. При такой точности эксперимента то же
уравнение неадекватно.
Проверим более сложное уравнение (2-го порядка). При тех же данных
метод наименьших квадратов дает:
y = 0,9143 + 0,8х + 0,1429х2.
Для этого уравнения остатки равны: – 0,11; +0,26; – 0,09; – 0,14; +0,09.
2
Отсюда sост = 0,0576; F = 0,0576/0,00834 = 6,9. Числа степеней свободы:
f1 = 5 – 3 = 2; f2 = 3. По таблице Fкр = 9,55 при α = 0,05. Таким образом, F < Fкр.
Уравнение адекватно.
Иногда провести параллельные опыты не удается или их очень
мало и оценка s2(y) представляется ненадежной. В таком случае можно предложить рассчитывать s2(y) исходя из представлений исследователя о том, какая средняя ошибка в данном эксперименте (или
при описании объекта) допустима. Если оценена не средняя, а максимальная допустимая ошибка, то среднюю ошибку можно принять
78
Глава 2. Элементы теории эксперимента
втрое меньше максимальной. Среднюю допустимую ошибку можно
использовать как оценку s(y), а дисперсию рассчитывать как s2(y).
Поскольку такая оценка практически всегда базируется на большой
информации, имеющейся у исследователя, то число степеней свободы для s2(y) при расчете F следует считать равным ∞. Во многих
случаях целесообразно сопоставлять выводы, основанные на оценке
дисперсии, рассчитанной по опытным данным, с выводами, основанными на допустимом значении, исходящим из требований, которые исследователь предъявляет к точности расчетов. Оговорюсь, что
такая постановка вопроса принадлежит мне и за ее корректность отвечаю я.
Пример 2.22. Изучена зависимость плотности жидкости от температуры.
Известно, что средняя ошибка определения плотности составляет 0,2 кг/м3.
Для практического использования уравнения регрессии достаточна средняя
точность 10 кг/м3. Оценка дисперсии воспроизводимости зависит от поставленной задачи. Если мы хотим выяснить, нет ли заметных отклонений полученных данных от уравнения регрессии, то, видимо, целесообразно принять
s2(у) = 0,04 (кг/м3)2; если же нас интересует, обеспечит ли расчет по уравнению приемлемую для практики точность, то можно пользоваться в 2500 раз
большей оценкой: s2(y) = 100 (кг/м3)2.
Нелинейное оценивание – оценивание параметров, входящих в уравнения математического описания, нелинейно (см. пример 2.16). В этом
случае, как правило, нетрудно записать нормальные уравнения, но они
оказываются также нелинейными. Их решение обычно представляет
собой сложную вычислительную процедуру.
Подробно о применении метода наименьших квадратов см. в [3, 6,
7, 8], а о методах нелинейного оценивания – в [8, 21].
2.4. Планирование эксперимента
Пассивный и активный эксперименты. Метод наименьших квадратов позволяет получить описание объекта по любым данным,
лишь бы матрица системы нормальных уравнений была невырожденной. Если оценивание линейное, то расчет в принципе прост, хотя и громоздок. Поэтому с появлением компьютеров возникла идея
получать математические описания технологических процессов,
пользуясь в качестве исходных данных результатами нормальной
эксплуатации процесса.
В реальных условиях технологический процесс все время испытывает случайные колебания режима. Сегодня значения контролируемых факторов несколько иные, чем вчера, а завтра будут еще
2.4. Планирование эксперимента
79
немного другими. Возникает вопрос: нельзя ли каждое изменение
режима рассматривать как эксперимент и, обработав совокупность
результатов таких «экспериментов» методом наименьших квадратов,
получить описание процесса, а затем использовать его для управления и оптимизации? Такой подход получил название пассивного эксперимента.
Пример 2.23. В реакторе проходит сложный химический процесс. На первом этапе решено получить его эмпирическое описание в виде полинома 1-й
степени. На процесс влияют: температура T, К; объемная скорость W, с–1 и
мольное отношение реагентов r. Отклик – выход продукта у.
Данные о работе реактора, выписанные из технологического журнала,
представлены в следующей таблице.
Дата
17.10
18.10
Смена
1
2
3
1
2
3
Т
802
807
804
799
802
805
W
0,063
0,060
0,061
0,063
0,062
0,060
r
2,71
2,69
2,73
2,72
2,70
2,72
y
0,213
0,220
0,209
0,210
0,221
0,209
Столбцы Т, W, r образуют матрицу плана эксперимента, у – векторстолбец результатов. Методом наименьших квадратов рассчитано уравнение
y = 0,125 − 0, 0159(T − 800) + 25, 7(W − 0, 06) − 0,16(r − 2, 7) .
Достоинством пассивного эксперимента является отсутствие затрат на опыты: данные получаются «сами собой». Но надежды, возлагавшиеся на этот метод, в большинстве случаев не оправдались.
Анализ неудач пассивного эксперимента [22] выявил несколько причин этого.
Во-первых, в обычных условиях колебания режима малы, опытные точки находятся близко одна к другой. Хорошо известно, что
чем ближе опытные точки, тем сильнее влияют на описание случайные ошибки. Действительно, различия в получаемых значениях
отклика при этом малы и эти малые различия плохо выделяются на
фоне шума – случайных ошибок. Поэтому значения коэффициентов регрессии оцениваются со значительными ошибками, зачастую
даже знаки их обратны истинным.
Во-вторых, в пассивном эксперименте факторы сильно закоррелированы (см. пример 2.19). Это делает крайне ненадежным анализ
влияния отдельных факторов – всегда может оказаться, что влияет
не данный фактор, а другой, коррелированный с ним.
80
Глава 2. Элементы теории эксперимента
В-третьих, сами факторы в производственных условиях часто измеряются с заметными ошибками, поэтому, как отмечалось в начале
разд. 2.3, применение метода наименьших квадратов в его обычном
варианте становится некорректным.
Обратим внимание на то, что две первые причины характерны не
только для случаев, когда данные пассивно снимаются в производственных условиях, но и когда их получают экспериментально, если
при планировании эксперимента не продуманы меры для устранения указанных причин. В связи с этим любой эксперимент, при проведении которого не учтено влияние планирования эксперимента на
статистические свойства получаемых оценок, часто называют пассивным. Ему противопоставляют активный эксперимент, в основе
которого лежит планирование эксперимента.
Впервые методы планирования эксперимента были разработаны
Р. Фишером в начале 20-х годов ХХ века применительно к сельскому
хозяйству. С начала 1950-х годов, после появления работ Дж. Бокса
начинается интенсивное применение планирования эксперимента
в химии и химической технологии.
В СССР работы по планированию эксперимента были начаты
в 1960 г. под руководством В.В.Налимова, и в настоящее время это
один из распространенных методов научного исследования.
Процессы химической технологии в подавляющем большинстве
случаев являются сложными системами. В частности, это выражается в том, что на процесс влияет не один, а ряд факторов. Возможны
два подхода к исследованию таких многофакторных систем. Первый
можно описать фразой: «изменяй факторы по одному». Исследование
разбивается на серии, в пределах каждой из которых изменяется (варьируется) лишь один фактор, а остальные неизменны. В следующей
серии изменяется второй фактор и т. д. Идея второго подхода – построить план эксперимента, который предусматривал бы изменение
всех влияющих факторов и обеспечивал максимум точности, минимум корреляции и другие хорошие статистические свойства. Такой
эксперимент называют многофакторным.
Долгое время в науке господствовал первый подход. Его главное
преимущество – наглядность: данные каждой серии легко поддаются
интерпретации. Один из важных выводов из теории планирования
эксперимента заключается в том, что второй подход значительно эффективнее первого. При том же объеме эксперимента и той же точности опытов получается существенно бóльшая точность результатов.
Мы рассмотрим некоторые простые планы многофакторного эксперимента.
2.4. Планирование эксперимента
81
Геометрическим образом совокупности независимых переменных
Х и зависимой переменной у является пространство р + 1 измерения,
где р – число независимых переменных; (р + 1)-e измерение относится к у. В этом пространстве зависимости у от всех х соответствует р-мерная поверхность, которую обычно называют поверхностью
отклика (результат опыта рассматривается как отклик системы на
опыт – заданную совокупность значений независимых переменных, или входов). В плане эксперимента указывается расположение
опытных точек в р-мерном пространстве независимых переменных
(факторном пространстве), или, иными словами, условия всех опытов, которые следует провести. Как правило, план эксперимента задается в виде матрицы плана (см. (2.38)).
План эксперимента должен строиться так, чтобы он обладал некоторыми оптимальными свойствами.
1. При заданном числе опытов и данной их точности (уровне случайной ошибки) результат должен быть наиболее точным. Точность
результата можно понимать по-разному. Можно говорить о точности описания: считать лучшим план эксперимента, для которого минимальной окажется ошибка расчета по уравнению регрессии. Для
других задач более важна точность оценки параметров – особенно,
когда параметры имеют определенный физический смысл (например, энергия активации в уравнении Аррениуса).
Поскольку во всех практически важных случаях параметров несколько, точность их оценки может быть различной: одни оцениваются точнее, другие – менее точно. Это приводит к возможности
разных вариантов определения того, что значит наибольшая точность оценки. Лишь в рассмотренных ниже планах 1-го порядка все
параметры оцениваются с одинаковой (и притом наибольшей) точностью и точность описания также максимальна.
2. Еще одно оптимальное свойство плана – отсутствие корреляции факторов или, по крайней мере, минимальная их корреляция.
Недостатки планов с сильной корреляцией факторов рассмотрены
выше, в конце разд. 2.4.
Планы 1-го порядка служат для построения математических описаний в виде полиномов 1-й степени (линейных уравнений регрессии):
y = b0 + b1x1 + b2x2 +…+ bpxp.
(2.56)
Наиболее распространен следующий порядок построения планов.
Выбирается центр исследуемой области (центр плана) и в него переносится начало координат. Затем выбирается интервал варьирования δ по
каждой переменной – расстояние по данной оси от центра плана до
экспериментальной точки. Выбор центра плана и интервала варьиро-
Глава 2. Элементы теории эксперимента
82
вания лежит вне математической теории: этот этап задачи должен решаться экспериментатором на основе знания исследуемых объектов.
Пример 2.24. Исследовалось [23] влияние температуры и времени реакции на ход изомеризации в производстве сульфамидного препарата. По
данным предварительных опытов были получены величины, приведенные
в следующей таблице.
Переменная ui
Значение в центре ui0
Интервал
варьирования δi
443
5
5
1
Температура T, K
Время t, ч
В последующих экспериментах наибольшее значение каждого из
факторов (верхний уровень) равно ui0 + δi , а наименьшее (нижний
уровень) равно ui0 – δi . Оптимальными свойствами обладают планы
1-го порядка, в которых каждый фактор принимает лишь два значения, т.е. варьируется на двух уровнях: верхнем и нижнем.
На следующем этапе выполняется операция приведения (кодирования) переменных, которая заключается в том, что все координаты
центра плана приравниваются к нулю, а интервалы варьирования
принимают за 1. Кодированные переменные удобны тем, что вся обработка результатов опытов приводится к стандартной форме, не зависящей от конкретных условий задачи, что существенно упрощает
вычисления. Переход от некодированных (натуральных) значений
переменных ui к кодированным xi и обратно производится соответственно по формулам
xi =
ui − ui 0
,
δi
(2.57)
(2.58)
ui = ui0 + xiδi .
Если ui – на нижнем уровне, то xi = –1; если ui – на верхнем уровне, то xi = +1.
Рассмотрим наиболее часто применяемый план 1-го порядка для
двух факторов х1 и х2 в приведенных координатах. Расположение
опытных точек показано на рис. 2.3. Точки располагаются в вершинах квадрата, центр которого совпадает с центром плана, стороны
параллельны осям и равны 2. Матрица плана имеет вид:
x1
–1
+1
–1
x2
–1
–1
+1
+1
+1
(2.59)
2.4. Планирование эксперимента
83
x2
1
–1
0
1
x1
–1
Рис. 2.3. Расположение опытных точек в плане 1-го порядка
Пример 2.25. Составим матрицу плана 1-го порядка для реакции изомеризации (см. пример 2.24). По формуле (2.58) рассчитаем значения факторов на верхнем и нижнем уровнях:
для Т :
для t :
443 + 5 = 448; 443 – 5 = 438;
5 + 1 = 6;
5 – 1 = 4.
Матрицы плана в кодированных и натуральных значениях имеют вид:
x1
–1
+1
–1
+1
x2
–1
–1
+1
+1
T
438
448
438
448
t
4
4
6
6
На практике для сокращения записи часто вместо «+1», «–1» пишут «+», «–». В таких обозначениях матрица плана выглядит так:
–
–
+
–
–
+
+
+
Рассмотренный план построен так, что каждый фактор варьируется на двух уровнях, причем в опытах перебираются все возможные
комбинации этих уровней. Никаких иных комбинаций, кроме четырех приведенных в строках матрицы (2.59), не существует. Такой
план называют планом полного факторного эксперимента на двух
уровнях. Сокращенное обозначение – п. ф. э. 22. Здесь 2 в основании – число уровней; показатель степени – число факторов; 22 –
число опытов.
Глава 2. Элементы теории эксперимента
84
Легко построить также планы полного факторного эксперимента
для p факторов на двух уровнях – планы 2р. Один из способов построения таков. В столбце фактора x1 – чередование знаков от строки
к строке, в каждой следующей строке – иной знак, чем в предыдущей.
В столбце х2 – две строки одного знака, две – другого и т. д. В столбце
х3 – четыре строки одного знака, четыре – другого. В столбце i – 2i–1
строк одного знака, 2i–1 – другого. И так до xp. Всего план 2p содержит
2p строк и, стало быть, такое же число опытов. Например, план 23 содержит 8 опытов.
x1
–
+
–
+
–
+
–
+
х2
–
–
+
+
–
–
+
+
х3
–
–
–
–
+
+
+
+
Важно отметить, что порядок опытов в матрице плана не должен
определять реальную последовательность их выполнения. Опыты
должны быть рандомизованы (см. разд. 2.2). Часто каждый опыт
(каждая строка матрицы планирования) повторяется несколько
раз – это делается для оценки дисперсии воспроизводимости. В этом
случае необходимо учесть два обстоятельства. Во-первых, число повторений для каждой строки матрицы должно быть одинаковым (все
опыты – по 2 раза, по 5 раз и т. д.). Во-вторых, рандомизуют все опыты, включая параллельные: если параллельные опыты делать подряд,
то нарушится независимость ошибок.
Другой прием, применяемый для оценки дисперсии воспроизводимости, – постановка специальной серии параллельных опытов
в центре плана, т. е. в точке с координатами (0, 0, ..., 0). В расчетные
формулы для определения коэффициентов регрессии результаты
опытов этой серии не включаются. Если факторов достаточно много,
такой прием позволяет обойтись меньшим числом опытов по сравнению с дублированием опытов матрицы планирования. Правда,
при этом не удается проверить гипотезу об однородности оценок
дисперсии воспроизводимости, но зато гипотеза об адекватности
проверяется более надежно. Привлечение еще одной точки – центра
плана – позволяет выявить неадекватность в ряде случаев, когда по
точкам плана это сделать не удается.
2.4. Планирование эксперимента
85
Можно комбинировать и оба приема: дублировать точки плана и
добавлять центральные точки. В любом варианте все опыты должны
быть рандомизованы.
Существенной особенностью п. ф. э. является то, что по данным
этих опытов можно рассчитать не только коэффициенты линейного
полинома (2.56), но и коэффициенты при произведениях факторов.
В планировании эксперимента их называют взаимодействиями факторов. По результатам п. ф. э. 22, кроме b0, b1 и b2, можно рассчитать
b12 – коэффициент при произведении х1x2. Полный факторный эксперимент 23 позволяет рассчитать парные взаимодействия b12, b13 и b23
и тройное взаимодействие b123 – коэффициент при х1x2x3. Из опытов
п. ф.э. 28 можно рассчитать двойные, тройные и т. д. вплоть до восьмерного взаимодействия. Учет взаимодействий позволяет оценить ряд
особенностей поведения объекта, связанных с его нелинейностью.
Пример 2.26. Рассмотрим два уравнения, описывающие один и тот же
объект. Уравнения получены при одних и тех же данных, но в первом оценены лишь линейные члены, а во втором – еще и произведение (взаимодействие) факторов:
y = 1 + х1 – 2х2 ;
(а)
y = 1 + х1 – 2х2 + 3х1х2.
(б)
Исследуем, как влияет х2 на у. При этом придется учитывать, что у зависит
от обоих факторов и влияние х2 удастся определить только тогда, если значение х1 фиксировано. Мы так и поступим. Рассмотрим два крайних случая:
х1 = –1 и х1 = +1; в принятых нами интервалах варьирования все остальные
значения х1 будут промежуточными. Получим для уравнения (а): у = 0 – 2х2
при х1 = –1 и у = 2 – 2х2 при х1 = +1. Графики этих уравнений показаны на
рис. 2.4,а. Получаются две параллельные прямые. При разных значениях х1
значения у – различные, но влияние х2 одно и то же: с увеличением х2 происходит уменьшение у с тем же коэффициентом наклона.
Теперь перейдем к уравнению (б). Рассуждая аналогично, приходим к таким результатам: у = 0 – 5х2 при х1 = –1 и у = 2 + х2 при х1 = +1 (рис. 2.4,б).
Как видим, картина уже иная. При изменении х1 меняется характер зависимости от х2: при одном значении х1 второй фактор влияет на результат положительно, при другом – отрицательно.
Таким образом, наличие в уравнении члена, содержащего произведение факторов, позволяет учесть влияние одного фактора на
характер влияния другого. Именно поэтому соответствующие члены
уравнения называют взаимодействиями. К сожалению, при освоении
этого материала довольно часто путают два понятия: взаимодействие
и корреляцию факторов. Это разные характеристики. Корреляция
означает связь между значениями одного и другого факторов, а взаимодействие – связь между значением одного и характером влияния
другого. Далее мы увидим, что в планах п. ф. э. факторы независимо
от того, значимы взаимодействия или нет, не коррелированы.
Глава 2. Элементы теории эксперимента
86
y
y
x2
а
x2
б
Рис. 2.4. Зависимость отклика от значения второго фактора:
a – без учета взаимодействия факторов; б – с учетом
Более сложные взаимодействия (двойные, тройные и т.д.) характеризуют более сложные зависимости, иногда позволяя вскрывать особенности механизмов процессов. Так, Л.П. Рузинов [24] установил,
что в ряде случаев наличие в описании процесса тройных, четверных
взаимодействий свидетельствует о том, что в выбранной области факторного пространства существуют подобласти с отличающими друг от
друга механизмами процесса. Например, при изучении электролитического выделения галлия достаточно большое значение четверного
взаимодействия «сигнализировало» о том, что при некоторых условиях исследования галлий выделялся на катоде в виде металлического
Ga, а при других условиях – на аноде в форме галлат-иона.
Таким образом, обработка результатов опытов, проведенных по
п. ф. э., позволяет получить сведения о некоторых достаточно сложных особенностях математических описаний и, соответственно,
описываемых объектов. Необходимо учесть, однако, что п. ф. э. 2р
не позволяет оценить коэффициенты при членах х2, х3 и т. д. и построить полный многочлен 2-й и более высоких степеней: матрица
коэффициентов нормальных уравнений окажется вырожденной.
Расчет коэффициентов по результатам п. ф. э. рассмотрим вначале на примере двух факторов. Для получения системы нормальных
уравнений нужно построить матрицу (2.45), содержащую четыре
столбца: х0, x1 ,x2, x12. Столбец х0 во всех строках содержит одно и то
же значение «+ 1» (сокращенно «+»). Каждое значение для столбца
x1x2 получается перемножением значений x1 и x2, стоящих в той же
строке. При этом, как отмечалось при обсуждении формулы (2.44),
2.4. Планирование эксперимента
87
в процессе обработки окажется безразличным, какая величина стоит
в этом столбце – произведение двух факторов или, например, некоторый самостоятельный фактор xз. Поэтому для простоты ниже,
в нормальных уравнениях, введем обозначение х3= x1x2.
Дополним матрицу плана столбцом значений отклика у, полученных при опытах. Образуется так называемая расширенная матрица:
x0
+
+
+
+
x1
−
+
−
+
x2
−
−
+
+
x1 x2
+
−
−
+
y
y1
y2
y3
y4
Система нормальных уравнений получит вид (как уже отмечалось,
x1x2 обозначено как х3):
4
4
j =1
j =1
4
4
4
j =1
b0 ∑ x02 j + b1 ∑ x0 j x1 j + b2 ∑ x0 j x2 j + b3 ∑ x0 j x3 j = ∑ x0 j y j ,
j =1
j =1
4
4
4
4
4
j =1
b0 ∑ x0 j x1 j + b1 ∑ x12j + b2 ∑ x1 j x2 j + b3 ∑ x1 j x3 j = ∑ x1 j y j ,
j =1
j =1
j =1
j =1
4
4
4
4
4
j =1
j =1
j =1
j =1
4
4
4
4
4
j =1
j =1
j =1
j =1
j =1
b0 ∑ x0 j x2 j + b1 ∑ x1 j x2 j + b2 ∑ x22 j + b3 ∑ x2 j x3 j = ∑ x2 j y j ,
(2.60)
j =1
b0 ∑ x0 j x3 j + b1 ∑ x1 j x3 j + b2 ∑ x2 j x3 j + b3 ∑ x32 j = ∑ x3 j y j .
Рассчитаем все суммы, являющиеся коэффициентами левых частей системы (2.60). Каждая из сумм, стоящих на главной диагонали,
имеет вид
4
∑x
j =1
2
ij
. Но так как хij равно либо «–1», либо «+1», то всегда
xij2 = +1 и эта сумма равна 4.
Теперь рассмотрим любую сумму, не попавшую на главную диа-
гональ, например
4
∑x
x . Произведения величин, стоящих в столб-
1j 2 j
j =1
цах х1 и х2, составляют для четырех строк соответственно +1, –1, –1
и +1, а их сумма равна 0. То же самое верно для любой внедиагональной суммы. Все внедиагональные суммы равны нулю. Поэтому система
(2.60) имеет простейший вид:
4
4b0 = ∑ x0 j y j ,
j =1
4
4b1 = ∑ x1 j y j ,
j =1
Глава 2. Элементы теории эксперимента
88
4
4b2 = ∑ x2 j y j ,
j =1
4
4b3 = ∑ x3 j y j .
j =1
4
∑x
ij
откуда находим, что bi =
yj
j =1
4
.
Эта формула элементарно распространяется на обработку резульр
татов п. ф. э. 2 при любом р:
2p
∑x
ij
bi =
yj
j =1
.
(2.61)
2p
Такая простота решения обусловлена важным свойством матрицы
плана. Если рассматривать каждый ее столбец как вектор (векторстолбец), то для двух векторов будет определена операция перемножения. Произведение (точнее, скалярное произведение) двух векторов одинакового порядка n (оба вектора имеют по n элементов) XlXm
определяется формулой
n
Xl X m = ∑ xlj xmj .
(2.62)
j =1
Таким образом, коэффициенты нормальных уравнений – это
произведения вектор-столбцов: по главной диагонали – произведения столбцов на самих себя, а остальные – попарные произведения
разных столбцов. Векторы, для которых XlXm = 0, называют взаимно ортогональными, а матрицу, все столбцы которой взаимно ортогональны, – ортогональной. Матрица плана п. ф. э. ортогональна,
поэтому и сам план называют ортогональным.
Благодаря ортогональности плана п. ф. э. расчет коэффициентов
методом наименьших квадратов крайне упрощается – сводится к последовательному расчету по формуле (2.61).
Пример 2.27. При исследовании изомеризации (см. примеры 2.25 и 2.26)
получены данные, приведенные в расширенной матрице планирования (у —
выход продукта в процентах):
x0 x1 x2 x1 x2
y
+ − −
+ 50,8
+ + −
− 66, 2
+ − +
− 56, 0
+ + +
+ 85, 0
2.4. Планирование эксперимента
89
Коэффициенты рассчитаем по уравнению (2.61):
50,8 + 66, 2 + 56, 0 + 85, 0
= 64,5,
4
−50,8 + 66, 2 − 56, 0 + 85, 0
b1 =
= 11,1,
4
−50,8 − 66, 2 + 56, 0 + 85, 0
b2 =
= 6, 0,
4
50,8 − 66, 2 − 56, 0 + 85, 0
b12 =
= 3, 4.
4
b0 =
Уравнение регрессии будет иметь вид
y = 64,5 + 11,1x1 + 6, 0 x2 + 3, 4 x1 x2 .
Простота расчета для ортогонального плана – преимущество заметное, но в настоящее время в связи с распространением компьютеров не очень существенное. Важнее другое. Ортогональность двух
столбцов означает полное отсутствие корреляции соответствующих
факторов. Следовательно, и оценки параметров оказываются некоррелированными. Это дает возможность оценивать независимо влияние каждого фактора, а также легко упрощать модель, если какойлибо член окажется незначимым: такой член просто исключают из
уравнения и это никак не сказывается на величине остальных параметров. Некоррелированность позволяет к тому же легко проверить
гипотезу о значимости факторов, что, как отмечалось выше, крайне
сложно, если факторы не независимы.
Пример 2.28. Рассмотрим процесс упрощения уравнения регрессии.
Предположим, что в примере 2.27 коэффициент b12 незначим и модель
содержит только линейные члены. Тогда пересчет сведется просто к исключению последнего члена из уравнения регрессии. При этом получим уравнение
y = 64,5 + 11,1x1 + 6, 0 x2 .
Если бы план не был ортогонален, вычеркивание одного члена привело
бы к необходимости пересчета всех остальных членов уравнения.
Дробный факторный эксперимент. Далеко не всегда изучаемые
объекты столь сложны, а требования к точности модели столь высоки, что необходимо оценивать все взаимодействия. При этом чем
сложнее взаимодействие, тем скорее можно ожидать, что его влияние окажется незначимым. В таких случаях удается построить планы
дробного факторного эксперимента (д. ф. э.). План д. ф. э. может соq
держать в 2, 4, .., 2 раз меньше опытов, чем п. ф. э. для того же числа
факторов.
Глава 2. Элементы теории эксперимента
90
Построение д. ф. э. проведем вначале для случая, когда факторов – три. При этом начнем с матрицы плана п. ф. э. для двух факторов, включающей столбец произведения:
x0
+
x1
−
x2
−
x1 x2
+
+
+
+
+
−
+
−
+
+
−
−
+
(2.63)
Пусть мы заранее решили, что коэффициент b12 незначим – его истинное значение β12 = 0. (Решение о незначимости коэффициента
в данном случае необходимо принять заранее, до проведения опытов.) Тогда можно воспользоваться четвертым столбцом матрицы
(2.63), чтобы варьировать значения третьего фактора х3. В первом
и четвертом (по строкам матрицы) опытах зададим его значения на
верхнем уровне, во втором и третьем – на нижнем. То есть мы принимаем, что
x3 = х1х2 .
(2.64)
Матрица плана при этом выглядит так:
x0 x1 x2 x3
+ − − +
(2.65)
+ + − −
+ − + −
+ + + +
Немного ранее, при записи системы уравнений (2.60), уже использовалось выражение (2.64). Но тогда оно означало лишь сокращение
записи. А сейчас действительно значение третьего фактора приравнено произведению первых двух. Закономерны два вопроса. Первый:
что значит соотношение (2.64)? Если, например, х1 – концентрация
реагента, х2 – температура, а х3 – время протекания реакции, то почему время должно равняться произведению концентрации на температуру? Второй вопрос: потеряем ли мы что-нибудь, приравняв
х3 к х1х2? Ответ на первый вопрос следующий. Соотношение (2.64)
относится только к кодированным значениям факторов и не означает ничего иного, чем указание, в каких опытах будет реализоваться
нижнее или верхнее значение х3. Сложнее ответить на второй вопрос.
Если действительно наша исходная гипотеза о том, что β12 = 0, верна,
то все в порядке: полученное на основе результатов опытов значение
b3 оценивает истинное значение β3. Если же β12 ≠ 0, то получается смешанная оценка: b3 оценивает сумму β3 + β12.
2.4. Планирование эксперимента
91
Подчеркну здесь следующее. Опасность того, что мы ошибемся
в априорной (принятой до проведения опытов) форме уравнения,
существует всегда, в том числе и опасность пренебречь значениями
каких-либо параметров, которые потом окажутся существенными.
Учесть и устранить такие ошибки удается лишь в процессе более
подробного изучения на последующих этапах работы. А в начале исследования обычно важнее всего получить самое первое, «грубое»,
представление о том, какие факторы влияют на объект положительно, какие – отрицательно. Именно такую «грубую» оценку дает
математическая модель первого порядка. Есть даже прием, уменьшающий относительное влияние нелинейности: принятие малых
интервалов варьирования.
Хорошо известно, что достаточно малый участок криволинейной
поверхности обычно можно рассматривать как плоский. Поэтому
в начале исследования зачастую целесообразно выбирать интервалы варьирования небольшими, заботясь лишь о том, чтобы опытные
точки не оказались слишком близко друг от друга, когда и линейные
члены уравнения перестают выделяться на фоне ошибок.
Разумеется, следует учесть еще одно обстоятельство – цену опытов. Если проведение каждого опыта не требует заметных затрат
средств и времени, стоит сразу осуществить п. ф. э., повторив каждую
строку матрицы несколько раз, чтобы уменьшить ошибку среднего
и хорошо оценить дисперсию воспроизводимости. Если же каждый
опыт дорог, то вначале чаще всего можно рекомендовать провести
д. ф. э, чтобы затем, на последующих этапах работы, изучить объект
уже подробно, выполнив «сэкономленные» вначале опыты.
Особенно эффективно использование д. ф. э., когда исследуется
р
влияние многих факторов. Действительно, план п. ф. э. 2 при р = 3
содержит восемь строк, при р = 4 – 16 строк. Такое количество даже
в начале исследования может быть разумным. Но при семи факторах
(27 = 128) и тем более при десяти факторах (210 = 1024) число опытов
становится нереально большим.
Принцип построения д. ф. э. и в этих случаях такой же, как описанный для трех факторов. Заранее, до начала опытов, экспериментатор предполагает, что взаимодействия, которым соответствуют те
или иные столбцы матрицы плана, незначимы и использует знаки
«+» и «–» в каждом из этих столбцов как значения еще одного добаp–q
вочного фактора. Обозначают такой план д. ф. э. 2 , где основание
2 – по-прежнему число уровней, p – общее число факторов, q – число столбцов взаимодействий в исходной матрице п. ф. э., использованных для введения в нее добавочных факторов. Начнем рассмотрение с п. ф. э. 23:
Глава 2. Элементы теории эксперимента
92
x0
x1
x2
x3
x1 x2
x1 x3
x2 x3
x1 x2 x3
+
−
−
−
+
+
+
−
+
+
−
−
−
−
+
+
+
+
−
+
+
+
−
−
−
+
+
−
−
−
+
−
+
−
−
+
+
−
−
+
+
+
+
+
−
+
−
+
+
+
−
−
+
+
−
+
−
−
+
+
+
+
−
+
(2.66)
Если в опытах варьировать три фактора, то этот план позволяет оценить свободный член, коэффициенты при линейных членах и при четырех взаимодействиях, записанных в верху матрицы (2.66). Но можно
«заменить» какие-то столбцы взаимодействий столбцами новых независимых факторов. C учетом того, влияние скольких дополнительных
факторов мы решили изучить, можно построить планы д. ф. э. 24–1, 25–2,
26–3 и, наконец, 27–4. В последнем случае влияние семи факторов будет
оценено только по восьми опытам (не считая возможных параллельных). При еще большем числе факторов восьми опытов уже недостаточно – число степеней свободы окажется отрицательным. Придется
исходить из матрицы плана 24 и строить д. ф. э. от 25–1 до 215–11.
Очень важно, что для всех планов д. ф. э. соблюдаются оптимальные свойства факторных экспериментов, в частности расчет
коэффициентов производится по формуле (2.61) с единственным
p–q
изменением: сумма в знаменателе равна 2 . Более подробно работа
с такими планами описана в [6].
Планы 2-го порядка. Главный недостаток многочленов 1-го порядка как эмпирических моделей состоит в том, что они не могут описать зависимостей с экстремумами – максимумами или минимумами.
Такие зависимости особенно важны, например, в задачах оптимизации, где оптимуму, как правило, соответствует экстремум целевой
функции (максимум прибыли, минимум потерь и т. д.). Не содержат
экстремумов и зависимости, содержащие, наряду с линейными членами, взаимодействия факторов. Для описания функций с экстремумами необходимо применять многочлены не ниже полного 2-го порядка
(на практике, как правило, используют именно 2-й) и соответственно
строить планы 2-го порядка, а иногда и более высоких порядков.
Теория показывает, что в случае 2-го порядка факторы должны варьироваться по меньшей мере на трех уровнях (соответственно для
3-го порядка – на четырех и т.д.). Первые планы 2-го порядка строиp
лись как п. ф. э. 3 : три уровня (–1, 0, +1); при записи матрицы плана
можно в первом столбце чередовать по очереди эти уровни, во втором – 3 раза «–1», 3 раза «0», 3 раза «+1», в третьем – каждое значение
повторяется по 9 раз и т.д. Для примера приведу матрицу п. ф. э. 32:
2.4. Планирование эксперимента
93
x1
−
0
+
−
0
+
−
0
+
x2
−
−
−
0
0
0
+
+
+
(2.67)
В случае наличия двух факторов такой план очень удобен. При большем числе факторов быстро растет число опытов. Поэтому в середине
ХХ века Дж. Бокс разработал более компактные центральные композиционные планы 2-го порядка (ц. к. п.). Центральными их называют вследствие симметричности относительно центра плана (точки, в которой
значения всех кодированных факторов xi равны нулю), а композиционными потому, что они компонуются путем добавления определенного числа опытов к плану 1-го порядка. Поэтому если линейное уравнение плохо описывает объект, то не нужно ставить все опыты заново,
достаточно добавить несколько точек – достроить план.
Характер достройки показан на рис. 2.5 для двух факторов. К точкам п.ф.э. (ядру плана) добавляются точки в центре плана (центральные точки – одна или несколько параллельных) и точки, расположенные на всех осях координат на одинаковых расстояниях ±α от
центра (звездные точки). Величину α называют звездным плечом. Для
разных вариантов планов звездное плечо может быть разным.
Рис. 2.5. Расположение опытных точек в центральном
композиционном плане 2-го порядка
Глава 2. Элементы теории эксперимента
94
Для двух факторов матрица такого плана имеет вид:
x1
−
+
−
+
−α
+α
0
0
0
x2
−
−
+
+
0
0
−α
+α
0
(2.68)
Здесь первые четыре строки – ядро плана (п.ф.э. 22), следующие
четыре – звездные точки и девятая – центр плана. Аналогично строятся планы и при числе факторов больше 2.
Вопрос об оптимальности планов 2-го порядка сложен. В частности, в строгом смысле ортогональным такой план быть не может.
Лишь специальный подбор величины α и добавочное преобразование членов, содержащих квадраты, позволяют получить ортогональность и избавиться от взаимной корреляции коэффициентов
при квадратах факторов. Чаще всего, если полная независимость
факторов не очень существенна и допустима небольшая коррелированность квадратичных членов, можно рекомендовать выбирать
значение α = 1. Тогда, например, матрицы (2.67) и (2.68) опишут
один и тот же план экспериментов, различаясь лишь порядком записи строк.
Расчет параметров полиномов 2-й степени может проводиться
либо по общим алгоритмам метода наименьших квадратов либо по
специально выведенным формулам, которые можно найти в [24].
Проверка гипотез в планированном эксперименте. Обычно проверяют следующие гипотезы:
1) об однородности оценок дисперсии, полученных для разных
строк матрицы планирования;
2) о значимости коэффициентов регрессии;
3) об адекватности уравнения.
Однородность оценок дисперсии проверяют прежде всего потому,
что могут встретиться случаи, когда в разных частях пространства
факторов точность опытов – разная (например, если условия одного
из опытов близки к критической температуре жидкости, при которой резко усиливаются флуктуации свойств). Так как каждой строке
матрицы плана соответствует одинаковое число параллельных опытов, проверка проводится по критерию Кокрена, по формуле (2.32).
2.4. Планирование эксперимента
95
Если оценки дисперсии однородны, дисперсия воспроизводимости
находится усреднением, причем ввиду одинакового числа повторений формула (2.34) переходит в формулу среднего арифметического
n
s2 =
∑s
j =1
n
2
j
,
(2.69)
а число степеней свободы составит
f = n (m – 1),
(2.70)
где т — число параллельных опытов в строке; п — число строк матрицы плана.
При дальнейшей обработке, например расчете коэффициентов,
целесообразно подставлять в формулу (2.61) и другие расчетные
формулы вместо уi средние арифметические y , полученные в каждой строке. Тогда дисперсия величины y в соответствии с уравнением (2.22) составит
s2 ( y ) =
s 2 ( y)
.
m
(2.71)
Если план – ортогональный, то гипотеза о значимости коэффициентов регрессии проверяется следующим образом. Рассчитывают
дисперсию коэффициента регрессии. Для факторных планов на двух
уровнях она равна
s 2 (bi ) =
s2 ( y )
.
n
(2.72)
Затем находят доверительный интервал для коэффициента δ (bi ) –
тот интервал, в пределах которого коэффициент, в действительности
равный нулю, может отклониться от истинного значения с заданной
малой вероятностью:
δ (bi ) = t s 2 (bi ) ,
(2.73)
где t находят по таблицам критерия Стьюдента для выбранного уровня значимости. Если для какого-либо коэффициента окажется, что
(2.74)
bi < δ (bi ) ,
то данный член можно считать незначимым и исключить из уравнения регрессии.
Наконец, гипотезу адекватности проверяют следующим образом.
Для каждой j-й строки матрицы плана по формуле (2.40) вычисляют
расчетное значение y j . Предварительно из уравнения регрессии вычеркивают незначимые члены. Затем находят разности y j − y j , называемые остатками, и остаточную дисперсию
Глава 2. Элементы теории эксперимента
96
n
2
sост
=
∑(y
j
− y j ) 2
j =1
f
,
(2.75)
где
f=n – p ,
(2.76)
п — число строк матрицы плана; р – число значимых коэффициентов регрессии. Чем меньше р, тем больше f – в этом одна из целей,
достигаемых при исключении незначимых членов.
Проверку адекватности проводят по критерию Фишера
F=
2
sост
.
s2 ( y )
(2.77)
Если уравнение неадекватно, переходят к более сложной модели
(например, повышают степень многочлена), для чего обычно требуется постановка добавочных опытов. Например, если неадекватна
модель 1-го порядка, то, воспользовавшись свойством композиционности, достраивают план до плана 2-го порядка. Иногда можно
обойтись без дополнительного эксперимента, если соответствующим образом преобразовать переменные у или х [24].
При использовании центральных композиционных планов 2-го
порядка гипотеза о значимости линейных членов и членов, содержащих произведения факторов, проверяется почти так же, как в случае факторного эксперимента: легко увидеть, что каждый из соответствующих столбцов матрицы плана ортогонален всем остальным.
Однако столбцы, соответствующие квадратам факторов, коррелированны между собой и со столбцом х0. Лишь в отдельных случаях специальным подбором звездного плеча и особыми преобразованиями
удается получить ортогональные планы 2-го порядка [6]. Но обычно
проверка значимости включена в компьютерные программы обработки данных таких экспериментов.
Интерпретация уравнений регрессии – важнейший этап моделирования процессов при использовании планирования эксперимента.
Интерпретация включает анализ прежде всего влияния отдельных
факторов и их взаимодействий, а затем – особенностей поведения
функции отклика в различных частях изученной области факторного пространства. Влияние факторов проще всего анализировать по
уравнению 1-й степени. Здесь вначале оценивается знак коэффициента регрессии, показывающий, в какую сторону – увеличения или
уменьшения – влияет на отклик данный фактор.
2.4. Планирование эксперимента
97
Планированный эксперимент позволяет также сопоставить силу
влияния отдельных факторов. В обычных уравнениях регрессии значение одного коэффициента трудно сопоставлять со значением другого. Факторы (а соответственно, и коэффициенты регрессии) суть
величины размерные, и нельзя сказать, что, например, больше: 1 м
или 0,001 кг. В планированном эксперименте факторы приведены
к безразмерному кодированному виду; в этом виде каждый из них
варьируется в одинаковых пределах: от –1 до +1. Поэтому можно
считать, что сила влияния фактора пропорциональна модулю соответствующего коэффициента регрессии.
Пример 2.29. При исследовании синтеза красителя варьировали три фактора: х1 – концентрация основного реагента, х2 – температура, х3 – время
синтеза. Отклик у – выход продукта. Опыты проведены по плану д. ф. э. 23-1.
Полученное уравнение регрессии имеет вид
y = 0,330 – 0,076х1 + 0,1785х2 + 0,0275х3.
Уравнение показывает, что сильнее всего на выход продукта влияет температура. При ее повышении выход продукта существенно растет.
Увеличение концентрации реагента в исследованном диапазоне влияет отрицательно, но это влияние в 2,3 раза слабее, чем влияние второго фактора.
Время синтеза в данном случае влияет слабо – в 6,5 раз слабее, чем температура.
Интерпретация взаимодействий рассмотрена выше, при обсуждении появления в уравнениях регрессии членов, содержащих произведения факторов. Отмечу лишь два достаточно часто встречающихся случая. Первый – когда коэффициенты bj , bk и bjk имеют
одинаковые знаки, второй – когда знаки у bj и bk одинаковы, а bjk
имеет другой знак. В первом случае эффект от совместного увеличения или уменьшения обоих факторов превышает сумму эффектов от
каждого из факторов (зачастую это обозначают как синергизм влияний факторов); во втором случае совместное действие двух факторов
слабее, чем следовало бы из суммирования их эффектов, а иногда
даже имеет противоположный знак (антагонизм влияний).
Пример 2.30. Изучено влияние компонентов А и В на активность катализатора. Получено уравнение регрессии, в котором x1 – доля А в композиции;
x2 – доля В (обе величины – в кодированных единицах); у – относительная
активность катализатора. Оказалось, что коэффициент b2 незначим; уравнение имеет вид
y = 58,6 + 19,8х1 + 10,4х1х2.
Его можно интерпретировать так. Вещество А – активный компонент катализатора. Добавление его в смесь резко увеличивает активность. Вещество
В – промотор. Само по себе, отдельно от А, оно активностью не обладает, но
его добавление существенно повышает общую активность.
Глава 2. Элементы теории эксперимента
98
Пример 2.31. Синтезированы два лекарственных препарата против вирусного заболевания. Их влияние изучено на подопытных животных. Факторы
x1 и х2 – употребление первого и второго лекарств при совместном их применении, при этом уровень «–1» для того и другого лекарства означает, что
данный препарат животному в этом опыте не дается, уровень «+1» – что ему
дается стандартная доза. Отклик – среднее число дней от начала лечения до
выздоровления.
Уравнение регрессии в данном случае имеет вид
y = 6,4 – 2,1х1 – 1,8х2 + 4,2х1х2.
Ясно, что лекарства плохо совместимы, их одновременное применение
нецелесообразно. Если использование первого лекарства привело к выздоровлению (в среднем) за 1,9 дня, второго – за 2,5 дня, то при одновременном
приеме обоих лекарств выздоровление наступило через 6,7 дня.
Если адекватно уравнение, полученное по результатам факторного эксперимента на двух уровнях (безразлично, линейное или содержащее взаимодействия факторов), то наибольшее и наименьшее
в изученной области значения отклика, предсказываемые уравнением, лежат в каких-либо из точек п.ф.э. В тех случаях, когда экспериментатора интересует максимум или минимум отклика (максимум
выхода или прочности, минимум загрязнений или затрат и т. д.), соответствующая точка окажется наилучшей для рассматриваемой области. Дальнейшее продвижение из области эксперимента в сторону
оптимума описано в разд. 7.4.
Если объект описывается уравнением 2-й степени, то чаще всего нас интересует либо положение экстремума, либо общий характер зависимости, или же уравнение регрессии нужно нам лишь как
фрагмент, который будет включен в более сложную математическую
модель. В первом и втором случаях, при небольшом числе факторов
(2 – 4), интерпретации может помочь построение линий уровня отклика, аналогичных горизонталям географической карты. Для функции 2-го порядка от двух факторов основные возможные случаи показаны на рис.2.6 (пределы изменения х1 и x2 от –1 до +1)
а
б
Рис. 2.6. Характерные варианты линий уровня
для поверхностей 2-го порядка
в
2.4. Планирование эксперимента
99
На рис. 2.6,а изображена ситуация, когда экстремум лежит в области эксперимента. Из уравнения можно найти точку оптимума, а
график помогает оценить поведение отклика вблизи нее: например,
насколько можно отклониться от оптимальных значений х1 и x2, не
опасаясь сильного уменьшения значения отклика. На рис. 2.6,б экстремум (максимум) далек от области эксперимента, отклик повышается при движении в сторону увеличения х1 и уменьшения x2. В эту
сторону и нужно двигаться, если нам нужен максимум (см. разд. 7.4).
Рисунок 2.6,в соответствует случаю, когда экстремума на поверхности нет, а есть седло – точка, двигаясь от которой в любом направлении вдоль одной прямой (на рисунке вдоль оси х1) будем наблюдать возрастание отклика, а двигаясь вдоль другой прямой (на
рисунке вдоль оси x2) – его убывание.
Если факторов больше двух, то графики, аналогичные приведенным на рис. 2.6, можно построить, рассмотрев сечения области эксперимента плоскостями, параллельными осям координат. Например,
при четырех факторах можно задать определенные значения х1 и x2
(скажем, х1 = 0; х2 = 0) и рассмотреть при этом условии зависимость
у от х3 и x4. Затем можно перейти к другим сечениям: либо к другим
значениям тех же факторов (сечение, параллельное предыдущему),
либо задать значения другой пары факторов.
Методы анализа при большом числе факторов рассмотрены в [6,
24]. Иногда особый интерес могут представить уравнения 2-й степени, содержащие дополнительные члены – взаимодействия высоких порядков (тройные, четверные и т. д.). По ним удается выделить
переходные области пространства факторов, в которых меняется
характер зависимости, например в связи с изменением механизма
процесса [24].
Пример 2.32. В лабораторных условиях исследуется синтез полимера.
Синтез проводится в растворе. Изучается влияние трех факторов: u1 – концентрации мономера, %; u2 – концентрации инициатора полимеризации, %;
u3 – температуры, К. Отклик y – выход фракции полимера, имеющего цепи,
длина которых лежит в заданном диапазоне. Исходя из данных проводившихся ранее аналогичных синтезов намечены следующие условия опытов
(см. таблицу).
Фактор
u1
u2
u3
ui0
24
0,2
353
δi
4
0,05
10
Для опытов выбран план п.ф.э. 23. Для оценки воспроизводимости в каждой точке плана (каждой строке матрицы) проведено по два опыта, результаты которых обозначены у1 и у2. Опыты рандомизованы, но в представленной
матрице записаны по порядку.
Глава 2. Элементы теории эксперимента
100
Приведем расширенную матрицу плана, содержащую все столбцы взаимодействий факторов. К ней добавлены столбцы у1, у2, столбец y средних
2
по каждой строке, а также столбец s j оценок дисперсии для тех же строк,
каждая из которых получена по результатам двух опытов; соответствующее
число степеней свободы f = 1 :
y
s2
x0
x1
x2
x3
x1 x2
x1 x3
x2 x3
x1 x2 x3
y1
y2
+
+
+
+
+
+
+
+
−
+
−
+
−
+
−
+
−
−
+
+
−
−
+
+
−
−
−
−
+
+
+
+
+
−
−
+
+
−
−
+
+
−
+
−
−
+
−
+
+
+
−
−
−
−
+
+
−
+
+
−
+
−
−
+
63
44
54
45
54
45
51
42
61 62
2
48 46
8
55 54,5 0,5
47 46
2
54 54
0
43 44
2
53 52
2
43 42,5 0,5
Обработку начнем с проверки однородности оценок дисперсий, поскольку лишь при однородных оценках остальная обработка окажется корректной. Рассчитаем G (наибольшая оценка – во второй строке):
8
G=
= 0, 471 .
2 + 8 + 0,5 + 2 + 0 + 2 + 2 + 0,5
Критическое значение Gкр = 0,680 (N = 8, f = 1, α = 0,05). Полученное значение меньше критического, поэтому можно принять гипотезу однородности. Рассчитаем усредненную оценку дисперсии воспроизводимости (f = 8):
s2
2 + 8 + 0,5 + 2 + 0 + 2 + 2 + 0,5
2
= 2,125 ; s ( y ) = = 1, 062 .
2
8
Теперь можно перейти к расчету коэффициентов регрессии по формуле
(2.61), подставляя в нее средние по каждой строке:
s2 =
b0 =
62 + 46 + 54,5 + 46 + 54 + 44 + 52 + 42,5
= 50,125 ;
8
b1 =
− 62 + 46 − 54,5 + 46 − 54 + 44 − 52 + 42,5
= − 5,5 ;
8
.....................................................................................
b123 =
− 62 + 46 − 54,5 + 46 + 54 − 44 + 52 − 42,5
= − 0,875 .
8
Расчет дает: b0 = 50,125; b1 = –5,5; b2 = –1,375; b3 = –2,00; b12 = +1,00;
b13 = +0,625; b23 = +0,5; b123 = –0,875 или уравнение
y = 50,125 − 5,5 x1 − 1,375 x2 − 2 x3 + x1 x2 + 0, 625 x1 x3 + 0,5 x2 x3 − 0,875 x1 x2 x3 .
2.4. Планирование эксперимента
101
Это уравнение не позволяет проверить гипотезу об адекватности, потому
что число коэффициентов в нем равно числу строк матрицы плана. Число
степеней свободы равно нулю. К тому же интерпретация уравнения – оценка характера влияния факторов – будет недостаточно надежной, если не
исключить незначимые члены. Поэтому следующим этапом анализа будет
проверка гипотезы о значимости коэффициентов регрессии. Рассчитаем
дисперсию коэффициентов по формуле (2.72):
s 2 (bi ) = 1,062 / 8 = 0,1327;
δ (bi ) = 2,31 0,1327 = 0,841 ,
(2.78)
где 2,31 – значение коэффициента Стьюдента при α = 0,05 и f = 8. Таким образом, коэффициенты регрессии, абсолютная величина которых меньше
0,841, можно считать незначимыми. Можно исключить из уравнения члены,
содержащие х1х3 и х2х3. Благодаря ортогональности плана остальные члены
не изменятся:
y = 50,125 − 5,5 x1 − 1,375 x2 − 2 x3 + x1 x2 − 0,875 x1 x2 x3 .
(2.79)
Наличие тройного взаимодействия сильно усложняет модель и затрудняет интерпретацию. К тому же величина b123 близка к границе доверительного
интервала: если бы мы приняли уровень значимости не 0,05, а 0,04, то сочли бы этот коэффициент тоже незначимым. При этом обратим внимание
на то, что выбор значения α = 0,05 не имеет серьезного теоретического обоснования, он обусловлен лишь нашей привязанностью к круглым числам.
Поэтому при проверке адекватности, наряду с вышеприведенным, проверим также уравнение без последнего члена:
y = 50,125 − 5,5 x1 − 1,375 x2 − 2 x3 + x1 x2 .
(2.80)
Вначале проверим адекватность уравнения (2.79) со всеми значащими
членами. Для каждой строки матрицы рассчитаем y и остаток y j − y j (j –
номер строки):
j
yj
y j
y j − y j
1
2
3
4
5
6
7
8
62
46
54,5
46
54
44
52
42,5
60,875 46,125 54,375 47,125 55,125 43,875 52,125 41,375
+1,125 −0,125 +0,125 −1,125 −1,125 +0,125 −0,125 +1,125
2
Число степеней свободы 8 – 6 = 2. По формуле (2.75) находим sост =2,56.
Выше было получено s2( y )=1,062 при числе степеней свободы 8. Отсюда находим
F = 2,56/1,062 = 2,41.
Уравнение адекватно не только на уровне значимости 0,05 (Fкр = 4,46), но
и на уровне 0,1 (Fкр = 3,14).
Теперь проверим адекватность уравнения (2.80) с исключенным тройным
взаимодействием. Число степеней свободы при оценке остаточной дисперсии возрастет, так как оцененных параметров станет при этом на один
2
меньше: f = 3. Проведем расчет sост по той же схеме, в результате чего полу2
2
чим sост =4,08 (обратите внимание: при расчете sост знаменатель в формуле
Глава 2. Элементы теории эксперимента
102
(2.75) в 1,5 раза больше, чем в предыдущем расчете, что является следствием
увеличения f ). Тогда
F = 4,08/1,062 = 3,84.
Критическое значение Fкр при α = 0,05 равно 4,07. Уравнение адекватно.
Таким образом, хотя при анализе влияния факторов на ход синтеза можно учитывать тройное их взаимодействие, но пренебрежение им снижает
точность описания не очень сильно. Для расчетов и предварительной интерпретации можно пользоваться уравнением, которое не учитывает это
взаимодействие.
Интерпретируя уравнение регрессии, отметим следующее. Коэффициенты b1, b2 и b3 отрицательны. Это говорит о том, что были выбраны завышенные значения факторов. Их снижение ведет к улучшению результатов.
Положительное значение b12 может означать следующее. В кодированных
единицах произведение x1x2 = +1 тогда, когда либо оба фактора принимают верхнее значение, либо оба находятся на нижнем уровне. В тех случаях,
когда один фактор – на верхнем, а другой — на нижнем уровне, x1x2 = –1.
Поэтому знак при b12 можно трактовать как указание на верно найденное
соотношение инициатора к мономеру; с уменьшением концентрации мономера следует уменьшить и количество инициатора, тогда результат окажется
лучше, чем сумма эффектов от изменения обоих факторов.
В рассматриваемом примере на ход синтеза сильнее всего влияет концентрация мономера: существеннее всего мы повысим выход, разбавляя
раствор. Следующими по силе будут влияния температуры, затем концентрации инициатора и взаимодействия концентраций (пропорция мономер :
инициатор, о которой говорилось выше). Слабее всего, уже близко к пределу
значимости, будет влияние сложного взаимодействия x1x2x3.
В заключение рассмотрим вопрос о привлечении к проверке адекватности данных, полученных в центре плана (в центре области эксперимента).
Допустим, что к приведенным выше опытам добавлены еще два:
x1
0
x2
0
x3
0
y1 y2
y
y
y − y
50 49 49,5 50,125 −0, 625
Здесь y = b0. Действительно, если x1 = x2 = x3 = 0, то все члены уравнения,
кроме свободного, равны нулю. Если в расчет дисперсии воспроизводимости добавить еще дисперсию в данной точке (s2 = 0,5), а в расчет остаточной дисперсии включить еще один остаток, равный –0,625, увеличив при
этом число степеней свободы и для той, и для другой оценки дисперсии на
единицу, то получим (для случая уравнения без тройного взаимодействия):
2
sост
= 3,16; s2( y ) = 0,972; F = 3,16/0,972 = 3,25. При α = 0,05, f1 = 4, f2 = 9,
Fкр = 3,63. Таким образом, добавление центральной точки при увеличении
числа степеней свободы подтвердило адекватность уравнения регрессии.
Но могли быть и иные результаты:
x1
0
x2
0
x3 y1 y2 y
y
y − y
0 57 55 56 50,125 +5,875
2.4. Планирование эксперимента
103
2
В этом случае уже оказывается, что sост = 13,75; s ( y ) = 1,055; F = 13,0 и
уравнение резко неадекватно. Ситуация, при которой уравнение, показавшее адекватность во всех точках плана 1-го порядка, оказывается неадекватным в центре плана, что обычно связано с влиянием членов, содержащих
xi2 . Это означает, что план следует достроить до плана 2-го порядка.
2
Другие постановки задач планирования эксперимента. Задачи
планирования эксперимента чрезвычайно многообразны; в этой
книге нет возможности рассмотреть их сколько-нибудь подробно.
Ограничусь кратким обзором постановок задач с указанием литературных источников, в которых эти задачи рассмотрены.
Подробное изложение вопросов, освещенных в этом разделе, имеется в [6, 24].
Близки к рассмотренным, но специфичны по математическому
аппарату задачи описания свойств многокомпонентных смесей. В этом
случае факторы, от которых зависит свойство, – это доли компонентов в смеси. Особенность таких задач заключается в условии: сумма
долей всех компонентов равна 1 (100%), т.е.
∑x
t
=1.
(2.81)
Это условие налагает связь на значения xi , что в обычном случае
приводит к вырождению матрицы нормальных уравнений. Для преодоления вырождения приходится применять специальные приемы.
Эти вопросы излагаются в [6, 25].
Весьма сложны вопросы планирования эксперимента в задачах
нелинейного оценивания. Здесь план эксперимента приходится
строить каждый раз применительно к каждой конкретной задаче,
причем обычно это построение – нетривиальная математическая и
расчетная задача, которую, как правило, приходится решать на компьютере. Для ознакомления с проблемой можно рекомендовать книги [8, 21].
Сильно отличается постановка задач для случая качественных
факторов. Выше предполагалось, что факторы – это величины,
имеющие определенные численные значения, для которых имеют
смысл такие понятия, как больше, меньше, промежуточное значение и т. д. Но на интересующие нас объекты могут действовать
и такие факторы, которым не удается присвоить физически ясную
количественную меру. Примером может служить такой важный фактор, влияющий на ход химической реакции, как вид катализатора.
Можно сказать, что в одном случае этот фактор «примет значение»
платина, в другом – никель, в третьем – железо, но у нас нет никаких
серьезных оснований считать одно из этих «значений» наибольшим,
104
Глава 2. Элементы теории эксперимента
другое – наименьшим, а третье – промежуточным. После исследования можно будет сказать, что один катализатор более активен, чем
другой, но тогда количественная мера относится уже не к фактору,
а к отклику: активность – это результат эксперимента, а не значение
фактора.
Другой качественный фактор – человек, проводящий эксперимент. При планировании эксперимента часто имеет смысл исследовать, как влияет индивидуальность экспериментатора на ход процесса. Однако заранее утверждать, что сотрудник А как фактор больше,
чем Б, а В – еще больше, бессмысленно: вряд ли имеют отношение
к данной задаче такие количественные характеристики, как возраст,
стаж или оклад сотрудника.
Эксперимент с качественными факторами опирается на особый
раздел статистики – дисперсионный анализ и использует большое число специфических планов эксперимента. Рассмотрению планирования эксперимента с качественными факторами посвящены книги
[26, 27].
Особая отрасль – планирование промышленных экспериментов, при
котором опыты проводят непосредственно на промышленных установках, стремясь добиться улучшения показателей их работы. Здесь
возникает много проблем, связанных с недопустимостью нарушения
регламента, высоким уровнем шума в производственных условиях,
развитием процессов во времени. Для ознакомления с этим вопросом можно рекомендовать книгу [28].
ГЛАВА 3.
МАТЕМАТИЧЕСКОЕ ОПИСАНИЕ
ХИМИЧЕСКИХ РЕАКЦИЙ
3.1. Стехиометрия и равновесие химических реакций
Анализ протекания химической реакции начинается с анализа ее
стехиометрии, и если реакция обратима, далее необходимо установить, к какому состоянию равновесия она будет стремиться. Я не буду
описывать методы расчета констант равновесия по термодинамическим данным – эти вопросы в достаточной полноте освещаются
в курсе физической химии [10]. Затрону лишь подходы к анализу
равновесия сложных реакций.
Стехиометрия. Многие химики считают: стехиометрия – это
нечто настолько простое, что не заслуживает серьезного внимания.
Правда, обычно где-то на краю сознания есть небольшая тень – воспоминание о былых мучениях, связанных с уравниванием коэффициентов в окислительно-восстановительных реакциях. Но мучения
забываются, а о том, что со стехиометрией может быть связан большой круг проблем, что для решения этих проблем приходится применять достаточно развернутый математический аппарат, большинство не догадывается.
Начну с краткой характеристики типичных задач, требующих подробного исследования стехиометрии. Две основные группы таких задач: анализ линейной зависимости (или независимости) стадий сложных реакций и установление связей между количествами ключевых и
неключевых веществ. Проиллюстрирую простыми примерами задачи
обоих типов, а затем перейду к более детальному их рассмотрению.
Линейно зависимые и независимые стадии. Рассмотрим реакцию:
С + О2 = СО2,
(3.1)
С + СО2 = 2СО,
(3.2)
2С + О2 = 2СО.
(3.3)
106
Глава 3. Математическое описание химических реакций
Легко заметить, что стадия (3.3) может быть представлена как
сумма (3.1) и (3.2): если мы формально сложим первое уравнение со
вторым и приведем подобные, т.е. взаимно уничтожим символы СО2
в левой и правой частях, то получим уравнение (3.3). Говоря языком
алгебры, третья строка является линейной комбинацией первых двух
(сумма – простейший, хотя не единственный, случай линейных комбинаций).
Возникают три вопроса:
1. Вправе ли мы обращаться со стехиометрическими уравнениями
(уравнениями реакций) так, будто формулы веществ – это алгебраические величины, т.е. складывать, вычитать, переносить из одной
части в другую?
2. Что означает случай, когда все стадии независимы? А когда есть
линейно зависимые стадии? Играют ли они в реакции иную роль,
чем независимые?
3. Для чего нам нужно выяснять, зависимы стадии или нет?
Ответы на эти вопросы достаточно просты.
1. Стехиометрическое уравнение реакции имеет ясный количественный смысл. Скажем, (3.1) означает, что с одним атомом С реагирует только одна молекула О2 и при этом образуется одна молекула
СО2. За каждым символом вещества стоит совершенно определенное
количественное содержание; конечно, можно рассматривать не один
атом С, а сто, 1023, 1030, …, но каждый раз количество как второго реагента, так и продукта окажется определенным однозначно. Поэтому
обращение с формулами веществ как с величинами корректно. Это
важное свойство стехиометрических уравнений назовем алгебраичностью*.
2. Линейная зависимость или независимость ничего не говорит
о реальном механизме реакции. В одних случаях линейно независимая схема отвечает действительному ходу процесса, в других – процесс содержит и линейно зависимые стадии. Например, любая обратная реакция линейно зависит от прямой (равна ей, умноженной
на –1). Но по этой математической зависимости нельзя установить,
обратима ли та или другая реакция. К тому же бессмысленной будет
постановка вопроса: какая именно стадия линейно зависима? В рассматриваемой реакции окисления углерода можно считать независимой любую пару уравнений – (3.1) и (3.2), (3.1) и (3.3) или (3.2) и
(3.3). Каждый такой набор математически корректен и при каждом
выборе третья из стадий линейно зависима.
* Мне не встречался в литературе термин «алгебраичность». Возможно он
используется только здесь. Но он удобен, и я буду им пользоваться.
3.1. Стехиометрия и равновесие химических реакций
107
3. Линейная независимость стадий важна при решении задач химического равновесия в сложных (многостадийных) реакциях. Здесь
линейно независимой системе стадий соответствует достаточный для
описания и расчета набор констант равновесия. А для любой линейно зависимой стадии константа может быть получена как функция
констант этого набора. Например, для реакций (3.1) – (3.3) имеем
К3 = К1 · К2.
Ключевые и неключевые вещества. Еще раз рассмотрим реакции
(3.1) – (3.3). Пусть вначале в системе содержался 1 моль С и 1 моль
О2, оксидов не было. И пусть в некоторый момент установлено, что
в системе находятся 0,1 моль С и 0,1 моль СО. Можно ли, исходя
только из этих данных, рассчитать для того же момента количества
непрореагировавшего О2 и образовавшегося СО2? Оказывается,
можно. Простой ход рассуждений таков. В реакцию вступило
1 – 0,1 = 0,9 моль С. Из него на образование СО затрачено 0,1 моль.
Значит, на образование СО2 пошло 0,8 моль; количество диоксида
в данный момент равно тоже 0,8 моль. Расход молекул О2 на образование СО равен 0,1/2 = 0,05 моль, а на образование СО2 – 0,8
моль. Всего затрачено 0,85 моль О2, осталось 1 – 0,85 = 0,15 моль О2.
Мы рассчитали: в заданный момент в системе есть 0,8 моль СО2 и
0,15 моль О2.
Те вещества, количества которых в данный момент заданы, называют ключевыми, а те, количества которых мы рассчитываем, – неключевыми. Заметим, что для начального момента должны быть известны количества и тех, и других веществ.
Здесь так же, как и для предыдущей группы задач, следует ответить на ряд вопросов.
1. Отличаются ли друг от друга ключевые и неключевые вещества
по их роли в данной реакции? Любое ли из веществ может попасть
как в ту, так и в другую группу?
2. Как выяснить, достаточен ли имеющийся набор ключевых веществ и нет ли в нем избытка веществ, отсутствие данных о которых
для текущего момента не воспрепятствует решению?
3. Для чего нужны подобные задачи?
Ответы таковы.
1. Любое из веществ, участвующих в реакции, может выступать
в роли и ключевого, и неключевого. Чаще всего ключевыми оказываются те вещества, количества (или концентрации) которых проще
измерить.
2. Задача определения необходимого и достаточного набора ключевых веществ требует специальных рассуждений, которые проводятся дальше.
108
Глава 3. Математическое описание химических реакций
3. Есть две основные ситуации, в которых желательно отнести
часть веществ к неключевым. Это, во-первых, обстановка эксперимента или контроля производства. Определять количества (или
концентрации) каких веществ не обязательно? Во-вторых, это этап
записи и решения уравнений математического описания процесса.
Выше уже говорилось и в дальнейшем будет разобрано подробно,
что в основе большинства этих уравнений лежат балансы по отдельным веществам. Число таких уравнений равно числу веществ,
причем они могут оказаться достаточно сложными (нелинейными,
дифференциальными), поэтому целесообразно уменьшить их число. Этого можно добиться, записывая и решая уравнения только для
ключевых веществ, а количества остальных веществ рассчитывать
через ключевые.
Теперь перейдем к более подробному анализу названных проблем.
Стехиометрическая матрица. В дальнейшем будем пользоваться, наряду со стандартными записями реакций, такими обозначениями: А, В, С, … или А1, А2, А3, … – символы веществ; а1, а2, а3, … – соответствующие стехиометрические коэффициенты.
Вернемся к реакциям (3.1) – (3.3). Сейчас каждое из этих уравнений рассматривается как стадия единой сложной реакции. В соответствии с алгебраичностью уравнений мы вправе перенести все
члены уравнений в одну сторону:
– С – О2 + СО2 = 0,
– С – СО2 + 2СО = 0,
(3.4)
– 2С – О2 + 2СО =0.
В системе (3.4) знаки выбраны так: если какое-то вещество J на
данной стадии расходуется, его стехиометрический коэффициент
aJ < 0; если J образуется, aJ > 0; если J не участвует в стехиометрии
данной стадии, то aJ = 0. Это правило знаков будем широко использовать в дальнейшем изложении.
Система уравнений (3.4) – это система однородных уравнений 1-й
степени (однородные уравнения – такие, у которых свободные члены равны нулю). Такая система может быть полностью охарактеризована матрицей коэффициентов:
⎛ a11
⎜a
21
a=⎜
⎜ ...
⎜⎝ a
m1
a12
a22
...
am 2
... a1n ⎞
... a2 n ⎟
⎟.
... ... ⎟
... amn ⎟⎠
(3.5)
3.1. Стехиометрия и равновесие химических реакций
109
Здесь n – общее число веществ; m – число стадий реакции; aij –
стехиометрический коэффициент j-го вещества в i-й стадии с учетом
правила знаков. Матрицу a называют стехиометрической. Например,
для системы (3.4) стехиометрическая матрица такова:
⎛ −1 −1 0 +1⎞
a = ⎜ −1 0 +2 −1⎟ ,
⎜
⎟
⎝ −2 −1 +2 0 ⎠
(3.6)
если порядок нумерации веществ С, О2, СО, СО2.
Очень кратко вспомним некоторые определения алгебры матриц. Матрица размера m × n – прямоугольная таблица (m строк и n
столбцов), составленная из чисел или алгебраических выражений aij,
называемых элементами матрицы. Квадратная матрица n × n – это
матрица, в которой число строк равно числу столбцов. Для нее число n называют порядком матрицы. Подматрица матрицы – это такая
матрица, которая получается из данной путем вычеркивания любого
числа столбцов и любого числа строк. Определитель (детерминант)
квадратной матрицы, элементы которой числа, – это число, получаемое из элементов по определенному правилу, которое здесь не
приводится из-за громоздкости. Если определитель равен нулю, то
матрицу называют вырожденной (особенной), если не равен, – то невырожденной (неособенной).
Ранг матрицы. Рассмотрим все возможные квадратные подматрицы порядка l некоторой матрицы а размера m × n (рассматриваются
любые целые положительные l, удовлетворяющие условию l ≤ m и
l ≤ n). Некоторые из этих подматриц окажутся вырожденными, другие – невырожденными. Найдем наибольший порядок lмакс, для которого существует хотя бы одна невырожденная подматрица. Этот
порядок называют рангом матрицы а и обозначают r g a:
r g a = lмакс.
(3.7)
Ранг матрицы и число линейно независимых строк (столбцов). Если
m ≤ n и r g a = m, то все m строк матрицы линейно независимы. Если
r g a < m, то среди строк имеется (m – r g a) линейно зависимых. Точно
так же если n ≤ m и r g a = n, то линейно независимы все столбцы, а
если r g a < n, то в матрице имеются линейно зависимые столбцы.
В частности, отсюда следует, что для того, чтобы система реакций была линейно независимой, необходимо, чтобы число строк
(стадий) не превышало числа столбцов (веществ). Более подробное
рассмотрение показывает, что необходимое условие линейной независимости стадий еще жестче:
m < n.
(3.8)
110
Глава 3. Математическое описание химических реакций
В линейно независимой системе число реакций всегда меньше
числа веществ, участвующих в ней как исходные (реагенты) и как
продукты.
Расчет ранга матрицы при количестве строк более двух – процедура достаточно громоздкая, и, как правило, ее проводят на компьютере. Однако во многих задачах рассматриваемого типа удается
выделить систему линейно независимых стадий реакции исходя из
нескольких достаточно простых правил. Но прежде желательно рассмотреть еще некоторые относящиеся к данной теме вопросы.
Атомная матрица. Квазиатомы. Удобным инструментом при
анализе стехиометрии является атомная матрица
⎛ h11
⎜h
21
h=⎜
⎜ ...
⎜⎝ h
n1
h12
h22
...
hn 2
... h1s ⎞
... h2 s ⎟
⎟.
... ... ⎟
... hns ⎟⎠
(3.9)
Строки этой матрицы соответствуют веществам, участвующим
в реакции, а столбцы – атомам, из которых состоят эти вещества.
Элемент hpq матрицы – количество атомов данного сорта q в молекуле (или формульной единице) вещества Ap; n – общее число веществ;
s – количество сортов атомов, составляющих эти вещества. Так, для
реакции (3.1) – (3.3), если пронумеровать вещества в порядке С, О2,
СО, СО2, а атомы в порядке С, О, то
⎛1
⎜0
h=⎜
⎜1
⎜⎝ 1
0⎞
2⎟
⎟.
1⎟
2⎟⎠
(3.10)
Важная особенность атомных матриц – возможность в ряде случаев вводить в нее в качестве столбцов квазиатомы. Если какая-либо
группа атомов переходит из одних веществ в другие, нигде не изменяясь количественно, то такая группа может рассматриваться как
«атом», точнее квазиатом. Например, рассмотрим реакцию хлорирования бензола (реакция представлена упрощенно, без различения
изомеров ди- и трихлорбензола и без учета иных продуктов):
С6Н6 + Cl2 = C6H5Cl + HCl,
C6H5Cl + Cl2 = C6H4Cl2 + HCl,
(3.11)
C6H4Cl2 + Cl2 = C6H3Cl3 + HCl.
Пронумеруем вещества в порядке C6H6, C6H5Cl, C6H4Cl2, C6H3Cl3,
Cl2, HCl, а элементы в порядке возрастания атомных номеров. Тогда
атомная матрица будет иметь вид
3.1. Стехиометрия и равновесие химических реакций
⎛6
⎜5
⎜
⎜4
h1 = ⎜
3
⎜
⎜0
⎜
⎝1
6 0⎞
6 1⎟
⎟
6 2⎟
.
6 3⎟
⎟
0 2⎟
⎟
0 1⎠
111
(3.12)
Но можно обратить внимание на то, что бензольное кольцо во всех
стадиях не изменяется, и принять С6 в качестве квазиатома («атомы»
H, C6, Cl). Тогда получим матрицу
⎛6
⎜5
⎜
⎜4
h2 = ⎜
3
⎜
⎜0
⎜
⎝1
1
1
1
1
0
0
0⎞
1⎟
⎟
2⎟
.
3⎟
⎟
2⎟
⎟
1⎠
(3.13)
Матрицы (3.12) и (3.13) эквивалентны – одинаково хорошо описывают состав участников реакции (до тех пор, пока рассматривается именно эта реакция).
Важно еще вот что. Стехиометрия безразлична к строению молекул, участвующих в реакциях. Поэтому если какая-то группа атомов
изменяет характер своих связей, но количество атомов в ней остается
тем же самым, ее приходится считать одним и тем же квазиатомом.
Так, рассмотрим (тоже в упрощенном виде) фотохимическое хлорирование бензола – реакцию, в которой хлор не замещает водород, а
присоединяется по двойным связям, каждый раз изменяя строение
шестичленного кольца: сначала это бензол, затем последовательно
производные циклогексадиена, циклогексаена и, наконец, циклогексана:
C6H6 + Cl2 = C6H6Cl2,
C6H6Cl2 + Cl2 = C6H6Cl4,
(3.14)
C6H6Cl4 + Cl2 = C6H6Cl6.
Строение колец различно, но количественно они вместе с водородом одинаковы – С6Н6. Попробуем записать атомные матрицы
вначале через атомы, а потом с использованием квазиатома С6Н6.
В первом случае получим:
112
Глава 3. Математическое описание химических реакций
⎛6
⎜6
⎜
h3 = ⎜ 6
⎜6
⎜
⎜⎝ 0
а во втором –
⎛1
⎜1
⎜
h4 = ⎜ 1
⎜1
⎜
⎜⎝ 0
6 0⎞
6 2⎟
⎟
6 4⎟ ,
6 6⎟
⎟
0 2⎟⎠
(3.15)
0⎞
2⎟
⎟
4⎟ .
6⎟
⎟
2⎟⎠
(3.16)
Между матрицами (3.15) и (3.16) есть важное различие. Два
первых столбца матрицы h3 линейно зависимы, в нашем частном
случае они просто равны друг другу. Это объясняется как раз тем,
что группа атомов С6Н6 переходит из соединения в соединение,
меняя свое строение, но не изменяясь количественно. Матрица h4
эквивалентна случаю, когда мы вычеркнем в предыдущей матрице линейно зависимый столбец (первый или второй – безразлично). Ранг обеих матриц равен 2. Обращение к квазиатомам позволило сразу получить матрицу без линейно зависимых столбцов.
Разумеется, в более сложных случаях стoит вычислять ранг матрицы на компьютере.
Стехиометрическое правило Гиббса. Преобразованием стехиометрической и атомной матриц можно получить правило Гиббса:
r g a ≤ n – r g h,
где n – число веществ–участников реакции. Здесь знак «<» может
быть только в том маловероятном случае, когда в записи системы уравнений пропущена какая-то линейно независимая стадия.
В обычном случае правило Гиббса – это равенство:
r g a = n – r g h.
(3.17)
Например, для реакций (3.1) – (3.3) n = 4, ранг матрицы (3.10) равен 2; значит, r g a = 4 – 2 = 2 и две из стадий реакции линейно независимы. Для реакций (3.11) n = 6, r g h = 3; отсюда r g a = 6 – 3 =3 и все
три стадии линейно независимы.
Можно сформулировать два правила, позволяющих в неслишком
трудных случаях находить линейно независимые стадии сложных
реакций, не прибегая к формальному анализу. Процедура заключается в последовательном вычеркивании независимых стадий.
3.1. Стехиометрия и равновесие химических реакций
113
Правило 1. Если стехиометрический коэффициент какого-то вещества отличен от нуля только в одной из стадий, эта стадия независима и ее можно вычеркнуть.
Правило 2. После такого вычеркивания для оставшихся стадий
продолжает действовать правило 1. Вычеркивание продолжается либо до тех пор, пока не останется лишь одна стадия (она, разумеется,
будет независима), либо пока для немногих оставшихся стадий не
удастся установить линейную зависимость.
Пример 3.1. Рассмотрим реакцию, протекающую по сложной последовательно-параллельной схеме:
A + Q = B + H,
(a)
B + Q = C + H,
C + Q = D + H,
(б)
A + D = E.
(г)
(в)
Стадия (г) независима, так как только в ней участвует вещество Е.
Исключив ее из рассмотрения, для оставшихся стадий имеем: вещество А
участвует только в стадии (а), вещество D – только в стадии (в). Вычеркнем
эти строки – останется лишь стадия (б), значит, и она независима.
Разумеется, в более сложных случаях можно провести анализ через расчет ранга матрицы а.
Ключевые и неключевые вещества. Химическая переменная.
Рассмотрим формально одностадийную реакцию:
а1А1 + а2А2 + … +аnАn = 0.
(3.18)
Формально простой (формально одностадийной) будем называть
реакцию, стехиометрическое уравнение которой можно записать
«в одну строчку», в виде (3.18). На деле механизм реакции может
оказаться сложным, она может проходить через ряд промежуточных стадий, но запись (3.18) означает, что в нашем рассмотрении
их продукты не обнаруживаются (обычно из-за большой скорости
промежуточных стадий). При более прецизионном исследовании та
же реакция может предстать как сложная, однако сейчас ее можно
считать простой. Часто понятие «формально простая» еще расширяют, распространяя его и на обратимые реакции; но в данном случае
это не важно, потому что любая обратная реакция линейно зависит
от прямой. При этом (3.18) может быть и той реакцией, которая нас
интересует, и одной из стадий более сложной реакции.
Обратим внимание на следующее. Уравнение (3.18) означает, что
превращающиеся количества веществ пропорциональны их стехиометрическим коэффициентам. Поэтому для рассматриваемой одностадийной реакции (или стадии сложной реакции) отношение ко-
114
Глава 3. Математическое описание химических реакций
личества превратившегося вещества ∆g [моль] к стехиометрическому
коэффициенту – одно и то же для всех веществ, следует лишь учитывать знаки ∆g и а:
∆g1 / a1 = ∆g2 / a2 = … = ∆gn / an = ζ.
(3.19)
Величину ζ будем называть химической переменной. Если сложная
реакция состоит из нескольких стадий, то протекание каждой из
стадий характеризуется своей химической переменной, как правило, иной, чем переменные других стадий. (В различных источниках
ζ называют также степенью завершенности стадии, числом пробегов
стадии.)
Основанный на химических переменных расчет позволяет вычислить количества неключевых веществ по начальному составу и
известным количествам ключевых веществ. Однако, вопрос о том,
сколько ключевых веществ следует задать, при этом, как правило, заранее не решается. Приведем пример, в котором будем считать, что
реакция протекает гомогенно при постоянном объеме. Поэтому, рассмотрев единичный объем, можем считать, что количества веществ
равны их концентрациям.
Пример 3.2. Пусть схема реакции такова:
A + 2B = 2C,
A = 2D,
(3.20)
C = E + H,
D = 2F + H.
Начальные концентрации, моль/л: сА0 = 5; сВ0 = 6; продукты реакции в начале отсутствовали. В зафиксированный текущий момент сА = 1, сС = 2, сЕ = 2,
сН = 5. Требуется рассчитать для текущего момента концентрации cB, cD, cF .
Таким образом, A, C, E и Н – ключевые вещества; B, D и F – неключевые.
Начнем анализировать величины ∆g, или в данном случае ∆с, для ключевых веществ:
1) ∆сА = 1 – 5 = – 4. Но А расходуется в двух стадиях, поэтому пока перейдем к другим веществам;
2) ∆сС = 2 – 0 = 2; по-прежнему двинуться дальше не удается, поскольку
вещество С участвует тоже в двух стадиях;
3) ∆сЕ = 2 – 0 = 2. Отсюда для третьей стадии ζ3 = 2/1 = 2, тогда расход С
в этой стадии равен 2 · (–1) = –2, а образование Н равно 2 · (+1) = 2.
Так как общее образование Н равно 5, а в третьей стадии образовалось 2Н,
значит, в четвертой стадии образовалось 3Н. Отсюда ζ4 = 3/1 = 3; количество
израсходованного в этой стадии D равно – 3, а количество образовавшегося
при этом F составляет 3·2 = 6 (все расчеты – в моль/л).
Далее. Если к текущему моменту имеется 2 С, а еще 2 израсходовано
в стадии 3, то в стадии 1 образовалось 2 + 2 = 4 С. Отсюда ζ1 = 4/2 = 2, расходы А и В в этой стадии равны соответственно – 2 и – 4. Сразу можно найти
концентрацию В: 6 – 4 = 2.
3.1. Стехиометрия и равновесие химических реакций
115
Наконец, перейдем ко второй стадии. Если всего израсходовано 4А, а
в первой стадии – 2, то ∆сА2 = – 2 и ζ2 = 2, откуда образование D составило 4;
с учетом расходования D в четвертой стадии имеем сD = 1. Окончательно:
сВ = 2 моль/л; cD = 1 моль/л; сF = 6 моль/л.
Поскольку расчет удался, можно полагать, что ключевые вещества выбраны правильно. Однако из данного расчета не ясно, как их
выбрать. Существует иной подход к задачам данного типа, к нему и
перейдем.
Стехиометрические инварианты химических реакций. Рассмотрим формально одностадийную реакцию:
2 СН3Br + Mg = C2H6 + MgBr2.
(3.21)
В процессе реакции количества СH3Br и Mg все время убывают,
а количества C2H6 и MgBr2 возрастают. Но существуют комбинации
этих количеств, остающиеся неизменными (инвариантными). Эти
комбинации называют инвариантами реакции. Так, для реакции
(3.21) можно записать:
g CH Br + 2 g C H = inv1 ,
(3.22)
3
2
6
g Mg + g MgBr2 = inv2 ,
(3.23)
g CH3Br + 2 g MgBr2 = inv3 .
(3.24)
Нетрудно обнаружить физический смысл записанных выражений: inv1 – общее число молей квазиатомов СН3 в системе, которое,
разумеется, не меняется; точно так же inv2 – число молей атомов Mg,
а inv3 – атомов Br. Но и любая линейная комбинация этих величин,
например
inv1 − inv2
= g C2 H6 − g MgBr2 = inv4 ,
2
тоже будет инвариантом.
Важно то, что инварианты можно определить не только для одностадийных, но и для любых многостадийных реакций. Это делает их
удобным инструментом анализа материальных превращений в реакционных системах. В частности, отмечу следующее. Пусть в реакционной системе имеется n веществ и пусть мы найдем q линейно независимых инвариантов. Тогда система инвариантов представляет
собой q уравнений 1-й степени с независимыми левыми частями,
содержащих n неизвестных. В этой системе можно выбрать (n – q)
свободных переменных gкл, а оставшиеся q неизвестных gнекл будут найдены при заданных gкл как решение системы уравнений. Индексом
«кл» здесь обозначены ключевые вещества, а индексом «некл» – неключевые. Таким образом, число неключевых веществ равно числу
линейно независимых инвариантов q, а число ключевых равно n – q.
116
Глава 3. Математическое описание химических реакций
Подчеркну, что инварианты – это величины, имеющие для данных
условий совершенно определенные численные значения, не изменяющиеся по ходу реакции. В частности, в начальный момент их
значения те же, и если известен начальный состав системы, то исходя из него легко их вычислить. Например, уравнение (3.22) означает:
g CH3Br + 2 g C2 H6 = ( g CH3Br + 2 g C2 H6 )0 ,
где индекс «0» относится к начальным количествам веществ.
Линейно независимые инварианты. Выше было уже показано, что
любая линейная комбинация стехиометрических инвариантов есть
также стехиометрический инвариант. Таких комбинаций можно составить бесконечно много. Встает вопрос: а какое наибольшее число
q линейно независимых инвариантов можно записать для данной реакции? Ответ на этот вопрос таков: наибольшее число линейно независимых инвариантов равно рангу атомной матрицы:
q = r g h.
(3.25)
Наибольшее число неключевых веществ равно q, а число ключевых
nкл = n – nнекл = n – q = r g a.
(3.26)
Один из простейших способов построения системы линейно независимых инвариантов – тот, который без особых объяснений был
применен при записи системы (3.22) – (3.24): каждый инвариант получается как уравнение материального баланса по одному из атомов
или квазиатомов (по одному из столбцов атомной матрицы):
invr = Σ hprgp,
(3.27)
где суммирование ведется по столбцу r (по r-му атому); gp – количество вещества Ap.
Пример 3.3. Для реакции (3.14) атомная матрица имеет вид (3.16). Из нее
можно получить два инварианта – балансы по C6H6 и по Cl:
g C6 H6 + g C6 H6Cl2 + g C6 H6Cl4 + g C6 H6Cl6 = inv1 ,
2 g C6 H6Cl2 + 4 g C6 H6Cl4 + 6 g C6 H6Cl6 + 2 g Cl2 = inv2 .
Разумеется, второе уравнение имеет смысл сократить на 2. Таким образом, для данной системы можно выбрать два неключевых и три (5 – 2) ключевых вещества.
Пример 3.4. Реакция (3.20) в примере 3.2 записана не для конкретных
веществ, но формальный характер анализа позволяет построить атомную
матрицу и для нее. Несложно понять, что все участники реакции могут
быть составлены из трех квазиатомов: B, F и H. Атомная матрица имеет
вид:
3.1. Стехиометрия и равновесие химических реакций
117
B F H
A 0 4
2
B 1
0 0
C 1
2 1
D 0
2 1
E 1
2 0
F 0
1 0
H 0 0 1
На основе этой матрицы получаются три инварианта (обозначения
концентраций для краткости опущены, записаны только индексы веществ):
B + C + E = B0 + C0 + E 0 = 6,
⎧
⎪
⎨4A + 2C + 2D + 2E + F = 4A 0 + 2C0 + 2D0 + 2E 0 + F0 = 20,
⎪
2A + C + D + H = 2A 0 + C0 + D0 + H 0 = 10.
⎩
(3.28)
Решение этой системы дает те же результаты, которые получены в примере 3.2.
Пример 3.5. В заключение рассмотрим ход стехиометрического анализа
на примере реальной многостадийной реакции. Это реакция между С и SO2,
цель которой получить серу – более транспортабельный продукт, чем диоксид. Кроме С и SO2 в системе изначально содержится Н2О (углеродистый
материал содержит влагу). Все стадии реакции обратимы. В условиях процесса углерод находится в твердой фазе, все остальное – в газовой. Вначале
были записаны 14 возможных стадий с участием 13 веществ:
2SO2 + 4C = 4CO + S2,
(а)
2SO2 + 2C = 2CO2 + S2,
(б)
C + CO2 = 2CO,
(в)
SO2 + 2C = COS + CO,
(г)
2S2 = S4,
(д)
3S2 = S6,
(е)
4S2 = S8,
(ж)
H2O + C = H2 + CO,
(з)
H2O + CO = H2 + CО2,
(и)
2H2 + S2 = 2H2S,
(к)
S2 + C = CS2,
(л)
S2 + 2CO = 2COS,
(м)
CS2 + H2O = COS + H2S, (н)
2COS + C = CS2 + 2CO.
(о)
(3.29)
118
Глава 3. Математическое описание химических реакций
Атомная матрица не содержит квазиатомов, и столбцы ее пронумерованы
в порядке возрастания атомных номеров. Нумерация строк не приводится,
так как читатель легко это сделает сам:
⎛2
⎜2
⎜
⎜2
⎜0
⎜
⎜0
⎜
⎜0
h = ⎜0
⎜
⎜0
⎜0
⎜
⎜0
⎜0
⎜
⎜0
⎜0
⎝
0 0 0⎞
0 1 0⎟
⎟
0 0 1⎟
1 0 0⎟
⎟
1 1 0⎟
⎟
1 2 0⎟
1 1 1⎟
⎟
1 0 2⎟
0 0 2⎟
⎟
0 0 4⎟
0 0 6⎟
⎟
0 0 8⎟
0 2 1⎟⎠
(3.30)
По правилу Гиббса, r g a = 13 – 4 = 9. Линейно независимы девять стадий, и в записи системы (3.29) имеются по меньшей мере пять зависимых
стадий. (Если выяснится, что линейно-зависимых стадий больше, это будет
означать, что упущена какая-то независимая стадия.) Попробуем выделить
систему независимых стадий, используя приведенные выше правила 1 и 2.
Будем выбирать стадии так, чтобы как можно чаще то или иное вещество
участвовало лишь в одной из них или чтобы стадии были последовательными по отношению друг к другу. Выберем, например, стадии (а), (б), (г), (д),
(е), (ж), (з), (к), (л). Дальше проводим рассуждения по правилу 1. Из выбранных только в стадии (л) участвует CS2; (к) – H2S; (з) – H2O; (ж) – S8;
(в) – COS; (б) – CO2. Исключив из рассмотрения эти стадии, далее по очереди исключаем стадии (е), затем (д). Остается одна стадия (а), которая, таким
образом, тоже независима. Имея атомную матрицу (3.30), легко записать
четыре уравнения линейно независимых инвариантов.
З а м е ч а н и е . Уравнения инвариантов верны без оговорок в двух случаях: для замкнутых систем и для систем непрерывного действия, работающих
в стационарных режимах. При нестационарности в открытых системах необходимо всякий раз анализировать, можно ли использовать подобные балансовые соотношения.
Степень превращения (конверсия), выход продукта, селективность. Это наиболее часто используемые показатели качества протекания химических процессов. Их расчет тесно связан со стехиометрией реакций. Конверсия χ характеризует глубину превращения
исходного реагента, выход η – количество образующегося продукта, селективность σ – то, насколько целесообразно использована та
часть реагента, которая превратилась в продукты (какая часть прореагировавшего реагента превратилась именно в нужный продукт).
3.1. Стехиометрия и равновесие химических реакций
119
Приведу пример, поясняющий смысл этих показателей. Несмотря
на несерьезность, в нем соблюдена точная количественная аналогия.
Пример 3.6. Я пришел на рынок, чтобы купить картошку. Для простоты
расчета положим, что 1 кг картошки стоит 10 руб. Входя на рынок, я имел
в кармане 100 руб. Здесь цена – аналог стехиометрического коэффициента
(дальше слово аналог опускается), деньги – реагент, картошка – продукт,
100 руб. – начальное количество реагента. Купив 7 кг картошки, я собрался
уходить, но тут ко мне подбежали лохотронщики и сумели вовлечь в свою
«беспроигрышную лотерею». К счастью, я проиграл всего 20 руб. (прошла
параллельная побочная реакция – часть реагента превратилась в нечто ненужное). Обрадованный, что потерял так мало, я пошел прочь, но меня остановил нищий и выклянчил килограмм картошки (прошла последовательная
побочная реакция, часть уже образовавшегося продукта пропала). На этом
мои приключения окончились. Как рассчитать χ, η и σ? Смысл этих величин определяет такой расчет. Вначале у меня было 100 руб. В конце осталось
10 руб., следовательно, я истратил 90 руб. Значит, χ = 90/100 = 0,9. Домой я
принес 6 кг картошки. Если бы я потратил все деньги без потерь на дело, то
мог бы купить 100/10 = 10 кг картошки. Отсюда η = 6/10 = 0,6. А на реально
потраченные деньги, т.е. на 90 руб., я смог бы купить 90/10 = 9 кг. Таким образом, величина σ = 6/9 = 0,75.
Обобщая то, о чем сказано в примере, можно прийти к такой простой схеме расчета. Пусть продукт В получается по реакции
аАА → … → аВВ→ …
(3.31)
Здесь аА и аВ – стехиометрические коэффициенты (взятые по
модулю). Запись (8.31) означает, что аА молекул реагента А по стехиометрии превращаются в аВ молекул целевого продукта В, причем
процесс превращения может быть многоступенчатым, а кроме того
могут протекать побочные реакции. При такой схеме можно ввести
коэффициент эквивалентности
э = аА / аВ,
(3.32)
который показывает, какому числу молей А эквивалентен один
моль В. Тогда для χ, η и σ получаем простые выражения:
g − gA
g
(3.33)
χ = A0
= 1− A ,
g A0
g A0
эg B
,
g A0
(3.34)
эg B
.
g A0 − g A
(3.35)
η=
σ=
Из формул (3.33) – (3.35) вытекают полезные соотношения:
120
Глава 3. Математическое описание химических реакций
η = σχ; σ = η/χ; χ = η/σ.
(3.36)
Отсюда, например, следует, что выход продукта равен степени превращения только при σ = 1, т. е. при отсутствии побочных реакций,
а во всех остальных случаях η < χ; далее, при χ = 1 получаем η = σ, а при
неполной конверсии η < σ. Как уже отмечалось, если реакция идет
в гомогенной среде при постоянном объеме, то в формулах (3.33) –
(3.35) можно заменить количества веществ на их концентрации.
Прямые задачи химического равновесия. Одно из важнейших применений стехиометрического анализа – запись уравнений для расчета равновесия сложных (многостадийных) реакций. Такой расчет
называют прямой задачей химического равновесия. Рассмотрим только
один сравнительно простой случай: реакция проходит в гомогенной
среде, причем можно считать активности равными концентрациям.
Пусть имеется система m одновременно протекающих линейно
независимых обратимых реакций (стадий), в которых участвуют n
веществ; при анализе на линейную независимость каждая обратимая
реакция считается одной стадией. Тогда для каждой стадии i может
быть записана константа равновесия Ki ; общее число таких констант
равно m и в свою очередь равно рангу стехиометрической матрицы:
m = r g a = n – r g h.
(3.37)
Каждой константе Ki соответствует уравнение, связывающее равновесные концентрации веществ. Но число таких уравнений равно
m, а число неизвестных концентраций составляет n > m. Необходимо
замкнуть систему уравнений, т.е. добавить независимые уравнения,
чтобы общее число их составило n. В качестве этих недостающих
уравнений можно использовать уравнения линейно независимых
инвариантов, число которых как раз равно r g h = n – m.
Пример 3.7. Если стадии реакции (3.20) обратимы, то ход рассуждений
таков. Имеем r g h = 3; число веществ n =7. Тогда согласно правилу Гиббса
r g a = 7 – 3 = 4. Пользуясь описанными выше правилами 1 и 2, легко установить, что записанные в системе (3.20) стадии линейно независимы. Для них
существуют четыре независимые константы равновесия, которым соответствуют четыре уравнения:
[C]2 = K1[A][B]2; [D]2 = K2[A]; [C] = K3[E][H]; [D] = K4[F]2[H]. (3.38)
К этим уравнениям можно добавить три уравнения инвариантов (3.28), и
система уравнений замкнется. Дальнейшее – уже чисто вычислительная задача: решение системы семи алгебраических уравнений (3.28), (3.38), четыре
из которых нелинейны.
Об обратных задачах химического равновесия. Обратная задача
равновесия формулируется так: получены опытные данные о свойствах систем, в которых установилось равновесие в интересующей
3.1. Стехиометрия и равновесие химических реакций
121
нас реакции. Необходимо рассчитать константы равновесия для стадий этой реакции.
Если свойства, по которым имеются данные, – это равновесные
концентрации веществ, то задача тривиальна: чтобы получить константу равновесия, достаточно поделить эти концентрации друг на
друга. Но такие случаи – редкая экзотика. Почти никогда не удается
проанализировать равновесную смесь, не нарушив состояния равновесия. Обычный случай – это когда мы можем измерить какие-то
характеристики равновесного состава, зависящие от концентраций,
причем чаще всего зависимость известна не полностью – мы не
знаем ее параметров. И задача стоит в том, чтобы вычислить и неизвестные параметры этой зависимости, и константы равновесия.
Изложить в общем виде, как это делается, сложно; проще рассмотреть порядок действий на примере.
Пример 3.8. Пусть исследуется реакция ступенчатого комплексообразования в растворе:
А + В = АВ,
АВ + В = АВ2,
(3.39)
(3.40)
(3.41)
АВ2 + В = АВ3.
После установления равновесия измеряется поглощение света раствором
на определенной длине волны. Имеются основания считать, что коэффициент D поглощения света раствором достаточно точно определяется формулой
D = DA cA + DBcB + DABcAB + DAB2 cAB2 + DAB3 cAB3
(3.42)
где DA , DB , DAB , DAB2 , DAB3 – мольные коэффициенты поглощения, из которых непосредственно можно измерить только DA и DB. Проведя опыт
с равновесной смесью, мы имеем в уравнении восемь неизвестных: три коэффициента поглощения и пять значений концентраций. Проделаем достаточно большое число n таких опытов при различных исходных концентрациях А и В, но при одной и той же температуре (чтобы можно было считать
константы равновесия постоянными). Теперь зададимся значениями шести
параметров K1, K2, K3, DAB , DAB2 , DAB3 исходя либо из данных по аналогичным
системам, либо из приблизительных теоретических соображений; практически они наверняка окажутся далекими от истинных значений. Далее для
каждого опыта исходя из заданных значений констант равновесия решим
прямую задачу, а затем проведем расчет D по формуле (3.42) также для каждого опыта. Все n значений D будут отличаться от опытных значений D.
Теперь в соответствии с формулой (2.41) мы вправе сформулировать нашу
задачу как задачу метода наименьших квадратов: найти такие значения параметров, которые обеспечат минимум суммы
S = ∑ ( Di − D i ) 2 ,
(3.43)
где суммирование производится по всем значениям i (номерам опытов).
122
Глава 3. Математическое описание химических реакций
Таким образом, здесь возникла задача нелинейного оценивания
в методе наименьших квадратов. В нашем примере требуется найти минимум функции шести переменных, поскольку S зависит от
шести задаваемых параметров. Решению таких задач – нахождению
экстремума функций многих переменных – посвящен один из важных разделов прикладной математики – теория оптимизации. В данной книге нет возможности подробно изложить соответствующие
процедуры. Кратко смысл их изложен в разд. 7.3, более подробное
описание можно найти в [3, 15]. Обращу внимание читателя на следующее. Поиск минимума осуществляется отдельными шагами и на
каждом шаге приходится n раз (для каждого опыта) решать прямую
задачу равновесия (чтобы потом по рассчитанным значениям концентраций вычислять D ). Это многократное решение прямой задачи
составляет львиную долю общего объема расчетов.
П р и м е ч а н и е . В ряде случаев оказывается, что лучшие результаты дает
расчет не для квадратов отклонений величин ( D − D ) 2 , а для квадратов отклонений логарифмов (ln D − ln D ) 2 .
3.2. Формальная химическая кинетика
Кинетика химических реакций – важнейшая основа их описания.
Главной проблемой кинетики как раздела физической химии является вопрос о механизме реакции. Основная задача – раскрыть механизм реакции и установить, как он отражается в кинетических закономерностях. При анализе, описании и расчете протекания реакции
как элемента химико-технологического процесса вопрос о механизме часто не возникает: кинетические закономерности рассматриваются как уже заданные (например, изученные на предыдущем
физико-химическом этапе исследования). В этих случаях описание
проводится на языке формальной (феноменологической) кинетики. Ей
и посвящен этот раздел.
Скорость реакции – основное понятие кинетики. Она определяется как количество вещества, реагирующее в единицу времени в единице реакционного пространства:
r=
dg р
Vdt
,
(3.44)
где r – скорость реакции; dgp – количество вещества, превращающееся в результате протекания реакции за время dt (знак дифференциала
dgp определяется тем, образуется или расходуется вещество – соот-
3.2. Формальная химическая кинетика
123
ветственно знаки «+» и «–»); V – реакционное пространство (объем
в случае гомогенной реакции, поверхность – в случае гетерогенной).
Далее в этом разделе будут рассматриваться в основном гомогенные
реакции, поэтому V обозначает объем.
Часто применяют удобный частный вид уравнения (3.44). Но прежде чем записать его, необходимо подчеркнуть, что пользоваться им
можно только при соблюдении двух условий:
1) реакция проходит при постоянном объеме;
2) объем этот можно считать закрытым.
Закрытой, или замкнутой, называется система, которая по ходу
процесса не обменивается веществом с окружающей средой (хотя и может обмениваться энергией). Большинство химико-технологических процессов, и в первую очередь все непрерывные процессы, протекают в открытых системах, которые характеризует обмен
с окружающей средой энергией и веществом. Именно открытость
аппарата непрерывного действия (ввод и вывод потока) обеспечивает непрерывность процесса. Реактор чисто периодического действия
открыт в периоды загрузки и выгрузки, а при протекании реакции он
замкнут. Особенность уравнений материального баланса для замкнутых систем: вход и уход вещества равны нулю. Поэтому единственной причиной изменения количества вещества в системе dg является
химическое превращение:
dg = dgp.
(3.45)
Уравнение (3.44) можно записать при этом в виде
r=
dg
.
Vdt
(3.46)
Если объем постоянен, его можно внести под знак дифференциала (в числителе) и, учитывая, что g/V = c, получить:
dc
.
(3.47)
r=
dt
Смысл уравнения (3.47) следующий: в замкнутых гомогенных системах скорость реакции равна изменению концентрации во времени. Им часто пользуются, однако необходимо помнить, что это лишь
частный случай, который верен далеко не для всех систем.
Формально простые и сложные реакции. Химическая кинетика
определяет простые (одностадийные) реакции как такие, которые по
существу проходят в одну стадию; простая реакция содержит один
элементарный акт. Однако такие реакции, которые проходят как
истинно одностадийные, встречаются редко. В феноменологической кинетике оказывается удобным говорить о формально простых
реакциях. Так называют реакции, которые можно формально пред-
124
Глава 3. Математическое описание химических реакций
ставить как протекающие в одну стадию и записать в виде (3.18). По
существу реакция может быть сложной, проходящей через какие-то
промежуточные стадии, но если в условиях рассматриваемой задачи промежуточные продукты не обнаруживаются, то реакция будет
считаться формально простой. В какой-либо другой задаче та же
реакция может рассматриваться как сложная – это будет означать
лишь переход к иному формальному рассмотрению.
Несмотря на условность понятия «формально простая реакция»
оно удобно и поэтому часто используется. При этом многие реакции
всегда приходится рассматривать как сложные: они явно распадаются на стадии (продукты различных стадий обнаруживаются в значительных количествах).
Можно выделить три простейших типа сложных реакций.
1. Обратимая реакция: с излагаемой точки зрения она – сложная,
состоящая из двух стадии: прямой и обратной реакций, хотя ряд авторов предпочитает говорить о них, как о частном случае формально
простых реакций.
2. Параллельная реакция: исходное вещество по двум или нескольким параллельно протекающим реакциям (стадиям) превращается
в два или несколько продуктов. Примером может служить нитрование толуола с параллельным получением о- и п-нитротолуолов.
3. Последовательная реакция: стадии реакции следуют одна за другой, продукт первой стадии является исходным веществом второй и
т. д. Примером может служить полимеризация с последовательным
присоединением молекул мономера к растущей макромолекуле.
Остальные сложные реакции можно представить в виде комбинаций указанных трех типов, например последовательно-параллельные, последовательные реакции с обратимыми стадиями и т. д.
Оговорюсь, что здесь я не рассматриваю такие многостадийные
реакции, стадии которых разделены во времени, т.е. сначала проводится одна стадия, затем через некоторое время – вторая и т. д. Такой
процесс будем считать несколькими независимыми реакциями. А те
сложные реакции, о которых говорится сейчас, проходят так, что
в реакционной смеси одновременно идут все стадии и присутствуют
исходные вещества и продукты всех стадий.
Скорость одностадийной реакции и скорость реакции по веществу. Рассмотрим формально одностадийную реакцию (она может
быть и одной из стадий сложной реакции):
aA A + aB B = aC C .
(3.48)
Возникает следующий вопрос: количество какого вещества
(А, В или С) следует вводить в уравнение (3.44) при определении
скорости реакции (3.48)? Ответ на этот вопрос легко получить из
3.2. Формальная химическая кинетика
125
понятия стехиометрической эквивалентности. Если за какой-то
промежуток времени прореагирует некоторое количество –dgA вещества А (знак минус означает, что вещество расходуется), то за
это же время количества прореагировавшего В и образовавшегося
С составят:
dgB = – (aB/aA) dgA; dgC = + (aC/ aA ) dgA.
(3.49)
Поэтому, подставив в формулу (3.44) один раз dgA, другой раз dgB,
третий раз dgC, получим три значения: rА, rB и rC, отличающиеся одно
от другого постоянными множителями. Строго говоря, это одна и та
же величина – скорость реакции (3.48), но выражена она в разных
единицах. Для единообразия скорость одностадийной реакции, или
скорость стадии, принято определять путем деления скорости, выраженной через любое вещество J, участвующее в данной стадии, на
стехиометрический коэффициент этого вещества. В таком случае
безразлично, какое из веществ принято в качестве J.
Сопоставление с формулой (3.19) показывает, что скорость стадии можно записать через химическую переменную ζ:
r=
dζ
.
Vdt
(3.50)
Но при записи уравнений материального баланса важно пользоваться величинами скорости реакции, отнесенными к определенным
веществам rJ . Такие скорости очень просто получаются из уравнений
(3.50) и (3.19):
rJ = aJ r.
(3.51)
Напомню, что, как говорилось в разд. 3.1, здесь коэффициент aJ
может быть как положительным, так и отрицательным или равняться нулю (например, если J – катализатор).
Пример 3.9. Рассмотрим реакцию А +2В = 2С, имеющую первый порядок по реагенту А и нулевой – по В; константу скорости обозначим через k.
Для этой реакции, в соответствии с формулой (3.51), имеем:
rA = – kcA; rB = – 2kcA; rC = + 2kcA.
Обратите внимание на то, что rА, rB и rC зависят от сA и не зависят от сB.
Ответ на вопрос, почему это так, лежит вне формальной кинетики – это вопрос о механизме реакции. Но при расчетах важно помнить, что в случае
формально одностадийной реакции или стадии сложной реакции rA, rB и rC
не три разные скорости, а одна и та же скорость реакции; различаться эти величины могут только множителями – стехиометрическими коэффициентами. Уравнение реакции устанавливает однозначную связь между реагирующими количествами веществ А, В и С и, стало быть, связь между скоростями
по этим веществам, определяемую формулой (3.51).
126
Глава 3. Математическое описание химических реакций
Порядок реакции. Скорость многих (хотя и не всех) формально
простых реакций, в том числе многих стадий сложных реакций, пропорциональна концентрациям реагирующих веществ в некоторых
степенях. Показатель степени в таком случае называют порядком реакции по реагенту. Так, для реакции
aAA + aBB → продукты
соответствующая зависимость будет выражаться кинетическим уравнением
r = kcAn1 cBn2 ,
(3.52)
где n1 – порядок реакции по веществу А; n2 – порядок реакции по
веществу В. Сумму n1 + n2 называют общим, или суммарным, порядком. Коэффициент пропорциональности k именуют константой
скорости реакции.
Порядок реакции или стадии буду иногда обозначать цифрой над
(или под) стрелкой, указывающей направление реакции; здесь же
приведу обозначение константы скорости. Так, запись
A + 2B
1 по А; k1
⎯⎯⎯⎯
→
←⎯⎯⎯
⎯
2 по C; k2
2C
обозначает обратимую реакцию, у которой прямая стадия имеет 1-й
порядок по А и константу скорости k1, обратная – 2-й порядок по С и
константу k2. Поскольку порядок по В не указан, значит, он – нулевой.
На практике встречаются реакции самых разнообразных порядков: целочисленных и дробных, нулевого, изредка и отрицательных.
Численное значение порядка может быть и очень малым, и большим,
например для каталитической димеризации ацетилена установлен
суммарный порядок выше 9-го [29].
Достаточно часты случаи, когда порядок по каждому из реагентов совпадает с его стехиометрическим коэффициентом. Но такое
совпадение обязательно лишь для строго (не формально) простых
реакций. Вследствие сложности механизма формально одностадийные процессы могут протекать по порядкам, сильно отличающимся
от стехиометрических коэффициентов.
Замечу, что у тех реакций, порядок которых не совпадает со стехиометрическими коэффициентами, при приближении к равновесию
(или к 100%-ному превращению, если реакция необратима) зачастую
начинается изменение порядка – непосредственно вблизи равновесия порядок сходится к величине, определяемой стехиометрией.
Существует достаточно много реакций, скорости которых вообще не могут быть описаны формулой (3.52). Понятие «порядок
реакции» к таким реакциям либо вообще неприменимо, либо при-
3.2. Формальная химическая кинетика
127
менимо с оговорками. В частности, обычно нельзя говорить о порядке разветвленных цепных реакций. Для многих неразветвленных
цепных реакций и гетерогенно-каталитических реакций (в случае
существенного влияния стадии адсорбции) в кинетическое уравнение, наряду со степенными, входят и сомножители более сложной
структуры. Например, кинетическое уравнение для синтеза бромистого водорода из простых веществ имеет вид:
r=
k1cBr2 cH2
.
cHBr
1 + k2
cBr2
В то же время задание порядка реакции иногда является кратким
выражением особенностей кинетики.
Пример 3.10. Реакция может иметь некоторый порядок по веществу, не
входящему в стехиометрическое уравнение:
1 по А, 1 по Н
A + B ⎯⎯⎯⎯⎯
→ С.
Это гомогенный катализ: вещество Н является катализатором. В роли гомогенного катализатора может выступать один из продуктов реакции – это
случай автокатализа:
1 по А, 1 по B
A ⎯⎯⎯⎯⎯
→ 2B .
Температурная зависимость скорости реакции. В уравнении (3.52)
концентрации не зависят от температуры в явном виде. Порядок реакции иногда претерпевает изменения с ростом температуры, но это
скорее исключение, чем правило. Наиболее тесно с температурой
связана константа скорости реакции. Эта зависимость может быть
описана уравнением Аррениуса:
k = Ae
−
E
RT
.
(3.53)
Параметрами уравнения (3.53) являются предэкспоненциальный
множитель, или предэкспонента, А и энергия активации Е.
Роль энергии активации. Формальная кинетика не занимается физическим смыслом величин А и Е, но для многих задач важно понимать,
именно какая характеристика реакции определяется величиной Е.
Существует мнение, что чем больше энергия активации, тем, в соответствии с формулой (3.53), меньше величина k и, значит, медленнее реакция. Однако это мнение неверное. Величина k определяется
совокупностью значений Е и А, поэтому сама по себе величина Е еще
не определяет, быстро или медленно проходит реакция.
В химической кинетике существует изокинетическое правило
(правило компенсации): почти всегда чем больше энергия активации,
тем больше предэкспонента. Несмотря на многочисленные попыт-
128
Глава 3. Математическое описание химических реакций
ки найти причину, объясняющую существование этого правила,
в полной мере сделать это до сих пор не удается. Но исключения
из него очень редки. Реакция с меньшей Е имеет и меньшее значение А, а влияния обоих параметров противоположны. Формальный
(феноменологический) смысл E иной. Прологарифмируем уравнение (3.53):
ln k = ln A −
E
.
RT
(3.54)
Получили линейную зависимость ln k от 1/Т, коэффициентами
которой являются ln A и –E/R. Изобразим ее на графике для двух реакций: у первой величина E меньше (и, согласно изокинетическому
правилу, ln A тоже меньше), чем у второй (рис. 3.1,а).
а
б
Рис. 3.1. Аррениусовы зависимости для двух реакций:
a – по уравнению (3.54), б – по уравнению (3.53)
Из рис. 3.1,а очевидно, что при высоких температурах (значение
1/Т мало, область близка к оси ординат) больше константа скорости той реакции, у которой энергия активации больше. При низких
температурах больше константа скорости реакции с малой энергией
активации. Те же зависимости, но в координатах T – k представлены
на рис. 3.1,б. Полученную закономерность можно сформулировать
так: чем больше энергия активации, тем сильнее скорость реакции зависит от температуры.
Такой характер влияния Е на прохождение реакции позволяет
произвести быструю качественную оценку влияния температуры на
ход некоторых сложных реакций. Так, для обратимых экзотермических реакций Е2 > Е1: энергия активации обратной реакции больше,
чем прямой. Поэтому с ростом температуры коэффициент k2 растет
быстрее, чем k1, в результате чего равновесие смещается влево. При
эндотермических обратимых реакциях наоборот Е2 < Е1, и с ростом
температуры равновесие смещается вправо. Так устанавливается
связь уравнения Аррениуса с правилом Ле Шателье.
3.2. Формальная химическая кинетика
129
Если рассматривается сложная реакция, некоторые стадии которой являются для нас побочными, то соотношение энергий активации различных стадий определяет влияние температуры на селективность: при нагревании преимущественно ускоряются те стадии,
которые характеризуются большей энергией активации.
Нужно иметь в виду, что в одном важном случае снижение энергии активации действительно приводит к ускорению реакции – это
катализ. Механизм действия катализатора связан со снижением
энергии активации реакции.
Скорость сложных реакций. Для всех типов формально сложных
реакций, кроме простейшей обратимой, понятие общей скорости
реакции не имеет смысла. Реакция состоит из ряда стадий, каждая из
них имеет свою скорость, и нельзя достаточно естественным образом определить, что такое скорость всей сложной реакции в целом.
В то же время любое из участвующих в реакции веществ образуется или расходуется с определенной скоростью, причем знание этой
скорости обязательно при расчете процесса.
Скорость сложной реакции по любому веществу J равна алгебраической сумме скоростей всех стадий по этому веществу (с учетом стехиометрических коэффициентов):
m
m
i =1
i =1
rJ = ∑ rJi = ∑ aJi ri ,
(3.55)
где i — номер стадии; m — число стадий.
Скорость стадии по веществу можно определить по формуле
(3.51). Если вещество в стехиометрии стадии не участвует, его стехиометрический коэффициент в этой стадии равен нулю.
Пример 3.11. Запишем кинетические уравнения для веществ, участвующих в реакции:
A + 2B
1 по B; k1
⎯⎯⎯⎯
→
C
,
←⎯⎯⎯⎯
0,7 по C; k2
1 по А, 0,35 по Н; k3
A ⎯⎯⎯⎯⎯⎯
→D ,
C+D
1 по C,1 по D; k4
⎯⎯⎯⎯⎯⎯
→
←⎯⎯⎯⎯⎯
⎯
2 по E; k5
3E .
Вещество А участвует в 1, 2 и 3-й стадиях со стехиометрическими коэффициентами –1, +1 и –1. Поэтому
rA = − r1 + r2 − r3 = − k1cB + k2 cC0,7 − k3cA cH0,35
(если выражение не ясно, вернитесь к примеру 3.9).
130
Глава 3. Математическое описание химических реакций
Соответственно
rB = −2k1cB + 2k2 cC0,7 ,
rC = k1cB − k2 cC0,7 − k4 cC cD + k5cE2 ,
rD = k3cA cH0,35 − k4 cC cD + k5cE2 ,
rE = 3k4 cC cD − 3k5cE2 ,
rH = 0 .
Последнее равенство естественно, поскольку Н, будучи катализатором, не
участвует в стехиометрии реакций: не расходуется и не образуется. Заметьте,
что если вещество участвует в обратимой реакции, то стехиометрические коэффициенты для прямой и обратной стадий равны по абсолютной величине
и противоположны по знаку.
О прямых и обратных задачах химической кинетики. Прямая
задача химической кинетики – расчет зависимости от времени концентраций веществ в реакционной смеси при известных кинетическом уравнении, значениях констант скорости, начальном составе.
Особенность таких задач состоит в том, что перечисленных данных
недостаточно. Необходимо учесть также характер движения потока,
в котором проходит реакция, а в случаях гетерогенных реакций также характер диффузии веществ в зоне реакции. Эти вопросы рассмотрены в гл. 4 и 5.
Обратные задачи кинетики имеют очень сложную специфику.
Дело в том, что, как уже отмечалось, реально все химические реакции сложны, проходят через ряд промежуточных стадий. Обратная
задача заключается в расшифровке механизма реакции, определении
ее маршрута: стадий, через которые она проходит, и кинетических
характеристик этих стадий. Исследования последних лет [30] показали, что a priori (до начала исследования) для одной и той же реакции
можно предположить чрезвычайно много (сотни или даже тысячи)
возможных маршрутов. Обратная задача может быть сформулирована как задача дискриминации : нужно отбросить все механизмы, кроме одного истинного. Из-за того что предполагаемых механизмов
много, часть из них, в том числе и далеких от истинного механизма,
может показывать результаты, близкие к истинным. Решение таких
задач требует больших объемов исследования, применения специальных методов планирования эксперимента и метода наименьших
квадратов в варианте нелинейного оценивания.
Качественный анализ хода реакции. Очень часто бывает целесообразно до проведения расчета показателей реакции осуществить
качественный анализ ее протекания. Одна из возможностей такого
3.2. Формальная химическая кинетика
131
анализа опирается на асимптотические оценки – оценки поведения
функций в крайних областях значений аргумента. В рассматриваемом случае целесообразно в качестве аргумента принять время t,
причем крайние области его значений – это t = 0 и t → ∞.
В качестве примера проанализируем протекание реакции
1 по А; k1
→B+ H,
⎪⎧A ⎯⎯⎯⎯
⎨
1 по В; k2
→ 2C + H.
⎪⎩B ⎯⎯⎯⎯
Целевым продуктом является вещество В. Примем следующие
условия. Реакция проходит в замкнутой системе (можно показать,
что качественные выводы окажутся такими же и для открытой системы, но для замкнутой анализ проще). Объем и температура постоянны. Начальная концентрация реагента сА0 = 1 моль/л. В начале процесса продукты отсутствуют. Известны энергии активации первой и
второй стадий: Е1 = 45000 и Е2 = 75000 Дж/моль соответственно.
Вначале выясним, какими станут концентрации веществ, если
время процесса очень велико (t → ∞). При этом обе реакции дойдут
до конца, поскольку и та, и другая необратимы. Веществ А и В не
останется, а концентрации С и Н определятся стехиометрией: 2 и 2
моль/л. Полученные данные приведены в табл. 3.1.
Таблица 3.1. Пределы концентраций
Показатель
t=0
t→∞
СА
1
0
СВ
0
0
СС
0
2
СН
0
2
Пользуясь данными табл. 3.1 по формулам (3.33) – (3.35) легко
определить пять из шести пределов для конверсии, выхода продукта
и селективности:
χ → 0, η → 0;
• при t → 0
• при t → ∞ χ → 1, η → 0, σ → 0.
Затруднение возникает при оценке предела σ, когда t→ 0. Формулы
(3.35) и (3.36) приводят к выражению вида 0/0, т.е. к неопределенности. Раскрыть эту неопределенность можно по правилу Лопиталя,
заменив функции в числителе и знаменателе их производными по
времени. Для замкнутой системы производная от концентрации по
времени равна скорости реакции. При этом учтем, что начальная
концентрация – величина постоянная (в данном случае равная 1),
а производная от постоянной равна 0. Учтем также то, что при t → 0
cB → 0. Получаем:
lim σ = lim
cB
r
kc −k c
= lim B = lim 1 A 2 B = 1 .
c A0 − c A
k1c A
0 − rA
Глава 3. Математическое описание химических реакций
132
Можно показать, что и в открытой системе предел окажется таким
же. Физический смысл этого результата прост. При малом времени
процесса скорость первой стадии реакции высока, так как велика
концентрация А, а скорость второй стадии очень мала (из-за малости сВ) и стремится к 0 при t → 0. Поэтому в пределе реакция проходит так, как будто побочной стадии нет; а в отсутствие побочной
стадии селективность равна 1. Если бы побочная стадия была параллельной, рассматриваемый предел был бы меньше 1. Зная величины
констант скорости, его можно было бы рассчитать; в противном случае пришлось бы констатировать, что селективность стремится к некоторой величине σ0, причем 0 < σ0 <1.
Теперь, сведя пределы показателей процесса в табл. 3.2, построим
качественный график изменения χ, η и σ во времени (рис. 3.2).
Таблица 3.2. Пределы показателей процесса
Показатель
t=0
t→∞
χ
η
σ
0
1
0
0
1
0
χ, η, σ
1
σ
χ
η
t
Рис. 3.2. Изменение показателей процесса во времени
Исследуем теперь, как влияет на показатели температура. Полученные нами асимптотические оценки не содержат температуры ни в явном, ни в неявном виде. Это верно для рассматриваемой реакции, но
в других случаях выражения для пределов могут содержать константы скорости или константы равновесия – тогда температура будет
влиять и на асимптотические оценки. Для рассматриваемой реакции
пределы при любых температурах одни и те же, изменяются характеристики зависимостей между этими пределами. Для показателей χ и
σ изменения просты. С ростом температуры скорость первой стадии
реакции растет, поэтому кривая для χ вначале идет круче и быстрее
3.2. Формальная химическая кинетика
133
приближается к предельному значению. Скорость второй стадии
реакции, обусловливающей падение селективности, тоже растет, и
кривая зависимости σ(t) падает круче сначала и быстрее переходит
в область очень малых значений. Что же касается зависимости η(t),
то здесь наибольший интерес представляет точка максимума, обе ее
координаты – время достижения максимума и максимальное достигаемое значение η. Для качественной оценки влияния температуры
на время достижения максимума достаточно учесть, что с ростом
температуры ускоряются обе стадии. При этом выход продукта будет
быстрее расти и быстрее падать – максимум сместится к меньшему
времени. Чтобы оценить, как при этом изменится высота максимума, учтем следующее. Искомая высота определяется конкуренцией
обеих стадий: первая увеличивает η, вторая уменьшает. С ростом
температуры обе стадии ускоряются, но вторая – сильнее, потому
что Е2 > Е1. В результате повышение температуры приведет к снижению максимального значения η (рис. 3.3).
η
t
Рис. 3.3. Изменение во времени выхода продукта
при двух разных температурах
Еще раз подчеркну: любое изменение схемы реакции, величин
энергий активации и т. д. потребует нового анализа и зависимости
могут оказаться совсем иными.
ГЛАВА 4.
АНАЛИЗ И ОПИСАНИЕ ПРОЦЕССОВ В ПОТОКЕ
Большинство химико-технологических процессов проводится
в потоке. Поток оказывает чрезвычайно существенное влияние на
их ход, поэтому построить хорошую модель процесса без учета этого
влияния невозможно. Для расчета протекания гомогенных реакций
в основном достаточно знания кинетики процесса в потоке. Если
процесс гетерогенный, необходимо сначала учесть явления переноса,
происходящие у раздела фаз. Но влияние потока необходимо учитывать и здесь: с одной стороны, поток существенно влияет на этот самый перенос, с другой стороны, влияние потока сказывается на следующем уровне иерархии – при рассмотрении рабочей зоны в целом.
4.1. Потоки в аппаратах непрерывного действия
Я буду в основном рассматривать потоки в аппаратах непрерывного действия – именно эта группа аппаратов является ведущей в современной химической технологии. При описании, как правило, не
буду делать различия между потоками газа, жидкости или, например,
суспензии. Для простоты всякую движущуюся среду буду называть
жидкостью. Лишь в немногих случаях, когда это потребуется, буду
оговаривать агрегатное состояние.
В процессе описания буду пользоваться термином «частица жидкости». Это не строго определенное, но удобное понятие. Частица –
это такая часть потока, о движении которой в рассматриваемый момент можно говорить, как о движении единого целого.
Сложность структуры потока. Любой поток сложен по своей
структуре. Сложность проявляется на различных уровнях, в разных
масштабах, проявления ее весьма многообразны. Рассмотрим некоторые из них.
Нестационарность скорости. По этому признаку, как известно,
потоки делятся на ламинарные и турбулентные. Ламинарный поток
преимущественно стационарен. Разумеется, при изменениях, про-
4.1. Потоки в аппаратах непрерывного действия
135
исходящих в системе (прежде всего при изменениях расхода жидкости), стационарность нарушается. Но установившийся ламинарный
поток стационарен: в данной точке аппарата скорость проходящего
через нее потока остается одной и той же. Турбулентный поток нестационарен по существу. Даже если никакие параметры в среднем
не меняются во времени, поток все время испытывает хаотические
колебания скорости, так называемые флуктуации, или пульсации.
Неоднородность поля скоростей. В разных частях потока скорости
частиц жидкости различны как по величине, так и по направлению.
Эти различия могут быть стационарными (например, параболический профиль скоростей в ламинарном потоке) и нестационарными:
в турбулентном потоке максимум скорости наблюдается то в данной
точке, то в соседней.
Крайние случаи неоднородности скоростей – это, с одной стороны, байпасы, а с другой – застойные зоны. В нашем случае под байпасом понимается часть потока, очень быстро проходящая от входа
к выходу, почти не участвуя в процессе. Порции жидкости, попавшие
в застойную зону, напротив остаются практически неподвижными и
также выпадают из процесса. Неоднородность скоростей по направлению может проявляться по-разному. В турбулентном потоке флуктуации скорости направлены не только вдоль, но и поперек потока.
Кроме того, и в ламинарных, и в турбулентных потоках могут образовываться зоны циркуляции жидкости.
Описанные особенности структуры потока приводят к двум взаимосвязанным явлениям, оказывающим сильное влияние на ход
химико-технологических процессов: возникновению перемешивания
текущей жидкости и неравномерности времени пребывания.
Традиция, существующая в химии, склонна всегда считать перемешивание жидкости фактором, способствующим протеканию реакции. Но при рассмотрении этого фактора следует различать два
случая: перемешивание в поперечном и в продольном относительно
потока направлениях. Поперечное перемешивание интенсифицирует массообмен между осевой частью (ядром) потока и его периферией и тем самым, как правило, улучшает условия протекания реакции. Продольное перемешивание – это смешение частиц, которые
недавно вошли в аппарат, с частицами, давно в нем находящимися,
в которых процесс уже зашел далеко; чаще всего оно снижает движущую силу процесса и ухудшает его показатели. Поперечное перемешивание возникает либо под действием перемешивающих устройств
(мешалок, устройств для барботажа и др.), либо под влиянием турбулентных пульсаций скорости, а также при наличии зон циркуляции.
136
Глава 4. Анализ и описание процессов в потоке
Те же факторы вызывают и продольное перемешивание, но
в этом случае, как правило, появляется еще сильно влияющий
фактор – неравномерность распределения скоростей: те частицы,
которые вследствие большей скорости ушли вперед, смешиваются с идущими впереди, отставшие – с нагоняющими их сзади.
Очень часто именно эта неравномерность вносит основной вклад
в продольное перемешивание. В ламинарном потоке оно может
оказаться существенно бóльшим, чем в турбулентном. Так, при течении капельной жидкости в трубе переход от ламинарного режима (Re = 2000) к турбулентному (Re = 100 000) приводит к уменьшению интенсивности продольного перемешивания на несколько
порядков.
Неравномерность времени пребывания – явление, в значительной мере эквивалентное продольному перемешиванию. Для частиц,
уходящих вперед, время пребывания меньше среднего. Отстающие
частицы характеризуются бóльшим временем пребывания. Среднее
время пребывания t текущей жидкости в аппарате, получаемое усреднением времен пребывания разных частиц, определяется простым
соотношением:
V
(4.1)
t = a,
v
где Va – объем аппарата (точнее, его рабочей зоны); v – объемный
расход жидкости.
Величину, обратную среднему времени пребывания (ψ), называют
объемной скоростью:
ψ = v/Va.
(4.2)
Ее интерпретируют как объем движущейся фазы, проходящий через единицу объема аппарата за единицу времени.
Может показаться, что учитывать неравномерность времени пребывания частиц вещества необязательно: при малом времени пребывания частиц в рабочей зоне реакция пройдет недостаточно глубоко,
зато если частицы долго находятся в этой зоне, то глубина протекания реакции велика. На выходе частицы взаимно перемешиваются,
и степень превращения усредняется. Возникает вопрос: можно ли
рассчитывать концентрации подстановкой в решение дифференциального уравнения кинетики значения t , пренебрегая неравномерностью t ?
Оказывается, что при одном и том же среднем времени пребывания частиц различные степени неравномерности дадут разные результаты. Приведу пример, относящийся не к химии, но аналогичный обсуждаемой ситуации.
4.1. Потоки в аппаратах непрерывного действия
137
Пример 4.1. Рассмотрим цех, в котором работают 100 совершенно одинаковых рабочих. Длительность рабочего дня 8 ч. Однажды они предложили
изменить режим работы: пусть половина рабочих работает по 4 ч (имеет свободные полдня), а другая половина, отрабатывая за товарищей, будет работать по 12 ч. В среднем все равно получится по 8 ч на человека. Повысится
или понизится производительность труда, если принять это предложение?
Нетрудно сообразить, что понизится. Действительно, 50 рабочих уйдут из
цеха не устав, а другие 50 будут за них работать после того, как они отработали восьмичасовую смену. От усталости их работоспособность снизится.
Аналогично протекает химическая реакция при неравномерном
времени пребывания частиц вещества. Частицы с малым временем
пребывания выносят из аппарата много не прореагировавшего вещества, что снижает степень превращения. Правда, в частицах, долго
находившихся в аппарате, реакция проходит очень глубоко. Но скорость большинства реакций снижается во времени. В этих частицах
скорость реакции уже столь мала, что увеличение времени пребывания слабо сказывается на превращении. Проигрыш из-за быстро
«проскочивших» через аппарат частиц не компенсируется выигрышем за счет частиц, задерживающихся в нем.
Можно предложить разные подходы к изучению структуры потока и влияния этой структуры на ход химических процессов.
Наиболее полную информацию о структуре потока можно получить, зная скорость жидкости в любой точке аппарата, т. е. анализируя поле скоростей. В принципе это дает исчерпывающую картину
потока. Точное описание поля скоростей может явиться материалом для решения любой задачи, относящейся к течению жидкости.
Но при таком подходе возникают труднопреодолимые препятствия.
Прежде всего чрезвычайно трудна экспериментальная задача измерения скоростей во всех частях потока. В любом аппарате имеются
области, где поток либо проходит сквозь сужения, либо резко заворачивает. Здесь почти невозможно измерить скорость, не нарушив
структуру потока.
Но едва ли не важнее то, что знание поля скоростей позволяет
решать практические задачи лишь в принципе. Как правило, это решение оказывается настолько сложным, что львиной долей информации воспользоваться не удается. Поле скоростей – сложная трехмерная структура, описание которой должно содержать функции
по меньшей мере трех переменных (координат). Нестационарность
(например, в турбулентном потоке) добавляет четвертую переменную – время. Математическое описание процесса обычно получается в виде систем нелинейных дифференциальных уравнений в частных производных. Решить такую систему даже с помощью мощных
компьютеров удается лишь в простейших случаях.
138
Глава 4. Анализ и описание процессов в потоке
Другой возможный подход – выделить изо всей сложной картины потока одну характеристику и основывать на ней описание. Так
можно было бы описывать процесс перемешивания. Наиболее распространено описание потока на основе распределения времени
пребывания. Этот подход мы рассмотрим в разд. 4.3.
Еще один подход – построение упрощенных мысленных моделей потока. Упрощая сложную картину, такая модель должна в то же время
отражать существенные для нас особенности потока, в первую очередь адекватно описывать особенности протекания в данном потоке
химических, тепловых и массообменных процессов.
Как и в других областях науки, в этом случае можно построить
модели разной степени упрощения (см. разд. 1.3). На первом этапе
создаются максимально упрощенные модели, которые называют идеальными потоками. Разработаны две модели идеальных потоков: идеальное вытеснение и идеальное смешение. Они описаны в разд. 4.2. Здесь
отметим одну особенность этих моделей: они не содержат никаких параметров, отражающих специфику структуры потока. Единственный
параметр – среднее время пребывания, определяемое пo формуле
(4.1). В этом смысле все потоки идеального вытеснения подобны один
другому; то же самое относится к потокам идеального смешения.
П р и м е ч а н и е . Во многих источниках слово «идеальное» заменяют
словом «полное»; кроме того, ряд авторов считает более подходящим не термин «смешение», а термин «перемешивание».
Существует довольно много задач, в которых описание реального потока моделью того или другого идеального потока оказывается
достаточно точным. Если же точность такого приближения недостаточна, то переходят к более сложным моделям неидеальных потоков.
Эти модели уже содержат параметры, описывающие характер потока, начиная от однопараметрических моделей и кончая сложными
комбинированными моделями, где число параметров может быть
велико. Описанию некоторых таких моделей посвящен разд. 4.4.
Рассматривая какую-либо модель, я буду стараться осветить три
вопроса:
1. Реалистичность и адекватность модели, т.е. насколько наша модель соответствует реальным объектам?
2. Свойства модели. Какая математическая модель соответствует
данной схеме потока, каковы особенности решения уравнений математического описания и какие свойства объекта определяются этими решениями?
3. Технологическая оценка. Хорошо или плохо влияют на технологические показатели те или иные особенности объекта, описываемого моделью?
Этот подход относится как к моделям потоков, так и ко всему
дальнейшему изложению.
4.2. Модели идеальных потоков
139
4.2. Модели идеальных потоков
Я буду говорить о потоках идеального вытеснения и идеального
смешения, а также об аппаратах идеального вытеснения и смешения – моделях аппаратов, через которые протекают соответствующие потоки. Часто для краткости буду говорить просто: идеальное
вытеснение или идеальное смешение.
Идеальные потоки, как и любая идеализация, – это абстракция,
которую нельзя точно осуществить на практике. Однако ясность физической картины и простота математического описания идеальных
потоков делают эти модели чрезвычайно удобными для анализа протекания химических процессов.
В аппарате идеального вытеснения поток движется совершенно
равномерно. В любом поперечном сечении все частицы имеют одинаковую скорость (рис. 4.1). Фронт потока движется, как твердый
поршень, поэтому такой поток иногда называют поршневым (от
англ. piston-flow).
Рис. 4.1. Схема потока идеального вытеснения
Рис. 4.2. Схема движения малого объема в потоке вытеснения
При анализе сложных процессов (например, реакций, проходящих с выделением и отводом тепла) определение идеального вытеснения приходится несколько конкретизировать – добавляется еще
одно свойство. Не только скорость, но и концентрации, и температура в таком потоке выровнены по поперечному сечению. Для изотермических процессов эта выровненность получается автоматически, если выровнены скорости.
Для описания, анализа и расчета процессов существенны два
следствия из определения идеального вытеснения.
1. Время пребывания всех частиц в потоке идеального вытеснения одинаково. Это практически единственный мыслимый поток,
для которого формула (4.1) определяет не только среднее, но и конкретное время пребывания любой движущейся через аппарат частицы жидкости.
140
Глава 4. Анализ и описание процессов в потоке
2. Выделенный в потоке малый объем, занимающий все поперечное сечение и движущийся вместе с потоком (рис. 4.2), в случае идеального вытеснения можно рассматривать, как замкнутый.
Действительно, в процессе течения ни одна частица не выйдет из
этого объема ни вперед, ни назад (для этого она должна была бы
двигаться с иной скоростью, чем остальные). Точно так же ни одна
частица не войдет в рассматриваемый объем из таких же объемов,
примыкающих к нему спереди и сзади. Поэтому кинетика реакции
при постоянном объеме будет описываться уравнениями
dcJ
= rJ ,
dt
(4.3)
которые равносильны системе уравнений (3.47).
Если объем непостоянен, то выражения усложняются, но в принципе в любом случае можно записать соответствующую систему
дифференциальных уравнений.
В уравнении (4.3) есть одна тонкость. Время, входящее в него,
отсчитывается в объеме, движущемся вместе с потоком. Поэтому
в его левой части – не совсем обычная производная: дифференцирование производится для движущейся вместе с субстанцией системы координат. Это субстанциональная производная. Если измерять
концентрацию любого вещества, находясь неподвижно в любой
точке аппарата, то получим обычную производную. Ясно, например, что в стационарном режиме концентрация любого вещества в
этой точке не меняется во времени: подходя к ней, жидкость всякий раз приобретает одно и то же значение концентрации, поэтому
обычная производная равна нулю. Но субстанциональная производная и в стационарном режиме – не нулевая, поскольку при прохождении данной точки реакция в движущейся жидкости продолжает идти.
Необходимо учитывать, что интегрирование субстанциональных
производных ничем не отличается от интегрирования обычных.
Решение системы (3.47) следует искать в пределах от t = 0 (жидкость
вошла в аппарат) до t = t (выход жидкости из аппарата). В этом случае получатся концентрации веществ на выходе из аппарата. Это поверочный расчет. Для проектного расчета в решение системы подставляют требуемые значения концентраций и находят t , а затем по
формуле (4.1) определяют объем аппарата.
Пример 4.2. Рассмотрим решение уравнений (4.3) для простейших случаев: реакций, протекающих в аппарате идеального вытеснения стационарно,
изотермически и при постоянном объеме. Для необратимой одностадийной
реакции порядка n
4.2. Модели идеальных потоков
141
А → продукты
(4.4)
можно записать уравнение для вещества А (для любого продукта такой реакции концентрацию можно найти из стехиометрического инварианта):
dcA
= kcAn .
dt
(4.5)
Это дифференциальное уравнение 1-го порядка с разделяющимися переменными:
dcA
= − kdt .
cAn
(4.6)
При n ≠1 решение этого уравнения в пределах от t = 0 до t = t с учетом
начального условия при t = 0
cA = cA0
(4.7)
c1Aк− n − c1A0− n = − kt
(4.8)
выглядит следующим образом:
(cAк – концентрация вещества A на выходе из аппарата).
Так, при n = 2 после простого преобразования получаем:
1
1
=
+ kt ,
cAк cA0
(4.9)
откуда при поверочном расчете определяем:
cAк =
cA0
,
1 + ktcA0
χ=
ktcA0
1 + ktcA0
(4.10)
(напомним, что для реакции (4.4) σ = 1 и η = χ).
Для проектного расчета
t =
1/ cAк − 1/ cA0
.
k
(4.11)
К тому же самому результату (4.9) – (4.11) мы придем, анализируя реакцию
1 по А, 1 по В; k
A + B ⎯⎯⎯⎯⎯→
продукты ,
(4.12)
если cA0 = cB0. В этом случае уравнение инварианта приводит к соотношению
cA = cB и уравнению (4.5) при n = 2. При неравных концентрациях реагентов
на входе решение немного усложняется, но все равно может быть получено
аналитически достаточно легко.
Если n = 1, интегрирование левой части уравнения (4.6) приводит к логарифму
ln
cA
= − kt .
cA0
(4.13)
Из (4.13) для поверочного расчета получаем
cAк = cA0 e − kt ,
(4.14)
Глава 4. Анализ и описание процессов в потоке
142
откуда χ = 1 − e − kt . Для проектного расчета
ln
t =
cA0
1
ln
cAк
1− χ
=
.
k
k
(4.15)
Еще одна не очень сложная реакция – обратимая (обе стадии 1-го порядка):
1 по А; k1
⎯⎯⎯⎯
→
A
B
.
(4.16)
←⎯⎯⎯
⎯
1 по В; k2
Для нее с учетом стехиометрии получаем
dcA
= − k1cA + k2 (cA0 − cA ) .
dt
(4.17)
В этом уравнении при том же начальном условии (4.7) тоже удается разделить переменные:
dcA
= − dt .
(k1 + k2 )cA − k2 cA0
(4.18)
Общее решение для уравнения (4.18) имеет вид:
1
= − t + const .
(k1 + k2 ) ln((k1 + k2 )cAк − k2 cA0 )
Постоянную интегрирования const легко найти из условия (4.7):
const =
ln(k1cA0 )
.
k1 + k2
Отсюда
ln
(k1 + k 2 )cAк − k2 cA0
= −(k1 + k2 ) t .
k1cA0
(4.19)
Из этой формулы легко вывести выражения и для проектного расчета
ln
t =
k1cA0
(k1 + k 2 )cAк − k2 cA0
,
k1 + k2
(4.20)
cA0 (k1e − ( k1 + k2 ) t + k2 )
.
k1 + k2
(4.21)
и для поверочного:
cAк =
З а м е ч а н и е . В дальнейшем изложении чаще всего будет анализироваться протекание необратимой реакции 1-го порядка. Это не самый распространенный класс реакций, но простота линейных уравнений приводит
к тому, что для таких реакций зависимости оказываются наиболее просты-
4.2. Модели идеальных потоков
143
ми, их удается получить и проанализировать в общем виде. Для более сложных схем реакций очень часто качественная картина такая же, но каждый
раз приходится учитывать особенности количественного расчета применительно к индивидуальным особенностям реакции. При этом общее аналитическое решение зачастую невозможно получить, поэтому переходят к численным методам и компьютерным расчетам.
Рассмотрим теперь две реакции, в которых имеются побочные
стадии, приводящие к образованию нежелательных продуктов.
1. Последовательная побочная реакция, обе стадии 1-го порядка:
1 по А; k1
1 по B; k2
A ⎯⎯⎯⎯
→ B ⎯⎯⎯⎯
→C ,
где В – целевой продукт; С – побочный. Уравнения (4.3) запишем
для веществ А и В; концентрация С определится стехиометрией:
сС = сА0 – сА – сВ.
(4.22)
Тогда
dcA
(4.23)
= − k1cA ,
dt
dcB
(4.24)
= k1cA − k2 cB .
dt
Уравнение (4.23) – это уравнение (4.4) при n = 1; его решение –
формула (4.14). Подставив ее в (4.24), преобразуем уравнение к виду
dcB
(4.25)
= k1cA0 e − k1t − k2 cB .
dt
Это линейное дифференциальное уравнение 1-го порядка. Решение его проводится хорошо известными методами, но оно достаточно громоздко. Приведу лишь результаты. Если k1 ≠ k2, то
e − k2 t − e − k1t
.
(4.26)
cBк = k1cA0
k1 − k2
Если k1 = k2 = k, то выражение (4.26) приводит к неопределенности, но можно получить иное решение:
cBк = cA0 kte − kt .
(4.27)
Формулы для поверочного и проектного расчетов рекомендую
вывести самостоятельно. При этом следует учесть, что провести полноценный проектный расчет «в одну формулу» здесь не удастся. Для
него должны быть заранее заданы желаемые значения χ и σ (или η
и σ); но при решении одновременное получение и заданного выхода,
и заданной селективности практически исключено, поскольку одна
величина зависит от другой. Поэтому поступают одним из двух способов: либо проводят серию решений и из них выбирают наиболее
приемлемое, либо проводят оптимизационный расчет (см. гл. 7).
Глава 4. Анализ и описание процессов в потоке
144
Если побочная реакция – параллельная
1 по А; k1
А ⎯⎯⎯⎯
→В
1 по А; k2
A ⎯⎯⎯⎯
→С
(целевой продукт по-прежнему – B), то система (4.3) получает вид:
dcA
= −(k1 + k2 )cA ,
dt
(4.28)
dcB
(4.29)
= k1cA
dt
(при том же выражении (4.20) для вещества С). Решение находится
просто:
cAк = cA0 e − ( k1 + k2 ) t
(4.30)
cBк =
(cA0 − cAк )k1
k1 + k2
(4.31)
Обратите внимание, что если производную в уравнении (4.3) рассматривать не как субстанциональную, а как обычную, то получим
уравнение, верное для замкнутой системы. Такая система реализуется в реакторах периодического действия. Простейший вариант такого реактора – это емкость, снабженная мешалкой, в которую загружают исходные материалы: реагенты, растворитель, катализатор
и т. д. Затем аппарат закрывают, и в нем идет реакция. Разумеется,
стационарный режим здесь невозможен, концентрации изменяются
во времени и эти изменения описываются уравнениями (3.3), а все
приведенные решения верны.
Теперь опишем аппарат идеального смешения. Представим себе аппарат с мешалкой, через который проходит поток жидкости
(рис. 4.3). Мощность мешалки такова, что поступающая жидкость
мгновенно перемешивается с массой, уже находящейся в аппарате.
Таким образом, все, что попадает в аппарат идеального смешения,
мгновенно равномерно распределяется по всему его объему.
Рис. 4.3. Концентрации веществ на входе, в объеме
и на выходе аппарата смешения; v – расход потока
4.2. Модели идеальных потоков
145
Перечислю важнейшие следствия из этого определения.
1. Концентрации всех веществ и температура равномерно распределены по объему аппарата. В любой паре точек в аппарате любая из
этих величин имеет в данный момент одно и то же значение.
2. Для уточнения следствия 1 следует рассмотреть две точки, о которых заранее трудно сказать, находятся ли они в аппарате: точки
входа и выхода потока. На выход поток выносит ту жидкость, которая находится в аппарате. Поэтому на выходе из аппарата идеального смешения концентрации и температура те же, что и в объеме. На
входе в аппарат концентрации и температура претерпевают скачок:
исходные значения параметров потока, мгновенно смешивающегося с содержимым аппарата, соответственно мгновенно изменяются
до тех значений, которые характеризуют режим внутри аппарата и
на выходе из него.
3. Время пребывания в аппарате идеального смешения распределено неравномерно. Действительно, распределяя по объему вошедшую порцию жидкости, наша идеальная мешалка пошлет некоторые
частицы из этой порции к выходу и они сразу уйдут из аппарата, в то
время как другие, попавшие в иные части аппарата, могут задерживаться в нем весьма надолго.
4. Аппарат, как и любая его часть, принципиально открыт.
Смешение в каждый момент и в каждой точке подводит одни порции
жидкости и отводит другие. Замкнутых объемов нет. Отсюда следует,
что зависимости (3.47) к потоку смешения неприменимы. Для его
описания следует искать иной подход.
Здесь можно использовать то обстоятельство, что во всех точках
аппарата концентрации и температура, а стало быть, и скорость реакции одинаковы. Аппарат идеального смешения – типичный пример объекта с сосредоточенными параметрами (см. разд. 1.3). Это
позволяет очень просто записать уравнения баланса (1.11) или (1.12).
Дело в том, что во всех точках такого объекта интенсивность источника (или стока) – одна и та же. В результате весь объем аппарата
можно рассматривать как элементарный объем.
Воспользуемся рис. 3.3 и составим схему материального баланса
по веществу J. Символ J будет означать «какое-либо из веществ», и
все, что получено для него, верно в общем виде для любого из участников реакции. Таким образом, уже выбраны субстанция (вещество J) и контур, охватывающий весь аппарат. Выберем в качестве
интервала времени дифференциал dt и обсудим статьи баланса.
Вход. За время dt в аппарат входит объем жидкости vdt. Умножив этот объем на концентрацию входящей жидкости, получим
ВJ = сJ0vdt.
146
Глава 4. Анализ и описание процессов в потоке
Уход. Определяем так же, как вход, при этом учитываем, что концентрация cJ имеет одно и то же значение как на выходе из аппарата,
так и в любой точке внутри него. Таким образом, УJ = cJvdt.
Источник и сток. Вспомним, что мы определили скорость реакции как количество вещества, превращающегося в единицу времени
в единице объема. При этом формула (3.55) определяет скорость по
веществу, так что в нее входят и стадии, в которых вещество образуется (источник J), и те, где оно расходуется (сток). Поэтому, умножив
скорость по J на объем аппарата и на интервал времени, получим
разность источника и стока: ИJ – СJ = VаrJdt.
Накопление. Если за время dt концентрация изменится на величину dcJ , то изменение количества вещества в объеме (накопление)
составит НJ = VadcJ .
Теперь можно записать уравнение баланса:
сJ0vdt – cJvdt + rJVadt = VadcJ
или для стационарного режима
cJ0vdt – cJvdt + rJVadt = 0.
Поделив почленно эти уравнения на dt, получим
dcJ
dt
(4.32)
cJ0v – cJv + VarJ = 0.
(4.33)
cJ0 v − cJ v + Va rJ = Va
и соответственно
Каждая из формул (4.32) и (4.33) задает систему уравнений, поскольку ее следует записать для каждого из веществ, участвующих
в реакции. Но в случае стационарного процесса часть уравнений
(4.33) целесообразно заменить уравнениями стехиометрических инвариантов.
Обратим внимание на одну особенность выражения (4.32). В его
правой части – производная от концентрации по времени, умноженная на объем, а в левой на объем умножена скорость реакции,
но имеются еще два члена. Отсюда следует, что практически никогда
в таком потоке скорость реакции не равна производной dc/dt. Это
объясняется открытостью данной системы. Лишь если мы исключим
поток (приравняем v к нулю), т.е. замкнем объем, эти две величины
сравняются и мы перейдем к описанию периодического процесса –
выражению (4.3).
Если поделить выражения (4.32) и (4.33) на v и учесть соотношение (4.1), то получим формулы, часто более удобные для расчетов:
4.2. Модели идеальных потоков
147
cJ0 − cJ + trJ = t
dcJ
,
dt
(4.34)
а для стационарного режима
cJ0 − cJ + trJ = 0 .
(4.35)
Если же поделить (4.33) на Va, то придем к выражению
откуда
cJ0 − cJ
+ rJ = 0 ,
t
rJ =
cJ − cJ0
.
t
(4.36)
(4.37)
В стационарном режиме в потоке смешения скорость реакции
может быть получена как отношение конечного изменения концентрации к среднему значению времени, за которое изменение произошло. Следует лишь учесть, что в нестационарном режиме это соотношение неверно.
Пример 4.3. Расчет простейших реакций в аппарате идеального смешения проведем для стационарного режима. Стационарный процесс в аппарате идеального смешения по определению всегда изотермичен (нет изменения температуры по аппарату). Оговорим лишь постоянство объема.
1. Реакция 1-го порядка А → В. Уравнение (4.35) для А имеет вид
(4.38)
cA0 − cA − t kcA = 0 .
Уравнение баланса по В можно не записывать вследствие наличия стехиометрического инварианта. Решения уравнения (4.38) при поверочном
расчете имеет вид
cA0
,
1+ t k
(4.39)
cA0 − cAк
.
kcAк
(4.40)
cAк =
а при проектном расчете –
t =
2. Реакция 2-го порядка А → В. Имеем:
cA0 − cA − t kcA2 = 0 .
(4.41)
Стехиометрия – та же, что в предыдущем случае. Для поверочного расчета получим
cAк =
−1 + 1 + 4 t kcA0
.
2t k
(4.42)
(Второй корень уравнения отрицателен, а потому лишен физического
смысла.)
Глава 4. Анализ и описание процессов в потоке
148
Для проектного расчета можно записать:
t =
3. Обратимая реакция A
cA0 − cAк
.
2
kcAк
1 по А; k1
⎯⎯⎯⎯
→
←⎯⎯⎯
⎯
1 по В; k2
(4.43)
B (обе стадии 1-го порядка).
Имеем уравнение:
cA0 − cA + t (− k1cA + k2 (cA0 − cA )) = 0 .
(4.44)
Решить его относительно как cA, так и t не составляет труда. Замечу лишь,
что при t → ∞ величина cA стремится к пределу – равновесной концентрации.
Уравнения и их решения для случаев последовательной и параллельной
побочных реакций читатель получит без труда.
Подход, основанный на уравнениях баланса, который мы применили к описанию реакции в аппарате идеального смешения, весьма
универсален, если применять его к элементарному объему. В зависимости от того, каков этот объем, будем иметь различные по форме
уравнения. Если он бесконечно мал, получатся дифференциальные
уравнения, а если бесконечно мал по двум (или более) координатам,
а также при бесконечно малом объеме и описании нестационарного
процесса, получим уравнения в частных производных.
Рассмотрим сравнительно простой случай – стационарное протекание реакции в потоке идеального вытеснения. Это будет иной подход
по сравнению с тем, что применен выше (см. вывод уравнения (4.3)).
П р и м е ч а н и е . Здесь возникает вопрос, имеющий очень общий характер. Уравнение (4.3) уже выведено. Целесообразно ли выводить его еще раз
исходя из иного подхода? Могу ответить на этот вопрос только так: если одну и ту же важную для нас задачу можно решать принципиально по-разному,
нужно постараться испробовать все методы. Если при этом все решения совпадут, это, во-первых, повысит наше доверие к надежности решения, а вовторых, покажет эквивалентность данных подходов, что иногда очень важно.
Может оказаться и так, что разные подходы приводят к разным результатам.
Это свидетельствует либо о том, что в одном из решений допущена ошибка,
либо о том, что какой-то подход неверен или неприменим к данному объекту. Такой вывод может иметь значение для анализа проблемы.
Так как мы считаем в идеальном вытеснении параметры выровненными в поперечных направлениях, то изменения происходят
только вдоль продольной оси х. Поэтому элементарный объем может занимать все поперечное сечение аппарата, но будет иметь бесконечно малую длину dx (рис. 4.4).
Обратите внимание на различие между схемами на рис. 4.2 и 4.4. На
рис. 4.2 изображен малый движущийся объем жидкости, на рис. 4.4 –
малая неподвижная часть аппарата, через которую проходит поток.
4.2. Модели идеальных потоков
149
dx
Fпоп
Рис. 4.4. Элементарный объем в аппарате идеального вытеснения
На рисунке показаны также расход жидкости v (он не меняется по длине,
так как рассматривается процесс при постоянном объеме) и концентрации
вещества J до и после прохождения элементарного объема. Применив те же
рассуждения, что и при выводе уравнения (4.33), получим баланс по J :
vcJ – v (cJ + dcJ) + Vэ rJ = 0,
где Vэ – величина элементарного объема, равная Fпопdx; Fпоп – площадь поперечного сечения аппарата.
Раскрыв скобки, приведя подобные и подставив выражение для Vэ , получим
vdcJ = FпопrJ dx.
Теперь поделим уравнение почленно на Fпоп и, учитывая, что линейная
скорость текущей жидкости w = v/Fпоп, получим:
wdcJ = rJ dx.
Поделим обе части на dx, а постоянную w введем под знак дифференциала
в знаменателе:
dcJ
= rJ .
d ( x / w)
И наконец, учтем, что отношение x/w есть время dt прохождения потоком
расстояния dx. Тогда
dcJ
= rJ .
dt
Итак, получили то же самое уравнение (4.3).
О реалистичности моделей идеальных потоков. Идеальные потоки – сильно упрощенные модели. Законен вопрос: насколько можно считать их соответствующими каким-либо реальным объектам?
Оказывается, что такое соответствие существует достаточно часто.
Так, к идеальному вытеснению близок поток жидкости или газа, проходящий через достаточно длинный аппарат, заполненный слоем
зернистого материала (насадочная колонна, реактор с неподвижным
слоем катализатора, шахтная печь). Зернистый слой интенсивно выравнивает поток. В меньшей степени можно применить эту модель к
потоку в пустой трубе, особенно в ламинарном режиме (см. разд. 4.1).
Близко к идеальному смешению течение жидкости через аппарат
с достаточно мощной мешалкой или через барботажный слой. В том
же барботажном слое течение газа плохо описывается данной моде-
150
Глава 4. Анализ и описание процессов в потоке
лью, но зачастую нам нужно описать именно движение жидкости,
считая, что газ не сильно отклоняется от идеального вытеснения.
В практических расчетах процессов во многих случаях используем
модели идеальных потоков. Так, рассчитывая время контакта (время
протекания реакции) в каталитическом реакторе или скорость газа в
насадочной колонне, мы не принимаем во внимание реальную неравномерность, размытость этих величин, т. е. ведем расчет в приближении идеального вытеснения. В то же время, рассчитывая выпарной аппарат с принудительной циркуляцией, мы, как правило,
считаем концентрацию упариваемого раствора одной и той же во
всем объеме, что соответствует идеальному смешению. Часто такое
пренебрежение неидеальностью потока действительно допустимо,
и тогда, разумеется, применять более сложные модели нецелесообразно. Но бывают ситуации, когда недопустимо грубо пользоваться
приближением идеальных потоков. Поэтому очень важно в каждом
конкретном случае оценить возможную ошибку идеализации, обусловливающую неадекватность модели.
Сопоставление идеальных потоков. Проведем его таким образом,
как будто имеем дело с реальными аппаратами (например, случай,
когда реальный поток достаточно точно соответствует идеализированной схеме). Вначале сопоставим особенности описания, а затем – протекание в этих потоках различных процессов.
Каждый из идеальных потоков отличает предельная равномерность. В идеальном вытеснении это равномерность скоростей и времени пребывания, в идеальном смешении – равномерность концентраций и температуры по объему.
Стационарный процесс в потоке идеального вытеснения описывается системой дифференциальных уравнений (4.3). Для идеального
смешения этот случай описывается уравнениями (4.33) или (4.35) –
конечными уравнениями, не содержащими операторов дифференцирования. Лишь в нестационарном режиме в описании появляются
производные. Объясняется это тем, что в идеальном смешении нулю
равны производные по координатам – градиенты концентраций и
температуры. В связи с этим процесс в потоке смешения можно описывать так, будто он целиком происходит в одной точке (от точки
к точке ничто не меняется). И в нестационарном процессе аппарат
идеального смешения ведет себя «как точка» – все изменения происходят во всем объеме одновременно. Таким образом, это объект
с сосредоточенными параметрами (см. разд. 1.3).
Аппарат идеального вытеснения – объект с распределенными параметрами: в нем параметры процесса меняются от точки к точке.
Правда, это простейший из таких объектов – одномерный, посколь-
4.2. Модели идеальных потоков
151
ку рассматриваются изменения лишь в продольном направлении, а
поперек потока все считается выровненным. Тем не менее описание
идеального смешения еще проще, что привлекательно с точки зрения математической обработки модели. Поэтому, как увидим далее,
ряд более сложных моделей строится на основе модели смешения.
Теперь посмотрим на примере простейшей реакции 1-го порядка А → В, как равномерность или неравномерность распределения
параметров влияет на ход химической реакции. Многие сделанные
при этом выводы будут верны для большинства формально простых
реакций, обратимых реакций, а также для процессов массо- и теплообмена, описание которых аналогично описанию обратимой реакции 1-го порядка.
Вначале проведем качественный анализ. Равномерность времени
пребывания в идеальном вытеснении способствует глубокому протеканию реакции (см. пример 4.1), так что с этой точки зрения преимущество следует отдать потоку вытеснения. Для того чтобы определить, как влияет на процесс равномерность концентраций в потоке
смешения, построим график изменения концентрации реагента А по
длине аппарата идеального вытеснения либо идеального смешения
(рис. 4.5). На графике х = 0 – вход в аппарат; х = L – выход. Значения
х < 0 и х > L соответствуют трубам, подводящим жидкость к аппарату и отводящим прореагировавшую смесь. Будем считать заданными
исходную cA0 и конечную cAк концентрации реагента.
CA
CA0
1
2
0
x=0
L
x
Рис. 4.5. Изменение концентрации реагента
по длине аппарата для идеальных потоков
В идеальном вытеснении легко связать пройденный частицей
путь с временем протекания реакции в этой частице:
t = x/w.
152
Глава 4. Анализ и описание процессов в потоке
Уравнение (4.14) соответственно получит вид
cA = cA0 e
−
kx
w
(см. экспоненту на рисунке).
В аппарате смешения картина совершенно иная. На входе происходит скачок концентрации реагента А до значения, которое дальше
сохраняется вплоть до выхода. По всей длине аппарата cA = cAк.
Если теперь рассмотреть любое поперечное сечение обоих аппаратов, то очевидно, что значение сА в аппарате вытеснения окажется
больше соответствующего значения в аппарате смешения. Скорость
реакции, пропорциональная сА, во всех сечениях аппарата, кроме
последнего (на выходе), также будет большей в аппарате вытеснения, чем в аппарате смешения. Получить картину, показанную на
рис. 4.5 (одинаковые начальные и одинаковые конечные сА), можно
только в том случае, если объем аппарата смешения больше объема
аппарата вытеснения. Отсюда можно сделать два вывода:
1) аппарат вытеснения обеспечивает большую эффективность
процесса;
2) на кинетику реакции влияет не только химизм, но и характер
потока.
Таким образом, анализ распределения и времени пребывания, и концентраций приводит к выводу о большей эффективности потока вытеснения. Правда, судить об эффективности только по скорости протекания
реакции опасно. Конструкции аппаратов, близких к обоим идеальным
типам, различны. В частности, интенсивное перемешивание способствует массо- и теплообмену. Часто процессы, для которых важен перенос тепла и вещества, проще оформить в аппарате с перемешиванием, и
тогда возникает проблема: чем жертвовать – простотой конструктивного оформления или малым продольным перемешиванием.
Пример 4.4. Проектируется аппаратурное оформление сильно экзотермической каталитической реакции. Можно насыпать катализатор в трубки,
между которыми циркулирует хладоагент, и пропускать поток сквозь его
неподвижный слой. Поток – почти идеальное вытеснение, но для интенсивного отвода тепла трубки должны быть узкими и для создания нужного
объема катализатора их потребуется много. Современные аппараты этого
типа могут содержать тысячи трубок, они сложны и дороги. Возможно проведение реакции в псевдоожиженном слое катализатора. Отвод тепла при
этом резко упрощается, но сильно возрастает продольное перемешивание,
поэтому придется брать больше катализатора.
Решение вопроса об эффективности того или иного потока должно, разумеется, базироваться на количественных оценках, к которым мы и перейдем. По-прежнему будем анализировать реакцию
1-го порядка А → В.
4.2. Модели идеальных потоков
153
Можно сопоставить выражения (4.14) и (4.39). Задав ряд значений
kt , .рассчитаем при каждом из них степень превращения в потоках
идеального вытеснения χвыт и идеального смешения χсм. Данные расчета сведены в следующую таблицу.
0,5
kt
1
2
4
6
10
χвыт
0,394
0,632
0,865
0,982
0,9975
0,99996
χсм
0,333
0,500
0,667
0,800
0,856
0,909
При малых значениях kt , соответствующих случаям малого объема аппарата или медленной реакции, разница не очень велика (~6%
при kt = 0,5). При росте kt разница может оказаться существенной.
Еще яснее видно различие при сопоставлении результатов проектного расчета, когда задается требуемая величина χ и по формулам
(4.15), (4.40) совместно с (4.1) рассчитываются потребные объемы
аппаратов. Значения отношения этих объемов Vсм/Vвыт при различных требуемых χ приведены в таблице.
Требуемое χ
Vсм/Vвыт
0,5
1,5
0,7
2
0,9
4
0,05
6
0,99
22
0,999
140
Результаты последнего сопоставления очень показательны. Если
требуется невысокая степень превращения (менее 0,9), то проигрыш
вследствие перехода от идеального вытеснения к идеальному смешению не слишком велик. Оценивая эффективность, нужно учитывать
и иные факторы. Но если требуется степень превращения 99% или
выше, различие в необходимых объемах столь велико (в десятки или
даже сотни раз), что ясно: следует применять аппараты, максимально близкие к идеальному вытеснению.
Пример 4.5. Продолжим рассмотрение, начатое в примере 4.4. То обстоятельство, что при небольших степенях превращения проигрыш вследствие
продольного перемешивания невелик, позволяет решить две задачи – отвод тепла и глубокое превращение реагентов – порознь, в разных аппаратах.
Вначале можно поставить аппарат с интенсивным перемешиванием, получая в нем степень превращения 80–90% и соответственно отводя 80–90%
всего выделяющегося тепла. Затем реагирующая масса направляется в аппарат вытеснения, где превращение доходит до высокой степени. В этом
аппарате отвод тепла упрощен, так как основная часть его уже отведена на
предыдущей ступени.
Вывод о том, что в аппарате вытеснения глубина превращения
выше, чем в аппарате смешения, и что преимущество этого потока
возрастает по мере роста требуемой степени превращения, верен для
154
Глава 4. Анализ и описание процессов в потоке
изотермических необратимых и обратимых реакций любого положительного порядка, а также для большинства тепло- и массообменных
процессов. Можно показать, что по глубине протекания процесса
поток идеального вытеснения теоретически наилучший всегда, когда скорость процесса снижается по мере его протекания.
Иногда делают обратный вывод, считая, что если один идеальный
поток – наилучший, то второй (смешение) – наихудший. Но это неверно. Существуют потоки, много худшие, чем идеальное смешение,
прежде всего это потоки с большими застойными зонами и мощными короткими байпасами.
Нужно также иметь в виду, что существует ряд процессов, в которых закон изменения скорости реакции по ходу процесса иной.
Вначале скорость реакции мала, постепенно она нарастает и затем,
достигнув максимума, начинает снижаться (рис 4.6). Объясняется
это тем, что во время процесса вырабатывается какая-либо субстанция (вещество или энергия), ускоряющая его протекание. Вначале
этой субстанции мало, поэтому процесс идет медленно. С течением
времени он самоускоряется до максимума, после чего скорость начинает уменьшаться вследствие нехватки исходного вещества. Отмечу
четыре группы таких процессов.
r
t
Рис. 11.6. Изменение по времени скорости реакции с самоускорением
1. Автокаталитические реакции, в которых один из продуктов
реакции ускоряет процесс. Пока этого продукта мало, реакция медленная. Накопление катализатора ведет к ускорению реакции до тех
пор, пока в конце процесса убыль исходных веществ не обусловит
снижение скорости.
2. Биохимические реакции, вызываемые микроорганизмами – брожение, ферментация. На начальной стадии процесса его скорость
возрастает в связи с интенсивным размножением микроорганизмов.
В конце процесс замедляется вследствие недостатка «пищи».
3. Автотермические процессы, в которых вначале за счет тепла экзотермической реакции происходит разогрев, ведущий к росту скорости.
4.2. Модели идеальных потоков
155
4. Процессы кристаллизации. В начальной стадии процесса скорость растет благодаря увеличению числа зародышей кристаллизации. Затем образование новых зародышей прекращается и скорость
снижается из-за уменьшения пересыщения.
Если процесс такого типа проводить в аппарате вытеснения, то на
начальном отрезке аппарата скорость реакции мала и эта его часть используется неэффективно. В таком случае более эффективным может
оказаться аппарат смешения: в нем несложно поддерживать высокую
концентрацию катализатора, микроорганизмов, зародышей кристаллизации или высокую температуру. Причем эта оптимальная концентрация или температура поддерживается во всем объеме аппарата.
После того как процесс пройдет через максимум скорости, он будет идти как процесс с падающей скоростью. Поэтому на этом этапе
(на «хвосте» процесса) смесь выгодно вывести из аппарата смешения
и направить в аппарат вытеснения.
В ряде подобных случаев процесс можно проводить и в аппарате вытеснения, но тогда для ускорения начальной стадии процесса
осуществляют циркуляцию: часть потока, выходящего из аппарата,
возвращают на его вход (рис. 4.7). С этим циркуляционным потоком в начальный участок аппарата вносится «затравка», ускоряющая
процесс. Можно отметить, что циркуляцию вообще можно рассматривать как один из механизмов продольного перемешивания.
Естественно, если агент, ускоряющий процесс, – это тепло, то
не нужно смешивать входящий и циркулирующий потоки, тепло от
уходящей жидкости ко входящей может быть передано через стенку.
Рис. 4.7. Схема аппарата с циркуляцией
Сложные реакции в идеальных аппаратах. При проведении сложных реакций с побочными стадиями обычно главной задачей является достижение высокой селективности. Зачастую ради этого жертвуют
степенью превращения: недопревратившиеся реагенты можно отделить от вышедшей из аппарата смеси и вернуть в начало процесса.
В результате стоимость переработки возрастает на величину стоимости процесса разделения. Низкая же селективность означает, что, вопервых, часть исходных веществ затрачивается бесполезно (переходит
в ненужные побочные продукты); во-вторых, эти побочные продукты
также приходится отделять (затраты на разделение могут быть даже
большими, чем при низкой степени превращения); в-третьих, с побочными продуктами после их отделения нужно что-то делать. Просто
Глава 4. Анализ и описание процессов в потоке
156
выбросить их, как правило, нельзя: загрязнение окружающей среды
в наше время становится одной из тяжелейших проблем, стоящих перед человечеством. Обезвреживание или уничтожение побочных продуктов ложится тяжелым грузом на экономику процесса.
Характер влияния структуры потока на протекание сложных реакций отличается большим разнообразием. Рассмотрим два простых
случая: реакцию с последовательной побочной стадией и реакцию
с параллельной побочной стадией. Для последовательной побочной
стадии вначале проведем качественный анализ. Реакция А → В → С,
где В – целевой продукт, а С – побочный. На качественном этапе
кинетические порядки стадий несущественны.
Построим график, аналогичный приведенному на рис. 4.5 (изменение концентрации по длине аппарата), но по оси ординат отложим изменение концентрации целевого продукта В (рис. 4.8). По
оси абсцисс по-прежнему – координата длины от входа к выходу.
CB
2
1
0
L
x
Рис. 4.8. Изменение концентрации целевого продукта по длине
аппарата: 1 – идеальное вытеснение, 2 – идеальное смешение
Учтем, что скорость второй (побочной) реакции тем выше, чем
больше концентрация В. Изменение показателей процесса по длине в аппарате вытеснения такое же, как изменение по времени
в периодическом процессе, проанализированное в конце разд. 3.2
(см. табл. 3.2). Вначале концентрация В мала, а концентрация А велика; скорость образования В – большая, а скорость побочной реакции – маленькая. Селективность при этом близка к 1. Затем, по
мере исчерпания А и накопления В, скорость первой стадии снижается, скорость второй растет и селективность уменьшается. В аппарате же смешения по всей длине мала концентрация реагента А и
велика концентрация В. Во всем объеме аппарата процесс протекает
с минимальной селективностью. Если обе стадии 1-го порядка, то,
4.2. Модели идеальных потоков
157
задав разные комбинации произведений k1 t и k2 t , несложно, проведя расчет по формулам (4.14) и (4.26) или (4.27) для идеального вытеснения и соответствующим формулам для идеального смешения,
сопоставить значения σ и χ для обоих идеальных потоков.
Для параллельной реакции (В – целевой продукт)
А→В
А→С
влияние структуры потока на селективность зависит от соотношения
порядков основной и побочной стадий. Аналитические выражения
для σ не всегда достаточно просты, поэтому легче провести анализ на
основе другой характеристики – отношения скоростей образования
обоих продуктов:
ω = rB/rC.
(4.45)
Величина ω не равна σ, но симбатна ей: чем больше отношение
скоростей, тем больше селективность. Если обе стадии одинакового
порядка, то ω зависит только от соотношения констант скоростей
обеих стадий:
ω = k1/k2.
В этом случае селективноcть не меняется по ходу реакции (если
температура постоянна) и не зависит от характера потока. Если же
порядки разные (n1 и n2), то
ω=
k1 n1 − n2
cA .
k2
Теперь селективность зависит от концентрации А. Например, если целевая (первая) реакция 1-го порядка, а побочная – 2-го, то ω
обратно пропорциональна сА.
Обратимся к рис. 4.5. При заданной степени превращения А его
концентрация в любом поперечном сечении аппарата смешения будет
ниже, чем в соответствующем сечении аппарата вытеснения. Значит,
в случае, когда n1< n2, процесс в аппарате идеального смешения будет
проходить хотя и медленнее, но зато с существенно большей селективностью, т. е. именно аппарат смешения окажется наилучшим.
Нетрудно понять, что если целевая реакция 2-го порядка, а побочная – 1-го, то все преимущества будут у аппарата вытеснения.
Рассмотрим теперь процессы полимеризации в потоке. Реакция
полимеризации состоит из чрезвычайно большого числа последовательных стадий присоединения молекул мономера к растущей цепи.
В этом случае нельзя говорить о целевом веществе: продукт представляет собой смесь макромолекул разной длины. Эту смесь можно
Глава 4. Анализ и описание процессов в потоке
158
охарактеризовать функцией распределения степени полимеризации
(или длины цепей). Свойства полимера существенно зависят как от
средней длины цепей (математического ожидания), так и от дисперсии этой величины (см. разд. 2.1). В большинстве случаев стремятся
получить молекулярно-однородный полимер: продукт с малой дисперсией степени полимеризации.
Теоретические исследования и математическое моделирование
показали, что влияние структуры потока на распределение степени
полимеризации зависит от особенностей кинетики полимеризации.
Можно выделить два крайних случая:
1) медленный рост цепей, который продолжается на протяжении всего
времени пребывания и прерывается на выходе из аппарата. Тогда длина цепи в основном определяется временем пребывания и наибольшая
однородность цепей будет достигаться в аппарате вытеснения;
2) быстрый рост цепей, при котором время роста отдельной цепи
малó. За время пребывания в аппарате многократно наступают начало
и конец роста цепи. Длина цепи в основном определяется концентрациями мономера и других веществ (инициатора полимеризации, регулятора длины и др.) в период ее роста. Поэтому молекулярной однородности будет способствовать идеальное смешение, выравнивающее
концентрации по всему аппарату. В аппарате вытеснения в этом случае цепи, выросшие в начале аппарата (высокая концентрация мономера), будут сильно отличаться от тех, что выросли в его конце.
Пример 4.6. Исследована [31] реакция анионной полимеризации стирола
с целью получения максимальной молекулярной однородности. Примерно
за 1 мс стирол смешивали с инициатором и пропускали по трубке (полимеризатору). Среднее время пребывания составляло от 0,1 до 2 с; после выхода
из трубки полимеризация прекращалась.
На рис. 4.9 показаны интегральные функции распределения степени полимеризации F (N), полученные при разных значениях критерия Рейнольдса.
F(N)
0,6
500
0
00
56
Re=
1
0,8
00
10
0,4
0,2
0
200
400
600
800
1000
Рис. 4.9. Интегральные функции распределения длины
цепей полимера при разных значениях Re
N
4.3. Статистика времени пребывания в потоке
159
Переход от ламинарного потока (Re = 1000) к развитому турбулентному
(Re = 15 000) привел к резкому снижению дисперсии N. Сопоставьте это
с данными об интенсивности продольного перемешивания, приведенными
в разд. 4.1.
4.3. Статистика времени пребывания в потоке
Мы убедились, что имеются условия (в первую очередь связанные
с необходимостью получения высокой степени превращения), когда
продольное перемешивание сильно ухудшает показатели процесса.
В этих случаях имеет место не только резкое различие в эффективностях аппаратов идеального вытеснения и идеального смешения, но и
заметное влияние небольших отклонений от идеального вытеснения.
Даже в аппаратах со слабыми отклонениями от равномерности времени пребывания процесс идет не так, как при идеальной модели.
Наблюдаются и такие случаи, когда аппарат (или участок аппарата), в котором создается интенсивное перемешивание, не описывается с достаточной точностью моделью идеального смешения.
Например, часто описание движения жидкости на тарелке барботажной колонны в приближении идеального смешения оказывается
неадекватным и не удовлетворяет нашим требованиям по точности.
Тогда необходимо описывать процесс более реалистичными моделями. Но прежде, чем переходить к рассмотрению этих моделей, целесообразно обсудить метод, которым можно воспользоваться для
анализа структуры реального потока.
В разд. 4.1 уже говорилось о том, что при всей привлекательности самого исчерпывающего подхода – изучения поля скоростей,
он слишком сложен. В ряде случаев его использование дает важные
результаты, но часто желательно воспользоваться более простым методом. Для этого может служить исследование распределения времени
пребывания жидкости в аппарате. Правда, при таком подходе многое
теряется; например, мы не узнаем, каковы скорости в разных частях
аппарата. Действительно, рассмотрим рис. 4.10. На нем схематически
изображены эпюры скорости в поперечных сечениях трех аппаратов.
В одном аппарате профиль скоростей – парабола с максимумом на
оси потока, в другом – поток идет в основном вдоль левой стенки,
в последнем – поток в среднем равномерен по сечению, но из-за
турбулентных пульсаций одни его частицы обгоняют другие. Однако
с той точки зрения, которую мы сейчас излагаем, эти аппараты неотличимы один от другого. Каждый из них часть жидкости проходит быстрее, чем поток в среднем, часть – медленнее. Если для двух
160
Глава 4. Анализ и описание процессов в потоке
аппаратов эти части одинаковы, то и потоки представляются одинаковыми. Таким образом, мы обедняем картину потока, исключая
много важных подробностей.
Рис. 4.10. Эпюры скоростей при неравномерности трех видов:
а – симметричной; б – несимметричной; в – хаотичной
Зато мы получаем серьезные преимущества. Во-первых, эксперимент при таком подходе прост. Во-вторых, данные опытов легко поддаются количественной обработке и трактовке: из всех переменных
остается одна – время пребывания. В-третьих, полученные результаты достаточны для многих случаев. Наконец, в-четвертых, если
этих данных окажется недостаточно для анализа процесса, то в дальнейшем можно перейти к снятию поля скоростей. При этом информация о распределении времени пребывания поможет наилучшим
образом спланировать соответствующий эксперимент и упростить
обработку его результатов.
Итак, мы хотим знать, какое количество текущей жидкости будет
находиться в аппарате в то или иное время. При этом отдельные частицы жидкости для нас неразличимы: обнаружив на выходе какуюлибо частицу, нельзя сказать, вошла она в аппарат минуту назад или
находилась в нем в течение часа. Чтобы различить частицы, выделим
из всей совокупности те из них, которые вошли в аппарат в некоторый зафиксированный момент. Примем его за начало опыта. Если
аппарат работает непрерывно в стационарном режиме, то «судьба»
выделенных частиц (например, распределение времени пребывания)
не будет отличаться от «судьбы» любых других. Таким образом, выделенные частицы образуют представительную выборку из генеральной
совокупности частиц, движущихся через аппарат (см. разд. 2.2).
Для выделения интересующих нас частиц пометим жидкость, входящую в аппарат в момент, который примем за начало опыта (t = 0).
С этой целью во входящий поток быстро (теоретически мгновенно)
4.3. Статистика времени пребывания в потоке
161
добавляем порцию какой-либо примеси, называемой индикатором,
или трассером. Индикатор должен быть легко количественно определим. Кроме того, его добавление не должно влиять на характер потока
(в частности, его следует вводить мало, чтобы существенно не изменять
расход), а сам он должен двигаться вместе с потоком, ни с чем не реагируя и не сорбируясь. Так, к потоку воды можно добавить немного кислоты или красителя, к воздуху – немного СО2 или Не. Начиная с момента
t = 0 на выходе из аппарата измеряют концентрацию индикатора си как
функцию t. Типичный график зависимости си(t) показан на рис. 4.11.
СИ
СИ
0
0
Рис. 4.11. Зависимости си от t : а – на входе, б – на выходе
В момент t = 0 на входе резким импульсом вводится индикатор
(рис. 4.11,а). В идеале подача мгновенная – индикатор вводится за
время, равное нулю. При мгновенной подаче конечного количества
индикатора его концентрация, естественно, будет бесконечной.
Реально получается более или менее узкий и высокий импульс. На
выходе (рис. 4.11, б) вначале си = 0: ни одна частица индикатора не
успела дойти до выхода. В момент t1 выхода достигает самая быстрая
часть потока, появляется индикатор. Далее его концентрация нарастает до момента t2, а затем начинает убывать: основная масса потока прошла, выходят те части индикатора, которые попали в зоны
циркуляции или застоя. Выход этих порций обычно продолжается
долго; лишь через большой промежуток времени практически весь
индикатор покидает аппарат.
Для количественной оценки результатов необходимо провести
некоторые математические рассуждения.
Обозначим количество индикатора, находящееся в данный момент в аппарате, через gи. В начальный момент в аппарате находилось
все введенное в поток количество индикатора gи0. Концентрацию
индикатора на выходе обозначим через си.
Рассмотрим произвольный текущий момент. За единицу времени
из аппарата выйдет объем жидкости, равный расходу v; за бесконечно
малый промежуток dt, отсчитываемый от данного момента, – объем
162
Глава 4. Анализ и описание процессов в потоке
vdt. Количество индикатора, вышедшего из аппарата за промежуток dt, составит
dgи = –cиvdt.
(4.46)
Знак «–» означает, что количество индикатора убывает, т.е. индикатор уходит из аппарата.
Дальнейший анализ целесообразно вести, перейдя к безразмерным
величинам. Прежде всего желательно пользоваться безразмерным
значением концентрации индикатора. В эксперименте си тем больше, чем больше введенное количество индикатора gи0. Но при изучении потока величина gи0 – несущественная, она определяется случайными обстоятельствами опыта. Безразмерная концентрация не
должна от нее зависеть. Время лучше рассматривать в безразмерных
единицах. Это позволит распространить результаты анализа модельного потока на другие потоки, подобные ему, но проходящие в ином
масштабе времени.
Воспользуемся способом построения безразмерных (приведенных) величин, широко распространенным в теории подобия. Для
каждой величины u на исследуемом объекте выберем характерное
значение u0. Соответствующая приведенная величина v получается
делением значений u на характерное значение (единицу масштаба):
u
v= .
u0
Ясно, что приведенные значения безразмерны. Их получают, измеряя величины не общими эталонами (метрами, молями и т.д.), а
внутренними, свойственными конкретному объекту, но не данному
классу величин вообще. В теории подобия приведенные величины
широко используются как параметрические критерии подобия.
В сходственных точках подобных объектов их значения одинаковы.
Примем за характерное значение времени среднее время пребывания t :
V
(4.47)
t = a.
v
Единицу масштаба си обозначим через си0 :
cИ0 =
g И0
.
Va
(4.48)
Приведенное время (обозначим его τ) равно отношению текущего
времени к среднему:
t
(4.49)
τ= .
t
4.3. Статистика времени пребывания в потоке
163
Приведенная концентрация индикатора С будет описываться
формулой
cИ
cИ0
(4.50)
t = tτ ,
(4.51)
C=
(напомню, что величина си определяется на выходе потока).
Обратный переход от безразмерных величин к размерным проводится по формулам:
(4.52)
си = си0С.
Для дальнейших рассуждений важно понять: безразмерные величины С и τ имеют тот же физический смысл концентрации и времени, что и размерные. Изменились лишь масштабы, в которых они
измеряются.
Преобразуем уравнение (4.46), используя сначала формулы (4.51)
и (4.52), а затем (4.47) и (4.48) и вынося постоянную величину t за
знак дифференциала:
g
V
dg И = − CcИ0 vtd τ = − C И0 v a d τ .
Va v
Сократив и перенеся gи0 в левую часть, имеем:
dg И
= − Cd τ .
g И0
(4.53)
Таким образом, дифференциал Сdτ равен доле первоначально
введенного индикатора, которая выходит из аппарата за промежуток
времени dτ. Вспомним, что dτ – бесконечно малое приращение, началом которого служит текущий момент τ. Индикатор, вышедший
в этот промежуток, находился в аппарате время τ с точностью до
бесконечно малого dτ. Но индикатор как таковой нас не интересует.
Нам важно, что он пометил ту жидкость, которая вошла в аппарат
вместе с ним в момент τ = 0, и, следовательно, время пребывания
его такое же. Поэтому получаем следующую формулировку. Доля от
общего количества проходящей через аппарат жидкости, равная Сdτ,
имеет время пребывания τ с точностью до dτ. Заметим, что ввиду безразмерности С величина Сdτ – одна и та же: и для индикатора, и для
помеченной жидкости.
Теперь учтем сказанное выше: при развиваемой постановке вопроса отдельные частицы для нас неразличимы. Для какой-либо частицы на входе мы не можем предсказать, каким точно окажется ее
время пребывания. Но тогда время пребывания – величина случайная
и к ее анализу следует привлечь методы теории вероятности и мате-
Глава 4. Анализ и описание процессов в потоке
164
матической статистики, рассмотренные в разд. 2.1 и 2.2. Сопоставив
выражения (4.53) и (2.2) и вспомнив, что вероятность характеризует
частоту или, что то же самое, долю от общего числа, мы увидим, что
из формулы (4.53) вытекает такое определение: безразмерная концентрация индикатоpa С равна плотности вероятности (дифференциальной функции распределения) времени τ как случайной величины.
Чтобы подчеркнуть свойства С как функции, в дальнейшем изложении я буду иногда записывать ее в виде С(τ). Для функции С(τ) верны все свойства, выраженные формулами (2.3) – (2.5), с некоторыми
уточнениями, связанными со следующей особенностью:
С = 0 при τ < 0
(4.54)
Смысл формулы (4.54) таков: вероятность того, что частица выйдет из аппарата раньше, чем войдет в него, равна нулю. Поэтому
в интегралах (2.4) и (2.5) нижний предел можно заменить на 0.
В частности,
τ
F (τ ) = ∫ C (τ )d τ .
(4.55)
0
Имеются экспериментальные методики, позволяющие получить
в опыте не функцию С(τ), как описано выше, a F(τ). Вид этой функции определяется законом, по которому на вход аппарата подается
индикатор. При импульсной подаче индикатора на выходе имеем
C(τ). Чтобы получить F(τ), характер подачи (сигнал на входе) должен
быть иным: до момента τ = 0 концентрация индикатора равна нулю;
в этот момент (теоретически мгновенно) концентрация скачком возрастает до 1 и далее остается на этом уровне (рис. 4.12,а).
СИ=F(t)
СИ
1
0
1
0
0
0
Рис. 4.12. Изменение во времени концентрации индикатора
при ступенчатой подаче: а – на входе; б – на выходе
Таким образом, получение в опыте С(τ) или F(τ) – дело методики. Использование же в анализе процесса той или иной функции –
в основном дело привычки. В принципе безразлично, какую из них
применять. Для контроля правильности вычислений (либо для расчета gи0, если эта величина неизвестна) можно воспользоваться свойством (2.4), в данном конкретном случае имеющим вид
4.3. Статистика времени пребывания в потоке
165
∞
∫ C (τ )d τ = 1 .
(4.56)
0
Среднее время пребывания. Обозначим математическое ожидание τ символом τ . Запишем формулу (2.10) с учетом того, что нижний предел интеграла можно положить равным нулю:
∞
τ = ∫ τ C (τ )d τ .
(4.57)
0
Формула (4.57) практически неинтересна: заранее известно, что
τ ≡ 1 . Действительно, при построении приведенного времени мы
приняли τ за единицу и при правильном расчете единица и должна
получиться. Но эту формулу нетрудно преобразовать к размерному
виду:
∞
∫ tc (t )dt
И
t =
0
∞
.
(4.58)
∫ c (t )dt
И
0
Рассчитав t по формуле (4.58), можно, применив уравнение (4.47),
решить одну из двух задач: либо по известному Va рассчитать расход
жидкости, либо по известному v – неизвестный объем. Первая задача встречается редко. Вторая же часто бывает важна. Так, указанным
методом определяют объемы воды в подземных озерах, прямое исследование которых невозможно.
Для химической технологии представляет интерес решение следующей задачи. Общий объем аппарата известен, но поток заполняет
не весь объем. Необходимо определить, какая часть аппарата занята
потоком. Такая задача особенно характерна для процессов, связанных с движением через аппарат двух фаз (ректификация, абсорбция,
экстракция и др.). Введя индикатор в поток одной из фаз, мы получим значение t , относящееся именно к ней, и сможем определить
порознь, какой объем занимают пар и жидкость в ректификационной колонне и т. д. Эта информация нужна, например, при ректификации термочувствительных смесей, когда необходимо, чтобы время
пребывания жидкости в зоне высоких температур было минимальным. От объема, занимаемого жидкой фазой, зависит также время
выхода ректификационной колонны на стационарный режим при
пуске. При разделении изотопов уменьшение этого времени имеет
большое значение, поскольку стационарный режим иногда достигается лишь через десятки суток.
Глава 4. Анализ и описание процессов в потоке
166
Та же задача возникает в процессах, в результате которых возможно образование воздушных пузырей внутри аппаратов или приставших к стенкам настылей («козлов»), отгораживающих от потока
часть объема.
Пример 4.7. Объем аппарата составляет 12 л. Необходимо, чтобы аппарат
был весь заполнен протекающей жидкостью, без воздушных пузырей. При
расходе жидкости 0,21 л/с проведен эксперимент с импульсным вводом индикатора. Полученные на выходе данные сведены в таблицу.
0
10
20
30
40
50
60
70
80
90
100
>100
си, мкмоль/л 0
t, с
0
1
4
11
10
7
4
2
0,5
0
0
Так как си = 0 при t > 100, то в качестве верхнего предела в интегралах формулы (4.58) можно принять не ∞, а 100. Расчет проведем по приближенной
формуле Симпсона:
b
∫ f (u )du ≈
a
∆u
( f1 + 4 f 2 + 2 f3 + 4 f 4 + 2 f5 + ... + 4 f n −1 + f n ) ,
3
(4.59)
где ∆u – интервал между соседними значениями u (шаг интегрирования);
в данном случае ∆t = 10 с (все ∆u должны быть одинаковы, а их число – четное, т. е. число значений u – нечетное). Величины f1, f2, …, fn – последовательные значения подинтегральной функции.
Данные предварительного расчета tcи в числителе (4.58) удобно сгруппировать в следующую таблицу.
t
си
tси
0
0
0
10
0
0
20
1
20
30
4
120
40
11
440
50
10
500
60
7
420
70
4
280
80
2
160
90
0,5
45
100
0
0
По формуле (4.59), сократив числитель и знаменатель на 10/3, получим:
t =
0 + 4 ⋅ 0 + 2 ⋅ 20 + 4 ⋅120 + 2 ⋅ 440 + 4 ⋅ 500 + 2 ⋅ 420 + 4 ⋅ 280 + 2 ⋅160 + 4 ⋅ 45 + 0
=
0 + 4 ⋅ 0 + 2 ⋅1 + 4 ⋅ 4 + 2 ⋅11 + 4 ⋅10 + 2 ⋅ 7 + 4 ⋅ 4 + 2 ⋅ 2 + 4 ⋅ 0,5 + 0
.
=
5860
= 50,5 c .
116
Из (4.47) найдем, что V = 0,21·50,5 = 10,5 л. Таким образом, можно предполагать наличие внутри аппарата пузыря объемом ~1,4 л.
Дисперсия времени пребывания также может быть использована
при анализе структуры потока. Вычисляется она по формуле (2.12),
которая с учетом нижнего предела интегрирования для функции и
значения τ ≡ 1 имеет вид
∞
σ 2 (τ ) = ∫ (τ − 1) 2 C (τ )d τ .
0
(4.60)
4.3. Статистика времени пребывания в потоке
167
По размерным значениям расчет можно вести, пользуясь формулой
∞
∫ t c (t )dt
2
И
2
σ (τ ) =
0
∞
t
2
− 1.
(4.61)
∫ c (t )dt
И
0
Пример 4.8. Рассчитаем σ2(τ), используя данные примера 4.7. Расчет величин t 2си может быть выполнен так же, как расчет tcи в примере 4.7. По
формуле Симпсона найдем, что числитель (4.61), деленный на 10/3, равен
321000. Отсюда с учетом результатов предыдущего примера имеем:
σ 2 (τ ) =
321000
− 1 = 0, 085 .
50,52 ⋅116
Как уже отмечалось в разд. 2.1, дисперсия характеризует разброс
данных относительно среднего. Чем больше дисперсия, тем сильнее
проявляется продольное перемешивание жидкости. Как будет показано ниже, идеальные потоки характеризуются следующими значениями: для вытеснения – σ2(τ) = 0; для смешения – σ2(τ) = 1. Поток,
для которого проведен расчет в примерах 4.7 и 4.8, видимо, ближе
к вытеснению, но не к идеальному, поскольку в потоке образовался
пузырь, «выключивший» часть объема.
Распределение времени пребывания и степень превращения. В примере 4.1 и в разд. 4.2 уже обсуждалось влияние распределения времени пребывания на степень превращения химической реакции.
В случае изотермической необратимой реакции 1-го порядка степень превращения однозначно определяется константой скорости,
средним временем пребывания и видом дифференциальной функции распределения. Такая же однозначность имеет место при протекании обратимой реакции и любой сложной реакции, все стадии
которой проходят по первому порядку. Уравнения тепло- и массопередачи аналогичны уравнению обратимой химической реакции 1-го
порядка, поэтому подчиняются аналогичным закономерностям:
• скорость реакции
r = k (cA – cA*),
(4.62)
где cA* – равновесная концентрация А;
• поток массы
qм = Kм (cA – cA*),
(4.63)
где Kм – коэффициент массопередачи;
• поток тепла:
qт = Kт (T1 – T2),
(4.64)
168
Глава 4. Анализ и описание процессов в потоке
где Kт – коэффициент теплопередачи; T1 и T2 – температуры теплоносителей.
Для реакций не 1-го порядка приходится учитывать ряд дополнительных факторов. Но во многих случаях первоначальную оценку
влияния потока можно получить и для них, имея данные о распределении времени пребывания.
Мы рассматриваем протекание реакции 1-го порядка А → В.
Скорость реакции определяется формулой
rA = –kcA.
(4.65)
Поскольку анализ распределения времени пребывания проводился в приведенных переменных, константу k целесообразно также
привести к безразмерному виду. Приведенная константа
(4.66)
κ = kt .
Заметим, что замена k на κ скажется только на размерности, но
не на форме уравнений, в которые входит эта константа. Так, если
какая-то частица жидкости находилась в аппарате отрезок времени τ, то уравнение (4.14) для нее можно записать в виде
cA = cA0 e −κτ.
(4.67)
Проведем теперь мысленный эксперимент. Мысленным экспериментом называют рассуждение о том, как повела бы себя исследуемая система, если бы с ней что-то сделали. Чтобы провести его, необходимо знать о системе достаточно много. Зато, если он удался,
мы зачастую получаем два преимущества. Во-первых, практически
всегда мысленный эксперимент дешевле реального. Во-вторых, его
зачастую удается провести и тогда, когда реальный эксперимент невозможен (именно так обстоит дело в рассматриваемом далее случае). Замечу, что мысленный зксперимент моделирует процесс реального опыта.
Итак, проведем мысленный эксперимент. На выходе аппарата из
потока жидкости, проходящего через него и характеризуемого дифференциальной функцией распределения времени пребывания С(τ),
отберем пробу объемом V и рассортируем ее на частицы в соответствии с временем пребывания каждой из них в аппарате. Тогда все,
что попадет в некую данную частицу, будет иметь время пребывания
не меньше τ и не больше τ + dτ. Жидкость с иным временем пребывания попадет в другую частицу и т. д.
Рассмотрим одну частицу. Ее объем dV, очевидно, равен общему
объему пробы V, умноженному на долю, которую жидкость с данным
временем пребывания составляет в общем количестве жидкости. Но
эта доля определяется уравнением (2.2).
4.3. Статистика времени пребывания в потоке
169
Поэтому
dV = VC(τ)dτ .
(4.68)
Концентрация вещества А в этой частице определяется формулой
(4.67). Количество вещества А, выходящего из аппарата в данной частице, равно произведению концентрации на объем:
dg A = cA dV = cA0 e −κτVC (τ )d τ .
(4.69)
Теперь перейдем ко всей пробе V. Мы не можем складывать значения концентраций вещества в разных частицах: концентрация –
величина интенсивная. Однако можно складывать количества вещества. Количество вещества А в пробе определится по формуле
(4.70)
g A = ∫ dg A .
V
Если подставить (4.69) в интеграл (4.70), то интегрировать будем
по τ. Пределы интегрирования определятся возможными пределами τ: от 0 до ∞. Постоянные сА0 и V вынесем за знак интеграла:
∞
g A = VcA0 ∫ e −κτ C (τ )d τ .
0
Поделив gA на V, получим концентрацию вещества А в пробе
∞
cAK = cA0 ∫ e −κτ C (τ )d τ
(4.71)
0
и для степени превращения
∞
χ = 1 − ∫ e −κτ C (τ )d τ .
(4.72)
0
Выражения (4.71) и (4.72) относятся к классу зависимостей, называемых в математическом анализе функционалами. Это более сложный класс, чем обычные функции. Так, функция одного аргумента
устанавливает связь между одной величиной (аргументом) и другой
(функцией). Может быть и несколько аргументов. В функционале же
роль аргумента выполняет не величина, которая может принимать то
или иное значение, а функция, вид которой и определяет значение
зависимой переменной. Например, в (4.72) значение χ определяется
не только значением κτ, но и видом функции С(τ) – для каждого ее
вида получится своя χ.
Законы распределения времени пребывания для идеальных потоков. Рассмотрим, какой вид имеют дифференциальная и интегральная функции распределения для аппарата идеального вытеснения.
Так как время пребывания всех частиц одинаково, то при τ < 1 выхода не достигнет ни одна меченая частица: С = 0. При τ > 1 также
Глава 4. Анализ и описание процессов в потоке
170
С = 0: все меченые частицы уже прошли. Функция С(τ) отлична от
нуля лишь при τ = 1. Но по условию (4.67)
∞
∫0 Cdt = 1 .
Если функция отлична от нуля только в одной точке, а площадь
под ее кривой конечна, то в этой точке функции придется приписать
бесконечное значение – функция оказывается весьма необычной.
Ее ввел в науку П. Дирак и назвал дельта-функцией (δ-функцией).
Для данного случая ее запись такова:
С(τ) = δ (τ – 1),
(4.73)
где единица в скобках – это значение времени, при котором происходит бесконечный импульс. Изобразить график δ-функции невозможно; график С(τ) для некоего режима, близкого к идеальному
вытеснению, показан на рис. 4.13. Это весьма узкий, крутой и высокий пик.
C
C(τ)
1
0
1
τ
0
1
τ
Рис. 4.13. Функция С(τ) для потока, близкого к идеальному вытеснению
Рис. 4.14. Функция F(τ) для потока идального вытеснения
Интегральная функция для данного случая показана на рис. 4.14.
Функция F(τ) = 0 при τ < 1. При τ = 1 происходит ее скачок, и при
1 < τ < +∞ функция F(τ) = 1: из аппарата уже вышла вся жидкость,
вошедшая в него в момент τ = 0.
Обратим внимание, что для получения на выходе функции С(τ)
необходимо подать индикатор на вход по закону δ-функции (см. рис.
4.11,а). Если на выходе желательно получить F(τ), сигнал на входе
должен быть интегралом от δ-функции (см. рис. 4.12,а). В потоке
идеального вытеснения входной сигнал, не искажаясь, переносится
4.3. Статистика времени пребывания в потоке
171
от входа к выходу за время τ = 1. Выходной сигнал, соответственно
С(τ) или F(τ), совпадает по форме с входным, но сдвинут по оси абсцисс на единицу.
Основное свойство δ-функции выглядит так. Для любой функции
φ(τ) справедливо равенство
∞
∫ φ (τ )δ (τ − a)d τ = φ (a) .
(4.74)
−∞
С учетом этого равенства после подстановки в уравнение (4.72)
значения С(τ) из (4.74) получим для идеального вытеснения
∞
χ = 1 − ∫ e −κτ δ (τ − 1)d τ = 1 − e −κ
(4.75)
0
или с учетом (4.66)
χ = 1 − e − kt ,
что, естественно, соответствует формуле (4.14).
Теперь выведем функцию С(τ) для потока идеального смешения.
1
0
1
2
3
τ
Рис. 4.15. Функция С(τ) для потока идеального смешения
Запишем для него уравнение (4.46), учитывая, что в любой момент
индикатор равномерно распределен по объему и его концентрация
в объеме и на выходе составляет gи/Va:
dg И = −
gИ
vdt .
Va
(4.76)
Перегруппируем сомножители с учетом соотношения (4.47):
dg И = − g И
v
dt
dt = − g И .
Va
t
Глава 4. Анализ и описание процессов в потоке
172
Разделим переменные
dg И
dt
=−
gИ
t
и проинтегрируем с учетом начального условия: gи = gи0 при t = 0. При
интегрировании учтем, что в левой части знаменатель есть переменная и при интегрировании получится логарифм, а в правой части
знаменатель – постоянная интегрирование приведет к величине t:
ln
gИ
t
=− .
g И0
t
Поделив числитель и знаменатель под знаком логарифма на Vа и
применив формулы (4.48) – (4.50), получим:
ln
cИ
t
= ln C = − = −τ ,
cИ0
t
откуда находим, что
C = e−τ .
(4.77)
При τ < 0, как и для любого потока, имеем С = 0. При τ = 0 функция скачком достигает максимального значения С = 1, а затем убывает по экспоненте (рис. 4.15). Для данного закона распределения
получается: τ = 1 ; σ2(τ) = 1.
Подставив выражение (4.77) в формулу (4.72), получим:
∞
∞
0
0
χ = 1 − ∫ e −κτ ⋅ e − τ d τ = 1 − ∫ e − (κ +1)τ d τ = 1 −
1
κ
,
=
κ +1 κ +1
(4.78)
что после подстановки κ из (4.66) приведет нас к выражению (4.39).
Мы вывели формулы (4.75) и (4.78) и убедились, что результат тот
же, что и полученный на базе иных соображений (из рассмотрения
материального баланса). Выше уже говорилось, какой смысл заключен в том, чтобы к одной и той же задаче подходить с разных позиций, решать ее разными методами. Если результаты, найденные
по двум методам, совпадают (как в нашем случае), это усиливает доверие к ним. Если же обнаружены несовпадающие результаты (особенно интересный и важный случай) – это значит, что какие-то факторы не учтены. Выявленное несовпадение позволяет вскрыть такие
факторы.
Рассмотрим протекание необратимой реакции 2-го порядка А → В
в потоке, характеризуемом дифференциальной функцией распределения времени пребывания С(τ). Заметим, что константа скорости
реакции 2-го порядка имеет иную размерность, чем для 1-го порядка: не (время)–1, а (концентрация × время)–1. Поэтому безразмерная
форма этой константы будет иной:
4.3. Статистика времени пребывания в потоке
173
κ = kcA0 t .
(4.79)
С учетом этой константы кинетическое уравнение, записанное
для безразмерного времени, имеет вид
rA = −κ cA2 ,
(4.80)
и для частицы с временем пребывания τ можно записать приведенный аналог уравнения (4.10), откуда
cA =
cA0
.
1 + κτ
(4.81)
Дальнейшие рассуждения аналогичны рассуждениям для случая
реакции 1-го порядка. Сортировка отобранной на выходе пробы
проводится точно так же, но с учетом формулы (4.81) вместо выражения (4.69) получим
dg A =
cA0
VC (τ )d τ ,
1 + κτ
(4.82)
а вместо (4.71) будем иметь
∞
C (τ )d τ
.
1 + κτ
0
cAK = cA0 ∫
(4.83)
Отсюда, используя формулы (4.74) и (4.81), получим для аппарата
идеального вытеснения то же выражение (4.10), которое было найдено другим путем.
Для аппарата идеального смешения аналогичные рассуждения
приводят к формуле
∞
e−τ d τ
.
1 + κτ
0
cAK = cA0 ∫
Несложное преобразование дает
∞
1− χ =
cAK
e − τ d τ e1/κ
=∫
=
cA0 0 1 + κτ
κ
∞
e − (1/κ +τ ) d (1/ κ + τ ) .
1/ κ + τ
1/κ
∫
Введя обозначение 1/ κ + τ = u , получим
1− χ =
e1/κ
κ
∞
e−u
du .
u
1/κ
∫
(4.84)
Интеграл, стоящий в правой части, – это интегральная показательная функция. К элементарным функциям она не сводится, ее
значения можно найти в таблицах.
Уровни перемешивания. Сегрегация. Итак, двумя способами мы
получили два разных выражения для реакции 2-го порядка, проходящей в потоке идеального смешения: (4.42) из материального баланса
Глава 4. Анализ и описание процессов в потоке
174
и (4.84) из распределения времени пребывания. Расчет χ по обеим
формулам графически представлен на рис. 4.16.
χ
1,0
1
0,8
2
х = 0,925
х = 0,8
0,6
0,4
0,2
0
40
80
120
κ
Рис. 4.16. Степень превращения для реакции
2-го порядка в аппарате смешения:
1 – по формуле (4.84); 2 – по формуле (4.42)
При больших значениях χ различие между результатами двух расчетов весьма существенно. Горизонтали на графике показывают:
в соответствии с уравнением (4.84) для достижения χ = 0,8 нужен
аппарат вдвое меньшего объема, чем рассчитанный по уравнению
(4.42); если же нужно обеспечить χ = 0,925, то эта разница достигнет
3,7 крат. Какое же уравнение правильно? В каком выводе допущена
ошибка и какая?
«Сортируя» жидкость, вытекающую из аппарата, по времени
пребывания, мы предполагали, что каждая частица проходит аппарат сама по себе. На деле же частицы взаимно смешиваются. Это
смешение не влияет на ход реакции 1-го порядка: в ней каждая
молекула реагирует независимо от того, какие молекулы ее окружают. Но в реакции 2-го порядка (и любого другого, кроме нулевого и 1-го) вероятность вступления молекулы в реакцию зависит
от вероятности ее столкновения с другими молекулами. А эта вероятность зависит от концентрации и изменяется при смешении
частиц.
Пример 4.9. В потоке двигались две частицы одинакового объема V, но
с разными концентрациями реагента cА1 и сА2 . В какой-то момент они быстро перемешались. Как изменится в результате смешения средняя по обеим частицам скорость реакции А → В в зависимости от того, какой порядок
реакции – 1 или 2-й?
4.3. Статистика времени пребывания в потоке
175
Для реакции 1-го порядка:
r1 + r2
c +c
= k A1 A 2 ;
2
2
до смешения r1 = kcA1; r2 = kcA2; r =
cA1 + cA 2
;
2
после смешения cA =
r = kcA = k
cA1 + cA 2
.
2
Как видим, смешение не изменило среднюю скорость.
Для реакции 2-го порядка:
2
до смешения r1 = kcA1
;
после смешения cA =
2
r2 = kcA2
;
cA1 + cA2
;
2
r =k
2
2
cA1
+ cA2
;
2
2
⎛c +c ⎞
r = kcA2 = k ⎜ A1 A2 ⎟ < r .
⎝
2 ⎠
Несложно установить, что в случае реакции 2-го порядка средняя скорость реакции в результате перемешивания частиц уменьшилась. Именно
по этой причине расчет по формуле (4.84) приводит к бóльшим значениям χ,
чем расчет по (4.42).
Однако было бы слишком поспешно заключить из сказанного,
что при расчете по формуле (4.84) результат всегда неверный, а при
расчете по (4.42) всегда верный. Дело в том, что в реальных случаях отдельные частицы смешиваются одна с другой в разной степени.
По определению, в аппарате идеального смешения каждая входящая частица полностью перемешивается со всеми другими и составляющие ее молекулы равномерно рассеиваются по всему аппарату
(рис. 4.17, а). При этом формула (4.42) будет верной. Но возможен и
иной случай.
Представим себе другой (также идеализированный) характер движения. Входящие в аппарат частицы жидкости мгновенно равномерно распределяются по его объему : с этой точки зрения в аппарате
наблюдается идеальное смешение. Но каждая частица движется в потоке как единое целое, не перемешиваясь с окружающими частицами. Поэтому хотя в среднем концентрация вещества во всех частях
аппарата одинакова, однако если рассмотреть маленький его участок
в увеличенном масштабе (рис. 4.17, б), то станет видно, что эта средняя концентрация складывается из значений, хаотически колеблющихся от частицы к частице. В первом случае говорят об идеальном
смешении на микроуровне, во втором – об идеальном смешении на
макроуровне при полной сегрегации (разделении) на микроуровне.
Итак, для расчета протекания реакции 1-го порядка достаточно
знать дифференциальную функцию распределения времени пребывания. Для реакций более высоких (а также и более низких) порядков этого уже недостаточно, так как начинает сказываться ограни-
176
Глава 4. Анализ и описание процессов в потоке
ченность подхода, не учитывающего особенности перемешивания
в аппарате. Понятие о сегрегации – один из путей преодоления этой
ограниченности. К сожалению, строгих количественных характеристик для случаев, промежуточных между полным смешением на
микроуровне (сегрегация равна нулю) и полной сегрегацией (равной
единице), видимо, пока не имеется. Можно говорить лишь о большей или меньшей сегрегации.
В случае идеального вытеснения, если за частицу принимать малый движущийся объем, занимающий все поперечное сечение, сегрегация всегда полная: такие частицы в этом потоке между собой
не перемешиваются. В потоках смешения в принципе возможны ситуации с любой степенью сегрегации. Если нет оговорки, то поток
считают несегрегированным. При гомогенных, не слишком быстрых
реакциях в турбулентных потоках степень сегрегации близка к нулю.
Повышение вязкости и переход в ламинарный режим увеличивают
сегрегацию.
Рис. 4.17. Изменение концентрации по длине в увеличенном масштабе:
а – идеальное смешение на микроуровне; б – полное
смешение на макроуровне при полной сегрегации
Высокой может быть сегрегация в случае очень быстрых реакций:
за время их протекания частицы не успевают перемешаться. В дисперсных фазах многофазных потоков сегрегация может быть близка
к единице. Так, если реакция идет в твердых частицах, проходящих
через аппарат (например, в псевдоожиженном слое), то сегрегацию
можно считать полной. Сегрегация дисперсной фазы эмульсии или
пены зависит от того, насколько часто сливаются (коалесцируют)
капли или пузыри.
Ход реакции не 1-го порядка зависит не только от степени сегрегации, но и от иных особенностей потока. Так, если в аппарате чередуются зоны с разным характером потока, то степень превращения
зависит от порядка чередования этих зон.
4.4. Модели неидеальных потоков
177
Пример 4.10. Рассмотрим протекание необратимой реакции А → В в двух
системах последовательно соединенных и равных по объему аппаратов идеального смешения и идеального вытеснения. В первой системе вначале
включен аппарат вытеснения, а во второй– аппарат смешения. Среднее время пребывания в каждом аппарате – 1 мин. Концентрация реагента на входе – 1 кмоль/м3. Расчет проведем для двух случаев: 1) реакция 1-го порядка,
k = 1 мин-1; 2) реакция 2-го порядка; k = 1 м3/(кмоль·мин).
Для реакции 1-го порядка и первой системы концентрация вещества А
после первого аппарата определяется по формуле
cA1 = cA0 e − kt ;
после второго –
cA2 =
Для второй системы имеем:
cA1 =
c e − kt
cA1
= A0
.
1 + kt
1 + kt
cA0
;
1 + kt
cA2 = cA1e − kt =
cA0 e − kt
.
1 + kt
Оба результата совпали; для заданных параметров получатся и одинаковые значения χ = 0,816.
В случае реакции 2-го порядка общие формулы громоздки, поэтому проведу расчет последовательно.
Первая система:
cA1 =
cA0
= 0,5;
1 + ktcA0
cA2 =
1 + 4ktcA1 − 1
= 0,366;
2kt
χ = 0, 634 .
cA1
= 0,382;
1 + ktcA1
χ = 0, 618 .
Вторая система:
cA1 =
1 + 4ktcA0 − 1
= 0, 618;
2kt
cA2 =
Мы видим, что для реакции 1-го порядка результат не зависит от порядка включения последовательных секций реактора. Несложно убедиться, что
в обоих случаях С(τ) – одна и та же, так что этот вывод подтверждает правильность формулы (4.72). Для реакции 2-го порядка, несмотря на совпадение функций С(τ), первая система обладает заметным преимуществом.
4.4. Модели неидеальных потоков
В разд. 1.3 обсуждался вопрос о переходе от предельно идеализированных моделей к более сложным, связанным с введением в описание параметров. В разд. 4.2 рассматривался вопрос о построении
моделей, описывающих идеальные потоки. Здесь будут описаны две
простейшие, однопараметрические модели неидеальных потоков и
кратко рассказано о путях построения более сложных моделей.
Глава 4. Анализ и описание процессов в потоке
178
Ячеечная модель – исторически первая. Эта модель схематически
представляет реальный аппарат как некоторое число п одинаковых
последовательно соединенных аппаратов (ячеек) идеального смешения (рис. 4.18). Суммарный объем всех ячеек равен объему реального аппарата, следовательно, объем каждой ячейки равен Va/n. Число
ячеек – единственный параметр ячеечной модели.
Рис. 4.18. Схема ячеечной модели
В ряде случаев в аппарате действительно можно выделить участки по ходу потока, в каждом из которых жидкость более или менее
полно перемешивается. Схема ячеечной модели близка, например,
к картине движения жидкости через каскад реакторов с мешалками или через тарельчатую барботажную колонну провального типа,
в которой жидкость интенсивно перемешивается на каждой тарелке
и быстро переливается с тарелки на тарелку. В других потоках отождествить физическую картину с ячеечной моделью можно лишь
ценой значительных упрощений. Например, для турбулентного потока в первом приближении можно считать, что каждая частица проходит некоторое расстояние как единое целое, а затем перемешивается с окружающим частицами. Участок, на котором происходит
это перемешивание (путь смешения), можно, хотя и весьма грубо,
сопоставить с ячейкой смешения. Другой такой пример – течение
газа в зернистом слое. Выходя из узкой щели между зернами в более широкую полость (такие всегда есть в слое), газ завихряется и
перемешивается, в результате чего возникает картина чередующихся
перетеканий и перемешиваний. Но и здесь схема ячеечной модели
сильно огрубляет реальное явление. Однако в ряде случаев ошибка
огрубления несущественна для решения конкретной задачи, а простота модели делает ее применение желательным.
Рассмотрим распределение времени пребывания и изменение концентрации по длине аппарата для ячеечной модели. Дифференциальная функция распределения времени пребывания имеет вид (формула
приводится без вывода)
C (τ ) =
nn
τ n −1e − nτ .
(n − 1)!
(4.85)
4.4. Модели неидеальных потоков
179
График этой функции изображен на рис. 4.19. По мере увеличения числа ячеек кривые становятся все более крутыми, приближаясь
к графику δ-функции. При п = 1 формула (4.85) переходит в уравнение (4.78), а при п→∞ – в (4.74). Таким образом, потоки идеального
смешения и идеального вытеснения являются крайними случаями
ячеечной модели.
3
2
n=100
n=1
n=10
1
n=4
n=2
0
1
2
τ
Рис. 4.19. Функция С(τ) для ячеечной модели при разных n
Из формулы (4.85) можно вывести простую зависимость для дисперсии:
1
(4.86)
σ 2 (τ ) = .
n
Этой формулой удобно пользоваться для расчета параметра модели n. Например, если поток, рассмотренный в примерах 4.10 – 4.12,
описывать ячеечной моделью, то по данным примера 4.11 легко
определить, что:
n = 1/σ2(τ) = 1/0,085 = 11,77.
Разумеется, физическая схема, включающая 0,77 ячейки смешения, не имеет смысла. Приходится полагать, что параметр n содержит эмпирическую поправку. Впрочем, и в тех случаях, когда число
ячеек связано с совершенно определенным числом конструктивных
элементов (например, тарелок колонны), эксперимент по изучению
распределения времени пребывания, как правило, дает значение n,
отличное от этого числа и чаще всего не целое. Различие объясняет-
Глава 4. Анализ и описание процессов в потоке
180
ся отклонением течения на каждой ступени от идеального, а также
случайными ошибками эксперимента. Поэтому n и здесь содержит
эмпирическую поправку. В некоторых расчетах удается использовать
нецелое n, в других – параметр округляют.
Распределение концентрации реагента по длине аппарата показано на рис. 4.20, аналогичном рис. 4.5. Для последней ячейки концентрация вещества А в ячеечной модели совпадает с его концентрацией при идеальном смешении. Но первые ячейки работают при
бóльших сА и соответственно при бóльших скоростях реакции. С этой
точки зрения ячеечная модель занимает промежуточное место между
обеими моделями идеальных потоков.
CА
CА0
1
2
3
4
5
0
L
0
x
Рис. 4.20. Распределение концентрации реагента по длине аппарата:
1 – идеального вытеснения; 2 – идеального
смешения; 3 – состоящего из трех ячеек
Рис. 4.21. Схема аппарата из трех ячеек
Рассмотрим теперь протекание химической реакции в ячеечной
модели. Описание этого процесса есть просто описание процесса
при идеальном смешении, повторенное n раз. Выходные значения
концентрации и температуры i-й ячейки являются входными для
(I + 1)-й. Для реакции А → В это показано на рис. 4.21. Для i-й ячейки уравнение баланса по веществу J в стационарном режиме имеет
вид, полностью аналогичный уравнению (4.35)
4.4. Модели неидеальных потоков
или
181
Va
rJi = 0
n
(4.87)
t
rJi = 0 .
n
(4.88)
vcJ,i −1 − vcJi +
cJ,i −1 − cJi +
Уравнения (4.87) – (4.88) обычно решают последовательно от
ячейки к ячейке, начиная с первой.
Для необратимой реакции 1-го порядка легко вывести общую
формулу степени превращения при любом n. Рассмотрим вначале
аппарат из двух ячеек. Для первой ячейки уравнение (4.88) имеет
вид
t
cA0 − cA1 − kcA1 = 0 .
n
Из него элементарно получаем при n = 2
cA1 =
cA0 .
kt
1+
2
(4.89)
Для второй ячейки соответственно имеем
kt
cA1 − cA2 − cA1 = 0 ,
2
откуда
c
cA2 = A1 .
kt
1+
2
(4.90)
Теперь подставим в формулу (4.90) значение сА1 из уравнения (4.89).
Тогда
cA2 =
cA0
⎛ kt ⎞
⎜⎝1 + ⎟⎠
2
2
.
(4.91)
Совершенно так же проводится вывод при любом числе ячеек n.
Отличие будет лишь в том, что в каждом уравнении баланса типа (4.89) и (4.90) вместо kt /2 будет стоять kt /n и таких подстановок, которые приводят к формуле (4.91), окажется не одна, а (n –1).
Формулы при этом примут вид
cAn =
cA0
⎛ kt ⎞
⎜⎝1 + ⎟⎠
n
n
(4.92)
Глава 4. Анализ и описание процессов в потоке
182
или
χ = 1−
1
⎛ kt ⎞
⎜⎝1 + ⎟⎠
n
.
n
(4.93)
Легко убедиться, что при n = 1 выражение (4.92) переходит в (4.39),
при n→∞ стремится к (4.14). Формулами (4.92) – (4.93) можно пользоваться даже при нецелом n, т.е. в случаях, когда параметр модели
содержит эмпирическую поправку. Например, в потоке, рассмотренном в примерах 4.10 – 4.12, n = 11,77, t = 50,5 с. Если принять
k = 0,1 с-1, как в примере 4.12, то
χ = 1−
1
⎛ 0,1⋅ 50,5 ⎞
⎜⎝1 + 11, 77 ⎟⎠
= 0,985 ,
11,77
что совпадает с рассчитанным в этом примере.
Пример 4.11. Рассчитаем по формуле (4.93) степень превращения в случае kt = 6 для ячеечной модели при разных значениях n (первый и последний расчеты относятся к идеальным аппаратам):
n =1
χ = 1−
n=2
χ = 1−
n=3
χ = 1−
n = 10
χ = 1−
n→∞
1
= 0,857 ;
1+ 6
1
⎛ 6⎞
⎜⎝1 + ⎟⎠
2
2
= 0,938 ;
3
= 0,963 ;
1
⎛ 6⎞
⎜⎝1 + ⎟⎠
3
1
6⎞
⎛
⎜⎝1 + ⎟⎠
10
10
= 0,991 ;
χ = 1 − e −6 = 0,996 .
Пример 4.11 показывает, что с увеличением числа ячеек степень
превращения довольно быстро приближается к результатам, характерным для идеального вытеснения. Ясно, почему в технологии
часто применяется прием секционирования : аппараты, в которых
создается интенсивное смешение потока жидкости, делят на последовательные секции, между которыми она перетекает по возможности без смешения. Для этого обычно служат всякого рода перфорированные перегородки. Иногда для достижения того же эффекта
применяют каскады последовательно соединенных аппаратов с мешалками.
4.4. Модели неидеальных потоков
183
Кроме увеличения степени превращения секционирование влияет и на другие показатели процесса, в частности на селективность.
Пример 4.12. Выведем формулу для расчета селективности при протекании в аппарате, описываемом ячеечной моделью, последовательной
реакции, рассмотренной в примерах 4.3 и 4.4 (примем k1 = k2 = k). Для соkt
. Тогда для i-й ячейки аппарата, сокращения выкладок обозначим q =
n
держащего n ячеек, получим:
cAi =
cA0
.
(1 + q )i
(4.94)
Рассмотрим баланс по В для ряда ячеек.
• Для первой ячейки
−cB1 + qcA1 − qcB1 = 0 ,
откуда с учетом значения сА1 ИЗ формулы (4.94) находим, что
cB1 =
qcA0
qcA1
.
=
1 + q (1 + q ) 2
(4.95)
• Для второй ячейки
cB1 − cB2 + qcA2 − qcB2 = 0 .
Используя формулы (4.94) и (4.95), определяем:
2qcA0 .
cB1 + qcA2
(4.96)
=
1+ q
(1 + q )3
• Для третьей ячейки, применив формулы (4.94) и (4.96), получим:
cB2 =
cB3 =
3qcA0
.
(1 + q ) 4
Методом индукции легко прийти к выражению
cBi =
iqcA0
(1 + q )i +1
cBn =
nqcA0
.
(1 + q ) n +1
или для последней n-й ячейки
(4.97)
Из уравнений (4.94) и (4.97) вытекает выражение для селективности:
σ=
nq
=
(1 + q )((1 + q ) n − 1) ⎛ kt
⎜⎝1 +
n
kt
n
⎞.
⎞ ⎛ ⎛ kt ⎞
⎟⎠ ⎜ ⎜⎝1 + ⎟⎠ − 1⎟
n
⎝
⎠
(4.98)
Так, например, расчет для kt = 0,5 дает ряд значений, представленных
в приведенной ниже таблице.
Глава 4. Анализ и описание процессов в потоке
184
n
χ
σ
1
0,333
0,667
2
0,360
0,711
4
0,376
0,739
6
0,381
0,749
10
0,386
0,757
∞
0,394
0,770
Таким образом, и в этом случае несомненна целесообразность
секционирования аппарата: растет как степень превращения, так и
селективность.
Однопараметрическая диффузионная модель – вторая наиболее
распространенная модель неидеального потока – основывается на
следующих предпосылках. Вначале рассмотрим аппарат идеального вытеснения. Предположим, что в поток введено некоторое количество индикатора, концентрация которого изменяется вдоль
оси потока по некоторому произвольному закону: если рассмотреть
систему координат, движущуюся вместе с потоком, то си = f(x). Это
положение показано на рис. 4.22,а для двух моментов времени t1 и
t2: картина распределения си по длине, неподвижная относительно
текущей жидкости, смещается вдоль аппарата вместе с потоком, не
деформируясь.
Рассмотрим неподвижное относительно аппарата поперечное сечение А – А и запишем, как будет меняться во времени си в этом сечении:
∂cИ
∂c
= −w И .
∂t
∂x
(4.99)
Изменение во времени концентрации си в сечении А – А происходит вследствие того, что картина изменения си, характеризующаяся производной по х, надвигается на наше сечение со скоростью w.
Смысл знака «–» хорошо понятен из рис. 4.22,а. Здесь около сечения
∂c
∂c
производная И отрицательна, а производная И в сечении поло∂x
∂t
жительна (си возрастает во времени).
Уравнение (4.99) – один из способов описания идеального вытеснения в отсутствии химической реакции. При этом оно описывает
наиболее общий случай – нестационарный режим (обратите внимание на левую часть).
Теперь предположим, что в потоке, подчиняющемся схеме идеального вытеснения, учтена диффузия индикатора. Этот случай
иллюстрирует рис. 4.22,б. Здесь происходит не только сдвиг картины распределения концентрации, но и ее деформация: по мере
продвижения потока кривая концентрации все больше «размазывается». Математическое описание этого случая дает следующее
уравнение диффузии индикатора в потоке (его вывод приведен
в разд. 5.1):
4.4. Модели неидеальных потоков
185
∂cИ
∂c
∂ 2c
= − w И + D 2И .
∂t
∂x
∂x
(4.100)
В правой части этого уравнения первый член связан с движением
потока – это конвективный член; второй – диффузионный член.
Теперь рассмотрим случай, когда поток в аппарате турбулентный. Для простоты допустим, что диффузия индикатора отсутствует.
Однако идеального вытеснения не будет (см. рис. 4.10,в). В результате турбулентных пульсаций скорости одни частицы будут обгонять
основную массу потока, другие – отставать от нее. Распределение
концентраций будет «размазываться» таким же образом, как показано на рис. 4.22,б. Причем вследствие хаотического характера
турбулентных пульсаций деформация распределения си аналогична
деформации распределения под влиянием хаотического теплового движения молекул (молекулярной диффузии). Математическое
описание также оказывается совершенно аналогичным предыдущему. Различие заключается лишь в коэффициенте при диффузионном
члене: вместо коэффициента молекулярной диффузии D здесь коэффициент турбулентной диффузии Dтурб. В то время как D – физикохимическая характеристика, в первом приближении зависящая лишь
от свойств системы жидкость – индикатор и от температуры; Dтурб –
характеристика потока, зависящая прежде всего от значения Re.
СИ
СИ
а
б
Рис. 4.22. Распределение индикатора по длине потока вытеснения
без учета (а) и с учетом (б) диффузии индикатора
В ламинарном потоке Dтурб = 0. Тем не менее и в этом случае, даже
при отсутствии молекулярной диффузии, наблюдается отклонение
потока от идеального, в самых общих чертах сводящееся к тому же –
одни частицы уходят вперед, другие отстают. Картина совсем не похожа на диффузию: уход частиц вперед и отставание происходят не
хаотически, а регулярно. Заранее можно сказать, что частицы, близкие к оси потока, уйдут вперед, а близкие к стенкам отстанут. Однако
необходимо учитывать, что нас, как правило, не интересует «судьба»
отдельных конкретных частиц. Нам важно знать поведение потока
в среднем А при описании «в среднем» теряется принципиальное
различие между ламинарным и турбулентным потоками. Но в этом
186
Глава 4. Анализ и описание процессов в потоке
случае, как и в ряде других, о которых уже говорилось, утрата информации компенсируется простотой и универсальностью модели; для
ряда приложений упрощенное описание даже удобнее, чем более совершенное. Особенно важно, что, если за си принимать среднее значение по сечению, то изменение си во времени можно приближенно
описать тем же уравнением (4.100), заменив коэффициент D так называемым коэффициентом тейлоровской диффузии Dтейл, который
так же, как и Dтурб, зависит от параметров потока. Во многих случаях
значение Dтейл оказывается даже больше, чем Dтурб: неравномерность
профиля скоростей сильнее перемешивает впереди и позади идущие
частицы жидкости, чем турбулентная диффузия.
Обобщая сказанное, можно прийти к выводу, что в самых разнообразных случаях поток можно упрощенно описать следующим образом. Картина потока определяется двумя членами: конвективным,
соответствующим идеальному вытеснению, и диффузионным, приближенно описывающим совокупное влияние различных факторов,
выражающееся в уходе одних частиц потока вперед и отставании
других:
∂cИ
∂c
∂ 2 cИ .
= − w И + Dl
∂t
∂x
∂x 2
(4.101)
Здесь Dl – коэффициент продольной диффузии; это эффективный
коэффициент, учитывающий и молекулярную диффузию, и турбулентность, и неравномерность поля скоростей. В практических задачах он обычно является эмпирическим параметром.
Схему потока, изложенную в предыдущем абзаце и описываемую уравнением (4.101), называют однопараметрической диффузионной моделью (или просто диффузионной моделью). Единственным
параметром модели является Dl . Поскольку одни частицы потока
перемещаются относительно других вперед или назад, происходит
продольное перемешивание частиц, вошедших в аппарат в разное
время. Поэтому коэффициент Dl иногда называют коэффициентом
продольного перемешивания.
При одном и том же значении Dl картина продольного смешения
может быть разной: на нее влияют также длина аппарата L и скорость потока w. Для распространения описания на ряд подобных
потоков продольное смешение удобно характеризовать критерием подобия. Этот критерий аналогичен диффузионному критерию
Пекле:
Pel =
wL
.
Dl
(4.102)
4.4. Модели неидеальных потоков
187
Анализ уравнения (4.101) показывает, что при Реl = 0, т. е. при
Dl = ∞, поток соответствует идеальному смешению: бесконечно быстрая диффузия полностью выравнивает концентрации веществ. При
Реl = ∞, т. е. при Dl = 0, уравнение переходит в уравнение (4.99) – поток движется по схеме идеального вытеснения. Все случаи 0 < Реl < ∞
являются промежуточными, они приближенно соответствуют тому
или иному реальному потоку.
Математический аппарат диффузионной модели сложен. В частности, результаты зависят от граничных условий уравнения (4.101) –
условий на входе и выходе, которые не всегда просто сформулировать. При Реl >10 приближенно верно уравнение
2
.
σ 2 (τ ) =
Pel
Сравнив его с уравнением (4.86), получим соотношение
Pel
≈ n,
(4.103)
2
которое устанавливает соответствие между ячеечной и диффузионной моделями. При соблюдении условия (4.103) один и тот же поток можно приближенно описать как той, так и другой схемой. Если
Реl < 10, соответствие ухудшается и решение сильнее зависит от краевых условий.
Описание химической реакции в рамках диффузионной модели
выглядит таким образом. Возьмем уравнение (4.101) в стационарном варианте, с нулевой левой частью. Если в аппарате движется не
индикатор, а вещество, участвующее в реакции, то к двум членам,
описывающим причины изменения концентрации (конвективному и диффузионному), добавляется третий член – скорость реакции. Чтобы в другой части уравнения получился ноль, все три члена
должны взаимно компенсироваться. Так, для вещества J можно записать:
dc
d 2 cJ
(4.104)
− w J + Dl
+ rJ = 0 .
dx
dx 2
В уравнении (4.104), в отличие от (4.101), производные – не частные, а обычные, поскольку рассматривается стационарный процесс
и в уравнении осталась одна независимая переменная х.
Ясность физической картины и хорошее соответствие многим
реальным случаям делают диффузионную модель очень привлекательной. Но расчет по ней труден. Я не буду останавливаться на
этом круге вопросов; его рассмотрение можно найти, например,
в [3].
188
Глава 4. Анализ и описание процессов в потоке
Более сложные модели применяют либо для описания потоков
усложненной структуры, либо в прецизионных задачах. Здесь нет
возможности рассмотреть их подробно, поэтому упомяну лишь о некоторых из них.
Ячеечно-циркуляционная модель отличается от описанной ячеечной
тем, что предполагает перетекание какой-то доли m общего расхода
жидкости навстречу потоку, т.е. из каждой i-й ячейки в (i–1)-ую.
В этой модели – два параметра: m и n. В ряде случаев модель хорошо описывает секционированные аппараты с интенсивным перемешиванием, например роторные экстракторы. Расчет по ней почти
столь же прост, как и по однопараметрической ячеечной модели.
Двухпараметрическая диффузионная модель, в отличие от однопараметрической и модели идеального вытеснения, рассматривает изменение концентраций веществ не только в продольном, но и в поперечном (радиальном) направлении. Ее применение важно в тех
случаях, когда затруднен поперечный перенос тепла и вещества, например при описании реакций, протекающих при движении потока
через трубки с неподвижным слоем катализатора и отводе тепла реакции через стенки трубок. В этой модели параметрами служат коэффициенты диффузии в продольном Dl и радиальном DR направлениях.
Комбинированные модели. Особенно сложные потоки часто удобно описывать схемами, построенными в виде совокупности ячеек
различного типа и разных размеров, соединенных последовательно,
параллельно или в каком-либо более сложном порядке. Как уже отмечалось, сложные модели требуют особенной тщательности при
оценке параметров во избежание ошибочных заключений об их влиянии.
ГЛАВА 5.
ЯВЛЕНИЯ ПЕРЕНОСА В ХИМИКО,
ТЕХНОЛОГИЧЕСКИХ ПРОЦЕССАХ...
ИХ АНАЛИЗ И ОПИСАНИЕ
Перенос тепла и вещества играет огромную роль в химической технологии. Многие важные процессы в основном сводятся к явлениям
переноса и исследуются в технологии как тепло- и массообменные
процессы. Поскольку описание и анализ таких процессов подробно
изучают в курсе процессов и аппаратов химической технологии [1],
в этой книге основное внимание будет уделено взаимодействию переноса с протеканием химических реакций.
Начиная с работ Д.А. Франк-Каменецкого [32] раздел науки, изучающей закономерности кинетики химических реакций с учетом
влияния на нее выделения (поглощения) тепла, тепло- и массопереноса, называют макрокинетикой. Мы познакомимся с рядом простых макрокинетических зависимостей.
В разд. 5.1 кроме переноса тепла и вещества вкратце рассмотрен
также перенос импульса (количества движения), играющий важную
роль в формировании структуры потока.
5.1. Механизмы переноса
Закономерности переноса отличаются сложностью, обусловленной наличием нескольких различных его механизмов. В то же время анализ облегчается аналогией, существующей между переносом
импульса, тепла и вещества. Поэтому перенос всех трех субстанций
удобно рассматривать вместе. Классифицировать механизмы переноса удобнее всего по уровню, т. е. по масштабу, в котором осуществляется элементарный акт переноса.
Квантовый уровень переноса является первым, наинизшим, уровнем, перенос на котором осуществляется путем излучения и поглощения элементарных частиц (квантов). Механизм переноса на этом
уровне называют излучением.
190
Глава 5. Явления переноса в химико-технологических процессах...
Перенос импульса излучением связан с давлением света. Этот процесс важен в космическом масштабе, его учет необходим при создании термоядерного оружия, но в химической технологии он пока не
играет роли. Перенос вещества излучением существен в ядерных реакциях, протекающих с поглощением или выделением тех или иных
элементарных частиц. Это важные процессы атомной технологии,
а в «обычной» химической технологии такой перенос, как правило,
не применяется, поэтому мы его рассматривать не будем.
Перенос тепла излучением играет первостепенную роль во многих
высокотемпературных процессах. В этой книге основное внимание
уделяется процессам сравнительно низкотемпературным, в которых
интенсивность излучения резко снижается. Поэтому и данный процесс переноса мы подробно разбирать не будем.
Молекулярный уровень переноса – второй, более высокий уровень, связанный с тепловым движением молекул. Перенос и импульса, и тепла, и вещества на этом уровне играет важнейшую роль
в большинстве процессов химической технологии.
Молекулярный механизм переноса импульса называется вязким
трением, или вязкостью. В химической технологии вязкость не часто
рассматривается как механизм переноса. Однако такое рассмотрение помогает при анализе многих случаев. Для выяснения механизма вязкости опишу такую упрощенную модель переноса.
а
б
Рис. 5.1. Упрощенная модель переноса импульса
Представим себе две параллельные линии рельсов (рис. 5.1,а). На
одной стоит неподвижная платформа А, по другой движется платформа Б. На обеих платформах стоят люди. В момент, когда платформы
поравнялись, люди с платформы А перепрыгнут на Б, а с Б – на А.
Что произойдет? Человек, перепрыгивающий с движущейся плат-
5.1. Механизмы переноса
191
формы на неподвижную, участвует в двух движениях: поперечном –
с платформы на платформу, и продольном – вместе с платформой,
с которой он прыгает. После приземления он передаст неподвижной
платформе продольный компонент импульса: она получит толчок
вперед. Наоборот, человек, прыгающий с неподвижной платформы
на подвижную, подтормаживает ее. Следовательно, после прыжков
платформа Б будет двигаться медленнее, чем до этого, а платформа А
придет в движение (рис. 5.1,б). Перепрыгивая, люди перенесли импульс с одной платформы на другую.
Обратимся теперь к другой, также упрощенной ситуации. Представим себе две касающиеся друг друга массы газа, одна из которых
в начальный момент неподвижна, а другая движется вдоль плоскости раздела обеих масс. Если эта плоскость проницаема для молекул,
то вследствие теплового движения молекулы начнут перелетать из
движущейся массы в неподвижную, перенося в нее свою долю импульса, а навстречу будут перелетать молекулы, подтормаживающие
движущуюся массу. Таков механизм вязкого трения в газах: это перенос импульса в направлении, перпендикулярном направлению движения.
В капельных жидкостях вязкость также переносит импульс в поперечном направлении, хотя механизм переноса там в значительной
мере иной, связанный со взаимодействием молекул.
Поток импульса (импульс, переносимый в единицу времени через единицу площади) равен тангенциальному напряжению трения
по величине и размерности. Равенство размерностей читатель может
проверить самостоятельно.
Основные количественные закономерности вязкого трения аналогичны закономерностям молекулярного механизма переноса
тепла – теплопроводности и молекулярного механизма переноса
вещества – диффузии. Все три процесса описываются аналогичными законами (1.4) – (1.6). Замечу, что исторически указанные законы получены как эмпирические соотношения. Как уже говорилось
в разд. 1.3, это характерно для фундаментальных закономерностей
науки. Лишь в простейших частных случаях (для идеальных газов)
эти уравнения можно вывести из молекулярно-кинетических соображений. В остальных задачах мы и сейчас принимаем их как эмпирические. В ряде случаев приходится считаться с приближенным
характером этих соотношений, вносить в них поправки, но в химической технологии необходимость в таких поправках возникает довольно редко. Например, при течении вязких систем приходится
учитывать отличия закона переноса импульса от (1.4); такие случаи
(например, течение суспензий, эмульсий, растворов полимеров [33])
изучает реология. Мы эту область затрагивать не будем.
192
Глава 5. Явления переноса в химико-технологических процессах...
Итак, процессы переноса на молекулярном уровне аналогичны
друг другу. Эта аналогия породила в свое время теорию теплорода и
обеспечила ряд ее успехов. В разных случаях она имеет разную глубину: от почти полного количественного соответствия до весьма
поверхностного сходства. Количественной мерой соответствия процессов переноса на молекулярном уровне служат критерии подобия,
определяющие отношение интенсивностей переноса импульса (кинематическая вязкость ν), тепла (температуропроводность а) и вещества (коэффициент диффузии D):
• критерий Прандтля
Pr = ν/a,
(5.1)
• диффузионный критерий Прандтля (критерий Шмидта)
Prд = ν/D,
(5.2)
• критерий Льюиса
Le = a/D.
(5.3)
Для газов все три критерия близки к 1, изменяясь в основном от
0,5 до 2. Интенсивности переноса – величины одного порядка. В капельных жидкостях Pr обычно имеет порядок 101 – 102, а Рrд – от 103
до 105. Здесь аналогия значительно менее глубокая. Разберем причину снижения глубины аналогии на примере переноса тепла и вещества.
В газах перенос в основном связан с перемещением молекул
в пространстве: перемещение «быстрых» молекул (молекул с большой энергией) ведет к переносу тепла; перемещение молекул рассматриваемого вещества – к его диффузии. Выше было показано,
что и перенос импульса основан на перемещении молекул. В соответствии с этим в газах ν ≈ a ≈ D.
В жидкостях перенос вещества из одной точки в другую также
требует перемещения молекул между этими точками. Для переноса
же тепловой энергии не обязательно непосредственное перемещение «быстрой» молекулы среди «медленных». Энергия может передаваться от молекулы к молекуле и таким образом переноситься
«эстафетой»; это же относится и к переносу импульса. В связи с этим
в жидкостях D <<a.
Наконец, в твердых телах тепло проводится хорошо, а диффузия
протекает чрезвычайно медленно. Здесь D/a ≈ 0 или Le → ∞.
Поэтому в ряде случаев диффузия и теплопроводность проходят
очень по-разному. Рассмотрим, например, передачу тепла и вещества внутри пористого зерна катализатора. Небольшой участок зерна
в крупном масштабе схематически изображен на рис. 5.2. Диффузия
здесь происходит по извилистым узким порам между твердыми части-
5.1. Механизмы переноса
193
цами, а перенос тепла – в основном «по твердому». Путь диффузии из
точки А в точку В оказывается гораздо длиннее пути теплопроводности, перенос тепла существенно интенсивнее, чем перенос вещества.
Рис. 5.2. Схема участка гранулы катализатора
Вывод уравнения диффузии. Рассмотрим вывод уравнения диффузии для случая неподвижной среды. (Если среда движется, придется
учитывать конвективный механизм переноса, о котором речь будет
дальше.) Разберем вариант, когда в неподвижной среде проходит химическая реакция. Исходить будем из уравнения (1.6).
Составим уравнение материального баланса, выбрав в качестве
субстанции вещество J. Элементарный объем – прямоугольный параллелепипед со сторонами dx, dy, dz (рис. 5.3).
Z
dz
dy
dx
Y
Рис. 5.3. Элементарный объем в неподвижной среде
X
194
Глава 5. Явления переноса в химико-технологических процессах...
В нашем уравнении баланса индексами х, у и z будем обозначать
условия на левой, задней и нижней гранях параллелепипеда, а индексами x + dx, y + dy и z + dz – соответственно на правой, передней
и верхней его гранях. Выберем интервал времени dt и будем считать,
что все компоненты вектора gradc направлены по положительным
направлениям осей координат. (Впрочем, если для какого-то компонента знак – противоположный, это учтется в уравнении автоматически и не повлияет на общность вывода.) Статьи баланса запишем
с учетом разложения векторов qJ и gradcJ по осям (дальше индекс J
опускаем, чтобы запись была менее громоздкой). Разложение вектора q имеет вид
q = qx + qy + qz.
(5.4)
С учетом такого же разложения градиента и соотношения (1.6),
запишем:
∂c
∂c
∂c
.
(5.5)
qx = − D , q y = − D , qz = − D
∂x
∂z
∂y
В материальном балансе: вход – сумма диффузионных потоков
вещества J через левую, заднюю и нижнюю грани элементарного
объема; уход – то же, для правой, передней и верхней граней; источник (или сток) и накопление записывают почти так же, как при
выводе уравнения (4.32). Таким образом, получаем уравнения, в которых индексами при производных обозначено положение граней
параллелепипеда:
⎛ ∂c ⎞
⎛ ∂c ⎞
⎛ ∂c ⎞
⎛ ∂c ⎞
dydz − D ⎜ ⎟ dxdz + D ⎜ ⎟
dxdz −
− D ⎜ ⎟ dydz + D ⎜ ⎟
⎝ ∂x ⎠ x
⎝ ∂x ⎠ x + dx
⎝ ∂y ⎠ y
⎝ ∂y ⎠ y + dy
∂c
⎛ ∂c ⎞
⎛ ∂c ⎞
− D ⎜ ⎟ dxdy + D ⎜ ⎟
dxdy + rdxdydz = dxdydz .
⎝ ∂z ⎠ z
⎝ ∂z ⎠ z + dz
∂t
(5.6)
Для принятого направления диффузионного потока первый, третий и пятый члены означают приход J через соответствующую грань;
второй, четвертый и шестой – уход через противоположную грань.
Последний член в левой части – это разность источника и стока.
В правой части – накопление.
Рассмотрим два первых члена левой части и произведем преобразование:
⎛ ⎛ ∂c ⎞ ⎛ ⎛ ∂c ⎞
⎛ ⎛ ∂c ⎞ ⎛ ∂c ⎞ ⎞
∂ ⎛ ∂c ⎞ ⎞ ⎞
Ddydz ⎜ − ⎜ ⎟ + ⎜ ⎟ ⎟ = Ddydz ⎜ − ⎜ ⎟ + ⎜ ⎜ ⎟ + ⎜ ⎟ dx⎟ ⎟ =
⎝ ⎝ ∂x ⎠ x ⎝ ∂x ⎠ x + dx ⎠
⎝ ⎝ ∂x ⎠ x ⎝ ⎝ ∂x ⎠ x ∂x ⎝ ∂x ⎠ ⎠ ⎠
⎛ ⎛ ∂c ⎞ ⎛ ⎛ ∂c ⎞
∂ 2c ⎞ ⎞
= Ddydz ⎜ − ⎜ ⎟ + ⎜ ⎜ ⎟ + 2 dx⎟ ⎟
⎠⎠
⎝ ⎝ ∂x ⎠ x ⎝ ⎝ ∂x ⎠ x ∂x
5.1. Механизмы переноса
195
(вторая производная определяет изменение первой производной, от
которой зависит поток вещества). Для остальных членов преобразование такое же, и уравнение (5.6) приводится к виду
⎛ ⎛ ∂ 2c ∂ 2c ∂ 2c ⎞ ⎞
∂c
⎜⎝ D ⎜⎝ ∂x 2 + ∂y 2 + ∂z 2 ⎟⎠ + r ⎟⎠ dxdydz = ∂t dxdydz .
Поделив обе части на dxdydz, получаем:
⎛ ∂ 2c ∂ 2c ∂ 2c ⎞
∂c
= D ⎜ 2 + 2 + 2 ⎟ + r.
∂t
∂y
∂z ⎠
⎝ ∂x
(5.7)
Сумму вторых частных производных по координатам называют
лапласианом и обозначают ∇ 2 c . Таким образом,
∂c
= D∇ 2 c + r .
∂t
При рассмотрении стационарных процессов левая часть уравнения (5.7) становится равной нулю и уравнение приобретает вид
(5.8)
D∇ 2 c + r = 0 .
Аналогично выводится уравнение теплопроводности (уравнение
Фурье):
r
(5.9)
a∇ 2T + T = 0 .
ρCT
В этом уравнении a – коэффициент температуропроводности;
ρ – плотность среды; Ст – удельная теплоемкость; rт – удельная тепловая мощность (количество тепла, выделяемое единицей массы
в единицу времени). Если все выделение тепла обусловлено тепловыми эффектами протекающих реакций, то
rт = ∑Qj rj ,
(5.10)
где j – номер стадии; Qj – тепловой эффект этой стадии; rj – ее скорость. Суммирование ведется по всем стадиям, для эндотермических
стадий Qj < 0.
Зачастую особенности процесса обусловливают частные случаи
уравнения (5.7). То же относится к уравнению теплопроводности,
что в дальнейшем не оговаривается.
Если химическая реакция отсутствует, то источник и сток равны
нулю и мы получаем:
∂c
= D∇ 2 c .
∂t
(5.11)
Во многих задачах рассматривают упрощенную картину: концентрация изменяется практически только вдоль одной оси х. Так
будет, например, при диффузии вдоль длинного стержня, когда
196
Глава 5. Явления переноса в химико-технологических процессах...
в поперечном направлении можно считать концентрацию равномерной, или при диффузии сквозь широкую тонкую пластину.
Тогда задачу решают как одномерную. В этом случае уравнение
(5.7) получает вид
∂c
∂2c
= D 2 +r.
∂t
∂x
(5.12)
Или, например, в отсутствии реакции при стационарности процесса получим
d 2c
dc
=0,
= const
dx 2
dx
(при стационарном одномерном диффузионном потоке в отсутствие
химической реакции концентрация изменяется линейно). В этих
уравнениях частные производные заменены обыкновенными, поскольку здесь рассматривается изменение только по одному аргументу – координате х.
Уравнения (5.7) – (5.12) являются основой математического описания процессов, проходящих в неподвижных средах. Сюда относятся термообработка полимеров, полупроводников и сплавов, диффузионное легирование, многочисленные химические процессы в этих
средах, включая такие важнейшие, как поликонденсация полимеров
или вулканизация, и т.д. При этом приходится учитывать характер
начальных и граничных условий, характеризующих распределение
концентраций веществ и температур в начальный момент, а также
характер их изменения на границах исследуемого тела.
Начальные условия часто задают просто как равномерно распределенные по объему концентрацию вещества с0 и температуру Т0, хотя могут встретиться и гораздо более сложные варианты. Граничные
условия в зависимости от специфики задачи могут быть заданы поразному. Рассмотрим этот вопрос на примере граничных условий для
уравнения теплопроводности.
Распределение температур на границах тела может быть задано
как функция от времени – граничные условия 1-го рода. Их простейший вариант – не меняющееся во времени распределение; особенно
простой вариант – если распределение сводится к случаю однойдвух границ, в пределах каждой из которых с и Т распределены
равномерно. Однако и в этих «простых» вариантах решение может
быть трудным; это обусловлено и возможной непростой геометрией
границ, и тем, что скорости реакций нелинейно зависят от концентраций и особенно от температуры. Исследование и решение таких
уравнений – важный раздел математической физики [12]. В сложных
5.1. Механизмы переноса
197
случаях процесс решения уравнений теплопроводности (при любом
роде граничных условий), равно как и диффузии, требует применения численных методов и работы на компьютере.
В случае, когда тепло подводится к поверхности в основном излучением, краевые условия обусловлены тем, что задается поток тепла.
В соответствии с уравнением (1.5) получается, что на поверхности
заданы производные ∂T/∂x, ∂T/∂y и ∂T/∂z. Это граничные условия 2-го
рода. Возможны и более сложные случаи, например при массоотдаче
или теплоотдаче к поверхности оказывается, что задаются некоторые комбинации величины Т и ее частных производных (граничные
условия 3-го рода).
Но описанных уровней недостаточно. В большинстве технологических процессов перенос осуществляется в потоке, и следует учитывать высший уровень переноса.
Конвективный перенос, или конвекция, – перенос импульса, тепла и вещества движущимися массами жидкости (безразлично – капельной или газа). Эти массы несут с собой и импульс, и тепло, и
вещество. Особенность конвективного переноса – его большая мощность. Предположим, что при движении газа переместилась частица
объемом 1 мм3. При обычных условиях в этой частице содержится
около 1016 молекул. Поэтому даже столь малый объем переносит неизмеримо больше и энергии, и вещества, чем одна молекула. Если
конвекция и молекулярный перенос происходят в одном направлении
(параллельные стадии, см. разд. 1.3), то суммарный перенос обычно
лимитирует гораздо более мощный конвективный механизм; вклад
молекулярного механизма мал.
Рассматривая перенос в потоке, целесообразно выделить два направления: вдоль и поперек потока.
Продольное направление – направление движения потока. Именно
в этом направлении происходит основной конвективный перенос.
Поэтому продольный перенос за счет молекулярных механизмов
почти никогда не учитывается при расчете технологических процессов. Так, при рассмотрении однопараметрической диффузионной
модели можно, рассчитывая коэффициент Dl в уравнении (4.103), не
учитывать величину D из (4.100). На самом деле, наблюдать эффект,
описываемый уравнением (4.100), как правило, не удастся: величина D столь мала, что даже очень слабое продольное перемешивание,
имеющееся в любом неидеальном потоке, «забьет» влияние молекулярной диффузии.
В качестве примера выведем уравнение, обобщающее формулы
(4.101) и (4.104).
198
Глава 5. Явления переноса в химико-технологических процессах...
dx
СА
СА+dCA
FПОП
Рис. 5.4. Элементарный объем в потоке
Будем исходить из того, что в основе картины – поток идеального вытеснения, неравномерность в поперечном направлении отсутствует. Выберем при записи уравнения материального баланса по
веществу J такой же элементарный объем, как при выводе описания
реакции в потоке вытеснения (рис. 4.4 и 5.4 совпадают), а в качестве интервала времени также выберем dt. Но здесь мы примем, что
профиль концентрации вещества J по длине может быть любым, а
значит, наш вывод теперь относится к нестационарному процессу;
стационарность будет являться крайним частным случаем. Для упрощения выкладок свяжем размер элементарного объема по длине dx
со скоростью потока w и интервалом dt :
dx = wdt.
(5.13)
За время dt фронт потока проходит от начала до конца элементарного объема.
Рассмотрим прежде всего ту часть прихода вещества, которая обусловлена конвективным его переносом в продольном направлении
(наше допущение, что в поперечном направлении параметры выровнены, снимает вопрос о переносе вещества поперек потока). В начале выбранного интервала времени концентрация J на входе в элементарный объем составляет cJ , а ее производная по длине равна ∂cJ /∂x.
К концу интервала фронт потока сдвинется на dx (см. уравнение
∂c
(5.17)), концентрация составит cJ − J dx (знак «–» обусловлен тем,
∂x
что поток вносит в элементарный объем порции жидкости, находящиеся слева от этого объема, в отрицательной области x). В среднем
1 ∂cJ
за рассматриваемый интервал концентрация J равна cJ −
dx ,
2 ∂x
1 ∂cJ ⎞
⎛
а вход J – ⎜ cJ −
dx⎟ vdt . Уход отличается от входа только знаком
⎝
2 ∂x ⎠
1 ∂cJ ⎞
⎛
в скобках: ⎜ cJ +
dx⎟ vdt .
⎝
2 ∂x ⎠
Размер элементарного объема Vэ = Fпоп dx и соответственно
член, представляющий собой разность источника и стока, равен
rJFпоп dxdt.
5.1. Механизмы переноса
199
В отличие от вывода, сделанного в разд. 4.2, мы сейчас рассматриваем общий случай, допускающий нестационарность, и поэтому
должны предусмотреть накопление, равное FпопdxdcJ .
В целом уравнение баланса записывается в виде
1 ∂cJ ⎞
1 ∂cJ ⎞
⎛
⎛
dx⎟ vdt − ⎜ cJ +
dx⎟ vdt + rJ Fпоп dxdt = Fпоп dxdcJ .
⎜⎝ cJ −
⎝
2 ∂x ⎠
2 ∂x ⎠
Раскрыв скобки, приведя подобные, поделив на Fпопdxdt, с учетом
того, что v/Fпоп = w, получим уравнение для нестационарного химического процесса в аппарате идеального вытеснения:
∂cJ
∂c
= − w J + rJ .
∂t
∂x
(5.14)
Если теперь учесть возможность переноса диффузионным механизмом (в любом его варианте – сейчас коэффициент D может относиться и к диффузии, и к продольному перемешиванию), то вместо последнего члена правой части (5.14) нужно подставить правую
часть (5.11). В результате придем к уравнению
∂cJ
∂c
∂ 2c
= − w J + D 2J + rJ ,
∂t
∂x
∂x
(5.15)
частными случаями которого являются уравнения (4.101) и (4.104).
Перенос вдоль потока играет в технологии громадную роль: на
нем основан весь транспорт. Перенос вещества по трубопроводам,
перенос тепла по трубам с греющим паром – типичные примеры,
при рассмотрении которых можно принимать во внимание только
конвекцию.
Поперечное направление. На практике почти все технологические
процессы требуют переноса тепла и вещества не только в продольном, но и в поперечном направлении. В процессах массообмена
переход вещества из фазы в фазу осуществляется в направлении
поперек движения фаз. Тепло пара, поданного по трубам от котла,
может быть использовано только после того, как оно перейдет от потока к стенке и далее наружу, т. е. в направлении, перпендикулярном
потоку пара.
При анализе поперечного переноса учтено следующее. Если направить поток прямо на твердое тело, например пустить из сопла затопленную струю (струю жидкости, проходящую сквозь слой той же
жидкости), то поток не дойдет до поверхности, а «расплющится» и
начнет обтекать тело (рис. 5.5). В непосредственной близости от поверхности жидкость обязательно течет вдоль нее. Здесь направление
переноса между потоком и стенкой будет перпендикулярно потоку.
200
Глава 5. Явления переноса в химико-технологических процессах...
Рис. 5.5. Движение затопленной струи вблизи стенки
При переносе в поперечном направлении действуют как конвекция, так и молекулярные механизмы, причем характер влияния
разных механизмов переноса зависит от режима потока. В установившемся ламинарном потоке поперечная конвекция, как известно,
отсутствует. Все частицы движутся вдоль потока. При этом важнейшее обстоятельство, определяющее характер течения, заключается в том, что непосредственно у твердой стенки скорость жидкости
равна нулю. Данный факт установлен и для ламинарных, и для турбулентных потоков на огромном опытном материале. Вследствие
этого между осью потока и стенкой возникает разность скоростей,
за счет которой происходит перенос импульса от оси к стенкам.
Количественное рассмотрение этого переноса (вязкости) для случая
ламинарного течения в круглой трубе приводит к известной формуле
распределения скоростей:
2
⎛ R⎞
wR
= 1− ⎜ ⎟ ,
w0
⎝ R0 ⎠
(5.16)
где w0 – скорость на оси потока; wR – скорость в данной точке на расстоянии R от оси; R0 – радиус трубы.
Относительно распределения в ламинарном потоке температуры
(например, при течении горячей жидкости по охлаждаемой снаружи трубе) и концентрации (один из компонентов текущей жидкости реагирует на стенке) ход рассуждений и результаты аналогичны.
Разница состоит в том, что на стенке нет условия T = 0 или с = 0; более того, и T, и с могут возрастать по направлению либо к оси, либо
к стенке. Здесь рассмотрение переноса приводит к формуле
2
⎛ R⎞
u − uП
= 1− ⎜ ⎟ ,
u0 − u П
⎝ R0 ⎠
(5.17)
где и – либо Т, либо с; индекс «п» относится к условиям у стенки.
Правда, необходимо учитывать, что профили, описываемые формулой (5.17), устанавливаются, как правило, значительно медленней,
5.1. Механизмы переноса
201
чем профиль скоростей по формуле (5.16), так что аналогия здесь неполная. Еще важнее то, что вещество или энергия, для которых записывается уравнение (5.18), претерпевают на стенке превращение или
отвод, поэтому величины uп и u0 все время изменяются.
Анализ уравнения (5.17) показывает следующее. Перенос в любом поперечном сечении осуществляется соответственно теплопроводностью либо диффузией. Но на скорость этого переноса влияет
профиль температуры (или концентрации). Профиль же, определяемый формулой (5.17), создается совместным действием продольной
конвекции и поперечной теплопроводности или диффузии. Поэтому
при расчете поперечного переноса в ламинарном потоке следует
учитывать влияние как молекулярных, так и конвективных явлений.
Подробно эти вопросы рассмотрены в [32, 34].
Опишем теперь переход из ламинарного режима течения в турбулентный. Структура турбулентного течения очень сложна, приводимое мной описание – весьма упрощенное. Более строгое изложение
вопроса можно найти в [1, 32, 34].
Установившийся ламинарный поток характеризуется стационарностью: в любой точке, неподвижной относительно стенок, скорость
не меняется во времени. Это не означает, что в таком потоке нет возмущений: в любом реальном случае возмущения возникают. Но в ламинарном режиме силы инерции, связанные с возмущениями, малы по сравнению с силами вязкости. Мерой отношения указанных
сил является, как известно, критерий Рейнольдса. Пока величина
Re мала, большие силы вязкости гасят возмущения. Однако по мере
роста скорости силы инерции становятся все больше по сравнению
с силами вязкости, Re растет. Наконец, при каком-то критическом
значении (в круглой трубе критическое значение Re = 2300) вязкость
уже не может гасить все возмущения. Вследствие случайных причин
какая-то частица жидкости может «сойти со своего места» в потоке.
При этом вследствие неразрывности потока она начнет «расталкивать» другие частицы. Таким образом, возмущение, первоначально
затронувшее одну частицу, передастся другим.
При дальнейшем росте Re ламинарное течение оказывается практически невозможным: возмущения охватывают все больше частиц,
передаются от частицы к частице и все они вовлекаются в хаотические пульсации, налагающиеся на среднюю скорость движения.
Наличие хаотических пульсаций скорости, направленных в разные
стороны, и определяет турбулентное течение.
В турбулентном потоке, в отличие от ламинарного, перенос импульса в поперечном направлении осуществляют не молекулы, а частицы, участвующие в пульсациях. Представим себе, что частица,
202
Глава 5. Явления переноса в химико-технологических процессах...
движущаяся у оси потока и потому имеющая максимальную скорость в продольном направлении, в результате турбулентной пульсации переместится ближе к стенке. При этом она перенесет с собой
в эту периферийную часть потока большой импульс, которым обладает. Навстречу же ей переместятся частицы, обладающие малыми
поступательными скоростями, что снизит среднюю скорость в осевой части потока. Так вследствие турбулентных пульсаций происходит поперечное перемешивание «быстрых» и «медленных» частиц,
выравнивающее средние скорости по сечению.
Вернемся к рис. 5.1. Легко видеть, что описанный выше механизм
поперечного переноса импульса, так же как и механизм вязкости,
соответствует схеме, изображенной на рисунке. Оба механизма переноса (молекулярный и конвективный) аналогичны. Поэтому рассматриваемое явление часто определяют термином турбулентная
вязкость. Поскольку конвективный перенос много интенсивнее молекулярного, то турбулентная вязкость гораздо больше, чем обычная
(молекулярная) вязкость. Поэтому в турбулентном потоке профиль
скоростей выровнен значительно сильнее, чем в ламинарном.
Таким же образом турбулентное перемешивание выравнивает по
поперечному сечению температуру и концентрации. Здесь также говорят о турбулентной диффузии и турбулентной теплопроводности –
конвективных аналогах истинных (молекулярных) диффузии и теплопроводности.
Заметим, что интенсивность конвективного переноса почти одинакова для импульса, тепла и вещества. Перенос осуществляют одни
и те же движущиеся частицы, все три субстанции переносятся одновременно.
Влияние стенок на поперечный перенос. Представленная картина распределения скорости, температуры и концентраций по сечению в турбулентном потоке (выровненность профилей вследствие
большой интенсивности конвективного переноса) еще неполная.
Имеется важнейшая особенность, в конечном счете определяющая
характер и скорость процессов поперечного переноса. Эта особенность обусловлена поведением потока у стенок.
Как уже отмечалось (см. рис. 5.5), движение потока, направленного к твердой стенке, приводит к его «расплющиванию»: непосредственно до стенки он не доходит. То же происходит и с частицами,
движущимися в турбулентном потоке в поперечном направлении.
По мере приближения к стенке поперечная составляющая скорости
уменьшается. Дойти до стенки частица не может: по мере приближения к ней турбулентные пульсации затухают. В результате около стенки образуется тонкий, так называемый пограничный слой, в котором
5.1. Механизмы переноса
203
конвективный перенос становится исчезающе малым. Перенос в нем
происходит за счет молекулярных механизмов. Перенос импульса
осуществляется за счет вязкого трения, при этом по мере приближения к стенке скорость его падает до нуля. Механизмами переноса
тепла и вещества являются теплопроводность и диффузия.
Для примера рассмотрим перенос вещества. Нетрудно заметить,
что в стационарном режиме поток вещества вдоль радиуса в основном постоянен: сколько вещества перенесено от оси потока, столько
же дойдет до стенки («по дороге» вещество никуда не девается). Но
в соответствии с уравнением (1.6)
qR = − D
∂c
,
∂R
(5.18)
где в левой части – поток вещества в направлении радиуса R; в правой – радиальный компонент градиента концентрации этого вещества.
Из формулы (5.18) следует, что при постоянной левой части
градиент ∂c/∂R должен быть тем больше, чем меньше D. В основной, приосевой зоне (в ядре потока) в формулу следует подставить
большое значение коэффициента Dтурб. Значит, здесь градиент мал.
Концентрации выровнены турбулентным смешением. А в пограничном слое коэффициент падает от Dтурб до значения молекулярного
коэффициента D. Соответственно, градиент сильно растет: в пограничном слое происходит резкое изменение концентрации (температуры и скорости). Профиль концентраций показан на рис. 5.6.
Рис. 5.6. Схема поперечного профиля концентраций в потоке
Разумеется, при переносе от стенки к оси (например, при растворении стенки) профиль зеркально симметричен: у стенки наблюдается резкое возрастание концентрации. Профили скорости и температуры качественно аналогичны описанному.
204
Глава 5. Явления переноса в химико-технологических процессах...
Как уже говорилось, механизм переноса в турбулентном потоке
весьма сложен. Теория турбулентности пока не позволяет получить
строгие количественные результаты, поэтому для описания пользуются либо эмпирическими зависимостями, либо упрощенными моделями. Первой из них явилась пленочная модель Нернста–Лэнгмюра,
в соответствии с которой пограничный слой рассматривают как неподвижную пленку толщиной δ. Пленка прилегает к поверхности
и отделяет ее от ядра потока, где концентрация (или температура)
полностью выровнена по поперечному сечению. Соответствующий
профиль концентраций показан на рис. 5.7.
Рис. 5.7. Профиль концентрации в соответствии с пленочной моделью
Введем обозначения: ся – концентрация вещества в ядре потока;
сп — то же, у поверхности (стенки). Применим уравнение (5.18), учтя,
что в пределах пленки предполагается полное отсутствие конвекции
и, значит, D = const. Следовательно, в пленке
∂c
c −c
= const = П Я ,
δ
∂R
(5.19)
откуда
− D(cП − cЯ )
(5.20)
= β (cЯ − cП ) .
δ
Это стандартное уравнение массоотдачи, в котором коэффициент
массоотдачи β определяется по формуле
D
(5.21)
β= .
δ
Точно так же для коэффициента теплоотдачи α получаем формулу
qМ =
5.1. Механизмы переноса
205
λ
.
(5.22)
δ
Формулы (5.21) и (5.22) показывают, что перенос вещества и тепла в поперечном направлении лимитируется молекулярными механизмами. Толщина ядра, в котором проходит конвективный перенос,
в формулах не учитывается. Это и естественно, так как поперечный
перенос складывается из последовательных стадий: вначале – перенос через ядро, затем – через пограничный слой. Поэтому лимитирует медленная молекулярная стадия. Однако нужно учитывать, что
толщина пограничного слоя зависит от интенсивности турбулентных
пульсаций. С ростом их интенсивности (например, при увеличении
скорости потока) пограничный слой утончается и коэффициенты
массо- и теплоотдачи растут.
Дальнейшее развитие теории показало, что пленочная модель
лишь весьма грубо отражает особенности переноса в пограничном
слое. Прежде всего этот слой нельзя считать ни неподвижным, ни
резко отделенным от ядра потока. Турбулентные пульсации затухают
постепенно. При этом толщина пограничного слоя зависит от интенсивности молекулярного механизма переноса.
Действительно, в качестве оценки толщины пограничного слоя
естественно принять расстояние от стенки, на котором конвективный
перенос становится мощнее молекулярного. Чем интенсивнее молекулярный перенос, тем, очевидно, дальше от стенки это произойдет.
При данной степени турбулентности толщина пограничного слоя тем
больше, чем выше интенсивность молекулярного переноса. Поэтому
один и тот же поток может иметь разную толщину пограничного слоя
в зависимости от того, что рассматривается – перенос импульса, тепла
или вещества. При исследовании переноса импульса и распределения
скоростей приходится говорить о гидродинамическом пограничном
слое; при рассмотрении теплоотдачи и распределения температур –
о тепловом пограничном слое; при анализе массоотдачи и распределения концентраций – о диффузионном пограничном слое. Как уже
говорилось, в газах Pr ≈ Prд ≈ 1 и все три пограничных слоя имеют примерно одинаковую толщину. В капельных жидкостях Pr ≈ 10 – 102, а
Prд ≈ 103 – 105; тепловой пограничный слой много тоньше гидродинамического, а диффузионный – еще на несколько порядков тоньше.
В потоках газов процессы переноса, как правило, проходят подобным образом. Здесь существует интересное соотношение:
α=
α
β ζ
= = ,
CT ρw w 8
(5.23)
206
Глава 5. Явления переноса в химико-технологических процессах...
где Ст – теплоемкость; ρ – плотность; ζ – коэффициент гидравлического сопротивления трения.
На основе формулы (5.23) массоотдачу можно моделировать теплоотдачей или трением. Например, измерив гидравлическое сопротивление канала (если в нем отсутствуют местные сопротивления),
можно предсказать, какова будет в нем скорость массоотдачи.
В заключение отмечу следующее. Несмотря на грубость пленочной модели, она очень удобна для первоначального анализа. В частности, формулы (5.21) и (5.22) вполне пригодны для относительной
оценки толщин пограничных слоев. Подобие переноса в пограничном слое определяется критериями Нуссельта:
• тепловым
αL
;
(5.24)
Nu =
λ
• диффузионным (критерием Стантона)
βL
,
(5.25)
Nu Д =
D
где L – характерный размер системы (например, диаметр канала).
Из уравнений (5.24) и (5.25) с учетом (5.21) и (5.22) получаем формулу
Nu =
L
.
δ
(5.26)
Таким образом, критерий Нуссельта определяет соотношение
между характерным размером системы и толщиной пограничного
слоя.
В дальнейшем я буду в основном применять термины пленочной
модели. Более подробное изложение вопросов переноса можно найти в [1, 32, 34].
5.2. Тепловые явления
Температура принадлежит к числу факторов, оказывающих наибольшее влияние на скорость химических реакций, поэтому протекание большинства химико-технологических процессов сильно зависит от выделения (или поглощения) и переноса тепла. Мы будем
пользоваться термохимической системой отсчета: выделяющееся
в реакции тепло будем считать положительным, поглощаемое – отрицательным (в термодинамике принято обратное правило: выделяющееся тепло считают отрицательным).
5.2. Тепловые явления
207
Тепловые режимы. По этому признаку можно назвать три основных
типа процессов (и аппаратов, в которых эти процессы проходят).
1. Изотермические процессы. Изотермии достигают разными путями. Практически изотермическими будут процессы с очень малыми
тепловыми эффектами либо процессы очень медленные, в которых
температура успевает выровняться. Близки к изотермии реакции,
протекающие в сильно разбавленных растворах, так как вследствие
низких концентраций реагентов выделение тепла на единицу реакционной массы мало.
Пример 5.1. Изотермическим можно считать аппарат для умягчения воды. Удельный тепловой эффект протекающей в нем реакции нейтрализации
велик, но концентрация солей жесткости мала, поэтому мал и разогрев.
Изотермичности можно добиться путем интенсивного теплообмена, выравнивающего температуру по объему аппарата. Так, стационарный процесс в аппарате идеального смешения изотермичен
по определению. В реальных условиях достигнуть изотермии может
быть затруднительно: потребуется большая поверхность теплообмена, интенсивное перемешивание. Чаще всего мы сталкиваемся с изотермическим процессом как идеализированной моделью реального
процесса. Анализ при этом особенно прост: из описания исчезают
сильно нелинейные уравнения Аррениуса. В частности, все рассмотрение в гл. 4 велось в приближении изотермических процессов.
2. Адиабатические процессы проводятся без подвода и отвода тепла.
Точнее, как и в любой открытой системе, тепло вводится в аппарат
со входящим потоком и выводится с выходящим. Адиабатическим
обычно считают процесс, в котором нет других путей теплообмена кроме этого. На практике, как правило, нет нужды стремиться
к строгой адиабатичности. Аппараты, в которых не оборудованы
теплообменные поверхности и которые достаточно велики, чтобы
можно было пренебречь потерями тепла через стенки, рассматривают как адиабатические.
Серьезное преимущество таких аппаратов – простота конструкции (отсутствие теплообменников); крупный недостаток – сильное
изменение температуры в процессе реакции. Это изменение определяется формулой
Q ∆с Q c ∆χ
,
(5.27)
∆T = Р = Р 0
ρСТ
ρCТ
где Qр – удельный тепловой эффект реакции; ∆с – изменение концентрации реагента; с0 – исходная концентрация реагента; ∆χ – изменение степени превращения в реакторе; ρ – плотность жидкости, в которой идет реакция; Ст – ее теплоемкость, отнесенная к единице массы.
208
Глава 5. Явления переноса в химико-технологических процессах...
Если принять ∆χ = 1, то формула (5.27) определяет адиабатический разогрев – максимально возможное повышение температуры за
счет тепла реакции (разумеется, если реакция эндотермическая, то
получится не разогрев, а адиабатическое охлаждение).
Изотермичность и адиабатичность реактора необязательно исключают друг друга. Так, если выделение тепла очень мало, то адиабатический реактор почти изотермичен. В стационарном процессе
изотермичен любой аппарат идеального смешения, в том числе и
адиабатический.
3. Режим частичного теплообмена является наиболее общим и
основным тепловым режимом. Некоторая часть тепла реакции отводится (а при эндотермии подводится), но полного выравнивания
температуры не происходит. Изотермический и адиабатический режимы можно считать крайними частными случаями.
П р и м е ч а н и е . В литературе режим частичного теплообмена иногда называют политропическим. Это название вряд ли удачно: по существу, здесь
нет ничего общего с политропическими процессами термодинамики.
Тепловые балансы. Анализ процессов, связанных с выделением
(отводом) тепла и теплообменом, чаще всего базируется на исследовании математических моделей этих процессов, представляющих
собой те или иные варианты уравнений теплового баланса. Здесь я
рассмотрю только стационарные процессы.
Уравнения теплового баланса следует решать совместно с уравнениями материального баланса, а при возможности – и с уравнениями стехиометрических инвариантов.
Идеальное вытеснение. Любой из подходов (анализ протекания
процесса во времени в движущемся объеме или баланс для элементарного объема) приводит к уравнению
⎞
dT
1 ⎛ m
=
∑ QРi ri − K Т fТ (T − TТН )⎟⎠ ,
dt ρCТ ⎜⎝ i =1
(5.28)
где i – номер стадии реакции; m – число стадий; Qрi – удельный
тепловой эффект i-й стадии; Kт – коэффициент теплопередачи;
fт – удельная поверхность теплопередачи (отношение поверхности
к объему аппарата); Ттн – температура теплоносителя, с которым
осуществляется теплообмен.
Уравнение (5.28) решается совместно с уравнениями материального баланса (4.3) и уравнениями Аррениуса, записанными для
констант скорости всех стадий. В результате имеем систему нелинейных (вследствие наличия экспоненциальных членов уравнений
Аррениуса) дифференциальных уравнений, решать которую приходится численными методами.
5.2. Тепловые явления
209
Одним из важных вопросов моделирования неизотермических
реакций являются положение горячей точки (точки, в которой устанавливается самая высокая температура) и значение температуры
в этой точке. Именно в районе горячей точки могут проявляться нежелательные эффекты: спекание катализатора, снижение селективности процесса и др. Ниже, в примере 6.1, приведены результаты моделирования процесса, описываемого уравнением (5.28); на графике
(см. рис. 6.3) на трех кривых видны горячие точки.
Следует также учесть, что в уравнении (5.28) температура теплоносителя Ттн положена постоянной. В очень многих случаях она
меняется по ходу потока – чаще всего по схеме противотока, хотя
возможны и другие схемы. В этих случаях приходится добавлять
еще дифференциальное уравнение теплопередачи, что существенно
усложняет и без того непростое решение.
Идеальное смешение. В этом случае уравнение теплового баланса
имеет вид
m
vρCТ (T0 − T ) + Va ∑ QРi ri − K Т f Т (T − TТН ) = 0 .
(5.29)
i =1
Здесь первый член – вход тепла с потоком (T0 – начальная температура) за вычетом ухода тепла с уходящим потоком; второй – источник (выделение тепла реакции) или сток в случае эндотермии; третий – уход тепла через поверхность теплообмена Fт (или вход, если
Т < Ттн).
Уравнение (5.29) решается вместе с уравнениями материального
баланса (4.33) и уравнениями Аррениуса. Хотя получается система
конечных (не дифференциальных) уравнений, но наличие в ней
уравнений Аррениуса делает невозможным решение аналитическими методами в общем виде. Как правило, решать приходится
с помощью компьютера. И в этом случае вероятны усложненные
варианты – если Ттн не постоянная величина, а изменяется по ходу
теплоносителя вдоль поверхности теплопередачи.
Пример 5.2. Запишем математические модели протекания реакции
2A
2 по А; k1
⎯⎯⎯⎯
→
B.
←⎯⎯⎯
⎯
1 по В; k2
1. Для аппарата идеального вытеснения имеем:
dT ( E2 − E1 )(k1cA2 − k2 cB )
=
− K T f T (T − TТН ) ,
dt
ρCT
(5.30)
dcA
= −2(k1cA2 − k2 cB ) ,
dt
(5.31)
210
Глава 5. Явления переноса в химико-технологических процессах...
cB =
1
(cA0 − cA ) ,
2
k j = Aj e
−
Ej
RT
,
(5.32)
j = 1, 2 ,
(5.33)
со следующими начальными условиями при t = 0: Т = Т0; cA= cA0 ; сВ = 0.
В уравнении (5.30) учтено, что удельный тепловой эффект обратимой реакции равен разности энергий активации обратной и прямой стадий.
2. Для аппарата идеального смешения имеем:
vρCT (T0 − T ) + Va ( E2 − E1 )(k1cA2 − k2 cB ) − K T FT (T − TTH ) = 0 ,
2
1 A
v(cA0 − cA ) − 2Va (k c − k2 cB ) = 0
(5.34)
(5.35)
и еще уравнения (5.32) и (5.33), вид которых не зависит от типа потока.
3. Для аппарата идеального вытеснения в случае противотока теплоносителя с изменяющейся по ходу температурой уравнения (5.30) и (5.31) необходимо дополнить уравнением теплового баланса для теплоносителя:
dTTH K T f T (T − TTH ) ,
(5.36)
=
dx
vTH CTH ρTH
причем для уравнения (5.36) начальное условие (Tтн = Tтн0) дается не при x = 0
(или, соответственно, t = 0), а на противоположном конце аппарата при
x = L. Это приводит к краевой задаче, решение которой требует использования специальных расчетных методов. Обсуждение этого вопроса можно
найти, например, в [3].
Процесс в неподвижном слое катализатора с отводом тепла. Этот
случай – один из сложнейших для анализа. Имеется несколько механизмов распространения тепла в слое: теплопроводность по текущему
газу, конвекция в газе, теплопроводность по гранулам катализатора.
При этом поперечная конвекция в газе затруднена влиянием гранул.
Чаще всего этот процесс удается описать моделью, аналогичной двухпараметрической диффузионной, упомянутой в разд. 4.4.
Параметрами модели являются эффективные коэффициенты температуропроводности в продольном al и радиальном aR направлениях
(для слоя цилиндрической формы). Параметры al и aR не равны один
другому: в зернистом слое турбулентность по-разному проявляется
в различных направлениях. Обычно эти параметры определяют экспериментально. Для стационарного случая модель имеет вид
m
w
∑Q r
∂T
∂T
∂ ⎛ ∂T ⎞ i =1 Pi i
,
+ al 2 + aR
⎜R ⎟ +
ρCT
∂x
∂x
∂R ⎝ ∂R ⎠
2
(5.37)
где х – продольная координата; R – радиальная. В простейшем случае граничные условия к уравнению (5.37) задаются как некая определенная температура стенки Тп при R = R0 (условия 1-го рода).
5.3. Внешнедиффузионное торможение
211
Интересно отметить, что решаемые совместно с (5.37) уравнения
материального баланса обычно можно записывать в приближении
идеального вытеснения: слой хорошо выравнивает поток, а передача вещества по гранулам, в отличие от передачи тепла, пренебрежимо мала. Но уравнение (4.3) приходится решать для каждого узкого
цилиндрического кольца радиусом R в отдельности, поскольку при
ином значении R смесь будет проходить через зоны других температур, так что скорости реакций и соответственно значения концентрации зависят от R.
Еще более сложный случай – это когда теплоноситель движется противотоком. Тогда приходится решать уравнение (5.37)
в краевых условиях 3-го рода (см. обсуждение уравнения (5.10)).
Подробнее вопросы описания неизотермических процессов изложены в [3].
5.3. Внешнедиффузионное торможение
Важную роль в макрокинетике, кроме тепловых, играют массообменные (диффузионные) факторы. Влияние массообмена невелико,
если реакция гомогенная: в этом случае процесс происходит в основной массе потока, где конвекция быстро доставляет необходимые
для реакции вещества.
По-другому обстоит дело при гетерогенных процессах, которые
проходят либо на поверхности (например, гетерогенный катализ,
кристаллизация, электролиз, обжиг, горение твердого топлива без
летучих), либо сопряжены с переходом вещества из одной текучей
фазы в другую (абсорбция, экстракция, процессы в газожидкостных реакторах и др.). Здесь реакция не может пройти без того, чтобы
вещество было доставлено к поверхности раздела фаз или через эту
поверхность из одной фазы в другую. Поэтому непременная стадия
таких процессов – диффузия у границы фаз.
Как мы уже видели, диффузия проходит гораздо медленнее,
чем конвекция. Наличие диффузионной стадии может тормозить химическую реакцию. Возникает диффузионное торможение.
Закономерности диффузионного торможения химических реакций
сложны и многообразны вследствие особенностей подвода вещества к зоне реакции. Можно выделить три наиболее важных случая.
1. Реагирующее вещество прежде чем оно прореагирует должно
перейти из одной движущейся фазы в другую. Процесс может на
этом и закончиться: вещество растворяется во второй фазе, не реа-
212
Глава 5. Явления переноса в химико-технологических процессах...
гируя. Это «физический» массообмен (абсорбция, ректификация,
экстракция и т. д.). Если же во второй фазе проходит реакция, – это
процессы хемосорбции. Анализ их часто очень сложен [35].
2. Несколько проще анализ реакций, проходящих на твердой поверхности. Здесь реакция в пограничном слое не идет; диффузия и
реакция – последовательные стадии. Учесть диффузию можно на
основе опытных данных по коэффициенту массоотдачи.
3. Особый случай – реакция, проходящая на поверхности пор,
пронизывающих пористые гранулы. Поверхность пор на несколько
порядков больше наружной поверхности гранул, поэтому применение пористых катализаторов, как правило, резко интенсифицирует
процесс. Но диффузионное торможение при этом значительно усиливается и приобретает специфические черты. Диффузия проходит
не через тонкий пограничный слой, а через неподвижный газ (или
неподвижную жидкость) в относительно длинных порах.
Если реакция протекает на наружной поверхности, омываемой
потоком, говорят о внешнедиффузионном торможении. Влияние
диффузии при реакции в порах обусловливает внутридиффузионное
торможение. Закономерности внешнедиффузионного и внутридиффузионного торможения рассмотрим в основном на примере каталитических реакций: в этих случаях возможно протекание реакции
в стационарном режиме, поскольку вещество поверхности не изменяется во времени. Впрочем, многие закономерности некаталитических гетерогенных реакций главным образом соответствуют рассматриваемым.
Проанализируем простой случай: процесс стационарен, проходит
изотермически. Не углубляясь в механизм каталитической кинетики, будем считать, что реакция необратима, имеет 1-й порядок, а ее
скорость
r = kcп ,
(5.38)
где cп – концентрация реагирующего вещества A непосредственно
у поверхности. Для реакций не 1-го порядка закономерности качественно близки к тем, которые получаются в анализируемом случае.
Подробнее об этом изложена в [32].
Начнем со случая, когда реакция протекает на непористом катализаторе. Поверхность катализатора омывается потоком газа; концентрация реагирующего вещества в ядре потока составляет ся. В результате протекания реакции концентрация у поверхности меньше
и составляет сп. Разность ся – сп является движущей силой массообмена: возникает поток массы через диффузионный пограничный
слой (рис. 5.8).
5.3. Внешнедиффузионное торможение
213
Рис. 5.8. Пограничный слой у поверхности катализатора
(стрелка указывает направление диффузионного потока реагента)
Изложу подход, развитый Д.А. Франк-Каменецким [32]. Рассмотрим материальный баланс по реагенту А. В уравнении баланса присутствуют только два члена: вход и сток (уход и источник равны нулю –
реагент не поступает с поверхности в поток и не образуется, так как
реакция необратима; накопление тоже равно нулю ввиду стационарности). Окружим контуром малый участок каталитической поверхности, площадь которого примем за единицу; за интервал примем единицу времени (интервал конечен, так как процесс стационарен). Тогда
вход А будет равен потоку вещества на поверхность, а сток – скорости
гетерогенной реакции. Уравнение при этом принимает вид
β(ся – сп) = kсп.
(5.39)
Здесь β – коэффициент массоотдачи; в скобках – движущая сила
массоотдачи. Решим это уравнение относительно неизвестной концентрации сп:
cП =
β сЯ
.
β+k
(5.40)
Подставив (5.40) в (5.38), получим
kβ
cЯ
k +β
или, обозначив множитель при ся через k ′,
r=
r = k ′cЯ .
(5.41)
(5.42)
Уравнение (5.42) очень похоже на (5.38), только вместо неизвестной концентрации сп оно содержит известную ся , а вместо константы
скорости k, имеющей для химика ясный физический смысл, – эффективную константу k ′ , зависящую и от k, и от β:
214
Глава 5. Явления переноса в химико-технологических процессах...
k′ =
kβ
.
k +β
Поделим числитель и знаменатель этой дроби на kβ:
k′ =
1
.
1 1
+
β k
(5.43)
Приравняв обратные величины, получим:
1 1 1
= + .
k′ β k
(5.44)
Уравнение (5.44) выражает свойство аддитивности сопротивлений. Коэффициенты β, k и k ′ – скоростные коэффициенты: скорости процессов им пропорциональны. Обратные величины называют
сопротивлениями. Формулу (5.44) можно прочесть так: общее сопротивление процессу 1/ k ′ складывается из сопротивлений стадий:
диффузионного 1/β и кинетического 1/k. Аддитивность сопротивлений говорит о том, что процесс складывается из последовательных
стадий и что лимитировать будет медленная стадия. Рассмотрим, от
чего и как будет зависеть скорость процесса при наличии лимитирования. Здесь только необходимо учесть вот что. Из уравнения (5.39)
следует, что скорость потока вещества А к поверхности равна скорости реакции. В этом смысле в стационарном случае нельзя говорить
о медленной и быстрой стадиях – их скорости равны. Но сравнивать
можно и по-другому: считая мерой скорости среднее время, затрачиваемое молекулой в одной стадии на преодоление пограничного
слоя, а в другой – на химическое превращение после того, как она
достигла поверхности. Тогда скорости становятся разными и их
можно сравнивать.
Случай 1 : k << β, медленная реакция при быстром транспорте вещества к поверхности.
Каковы основные закономерности этого случая? Из вышесказанного ясно, что лимитирующая стадия – протекание химической
реакции на поверхности. Реакция проходит в кинетической области.
Для уточнения особенностей этой области обратимся к уравнениям
(5.38) – (5.44). Из (5.40) следует, что сп ≈ ся: быстрая диффузия выравнивает сА по толщине пограничного слоя, медленная реакция «не
в силах» существенно снизить эту концентрацию. Из (5.44) получим,
что k ′ ≈ k, так как малым слагаемым 1/β можно пренебречь по сравнению с большим 1/k. Теперь из (5.42) находим:
r ≈ kcя.
(5.45)
5.3. Внешнедиффузионное торможение
215
В уравнении (5.45) ничто не связано с процессом диффузии, все
определяется через закономерности кинетики.
Случай 2 : k >> β, быстрая реакция при медленной диффузии.
Лимитирует подвод реагента через пограничный слой. Процесс идет
в диффузионной области (внешнедиффузионной, диффузия проходит
вне гранулы катализатора). Снова обратимся к уравнениям (5.38) –
(5.44). Из (5.40) следует, что сп ≈ 0: знаменатель дроби много больше,
чем числитель. Из (5.44) получим, что k ′ ≈ β. Тогда уравнение (5.42)
можно записать в виде
r ≈ βcя = β(ся – 0).
(5.46)
Правую часть выражения (5.46) я записал так, чтобы было ясно:
это уравнение массоотдачи для случая, когда концентрация со стороны твердой поверхности практически равна нулю.
Случай 3 : коэффициенты k и β сравнимы по величине. Ни одна
из стадий не лимитирует процесса – он проходит в промежуточной
(переходной) области. Скорость реакции рассчитывается по формуле (5.41).
Какие условия способствуют увеличению скорости массоотдачи? В первую очередь это рост скорости потока. В то же время скорость потока непосредственно не влияет на химическую кинетику.
Поэтому если процесс проходит в кинетической области, поток не
влияет на его скорость; если в диффузионной, то увеличение скорости потока ускоряет процесс, а если в промежуточной, то при увеличении скорости потока процесс может перейти в кинетическую
область.
Какие условия способствуют ускорению собственно реакции? Как
уже говорилось, сильнее всего константа скорости реакции зависит
от температуры. В то же время скорость массоотдачи слабо зависит
от температуры, в особенности если движущая фаза – газ. В связи
с этим кривая зависимости скорости реакции от температуры имеет
характерный вид (рис. 5.9).
В области низких температур общая скорость процесса сравнительно мала, но при этом с повышением температуры она резко
возрастает в соответствии с уравнением Аррениуса. Процесс идет
в кинетической области. При повышении температуры рост скорости процесса замедляется и начиная с некоторой температуры почти
прекращается. Процесс вступает в диффузионную область.
Если увеличить скорость потока, т. е. снизить диффузионное торможение (верхняя кривая на рис. 5.9), то в кинетической области
кривая пойдет точно так же, но промежуточная и диффузионная области начнутся при несколько более высоких температурах, а общая
скорость процесса в этих областях окажется выше.
216
Глава 5. Явления переноса в химико-технологических процессах...
Рис. 5.9. Зависимость скорости реакции от
температуры для непористого катализатора.
Области: 1 – кинетическая; 2 – промежуточная; 3 – диффузионная
Как уже говорилось, описанные закономерности верны не только для катализа на непористой поверхности, но и для многих других гетерогенных процессов. Кинетика ряда процессов горения и
обжига определяется внешнедиффузионным торможением. С ним
связаны явления концентрационной поляризации в электролизе.
Проиллюстрирую сказанное на примере, который хорошо известен, – на реакции окисления древесины.
Пример 5.3. Реакция окисления древесины может проходить в двух основных режимах: гниения – низкотемпературный медленный процесс, который
проходит в кинетической области, и горения – высокотемпературный быстрый процесс, протекающий в диффузионной области. На скорость гниения сильнее всего влияет температура. В джунглях Вьетнама древесина гниет
во много раз быстрее, чем на Шпицбергене. В то же время скорость воздуха
практически не влияет на этот процесс: в шторм дерево гниет не быстрее, чем
в штиль. У горения иные закономерности. С точки зрения школьной химии
дуя на горящее дерево, мы делаем все для подавления реакции. Во-первых,
мы выдуваем из легких воздух с пониженным содержанием О2, снижая в зоне
реакции концентрацию реагента. Во-вторых, мы вдуваем в зону реакции холодный воздух, снижая температуру. Тем не менее, дуя, мы интенсифицируем
горение, поскольку струя воздуха утончает пограничный слой и тем самым
ускоряет лимитирующую стадию – подвод кислорода к поверхности.
Диффузионное торможение и селективность. Влияние диффузионной кинетики на селективность иногда очень существенно и
может определять успех или неуспех того или иного варианта технологии. Разберем два примера.
5.3. Внешнедиффузионное торможение
217
Селективность параллельной реакции
1 по А; k1
A ⎯⎯⎯⎯
→B
1 по A; k2
A ⎯⎯⎯⎯
→C
(5.47)
зависит лишь от отношения констант скоростей. Диффузионное
торможение не влияет на селективность. Иное дело – последовательная реакция (целевой продукт – В):
1 по А; k1
A ⎯⎯⎯⎯
→B
1 по В; k2
B ⎯⎯⎯⎯
→C
(5.48)
Аналогично уравнению (5.39) здесь получаются зависимости [18]:
βА (сАя – сАп) = k1сАп,
βВ (сВп – сВя) = k1сАп – k2сВп,
βС (сСп – сСя) = k2сВп.
(5.49)
(5.50)
(5.51)
В уравнениях (5.49)–(5.51) отражено направление переноса вещества: к поверхности – для А, в ядро потока – для В и С. Отсюда легко
вывести выражение для сАп (5.40). Для сВп получим:
cBП =
k1β A cAЯ + (k1β B + β A β B )cBЯ
.
(k1 + β A )(k2 + β B )
(5.52)
Рассмотрим самое начало процесса, когда сВя = 0. Тогда из (5.52)
находим:
cBП =
k1β A cAЯ
.
(k1 + β A )(k2 + β B )
(5.53)
Подставив величины сАп и сВп из уравнений (5.40) и (5.52) в (5.49)–
(5.51), можно получить следующее отношение:
rB /rC = βB /k2.
(5.54)
Учтем, что, как правило, βА, βВ и βС – величины одного порядка, да
и обе константы скорости не очень сильно отличаются друг от друга
(иначе либо было бы можно пренебречь побочной реакцией, либо,
наоборот, вещество В практически не получалось бы). Поэтому из
(5.54) следует, что переход второй стадии реакции из кинетической
области в диффузионную коренным образом изменит ход реакции.
В кинетической области отношение βВ/k2 очень велико и в начале
процесса σ = 1. Образующийся продукт В столь быстро отводится от поверхности, что вторая стадия вообще вначале не идет; она
начинается лишь тогда, когда вещество В накопится в ядре потока.
В диффузионной же области βВ/k2 ≈ 0 и σ = 0, причем селективность
нулевая на всем протяжении процесса: целевой продукт не успева-
218
Глава 5. Явления переноса в химико-технологических процессах...
ет диффундировать в поток и практически целиком вступает в побочную реакцию. В последнем рассмотренном случае совершенно
необходимо интенсифицировать массообмен, снять диффузионное
торможение и работать в кинетической области.
Учет выделения тепла. Выделяющееся на поверхности тепло реакции отводится через пограничный слой в ядро потока (если реакция эндотермическая, то тепло подводится из ядра). Поэтому расчет
процесса требует рассмотрения еще, наряду с реакцией и массообменом, выделения и отвода тепла. Так, в случае необратимой реакции
1-го порядка, проходящей в стационарном режиме, уравнение (5.39)
приходится решать совместно с уравнением, фиксирующим равенство выделения и отвода тепла (α – коэффициент теплоотдачи):
Qpkcп = α(Tп – Tя),
(5.55)
и уравнением Аррениуса. В таком виде вычисления достаточно
сложны и их следует проводить, используя компьютер. Лишь в кинетической области анализ упрощается. Основываясь на аналогии
между переносом тепла и вещества (см. разд. 5.1), можно полагать,
что режим интенсивного массообмена (определяющего закономерности кинетической области) совпадает с режимом интенсивного
теплообмена, когда соблюдается условие Тп ≈ Тя и уравнение (5.55)
можно исключить из рассмотрения.
Квазигомогенная модель слоя катализатора. Приведенные в этом
разделе выкладки относятся к маленькому участку поверхности, например к одному зерну катализатора. Только при этом условии можно принимать за постоянную величину ся в уравнении (5.39) и последующих.
Переход к описанию процесса в слое катализатора обычно производится следующим образом. Формула (5.38) определяет скорость реакции r
как количество вещества, реагирующего в единицу времени на единице
поверхности катализатора. Рассчитаем удельную поверхность катализатора φ – отношение суммы поверхностей всех зерен Fз к объему слоя:
φ=
∑F
з
(5.56)
.
Vсл
Если умножить r на φ, получим величину rсл – скорость, отнесенную к единице объема слоя:
rсл = φr.
(5.57)
Дальнейший расчет можно вести так, будто реакция – гомогенная,
проходящая со скоростью rсл в некой среде, движущейся через весь
объем слоя катализатора и проходящей его за то же время, за которое
проходит его реальный поток, движущийся не через весь объем, а через
свободную от гранул часть. Получаем квазигомогенную модель слоя.
5.4. Внутридиффузионное торможение
219
В зависимости от характера движения потока, его описание в квазигомогенной модели может быть различным. Если слой катализатора неподвижен, а поток фильтруется сквозь него, то обычно будет достаточно точным описание в приближении идеального вытеснения.
Если слой катализатора псевдоожиженный, то иногда используют
однопараметрическую диффузионную модель; однако точность ее
будет невысокой. Для этого случая разработаны специальные комбинированные модели. Но по распределению температуры этот тип
аппаратов обычно можно рассматривать в приближении идеального
смешения: основной запас тепловой энергии несут твердые частицы, перемешивание которых близко к идеальному. В ряде процессов
катализатор применяется в виде очень мелкого порошка, взвешенного в жидкой фазе, а реакция проводится в аппаратах с мешалками.
Здесь естественно использовать модель идеального смешения.
Пример 5.4. Реакция 1-го порядка А → В проводится в неподвижном
слое непористого катализатора. Диаметр аппарата мал, и можно считать
температуру полностью выровненной по сечению. Реакция проходит в кинетической области, условия отвода тепла от поверхности гранул в поток –
хорошие. Описание процесса выглядит следующим образом.
Скорость реакции на зерне r = kcА (индекс «я» здесь опущен, поскольку
в квазигомогенной модели перепад концентраций в пограничном слое не
рассматривается и весь расчет ведется исходя из концентраций в ядре потока). Скорость реакции в квазигомогенной модели rсл = φkcA. Уравнение
изменения cА имеет вид
dcA
= − rсл . Уравнение изменения температуры
dt
аналогично (5.28) с заменой ri на rсл. При интегрировании этих уравнений
среднее время рассчитывается по формуле
ного объема (доля пустот) в слое.
t =
εVсл
, где ε – доля свободv
5.4. Внутридиффузионное торможение
Главная причина, заставляющая применять пористые катализаторы, – это многократное увеличение поверхности. Непористая гранула диаметром 5 мм имеет поверхность порядка 10–4 м2; поверхность
пор в пористой грануле такого же диаметра может составлять порядка 102 м2, т. е. в миллион раз больше.
Картина процесса, протекающего в зерне пористого катализатора, отличается большой сложностью. Диффузия проходит в неподвижном газе (или жидкости), в узких порах. Форма и сечение пор
непостоянны, поры разветвляются и сливаются. Я.Б. Зельдовичу
220
Глава 5. Явления переноса в химико-технологических процессах...
удалось предложить простую схему, позволяющую анализировать
сложную картину в пористом зерне катализатора. Это квазигомогенная модель зерна, в соответствии с которой зерно рассматривается не
как сложная система пор, а как некоторая сплошная неподвижная
среда (скажем, капля неподвижной жидкости), внутрь которой идет
диффузия peaгентов (эффективный коэффициент Dз) и в которой
проходит реакция (эффективная константа скорости kз). Если реакция идет при постоянной температуре, то значения Dз и kз считаются
одинаковыми во всех точках зерна (что вытекает из самого принципа
квазигомогенности). При этом следует учесть, что скорость реакции
в этой модели отнесена к единице объема зерна, а не к единице поверхности – это отражается в размерности коэффициента kз. Таким
образом, анализ сводится к описанию реакции в неподвижной жидкости, в которую с поверхности диффундируют реагенты, в то время
как им навстречу диффундируют продукты реакции.
Введем еще одно упрощение. Примем, что зерно бесконечных
размеров: диффузия идет от поверхности вглубь вдоль оси х на неограниченную глубину (рис. 5.10). Смысл упрощения в том, что задача становится одномерной – рассматривается одна координата х,
и к тому же, как бывает очень часто, решать уравнения на бесконечном интервале х от 0 до ∞ проще, чем в иных пределах. Насколько
допустимо такое упрощение, станет ясно в дальнейшем.
СП
Рис. 5.10. Схема диффузии в глубь зерна катализатора
Как и прежде, для примера используем необратимую реакцию
1-го порядка А → В. При Т = const описание в рамках квазигомогенной модели представляет собой уравнение (5.14); для данной реакции оно имеет вид
DЗ
d 2 cA
− kЗ сA = 0 .
dx 2
(5.58)
5.4. Внутридиффузионное торможение
221
Краевые условия:
при х→0
сА→ся ,
(5.59)
при х→∞
сА→0 .
(5.60)
Условие (5.59) основано на том, что количество реагента, превращающегося на наружной поверхности зерна, ничтожно мало по
сравнению с тем, что реагирует внутри зерна. В соответствии с этим
диффузионное торможение в пограничном слое мало по сравнению
с торможением диффузией внутри зерна и градиент сА между ядром
потока и наружной поверхностью близок к нулю. Смысл условия
(5.60) состоит в том, что далеко в глубине зерна концентрация реагента должна падать до нуля, поскольку «по дороге» весь реагент будет затрачен на реакцию.
Уравнение (5.58) – линейное однородное 2-го порядка. Решение
его можно искать в виде
сА = еλх.
(5.61)
Тогда
d 2 cA
= λ 2 eλ x
dx 2
и уравнение (5.58) примет вид
λ 2 DЗ eλ x − kЗ eλ x = 0
(5.62)
или после сокращения и извлечения корня
λ=±
kЗ
DЗ
(5.63)
После подстановки двух значений λ из (5.63) в формулу (5.61)
имеем
kЗ
⎧
x
⎪⎪ cA = e DЗ ,
(5.64)
⎨
k
− Зx
⎪
D
⎪⎩cA = e З .
Общее решение уравнения (5.58) получается, как линейная комбинация решений системы (5.64), где С1 и С2 – произвольные константы:
cA = C1e
kЗ
x
DЗ
+ C2 e
−
kЗ
x
DЗ
.
(5.65)
Для получения частного решения используем краевые условия
(5.60) и (5.61). При подстановке в уравнение (5.65) второе условие дает С1 = 0. После этого применим первое условие и получим C2 = cя.
Глава 5. Явления переноса в химико-технологических процессах...
222
Итак,
cA = cЯ e
−
kЗ
x
DЗ
.
(5.66)
Введем комплекс L:
L=
DЗ
,
kЗ
(5.67)
и перепишем формулу (5.66):
x
−
cA
=e L.
cЯ
(5.68)
Уравнение (5.68) в безразмерном виде выражает глубину проникновения реагента в зерно катализатора. В качестве единицы масштаба х
выступает комплекс L, имеющий, как следует из (5.67), размерность
длины. Отношение х/L есть безразмерная длина (параметрический
критерий подобия поля концентраций).
На рис. 5.11 изображен график зависимости сА/ся от x/L (5.68).
По мере углубления в зерно концентрация сА убывает. Теоретически
убывание продолжается до х = ∞. Но при достаточно больших значениях х/L концентрация столь мала, что практически реакция уже не
идет. Это верно начиная приблизительно с x / L ≥ 5, при этом значение сА/ся < 0,01 и соответственно скорость реакции на два с лишним
порядка меньше, чем у наружной поверхности.
По формуле (5.68) при равных x/L получаем равные cA/cп. Это значит, что в пределах принятых допущений все необратимые изотермические реакции 1-го порядка протекают подобным образом.
СА
Сп
1
0
0
1
2
Рис. 5.11. График зависимости сА/cя от x/L
Однако для выявления влияния разных факторов на ход реакции
удобно проанализировать протекание процесса, приняв за абсциссу
х/dз, где dз – диаметр зерна катализатора. Тогда мы получим характеристику распределения концентрации по зерну не бесконечных
размеров, а определенного диаметра dз. Оказывается, эта характеристика существенно зависит от отношения L/dз.
5.4. Внутридиффузионное торможение
223
Заметим, что величину L можно трактовать либо как масштаб
глубины проникновения реагента в зерно, либо как некоторую меру
соотношения скоростей диффузии и реакции (см. уравнение (5.67)):
малое L означает малое значение Dз по сравнению с kз – медленную
диффузию при быстрой реакции, большое L – быструю диффузию.
Точнее, такой мерой служит не L, а отношение L/dз, поскольку Dз и
kз – величины разных размерностей и прямо сравнивать их значения
нельзя.
На рис. 5.12 в координатах х – сА показаны два типичных режима
работы катализатора, между которыми имеется переходная область.
СА
L>>d3
L
=0,02
d3
L
d3 =0,1
d3
2
d3
2
0
X
Рис. 5.12. Изменение концентрации реагента вдоль диаметра зерна
Первый режим: L >> dз. Скорость реакции мала, диффузия – быстрая. В этом случае центру зерна будет соответствовать очень малое
значение отношения х/L (велик знаменатель). Обратившись к графику на рис. 5.11, мы увидим, что при этом в центре зерна величина сА будет почти такая же, как на его периферии: по всему объему
зерна сА ≈ ся. Быстрая диффузия успевает доставить реагент в любую
точку почти без уменьшения его концентрации (верхняя кривая на
рис. 5.12).
Этот вывод верен, хотя уравнение (5.68) здесь неприменимо
и вместо него получается более сложная формула. Дело в том, что
в данном случае неверно краевое условие (5.5) – зерно уже нельзя
рассматривать как бесконечное, а концентрация нигде не падает до
нуля. Краевое условие для центра зерна имеет вид
dcA
=0
dx
при x =
dЗ
.
2
(5.69)
Смысл его в том, что в центре концентрация вещества А минимальна, а производная в точке минимума равна нулю.
224
Глава 5. Явления переноса в химико-технологических процессах...
Но здесь, не вдаваясь в подробности решения при краевом условии (5.69), можно удовлетвориться простым рассуждением. В соответствии с тем, что сА ≈ ся, скорость реакции по всему объему зерна
будет одной и той же:
rз = kзся .
(5.70)
Катализатор работает во внутрикинетической области. Закономерности процесса лимитирует химическая кинетика. В частности,
зависимость rз от температуры определяется уравнением Аррениуса.
Второй режим: L ≤ dз /10. По сравнению с диффузией реакция –
быстрая. В этом случае в центре зерна х/L ≥ 5. При обсуждении графика на рис. 5.11 я уже отмечал, что при таких значениях x/L концентрация реагента близка к нулю. То есть в этом режиме до центра
зерна реагент практически не доходит и реакция здесь не идет (нижние кривые на рис. 5.12).
Теперь уже можно использовать краевое условие (5.60) и формулу
(5.68). Действительно, после того как сА упалa до нуля, дальнейшее
увеличение размеров зерна не изменит картины. Зерно стало практически бесконечным. Эту область работы катализатора принято
называть внутридиффузионной. При этом скорость процесса проще
всего рассчитать следующим образом. Очевидно, что в зерне прореагирует столько реагента, сколько успеет продиффундировать от
его наружной поверхности в глубь зерна. Это количество равно наружной поверхности Fз , умноженной на поток вещества через нее.
Поток вещества можно определить по формуле (1.6), учитывая, что
в рассматриваемой одномерной задаче
grad c =
∂c
∂x
и что градиент рассчитывается на наружной поверхности, т.е. при
x = 0 (см. рис. 5.10):
⎛ ∂g A ⎞
⎛ ∂cA ⎞
⎜⎝
⎟ = FЗ qM = − FЗ DЗ ⎜⎝
⎟ .
∂t ⎠ M
∂x ⎠ x = 0
(5.71)
Подставив сюда выражение для сА из (5.68), получим:
x
x
−
⎛ ∂g A ⎞
⎛ cЯ ⎞ − L
L
⎜⎝
⎟ = FЗ DЗ ⎜⎝ ⎟⎠ e = FЗ cЯ kЗ DЗ ⋅ e .
L
∂t ⎠ M
При x = 0 имеем
⎛ ∂g A ⎞
⎜⎝
⎟ = FЗ kЗ DЗ ⋅ cЯ .
∂t ⎠ M
(5.72)
Чтобы перейти к величине rз, относящейся к объему зерна, нужно
поделить левую и правую части выражения (5.72) на объем зерна:
5.4. Внутридиффузионное торможение
rЗ =
FЗ
kЗ DЗ ⋅ cЯ .
VЗ
225
(5.73)
На основе формулы (5.73) и графика, приведенного на рис. 5.12,
можно установить главные особенности поведения катализатора во
внутридиффузионной области.
Первая характерная особенность заключается в том, что в работе
участвует не вся поверхность пор катализатора. Во внутренних частях
зерна реакция не идет. При этом чем меньше L, тем меньшая часть
зерна участвует в реакции. При малых L реакция сосредоточивается
в тонком слое, прилегающем к наружной поверхности зерна (сравните кривые для L/dз = 0,1 и L/dз = 0,02 на рис. 5.12).
С этим связана вторая важная особенность внутридиффузионной
кинетики. Мы знаем, что удельная поверхность тела тем больше, чем
меньше его размер. Из уравнения (5.73) следует, что скорость реакции во внутридиффузионной области пропорциональна удельной
наружной поверхности зерна Fз/Vз. Итак, чем мельче зерна катализатора, тем больше скорость реакции на них. В то же время во внутрикинетической области скорость реакции не зависит от наружной
поверхности зерна (см. уравнение (5.70)). Изменение размера зерна
в этой области не влияет на скорость (правда, лишь в изотермическом режиме). Поэтому, как правило, в кинетической области целесообразно работать с более крупнозернистым катализатором: гидравлическое сопротивление такого катализатора ниже.
Третья особенность внутридиффузионной области следует из
уравнения (5.73). Поскольку внутридиффузионная область отвечает условиям медленной диффузии и быстрой реакции, можно было
бы ожидать, что диффузия здесь является лимитирующей стадией.
Однако из уравнения видно, что скорость процесса в данном случае одинаково зависит и от константы скорости реакции, и от коэффициента диффузии. Лимитирующей стадии в данном процессе нет.
(Иногда говорят, что здесь лимитируют обе стадии. Вряд ли такая
формулировка удачна – она противоречит самой сути понятия лимитировать.) Отсутствие лимитирующей стадии объясняется тем,
что скорость одной стадии влияет на скорость другой (см. разд. 1.3).
Сравним распределение концентрации реагента в пограничном
слое для случая внешнедиффузионной области при непористом катализаторе (рис. 5.13) и в зерне для внутридиффузионной области
(см. рис. 5.12). На рис. 5.13 показаны (в приближении пленочной
модели) две прямые изменения сА по пограничному слою. Нижняя
относится к реакции, в 10 раз более быстрой, чем верхняя (сп в 10 раз
меньше). Но наклон обеих линий (градиент концентрации) почти
226
Глава 5. Явления переноса в химико-технологических процессах...
одинаков. Увеличение k в 10 раз практически не скажется на скорости диффузии, не скажется и дальнейшее увеличение, например
в 100 раз. Диффузия лимитирует процесс.
СА
Ся
Рис. 5.13. Изменение концентрации вещества А
по пограничному слою при работе в диффузионной области
В противоположность этому во внутридиффузионной области
увеличение скорости реакции (уменьшение отношения L/dз) ведет
к росту градиента концентрации (сравните две нижние кривые на
рис. 5.12). Чем больше kз, тем тоньше тот слой, через который должна идти диффузия, и тем больше общая скорость процесса.
Подставим в уравнение (5.73) выражение для kз из уравнения
Аррениуса и вынесем экспоненту из-под знака корня; показатель
степени при этом поделится на 2:
E /2
−
F
(5.74)
rЗ = З AЗ DЗ ⋅ e RT cЯ .
VЗ
Во внутридиффузионной области кажущаяся энергия активации
равна половине истинной. Напомню, что во внешнедиффузионной
области кажущаяся энергия активации падает почти до нуля (скорость реакции перестает зависеть от температуры).
Рассмотрим изменение характера работы зерна катализатора по
мере увеличения скорости реакции при приблизительно постоянной
скорости диффузии (например, при повышении температуры). При
малом значении константы скорости реакции L >> dз процесс идет
во внутрикинетической области и подчиняется уравнению (5.70).
Скорость реакции зависит от температуры по закону Аррениуса в соответствии с истинной энергией активации.
При увеличении константы скорости реакции начинает сказываться диффузионное торможение. Условно границей кинетической
и промежуточной областей можно считать значение L/dз ≈ 5; в этом
случае (в изотермическом процессе при реакции 1-го порядка) в центре зерна сА ≈ 0,9ся. В промежуточной области по мере роста kз посте-
5.4. Внутридиффузионное торможение
227
пенно уменьшаются концентрация реагирующего вещества в центральной части зерна и кажущаяся энергия активации. Когда L/ dз
приближается к 0,1, процесс переходит во внутридиффузионную
область. Внутренние части зерна выключаются из работы, причем
в тем большей степени, чем меньше значение L/dз. Кажущаяся энергия активации снижается до половины истинной. При дальнейшем
росте константы скорости реакции наступает такое состояние, когда L становится сравнимым с диаметром единичной поры: L ≈ dпоры.
Реакция настолько быстрая, что практически заканчивается на наружной поверхности зерна, проникая только на ничтожную глубину
у самых устьев пор. Применять квазигомогенную модель уже нельзя:
она основывалась на представлении о крайней малости и крайней
многочисленности пор, благодаря чему можно было не рассматривать отдельные поры, а усреднить свойства пористой среды с помощью коэффициентов kз и Dз. В то же время легко понять, что работа
зерна катализатора перестала отличаться от работы непористого зерна: реакция проходит только на внешней поверхности. Катализатор
стал работать во внешнекинетической области. Закономерности работы выражаются уравнением (5.45). Энергия активации вновь возросла до истинного значения. Но в отличие от внутрикинетической
области скорость реакции целесообразно относить не к объему зерна, а к его наружной поверхности. При дальнейшем росте k реакция
через промежуточную область переходит во внешнедиффузионную
и становится справедливым уравнение (5.41), а затем (5.46).
Лишь для очень немногих реакций можно на одном и том же зерне
катализатора пройти все рассмотренные области работы. Необходимый
для этого температурный интервал слишком широк, и либо начинает изменяться механизм реакции (например, проявляется ее обратимость),
либо начинает разрушаться катализатор. Рассмотренная схема тем не
менее полезна при рассмотрении условий работы катализаторов.
Выбор структуры поверхности катализатора определяется прежде
всего скоростью реакции. Если она невелика, целесообразно применять
пористые гранулы. Чем медленнее реакция, тем большую поверхность
пор желательно создать. Для реакций, достаточно быстрых, очень большая поверхность не нужна, поскольку целиком использовать ее все равно не удастся вследствие перехода во внутридиффузионную область.
При подборе катализаторов для медленных реакций возникает следующая трудность. Для увеличения поверхности необходимо
создавать поры малого диаметра – лишь таким путем можно развить
достаточную поверхность. Но диффузия в такие поры затруднена,
усиливается диффузионное торможение, препятствующее использованию полученной поверхности.
228
Глава 5. Явления переноса в химико-технологических процессах...
Известно несколько способов снижения диффузионного сопротивления в такой ситуации. Один заключается в применении чрезвычайно мелких частиц катализатора. Использовать их в неподвижном слое нельзя: гидравлическое сопротивление было бы огромным.
Катализатор суспендируют в реагирующей жидкости или газе. Другой
способ – создание гранул с порами двух типов: сравнительно широкими, служащими для подвода реагентов, и очень узкими, короткими, открывающимися в широкие. Длина узких пор мала, что снижает
диффузионное торможение, а их наличие резко увеличивает поверхность. Схема такого строения показана на рис. 5.14. Достигается
оно обычно двойным процессом формовки. Вначале мельчайший
порошок формуется в очень мелкие гранулы, пронизанные узкими
порами, а затем эти гранулы агрегируются в более крупные. Между
мелкими гранулами образуются широкие «транспортные» поры.
Полезно заметить, что схема, приведенная на рис. 5.14, может, например, иллюстрировать строение человеческого легкого: широкая
пора – бронхиола, узкие – альвеолы. Подобные структуры с транспортными порами и мелкими порами, развивающими поверхность,
часты и в живых организмах, и в почве, и во множестве других областей природы и техники.
2
1
Рис. 5.14. Схема пор двух размеров
Если реакция – очень быстрая, то иногда никакими приемами не
удается «ввести» ее внутрь пор – она заканчивается на наружной поверхности. В таких случаях бессмысленно применять пористый катализатор.
Пример 5.5. Реакция окисления SO2 до SO3 на ванадиевом катализаторе – типичный случай умеренно быстрой реакции. Ее проводят на пористых
гранулах катализатора, причем процесс идет по внутрикинетической области, немного заходя в промежуточную. Реакция окисления NH3 до NO на
платине – очень быстрая. Практически она всегда проходит во внешнедиффузионной области. Поэтому здесь используется непористый катализатор,
выполненный в виде сетки из нитей сплава Pt – Rh.
Влияние диффузионного торможения на селективность проявляется и при использовании пористых катализаторов. Рассмотрим лишь
один случай – последовательную реакцию А → В → С (В – целевой
продукт), о которой говорилось в разд. 5.3. Записав для первой и вто-
5.4. Внутридиффузионное торможение
229
рой стадиях уравнения, аналогичные (5.73), и учитывая, что для этой
реакции, в которой размеры молекул А и В приблизительно равны (как
правило, DА ≈ DВ), можно сделать вывод, что во внутридиффузионной
области скорость первой стадии будет пропорциональна k1 , скорость второй – k2 . Отношение скоростей стадий пропорционально
k1 / k2 . В кинетической области оно пропорционально k1/k2.
Сопоставление выражений k1 / k2 и k1/k2 приводит к выводу о том,
что во внутридиффузионной области сильнее тормозится та стадия,
константа скорости которой больше. При этом в зависимости от того, что больше: k1 или k2, селективность может либо уменьшаться,
либо возрастать.
Работа зерна катализатора в неизотермическом режиме. Анализ
процесса на пористом катализаторе с учетом выделения (поглощения) тепла сложен. Приходится совместно решать дифференциальные уравнения теплопроводности, диффузии и кинетики. Как правило, после этого рассчитывают скорость реакции rз, усредненную
по объему зерна. Величина неизотермичности зависит от скорости
реакции, теплового эффекта, эффективной теплопроводности зерна катализатора. Разность температур между центром и периферией
зерна может превышать 50 К [36]. Качественные оценки характера
распределения температуры по диаметру зерна в случае экзотермической реакции показаны на рис. 5.15.
T
1
2
3
Tя
d3
2
0
d3
x
2
Рис. 5.15. Распределение температуры
по диаметру зерна в разных режимах
Во внутрикинетической области (кривая 1 ) тепло выделяется во
всем объеме зерна. Поскольку для отвода тепла из внутренних частей необходим градиент температуры, последняя монотонно растет от наружной поверхности зерна к центру. Во внутридиффузионной области (кривая 2 ) внутренние части зерна не выделяют тепла.
Теплопотерь из них тоже нет: они окружены нагретыми наружными
230
Глава 5. Явления переноса в химико-технологических процессах...
частями. Поэтому здесь температура постоянна. В той части зерна,
в которой идет реакция, температура снижается к периферии. При
внешнедиффузионной кинетике (кривая 3) температура по всему
зерну постоянна; в пограничном слое она уменьшается.
Переход от описания процесса на зерне к квазигомогенной модели
процесса в слое производится по сути так же, как в случае непористого катализатора. Но так как величина rз отнесена к единице объема
зерна, то коэффициент перехода ν имеет вид
ν=
∑V
З
VСЛ
.
(5.75)
Соответственно, для rсл получаем
rсл = νrз.
(5.76)
Дальнейшие вычисления не отличаются от расчета ни для непористого катализатора, ни для гомогенных реакций.
Некаталитические процессы в пористых частицах проходят, как
правило, в нестационарных режимах. Часто приходится рассматривать такой случай. Реакция между материалом частицы и наружной
средой (газом или жидкостью) начинается на внешней поверхности частицы и постепенно распространяется к центру. При этом
в периферийной зоне частицы нарастает слой продуктов реакции
(«золы»), в котором реакция не проходит. Но реагент, проникая
к внутренним частям зерна, должен диффундировать сквозь слой
«золы».
Пусть происходит сгорание материала В по реакции с газообразным окислителем А, имеющей 1-й порядок по А и нулевой по В:
1 по А; k
A + B ⎯⎯⎯
⎯
→C.
Рассмотрим такой процесс в приближении квазигомогенной модели сгорающей частицы (зерна), изображенной схематически в координатах х – сА, аналогично рис. 5.10.
CA
Cя
xp
x
Рис. 5.16. Изменение концентрации реагента А
по глубине проникновения в частицу
5.4. Внутридиффузионное торможение
231
На наружной поверхности зерна концентрация реагента А практически такая же, как в ядре потока. Затем, следуя по координате х,
мы пройдем слой «золы», где реакция не идет (все уже сгорело), а реагент диффундирует вглубь. На некотором расстоянии хр от наружной
поверхности расположена поверхность (в нашем упрощенном рассмотрении – плоская), на которой происходит реакция. Дальше начинается зона непрореагировавшего материала. Обозначим среднюю
концентрацию реагента В в этой зоне сВ. В данном случае, учитывая
нулевой порядок по В, существенна именно средняя концентрация.
Определим количество В, превращающееся за время dt в элементарном объеме, расположенном вдоль поверхности реакции, занимающем на этой поверхности площадь F и уходящем в глубь частицы
вдоль оси х на расстояние dxр:
dgB = cBFdxр .
(5.77)
В то же время, dxр – это расстояние, на которое сдвинется поверхность реакции за время dt. Оно определяется скоростью реакции:
dg B = cB FdxP = − rB Fdt
(5.78)
(скорость здесь отнесена к единице площади реакционной поверхности). Сопоставив выражения (5.77) и (5.78), получим:
r
dxP
(5.79)
=− B
dt
cB
Теперь учтем заданную кинетику реакции – первый порядок
по А; константу скорости отнесем к той же площади поверхности:
rB = − kcA . Окончательно получим формулу для скорости, с которой
поверхность реакции отодвигается в глубь частицы:
dxР
c
(5.80)
=k A .
dt
cB
Заметим, что здесь сА определена непосредственно у поверхности
реакции. Поэтому необходимо дополнить модель уравнением диффузии через «золу» – частным случаем уравнения (5.14) для одномерного переноса в отсутствие реакции:
∂cA
∂ 2 cA
.
= DКГ
∂t
∂x 2
(5.81)
Система уравнений (5.80) и (5.81) по своей сути очень сложна.
Дело в том, что (5.80) выступает в роли краевого условия к уравнению (5.81) и при этом значение хр – координаты, на которой задано это условие, – непрерывно изменяется. Теория таких уравнений существует, но всякий раз их решение – задача нетривиальная.
Упростить решение удается, если имеет место лимитирование одной
232
Глава 5. Явления переноса в химико-технологических процессах...
из стадий. Это достаточно распространенные случаи. Процесс идет
в кинетической области, если реакция очень медленная. Например,
так проходит коррозия металлов. В таком случае концентрация реагента А успевает выровняться по всему объему «золы» (ржавчины) и
всюду равна ся. Уравнение (5.80) получает вид
dxP
c
=k Я
dt
cB
и его решение тривиально:
xP = kt
cЯ
.
cB
(5.82)
Поверхность реакции уходит вглубину с постоянной скоростью.
В случае быстрой реакции (горение) процесс лимитирует диффузия. При этом зачастую можно принять, что движение реакционной
поверхности происходит все же не очень быстро и в слое «золы»
успевает установиться профиль концентрации реагента А, характерный для стационарного процесса – линейное уменьшение сА вдоль
координаты х. Принятие такого упрощения характеризует квазистационарную диффузию. Учтем также, что в результате быстроты реакции концентрация реагента А у реакционной поверхности падает
практически до нуля и градиент концентрации в «золе» составит
(cЯ − 0) cЯ
= .
xP
xP
Баланс по А в этом слое в квазистационарном приближении определяется тем, что вход (поток вещества) равен стоку вещества в результате реакции
dxP
=
dt
DКГ
сЯ
cB
xP
.
(5.83)
Разделим переменные и проинтегрируем, приняв, что при t = 0
xр = 0. Тогда
xP2
с
= DКГ Я t ,
2
cB
откуда
xP = 2 DКГ
сЯ
t.
cB
(5.84)
В диффузионной области продвижение реакционной поверхности вглубь по мере утолщения «золы» замедляется (xр пропорционально не t, а
t ).
5.5. Процессы с межфазным массообменом
233
Расчет реальных процессов, как правило, гораздо сложнее. Приходится учитывать неплоскостность поверхности реакции, ее изменение по мере протекания процесса, неодинаковость размеров
частиц, неравномерность времени их пребывания в рабочей зоне, а
также то, что в какой-то момент частица сгорает полностью и выбывает из реакции. Приведенные уравнения – лишь первое приближение к реальной сложной картине.
Другой вариант диффузионного торможения наблюдается, например, при ионном обмене. Здесь возможно выравнивание концентрации по объему зерна благодаря проходящей в нем диффузии.
Характер процесса в этом случае зависит от соотношения скоростей
подвода вещества к наружной поверхности и диффузии внутри зерна. Если подвод осуществляется быстро, то процесс довольно быстро
затормаживается, так как в периферийных частях зерна образуется
слой, насыщенный поглощаемым веществом. Если теперь на некоторое время прервать процесс, а затем возобновить его, то во время перерыва вещество перераспределится по зерну сорбента и сразу
после перерыва скорость поглощения окажется значительно выше,
чем до перерыва (эффект «отдыха»). Если же процесс идет медленно, то перераспределение в зерне может происходить непрерывно,
тогда лимитировать процесс начнет массоотдача в пограничном слое
омывающего потока.
5.5. Процессы с межфазным массообменом
Процессы, в которых вещества переходят из одной фазы в другую,
играют весьма важную роль в химической технологии. Достаточно
упомянуть такие из них, как ректификация, абсорбция, экстракция,
газожидкостные реакции. При описании этих процессов возникают
специфические трудности, усложняющие создание математических
моделей и работу с ними.
Наличие двухфазного потока приводит к более сложным, чем
в однофазных процессах, уравнениям материального баланса –
уравнениям рабочих линий. В случае противотока расчет материального баланса может приводить к краевым задачам (см. разд. 1.3).
Межфазное равновесие часто описывается сложными соотношениями, теоретический вид которых во многих случаях неизвестен.
Надежные теоретические уравнения кинетики массообмена пока
не созданы. Гидродинамика двухфазных потоков, во многом определяющая кинетику процессов, крайне сложна и плохо изучена.
В двухфазных потоках очень сложны процессы продольного пере-
234
Глава 5. Явления переноса в химико-технологических процессах...
мешивания. При многокомпонентном массообмене анализ процесса значительно усложняется, закономерности массообмена многих
компонентов изучены еще слабо. Конструктивные особенности
аппаратуры чрезвычайно разнообразны, при этом их влияние на
гидродинамику и, следовательно, на кинетику процессов очень велико.
h
L
x+dx
y+dy
dg
dF
dh
x
y
G
Рис. 5.17. Схема элементарного объема
массообменного аппарата с противотоком
Описание массообменных процессов подробно изучается в курсе
процессов и аппаратов химической технологии [1]. Здесь рассмотрим лишь несколько основных вопросов, в первую очередь на примерах абсорбции и ректификации бинарных смесей.
Схемы потоков. Существуют три основные схемы потоков: противоток, прямоток и перекрестный ток. Различие описаний обусловлено тем, вдоль каких осей и в каком направлении меняются концентрации в обеих фазах.
Характер контакта фаз – это существенный признак, по которому массообменные аппараты делятся на две большие группы. При
непрерывном контакте потоки взаимодействуют непрерывно, без
резких изменений характера течения по высоте. Типичный пример
таких аппаратов – насадочные колонны. Аппараты со ступенчатым
контактом разделены по высоте на ряд последовательных ячеек
(ступеней). На каждой ступени фазы вступают в контакт, после чего разделяются и передаются на соседние ступени (в подавляющем
большинстве случаев – противотоком). Типичные примеры таких
аппаратов – тарельчатые колонны, смесительно-отстойные экстракторы.
5.5. Процессы с межфазным массообменом
235
Материальный баланс и уравнение рабочей линии. Воспользуемся
следующими обозначениями: G – расход газовой (паровой) фазы;
L – расход жидкой фазы; у и х – мольные доли в газовой и жидкой
фазах поглощаемого компонента (в случае абсорбции) или легколетучего (при ректификации). Рассмотрение материального баланса
будем вести применительно к потоку, в котором можно пренебречь
поперечной неравномерностью концентраций и все изменения происходят лишь вдоль вертикальной оси h. Если такая неравномерность существует, можно получить те же соотношения, но они будут
относиться к усредненным по сечению составам. При этом закон
усреднения далеко не всегда тривиален.
Выделим элементарный объем высотой dh, причем за положительное примем направление оси h снизу вверх (рис. 5.17). Материальный баланс связывает количество вещества dg/t, переходящее
в единицу времени из фазы в фазу с изменением расходов и составов фаз:
dg
= ± d ( Lx) = ± d (Gy ) .
t
(5.85)
Знаки «+» относятся к ректификации, когда х и у возрастают вверх
по колонне, знаки «–» – к абсорбции, когда содержание поглощаемого вещества в фазах уменьшается снизу вверх. При прямоточной
абсорбции у убывает книзу. В этом случае
dg
= − d ( Lx) = + d (Gy ) .
t
В дальнейшем рассматривается только противоток.
Уравнение (5.85) сложно для анализа вследствие своей нелинейности: оно содержит дифференциалы от произведений переменных.
Как правило, анализ этого уравнения проводят при линеаризующих
упрощающих допущениях. При анализе абсорбции линеаризовать
уравнение (5.85) можно, если выразить расходы фаз не общим количеством газа и жидкости, а количествами их составных частей, не
переходящих из фазы в фазу: G0 – количеством непоглощаемых составных частей газа и L0 – количеством поглотителя. Легко видеть,
что G0 и L0 не меняются по высоте абсорбера. Тогда и содержание абсорбируемого компонента следует отнести не к общему количеству
фазы (что дало бы мольные доли х и у), а к той составной части фазы,
которая не участвует в массообмене, т. е. выражать относительными
концентрациями X и Y, Так, Y есть число молей поглощаемого вещества, приходящееся на один моль непоглощаемой части газа. При
таком выражении постоянные L0 и G0 можно вынести за знак дифференциала, тогда уравнение (5.85) преобразуется к виду
236
Глава 5. Явления переноса в химико-технологических процессах...
dg
(5.86)
= − L0 dX = −G0 dY .
t
Часто абсорбцию проводят в условиях, когда х и у невелики. Тогда
L ≈ L0, G ≈ G0, x ≈ X, y ≈ Y и можно приближенно записать:
dg
(5.87)
= − Ldx = −Gdy .
t
Анализ ректификации упрощается в тех случаях, когда значения
теплоты испарения компонентов близки друг к другу. Тогда при конденсации одного моля труднолетучего компонента выделяется почти точно столько тепла, сколько нужно для испарения одного моля
легколетучего компонента. Конденсация и испарение происходят
в равных количествах, в результате чего L и G остаются постоянными. В данном случае можно применять уравнение (5.87), заменив
знаки «–» на «+».
Решение уравнения (5.87) для любых двух поперечных сечений 1
и 2 аппарата имеет вид
g
= ± L (x1 − x2 ) = ±G ( y1 − y2 ) .
(5.88)
t
Рассмотрев самое нижнее сечение «н» (вход газа) и самое верхнее
«в» (вход жидкости), получим уравнение для аппарата в целом:
g
(5.89)
= ± L (xB − xH ) = ±G ( yB − yH ) .
t
Из уравнений (5.88) и (5.89) легко получить уравнение рабочей линии, связывающее х и у в произвольном поперечном сечении:
xH − x
y −y
= H
.
xH − xB yH − yB
(5.90)
Для процесса абсорбции уравнение (5.90) точно лишь при замене
х и у на X и Y либо при малых значениях х и у. В общем случае приходится работать с гораздо более сложным, нелинейным уравнением
баланса. При описании ректификации записывают два уравнения
(5.90) – для укрепляющей и для исчерпывающей частей колонны.
При значительном различии в значениях теплоты испарения приходится также применять нелинейные уравнения баланса.
Межфазное равновесие. Равновесие между газом (паром) и жидкостью – явление сложное, что связано в первую очередь со сложностью структуры реальной жидкости, а возможно, и с неидеальностью газовой фазы. Во многих практически важных случаях
равновесие приходится рассчитывать, применяя вычислительную
технику [5].
5.5. Процессы с межфазным массообменом
237
Простейшие системы, такие как смеси изотопов, углеводородов
некоторых классов и немногие другие, можно с достаточной точностью считать идеальными: для них соблюдается закон Рауля, связы*
вающий равновесное давление любого i-гo компонента pi с содержанием его в жидкости xi:
pi* = p0*i xi ,
(5.91)
причем p0*i — равновесное давление над чистым компонентом – не
зависит от состава смеси.
Даже уравнение (5.91), описывающее простейшие системы, приводит к нелинейной зависимости между равновесными составами
фаз xi и yi* , в чем легко убедиться на примере бинарной смеси.
Пример 5.6. С помощью уравнения (5.91) рассчитаем зависимость у* = f(х)
*
*
при p01 = 1; p02 = 0,5, учитывая, что
y* =
x
p1*
p2*
y*
0, 000
0, 000
0,500
0, 000
0, 250
0, 250
0,375
0, 400
p1*
;
p1* + p2*
0,500
0,500
0, 250
0, 667
0, 750
0, 750
0,125
0,857
1, 000
1, 000
0, 000
1, 000
Нелинейность зависимости очевидна.
Лишь при малых значениях х (разбавленные растворы) зависимость у* (х) можно приближенно выразить формулой
у* = mх.
(5.92)
Уравнение (5.92) называется законом Генри. Коэффициент m называют константой фазового равновесия, или коэффициентом распределения. Иногда m или ее обратную величину Н = 1/m называют коэффициентом Генри. При расчетах уравнение (5.92) часто используют
и в условиях, когда закон Генри неприменим. Тогда m рассматривают
не как константу, а как функцию от х.
Кинетика массопередачи выражается уравнением
dg
≡ rM = K M (cГ − cГ* ) .
tdF
(5.93)
Здесь за положительное принято направление переноса от газа
к жидкости; rм – скорость массопередачи; сг и cГ* – соответственно
концентрация поглощаемого компонента в газовой фазе и концентрация его, равновесная с жидкой фазой. Во многих расчетах вели-
238
Глава 5. Явления переноса в химико-технологических процессах...
чины с заменяют на у (с соответствующим изменением размерности
Км). Коэффициент массопередачи Kм связан с коэффициентами массоотдачи в газовой βг и жидкой βж фазах соотношением
1
1 m
.
(5.94)
=
+
KM βГ βЖ
Разность, заключенная в скобки в правой части уравнения (5.93),
называют движущей силой массопередачи.
Возможна и другая форма уравнения (5.93), когда движущую силу
выражают через состав не газовой, а жидкой фазы. Этот вопрос подробно рассмотрен в [1, 37].
В разд. 5.1 и 5.3 указывалось, что коэффициенты массоотдачи β
существенно зависят от скоростей потоков. Но и при неизменной
гидродинамике величина Км изменяется по ходу процесса, поскольку
величина m в уравнении (5.94) зависит от состава жидкости. Считать
Kм константой можно лишь в двух случаях: в пределах действия закона Генри и тогда, когда один из членов правой части уравнения (5.94)
очень мал по сравнению с другим. Последний случай соответствует
лимитированию процесса массоотдачей в одной из фаз. Обычно лимитирующая фаза определяется величиной m. Если коэффициент m
мал (хорошо растворимый газ), то из уравнения (5.94) получим
Kм ≈ βг ,
(5.95)
что означает лимитирующую роль газа. Если коэффициент m велик, то
β
(5.96)
KM ≈ Ж ,
m
т. е. лимитирует жидкая фаза.
а
б
СП
СП
СЯ
СЯ
Рис. 5.18. Изменение концентрации реагента в пограничном слое:
а – профили концентрации в отсутствие (1) и при наличии (2) реакции;
б – приближенное изображение профиля при наличии реакции
Массопередача при протекании химической реакции в жидкости,
как правило, ускоряется. Проиллюстрировать причину этого ускорения проще всего в рамках пленочной модели. На рис. 5.18,а показа-
5.5. Процессы с межфазным массообменом
239
ны два профиля концентрации поглощаемого вещества в пограничном слое жидкости у границы с газом (газ – слева). Как в отсутствие
реакции, так и при ее протекании приняты одни и те же значения
концентрации поглощаемого компонента в массе жидкости ся и на
границе раздела фаз сп. При поглощении без реакции, т. е. при физической абсорбции (кривая 1), концентрация изменяется прямолинейно в соответствии с (5.24) (см. рис. 5.7). Наличие химической реакции приведет к тому, что поглощаемый компонент будет вступать
в реакцию в пограничном слое. Теперь уже падение концентрации
вызывается не только переносом, но и реакцией. Поэтому профиль
концентрации искривляется (см. рис. 5.18,а, кривая 2). Это приводит к увеличению градиента концентрации у границы раздела фаз и
соответственно к росту скорости переноса.
Приближенно кривую 2 можно изобразить ломаной; переход от
прямой 1 к кривой 2 эквивалентен уменьшению толщины пограничного слоя от δ до δ' = δ/а, как показано на рис. 5.18,б. По уравнению
(5.1) для этой схемы получится
D aD
(5.97)
β Ж′ = =
= aβ Ж .
δ′ δ
Здесь βж – коэффициент массоотдачи в жидкой фазе в отсутствие
реакции; β′Ж – коэффициент, получающийся под влиянием реакции; а – коэффициент ускорения. Конкретный расчет влияния реакции, как с помощью величины а, так и другими методами, должен
учитывать скорость и порядок реакции, скорости диффузии всех
реагентов и реальную структуру пограничного слоя. Подробно этот
вопрос рассмотрен в [35].
Интегрирование уравнений кинетики. Для расчета процесса нужно проинтегрировать уравнение (5.92) вместе с уравнением материального баланса. Интегрирование возможно либо для аппарата с непрерывным контактом, либо в пределах одной ступени аппарата со
ступенчатым контактом. Для примера рассмотрим интегрирование
(5.93) в случае абсорбции при следующих упрощениях: состав газовой
фазы выразим величиной у, величины G и Км будем считать постоянными. В уравнении (5.93) преобразуем левую часть с учетом (5.87):
dy
(5.98)
−G
= K M ( y − y* ) .
dF
Интегрирование по площади F, заключенной между сечениями 1
и 2, дает
y1
dy
G∫
= KM F .
(5.99)
y − y*
y2
240
Глава 5. Явления переноса в химико-технологических процессах...
Знак «–» в левой части уравнения (5.98) учтен переменой пределов
интегрирования (от у2 до у1, а не от у1 до y2). С учетом (5.88) имеем
y −y
g
= K M F y1 2 1 .
t
dy
∫y y − y*
2
(5.100)
По аналогии с формулой (5.92) можно записать:
g
(5.101)
= KM F ∆ ,
t
где ∆ — средняя движущая сила. Сопоставив уравнения (5.100) и
(5.101), получим для нее выражение
∆=
y2 − y1
y1
∫
y2
dy
y − y*
=
y2 − y1
.
N
(5.102)
Знаменатель содержит величину N, определяемую формулой
y1
N=
dy
∫ y − y* .
(5.103)
y2
Ее называют числом единиц переноса. Если Км и G постоянны, то из
уравнения (5.99) находим:
K F
(5.104)
N= M .
G
Число единиц переноса и связанные с ним понятия, например
высота единицы переноса (высота такой части аппарата, для которой N = 1), удобны для анализа и часто используются.
Если система подчиняется закону Генри, то интеграл (5.104) можно вычислить аналитически, использовав уравнения (5.92) и (5.88):
y1 − y1*
y2 − y2*
,
N=
mG
1−
L
ln
(5.105)
откуда для средней движущей силы получаем выражение
⎛ mG ⎞
( y1 − y2 ) ⎜1 −
⎟
⎝
L ⎠,
∆=
*
y −y
ln 1 1*
y2 − y2
которое несложно преобразовать к виду
∆=
( y1 − y1* ) − ( y2 − y2* ) ∆1 − ∆ 2
=
∆
y − y*
ln 1
ln 1 1*
∆
y2 − y2
2
(5.106)
5.5. Процессы с межфазным массообменом
241
(∆1 и ∆2 – движущие силы соответственно в низу и в верху аппарата).
Выражение (5.106) часто называют средней логарифмической движущей силой. Оно применимо в случае линейного уравнения рабочей
линии и соблюдения закона Генри. Если отношение ∆1/ ∆2 находится
в пределах от 0,5 до 2, то значение ∆ приближенно равно среднему
арифметическому:
∆≈
∆1 + ∆ 2
.
2
(5.107)
Влияние структуры потока. Уравнение (5.85) верно лишь в том
случае, когда каждая фаза движется в режиме идеального вытеснения, поскольку в уравнении не отражен перенос механизмами продольного смешения. Приведу выведенные в [37] формулы для расчета процесса абсорбции при разных вариантах движения фаз. Здесь
указана зависимость коэффициента извлечения φ от числа единиц
переноса. Коэффициент φ равен отношению поглощенного количества вещества к тому, которое было бы поглощено, если бы на выходе
газа было достигнуто равновесие:
y − yВ
(5.108)
φ= Н
.
yН − yВ*
Для упрощения введены обозначения: l =
L
,
mG
1
B = 1− ,
l
C=
1 − e− N
l
.
Формулы учитывают относительное движение потоков и характер
течения каждой фазы (в приближении идеальных потоков).
Идеальное вытеснение в обеих фазах:
• противоток
• прямоток
φ=
φ=
e BN − 1
;
e BN − l
1
(1 − e − BN ) ;
B
−C
• перекрестный ток φ = l (1 − e ) .
Идеальное смешение жидкости, идеальное вытеснение газа:
φ=
eN − 1
.
⎛ 1⎞ N 1
1
+
e
−
⎜⎝
⎟
l⎠
l
Идеальное смешение жидкости и газа:
φ=
eN − 1
.
⎛ 1⎞
1
+
N
+
1
⎜⎝
⎟
l⎠
242
Глава 5. Явления переноса в химико-технологических процессах...
Если продольное перемешивание можно описать однопараметрической диффузионной моделью, то расчет можно провести по методике, описанной в [37, с. 220–224].
Один из важнейших вариантов структуры потока – ступенчатый
контакт. Между ступенями зависимости, получаемые интегрированием уравнений кинетики, претерпевают разрыв; взаимосвязь между ступенями учитывается добавочными соотношениями.
Первой моделью аппарата со ступенчатым контактом была модель теоретической тарелки, или равновесной ступени. Она сводится
к следующей схеме. Аппарат рассматривается как последовательность ступеней («тарелок») идеального смешения. В каждую ступень
снизу входит газ (пар), сверху – жидкость. Здесь фазы перемешиваются. Затем они разделяются и расходятся: газ наверх, жидкость
вниз. При этом вводится добавочное допущение: на каждой ступени
массообмен столь интенсивен, что фазы приходят в равновесие. Таким
образом, это ячеечная модель (см. разд. 4.4), дополненная условием
идеального массообмена. Математическую модель для этой схемы
построить очень просто.
Рассмотрим схему потоков для j-й ступени (рис. 5.19).
Рис. 5.19. Схема участка ступенчатого аппарата
Нумерацию ступеней примем снизу вверх; индекс j будет относиться к j-й ступени и к потоку, уходящему с нее. Уравнение материального баланса для ступени будет аналогично (5.85):
5.5. Процессы с межфазным массообменом
L( x j +1 − x j ) = G ( y j − y j −1 ) .
Уравнение (5.109) дополняется условием равновесия
y j = mx j .
243
(5.109)
(5.110)
Математическое описание процесса состоит из уравнений (5.109)
и (5.110), записанных для каждой ступени и общего уравнения баланса (5.90). Их легко решать графически или на компьютере.
Большое преимущество модели равновесной ступени состоит
в том, что с ее помощью несложно построить математическое описание процесса для случая многокомпонентной смеси. Уравнения математического описания будут выглядеть аналогично (5.109) и (5.110),
но такие уравнения нужно записать отдельно для каждого компонента смеси. То обстоятельство, что степень приближения к равновесию для разных компонентов может оказаться различной, иногда
вносит добавочные неточности. В разд. 4.4 мы уже говорили о том,
что иногда ячеечную модель формально используют и в случаях, когда структура реального потока не соответствует физической схеме
модели. Это же относится и к модели равновесной ступени, которую
изредка применяют и при описании аппаратов с непрерывным контактом.
Особый случай – разделение сильно неидеальных многокомпонентных смесей. Если многокомпонентная система – сильно неидеальная,
содержащая азеотропные смеси, то в расчете процесса возникают
новые сложности. Во-первых, равновесие в таких системах описывается специальными соотношениями, причем для различных систем
наилучшими зачастую оказываются разные по структуре соотношения. Далее в этих случаях прежде чем проводить расчет разделения
в данном аппарате, приходится решать вопрос, на какие продукты
вообще можно разделить смесь данного состава. Для решения возникающих при этом вопросов разработан специальный математический аппарат [5].
ГЛАВА 6.
МОДЕЛИРОВАНИЕ ПРОЦЕССОВ С УЧЕТОМ
ВОЗМОЖНОЙ НЕСТАЦИОНАРНОСТИ
6.1. Математические модели нестационарных процессов
В этой книге я анализирую в основном стационарные процессы –
то, что в теории автоматического регулирования называют статикой. Процессы в динамике (меняющиеся во времени) также играют
в химической технологии большую роль. К ним относятся все периодические процессы, а также такие важные этапы любого процесса, как
пуск и останов, и переходные процессы, возникающие при изменениях режима работы вследствие либо случайных возмущений, либо регулирующих воздействий. Изучение переходных процессов – одна
из основ теории автоматического регулирования, и здесь, пожалуй,
важнейшим методом является математическое моделирование.
Математическое описание нестационарного процесса обязательно
содержит производные по времени. В простейшем случае это связано с членами, описывающими накопление (см., например, уравнение
(4.12)). Поэтому математический аппарат, применяемый для описания
и анализа этих процессов, – дифференциальные уравнения. Методы
анализа результатов на основе дифференциальных уравнений, например метод Лапласа [13], изучают, как правило, в курсе автоматического регулирования. Не углубляясь в эту область, рассмотрю простейшие
случаи – переходные процессы в идеальных аппаратах при ступенчатом возмущении по концентрации. Такой тип возмущения часто анализируется в теории: до некоторого момента t = 0 величина на входе
имела одно значение, а затем мгновенным скачком принимает новое
значение, которое сохраняется в дальнейшем. Пример подобного возмущения (по концентрации индикатора) показан на рис. 4.12,а.
Рассмотрим протекание необратимой реакции 1-го порядка А → В
в аппарате идеального смешения. Температура и расход жидкости
постоянны. До момента t = 0 концентрация вещества А на входе со-
6.1. Математические модели нестационарных процессов
245
ставляла c01, затем она скачком возросла до c02. Математическое описание процесса состоит из одного уравнения баланса, являющегося
частным случаем уравнения (4.34):
c −c
dcA
(6.1)
= − kcA + A0 A .
dt
t
Вначале, в стационарном режиме при cA0 = c01, значение cA будет
определяться формулой (4.39), задающей начальное условие для
уравнения (6.1) при t = 0:
c
cA = 01 .
(6.2)
1 + kt
Учитывая, что на протяжении переходного процесса сА0 = с02, уравнение (6.1) можно переписать в виде
c
dcA ⎛
1⎞
+ ⎜ k + ⎟ cA = 02 .
⎝
⎠
dt
t
t
Теперь ясно, что это линейное дифференциальное уравнение 1-го
порядка с постоянными коэффициентами и постоянной правой частью. Запишем его общее решение:
⎛ 1⎞
−⎜ k + ⎟ t
⎝ t⎠
c02
.
(6.3)
1 + kt
Константа интегрирования определяется из начального условия
(6.2). Окончательно имеем:
cA = const e
+
⎛ 1⎞
−⎜ k + ⎟ t
c − (c02 − c01 )e ⎝ t ⎠
.
(6.4)
cA = 02
1 + kt
Это и есть уравнение нашего переходного процесса, которое описывает изменение концентрации на выходе из аппарата, графически
показанное на рис. 6.1,б.
Рис. 6.1. График переходного процесса в аппарате идеального смешения:
а – на входе; б – на выходе
246
Глава 6. Моделирование процессов с учетом возможной нестационарности
Рис. 6.2. График переходного процесса
в аппарате идеального вытеснения:
1 – на входе; 2 – на выходе
График – экспонента, начинающаяся от первого стационарного
значения и асимптотически приближающаяся ко второму. Объект,
описываемый уравнением (6.1) или соответственно (6.4), в теории автоматического регулирования называют апериодическим звеном 1-го
порядка. Постоянная времени в данном случае составляет 1
t
1
.
+k
По-иному выглядит переходный процесс в аппарате идеального
вытеснения. В стационарном режиме при cA0 = c01 концентрация вещества А на выходе аппарата определяется формулой (4.14):
cK1 = c01e − kt .
Если на входе происходит возмущение, то вначале оно никак не
проявляется на выходе – те порции жидкости, в которых начальная
концентрация изменилась, до выхода еще не дошли. Когда же пройдет
− kt
время, равное t , концентрация скачком изменится до cK 2 = c02 e
(рис. 6.2). С точки зрения теории автоматического регулирования
в аппарате идеального вытеснения имеет место чистое запаздывание
(транспортное запаздывание).
Особенно непросто описание переходных процессов в тех случаях, когда технологический процесс является сильно неизотермическим. При этом приходится учитывать тепловую инерцию конструктивных элементов аппаратов и их заполнения (катализатор, насадка
и др.). Нагревание и охлаждение этих элементов описываются сложными уравнениями при краевых условиях, меняющихся во времени.
Получив описание и характеристику переходных процессов в какомлибо аппарате, можно рассчитать оптимальные параметры системы
автоматического регулирования. Есть и еще важное применение
таких описаний. На их основе может быть создано специальное
устройство – тренажер (см. пример 1.2).
6.2. Параметрическая чувствительность и устойчивость процессов
247
6.2. Параметрическая чувствительность и устойчивость процессов
В ряде случаев анализ математической модели позволяет обнаружить такие особенности процесса, предсказание которых по лабораторным данным невозможно или весьма затруднительно, поскольку
они сильно зависят от размеров объекта. Рассмотрим две такие особенности.
Параметрическая чувствительность Пij – производная от i-й выходной величины по j-му входному параметру:
Пij =
∂yi
.
∂x j
(6.5)
Чем больше Пij , тем сильнее влияет данный фактор на выход. Если
параметрическая чувствительность очень мала, то соответствующим
фактором нельзя пользоваться как управляющим: он почти не влияет на процесс. Если параметрическая чувствительность чрезмерно
велика, процесс становится трудноуправляемым. Даже малые колебания входного параметра приводят к резким колебаниям режима.
Поэтому приходится либо чрезвычайно точно стабилизировать вход,
либо тем или иным способом снижать чувствительность.
Отмечу, что поскольку Пij — функция входных факторов, то при
их изменении процесс может попадать в области и малой, и высокой
чувствительности.
Пример 6.1. Рассчитано протекание необратимой экзотермической реакции 1-го порядка А → В в аппарате идеального вытеснения с охлаждаемой
стенкой [38]. Исследовано влияние температуры стенки Тп (постоянной по
длине аппарата) на температуру в горячей точке – наибольшую температуру в зоне реакции. Математической моделью процесса являются уравнения
(4.5), (3.53) и (5.28). Результаты моделирования показаны на рис. 6.3.
342,5
340
420
337,5
380
335
330
340
300
0
10
300
20
320
310
Рис. 6.3. График чувствительности трубчатого реактора к температуре стенки
248
Глава 6. Моделирование процессов с учетом возможной нестационарности
По оси абсцисс отложено время реакции (начиная от момента входа смеси в аппарат), по оси ординат – температура смеси.
До Тп = 335 К параметрическая чувствительность невелика. Это объясняется тем, что входящая смесь охлаждается и реакция идет очень медленно.
Но затем при росте Тп начинается бурное развитие реакции, самоускоряющейся за счет выделения тепла. Увеличение Тп на 2,5 К (от 335 до 337,5 К)
вызывает рост температуры в горячей точке почти на 70 К. Отсюда находим,
что П ≈ 70 : 2,5 = 28.
Если в рассмотренном случае использовать изменяющуюся по
длине температуру стенки (вначале значение Тп относительно велико, а затем оно снижается), то скачок температуры сгладится и П понизится. Управлять процессом будет легче.
Заметим, что в ряде случаев параметрическую чувствительность
целесообразно определять так, как это сделано в примере 6.1: заменяя в уравнении (6.5) производную отношением малых конечных
приращений
∆y
(6.6)
Пij = i .
∆x j
Такая модификация будет, например, целесообразна в случае, если
зависимость у от х имеет вид кривой с крутым и узким максимумом
(узкого пика). Тогда в точке максимума по определению уравнение (6.5)
даст значение П = 0, но расчет по (6.6) приведет к большому по модулю
значению П. А так как в реальном процессе колебания х вполне конечны, ориентироваться на «теоретическую» формулу (6.5) нельзя.
Предельный случай параметрической чувствительности: П → ∞.
Это означает, что бесконечно малое изменение входного параметра
вызывает конечное изменение показателей работы. Такая ситуация
наблюдается при неустойчивости процессов.
Устойчивость химических процессов определяется их реакцией
на возмущающие воздействия. Если процесс, проходящий устойчиво,
отклонить от данного состояния, а затем предоставить самому себе,
то он самопроизвольно вернется в начальное состояние.
Наиболее известно явление устойчивости равновесия механических
систем. Так, стул, стоящий на четырех ножках, устойчив. Если его слегка наклонить, а затем отпустить, то он вновь станет на ножки. Устойчив
также стул, лежащий на боку. Теоретически можно уравновесить стул и
на двух ножках, и даже на одной. И если бы он не испытывал никаких
толчков, то простоял бы в таком положении неопределенно долго. Но
достаточно легкой вибрации пола – и стул, отклонившись от положения равновесия, уже не вернется к нему, а будет отклоняться дальше,
пока не встанет на четыре ножки или не упадет на бок. Равновесие стула, стоящего на одной или двух ножках, неустойчиво.
6.2. Параметрическая чувствительность и устойчивость процессов
249
Если систему, находящуюся в неустойчивом равновесии, вывести
из него, а затем предоставить самой себе, то она будет самопроизвольно продолжать отклоняться от исходного состояния. Вопрос
о том, что может произойти с ней дальше, я вкратце рассмотрю немного ниже. Из примера со стулом ясно, что одна из возможностей
(возникающая, пожалуй, чаще всего) – приход к какому-либо устойчивому равновесию.
В химической технологии обычно анализируют устойчивость
стационарных режимов работы. В любом технологическом процессе
стационарный режим подвержен случайным колебаниям (возмущениям). Предположим, что в результате возмущения значение какогото входного параметра х, влияющего на работу аппарата, слегка отклонилось от постоянной величины (рис. 6.4,а) и затем вернулось
к начальному положению. Как будет вести себя аппарат, находящийся в устойчивом и в неустойчивом состояниях?
О работе аппарата будем судить по изменению во времени значения какого-либо из выходов системы у. Если исходный режим
устойчив, то переходный процесс будет проходить приблизительно
так, как показано на рис. 6.4,б, – через некоторое время после снятия возмущения режим вернется к начальному состоянию. Если же
состояние аппарата было неустойчивым, то при том же характере
возмущения по окончании переходного процесса аппарат окажется
уже в каком-либо другом, устойчивом состоянии (рис. 6.4,в).
Рис. 6.4. Графики возмущающего воздействия (а) и переходных
процессов при устойчивом (б) и неустойчивом (в) режимах
r
T
Рис. 6.5. Температурная зависимость скорости
реакции в аппарате идеального смешения
250
Глава 6. Моделирование процессов с учетом возможной нестационарности
Рассмотрим задачу об устойчивости химических процессов на
примере тепловой устойчивости экзотермической необратимой реакции 1-го порядка, протекающей в аппарате идеального смешения
с отводом тепла. Для анализа этого случая нам потребуется зависимость скорости реакции, протекающей в аппарате идеального смешения, от температуры. Поэтому вначале найдем эту зависимость.
Имеем необратимую реакцию 1-го порядка А → В, протекающую
в аппарате идеального смешения. Скорость реакции выражается
формулой
r = kcA = Ae
−
E
RT
cA .
Однако cA в свою очередь зависит от концентрации на входе сА0 и
c
от Т. Поэтому воспользуемся формулой (4.39): cA = A0 . Тогда
1 + kt
−
E
kc
Ae RT cA0
r = A0 =
.
(6.7)
E
−
1 + kt
RT
1 + Ae t
График зависимости (6.7) показан на рис. 6.5. При малых Т второй член в знаменателе пренебрежимо мал по сравнению с единицей. Тогда
−
E
r = Ae RT cA0 .
В этой области с повышением температуры скорость реакции
растет по закону Аррениуса. Происходит это потому что здесь скорость мала, следовательно, степень превращения низкая и сА ≈ сА0.
При больших Т, наоборот, второй член в знаменателе формулы (6.7)
много больше единицы. Единицей можно пренебречь, тогда дробь
сократится и мы придем к выражению
c
(6.8)
r = A0 .
t
Вначале зависимость (6.8) может показаться парадоксальной.
Почему скорость реакции зависит не от концентрации в зоне реакции (которая при высокой температуре очень мала), а от концентрации реагента на входе в аппарат? Почему на скорость влияет среднее
время пребывания? Учет особенностей процесса делает, однако,
физический смысл такой зависимости достаточно ясным. При высоких температурах реакция протекает быстро, поэтому перерабатывается практически все вещество, вводимое в аппарат. Скорость
реакции определяется просто количеством реагента, вводимого в аппарат в единицу времени (отсюда множитель cA0 в числителе форму-
6.2. Параметрическая чувствительность и устойчивость процессов
251
лы (6.8)), а также средним временем, затрачиваемым на переработку.
Для анализа важно то, что в этом режиме скорость r не зависит от
температуры : с ростом Т увеличивается k и одновременно уменьшается сА, но так как концентрация А на выходе очень мала, ее дальнейшее уменьшение практически не сказывается на разности (сА0 – сА) и
соответственно на скорости реакции.
Теперь перейдем к анализу устойчивости данной реакции. Реакция
протекает в аппарате идеального смешения. Тепло реакции отводится через поверхность Fт к теплоносителю, имеющему температуру
Tтн. Если процесс стационарен, то его характеризует уравнение теплового баланса (5.29), которое запишем в виде
(6.9)
Va Qp r = vρCT (T − T0 ) + K T FT (T − TTH ) .
Обозначим левую часть уравнения через Q1, а правую – через Q2.
Здесь Q1 – выделение тепла, т. е. количество тепла, выделяемого реакцией в единицу времени; Q2 – отвод тепла, т. е. количество тепла,
выводимого в единицу времени с потоком и через стенку (за вычетом
входящего с потоком).
Итак, в стационарном режиме
Q1 = Q2.
(6.10)
Если Q1 ≠ Q2, процесс нестационарен: при Q1 > Q2 температура растет во времени – система нагревается; при Q1 < Q2 система охлаждается. Исследуем, как зависят левая и правая части уравнений
(6.9) – (6.10) от температуры в аппарате. В левой части VaQp – коэффициент, почти не зависящий от Т, так что функция Q1(Т) имеет такой же вид, как функция r (Т), изображенная на рис. 6.5, отличаясь
лишь постоянным множителем.
Правую часть уравнения (6.9) преобразуем, выделив скобками величины, не зависящие или почти не зависящие от T:
Q2 = −(vCT ρT0 + K T FTTTH ) + (vCT ρ + K T FT )T .
(6.11)
Таким образом, это практически линейная зависимость, причем
Q2 растет с повышением Т.
На рис. 6.9 зависимости Q1 и Q2 от Т представлены графически.
Линия I выделения тепла и линия II отвода тепла пересекаются в трех
точках 1, 2 и 3 при температурах Т1, Т2 и T3. При этих температурах
соблюдается условие (6.10) и процесс стационарен. Итак, в данной
ситуации при одних и тех же значениях всех внешних (входных) параметров возможны три различных стационарных режима.
Рассмотрим вначале стационарный режим при температуре Т1.
Так как скорости выделения и отвода тепла равны одна другой, то
пока температура не меняется, режим остается стационарным.
Предположим теперь, что в результате случайного возмущения тем-
252
Глава 6. Моделирование процессов с учетом возможной нестационарности
пература в реакторе немного повысилась и стала равной T1 + dT (рис.
6.6). При этом из-за ускорения реакции возрастает скорость выделения тепла; этот рост происходит в соответствии с кривой тепловыделения. Одновременно из-за увеличения разности температур между
реактором и теплоносителем повышается скорость отвода тепла.
Этот рост характеризуется прямой теплоотвода.
Рис. 6.6. Зависимости выделения и отвода
тепла от температуры в реакторе
В точке 1 прямая идет круче кривой, поэтому при температуре
T1 + dT скорость отвода тепла окажется выше, чем скорость его выделения. Раз так, то после снятия возмущения реактор начнет охлаждаться. Охлаждение будет продолжаться до тех пор, пока реактор не
вернется к температуре Т1. При этой температуре скорости выделения и отвода тепла опять уравняются и режим снова станет стационарным. Наоборот, если в результате возмущения реактор слегка
охладится, то скорость выделения тепла станет больше, чем скорость
его отвода и реактор начнет нагреваться, пока снова не достигнет Т1.
Таким образом, при температуре Т1 режим устойчив.
При температуре Т3 с точки зрения устойчивости картина полностью аналогична предыдущему режиму. Прямая теплоотвода также
идет круче, чем кривая выделения тепла. Точно такие же рассуждения приводят к такому же выводу: режим устойчив.
Теперь обратимся к точке 2. Здесь наклон прямой теплоотвода
меньше, чем наклон кривой выделения тепла. Так же, как и в точках 1 и 3, Q1 = Q2, и если нет возмущений, режим будет оставаться
стационарным. Но предположим, что произошло случайное возмущение – повышение температуры до T2 + dT. При этой температуре скорость выделения тепла станет большей, чем скорость тепло-
6.2. Параметрическая чувствительность и устойчивость процессов
253
отвода. После снятия возмущения реактор будет не охлаждаться, а
нагреваться, удаляясь от начального состояния. Нагревание будет
продолжаться до тех пор, пока при температуре T3 реактор не придет
в устойчивое стационарное состояние. Точно так же при случайном
охлаждении реактор будет самопроизвольно охлаждаться до тех пор,
пока не дойдет до устойчивого состояния при Т1.
Итак, из трех возможных в данных условиях стационарных режимов два – при низкой температуре (и малой скорости реакции) и при
высокой температуре (и большой скорости реакции) – устойчивы,
а третье – при промежуточных температуре и скорости реакции –
неустойчиво. Условие устойчивости в этой задаче состоит в том, что
прямая теплоотвода идет круче, чем прямая тепловыделения. Это
условие можно записать формулой
dQ2 dQ1
.
(6.12)
>
dT
dT
Что делать, если желательно работать в области температур вблизи T2? Есть два выхода: один – построить систему автоматического
регулирования, которая будет удерживать режим в неустойчивом
состоянии, второй – сделать теплоотвод столь интенсивным, что
линия отвода тепла будет всюду круче линии выделения, как это показано на рис. 6.7.
Рис. 6.7. Зависимости Q1 и Q2 от Т при устойчивости во всем диапазоне Т
Подставив в формулу (6.12) выражения для Q1 и Q2 из (6.9), после
несложных преобразований получим условие устойчивости в виде
ρCT K T FT
dr
.
(6.13)
+
> QP
t
Va
dT
Заметим, что левая часть будет большой при условии интенсивного
теплообмена, т.е. когда велики Кт и удельная поверхность fт = Fт / Va.
Это указывает путь к повышению устойчивости. Но одновременно
учтем следующее. Если размер аппарата уменьшается, то величина
254
Глава 6. Моделирование процессов с учетом возможной нестационарности
fт растет (см. разд. 1.1, пример 1.9). Поэтому условия работы малой
модели могут соответствовать зависимости, показанной на рис. 6.7,
при этом неустойчивость не возникает. При переходе к большим размерам установки fт уменьшается и возможно неожиданное возникновение неустойчивости. В серьезных технологических разработках необходимо анализировать параметрическую чувствительность
и устойчивость методами математического моделирования.
Зажигание катализатора. Зависимость скорости реакции на непористом катализаторе от температуры поверхности, рассмотренная
в разд. 5.3 (см. рис. 5.9), близка к зависимости, показанной на рис.
6.5. В случае экзотермической реакции выделяющееся тепло отводится в поток газа или жидкости. Уравнение (5.70), так же как и баланс (6.9), сводится к записи (6.10). При этом изменение температуры
в ядре потока Тя вызывает на графике параллельный перенос прямой
теплоотвода: чем выше Тя, тем правее пройдет эта прямая (рис. 6.8).
Рис.6.8. Графическое пояснение к процессам
зажигания и угасания катализатора
Рассмотрим с помощью этого рисунка процесс постепенного
повышения Тя. Пока эта температура растет от Т1 до Т5, процесс на
зерне устойчиво удерживается в кинетической области (пересечение
прямых с нижней частью кривой выделения тепла). При достижении
в ядре потока температуры Т5 произойдут скачкообразный рост температуры Тп и переход в диффузионную область – зажигание катализатора. Зажигание связано с потерей устойчивости низкотемпературного процесса: в точке, где прямая 5 касается кривой, процесс
уже неустойчив. После зажигания устойчивым становится процесс,
соответствующий верхней части кривой Q1. Он будет устойчив даже, если температура Тя начнет понижаться. Лишь при достижении в ядре температуры Т2 (прямая 2) устойчивость будет потеряна,
температура скачком упадет, процесс перейдет в кинетическую область – произойдет погасание катализатора.
6.2. Параметрическая чувствительность и устойчивость процессов
255
Некоторые особенности задач, связанных с устойчивостью.
Развитие науки и техники в ХХ веке показало, что проблемы устойчивости чрезвычайно важны и что они пронизывают самые различные области – от устойчивости механических конструкций до стабильности финансовых рынков, устойчивости расчетных схем или
форм поведения масс людей. Привести здесь современную теорию
устойчивости не представляется возможным. Ограничусь очень
кратким описанием некоторых понятий из этой области; для изучения ее можно рекомендовать [14].
При описании задач, связанных с устойчивостью, часто бывает
удобно изображать состояние системы в фазовых координатах. По
осям координат откладываются значения параметров, определяющих состояние системы. Точка в фазовом пространстве соответствует
какому-либо из таких состояний. (Для примера скажу, что рис. 2.3–2.5
можно рассматривать как изображения областей фазового пространства: показанные на них значения факторов определяют условия эксперимента, а каждая точка – условия какого-либо опыта.) При этом
если мы рассматриваем изменение фазового графика во времени и
если точка неподвижна, значит, состояние системы стационарно; нестационарный режим изображается движущейся точкой.
Что отличает в фазовом пространстве неподвижные точки, соответствующие устойчивым или неустойчивым стационарным состояниям? Если состояние, изображаемое точкой, устойчиво, то
около нее имеется область, в которой все возможные траектории
нестационарных процессов движутся в направлении этой точки.
Переходные процессы заканчиваются стационарным состоянием.
Такие точки называют аттракторами. Напротив, точку, изображающую неустойчивое стационарное состояние, окружает область, где
все траектории направлены прочь от этой точки. Такую точку называют репеллером (от лат. attraho – притягивать, repello – отталкивать). Бывает и так, что малое число траекторий (обычно – две) направлены к данной точке, а остальные – от нее. Это случай седловой
точки.
Что может произойти, если система вышла из неустойчивого состояния и предоставлена самой себе? Простейший вариант, к которому сводились рассмотренные выше случаи: вблизи данного репеллера отыщется аттрактор и точка перейдет в него, система окажется в
ином, уже устойчивом состоянии. Но возможны и другие варианты.
Один из них таков. Точка начинает двигаться по замкнутой кривой,
совершая один оборот за другим. Такую кривую называют предельным циклом. Движение точки по предельному циклу отображает протекание на объекте колебательного процесса, параметры которого пе-
256
Глава 6. Моделирование процессов с учетом возможной нестационарности
риодически изменяются во времени. Так ведут себя многие процессы
при перерегулировании : вместо того чтобы под воздействием регулятора прийти к заданному режиму, процесс начинает совершать непрерывные колебания [13]. То же наблюдается при возникновении
колебательных химических реакций [39].
В последние десятилетия обнаруживается еще один возможный
вариант, обозначаемый термином «странный аттрактор». Странный
аттрактор – это не точка, а целая область в фазовом пространстве,
обладающая двумя свойствами. Во-первых, это аттрактор – точка,
попавшая в его окрестность, будет двигаться к нему и затем войдет
внутрь. Во-вторых, внутри странного аттрактора существует множество (теоретически бесконечное) возможных траекторий, но все
они неустойчивы. Точка, вошедшая в странный аттрактор, начнет
двигаться по какой-либо траектории, но вследствие неустойчивости этого движения при малейшем возмущении перескочит на другую «случайно подвернувшуюся» траекторию, затем на третью и т.д.
Система войдет в режим хаотических колебаний.
Пример 6.2. Ламинарное течение жидкости при постоянном расходе стационарно. Но если скорость превысит предел, определяемый критическим
значением критерия Re, то ламинарное течение становится неустойчивым и
поток эволюционирует в сторону странного аттрактора – турбулентного режима, в котором траектория движения любой частицы неустойчива и поэтому претерпевает хаотические пульсации.
Устойчивость режимов при автокатализе. Рассмотрим еще одну задачу, представляющую заметный интерес для химиков. В аппарате идеального смешения при постоянных температуре и расходе
жидкости проводится реакция
1 по А, 1 по В; k
(6.14)
A ⎯⎯⎯⎯⎯
→B+ C.
Таким образом, вещество В является и продуктом реакции, и катализатором. Такая схема реакции – простейшая модель процессов
типа ферментации, протекающих под воздействием микроорганизмов (об этом я уже упоминал в разд. 4.2). В этом случае вещество
А – субстрат, т.е. пища для бактерий или грибков; С – тот продукт,
который следует получить; В – сами микроорганизмы. Они выступают в роли и катализатора, потому что без них реакция не идет, и
продукта: поедая субстрат, они размножаются, и чем больше потреблено пищи, тем больше их образовалось. Существенная особенность процесса: сВ0 = 0. Это обусловлено тем, что входящий поток
субстрата стерилизуют, поскольку иначе на вход могут попасть так
называемые «дикие расы» микроорганизмов, бесплодные, но хорошо приспособленные к конкуренции и культурная раса В окажется
вытесненной.
6.2. Параметрическая чувствительность и устойчивость процессов
257
Начнем анализ с записи уравнений математической модели.
Поскольку предполагаем возможность нестационарных процессов,
нашей моделью будет система дифференциальных уравнений материального баланса по А и по В. Уравнение баланса по С не понадобится, поскольку количества образующихся В и С равны. Но вот
записывать стехиометрический инвариант
cB = cA0 − cA
(6.15)
в общем случае нельзя из-за возможной нестационарности. Итак,
запишем два уравнения в такой форме:
⎧ dcA
⎪⎪ t dt + cA + kcA cB = cA0 ,
⎨
⎪ t dcB + c − kc c = 0.
B
A B
⎪⎩
dt
(6.16)
Почленно сложим оба уравнения и обозначим сА + сВ = сΣ.Получим
dc ⎞
dc
⎛ dc
(6.17)
t ⎜ A + B ⎟ + cA + cB = t Σ + cΣ = cA0 .
⎝ dt
dt ⎠
dt
Не записывая подробно ход решения уравнения (6.17) (в нем несложно разделить переменные), приведу результат:
t
−
cΣ − cA0
=e t ,
cΣH − cA0
(6.18)
где индекс «н» относится к началу переходного процесса. Отсюда следует, что при любых концентрациях веществ А и В их сумма быстро (со
скоростью экспоненты) приходит к значению, задаваемому формулой
(6.15). Поэтому дальнейший анализ проведем для режимов, подчиняющихся этому соотношению. Для них в математической модели можно оставить одно уравнение (6.16). Преобразуем его с учетом (6.15):
t
dcA
= t kcA2 − (1 + t kcA0 )cA + cA0 .
dt
(6.19)
Вначале найдем решения, определяющие стационарные режимы
процесса, т.е. режимы, для которых левая часть уравнения равна нулю. Разложим правую часть на множители:
t kcA2 − (1 + t kcA0 )cA + cA0 = (cA0 − cA ) − t kcA (cA0 − cA ) =
= (cA0 − cA )(1 − t kcA ) = 0 .
Ясно, что уравнение имеет два решения: cA = cA0 и cA =
(6.20)
1
. Что они
tk
означают? Первое решение относится к случаю, когда вначале процесс пытались запустить, не вводя в аппарат вещество В. Без него
258
Глава 6. Моделирование процессов с учетом возможной нестационарности
реакция не начнется, сколько бы ни продолжать продукты образовываться не будут. Второе решение относится к случаю, когда вначале в аппарате присутствовало вещество В (была введена затравка
микроорганизмов), реакция началась и хотя в установившемся стационарном режиме катализатор не вводится он образуется в результате реакции и поддерживает ее протекание. Возникает вопрос об
устойчивости: что произойдет, если концентрация вещества В случайно слегка изменится? Выправится в дальнейшем это изменение
или окажется, что из аппарата выносится больше катализатора, чем
образуется, и в конце переходного периода вещества В не останется,
реакция прекратится и реализуется первое решение?
Рис. 6.9. Изменение концентрации вещества А в переходном процессе
Снова обратимся к уравнению (6.19). Правая его часть – это квадратный трехчлен относительно сА, причем член, содержащий квадрат, положителен. График зависимости представляет собой параболу с минимумом, находящимся между корнями трехчлена (рис. 6.9).
А это значит, что если значение концентрации сА окажется между
обоими стационарными значениями, производная по времени будет
отрицательной, концентрация реагента станет уменьшаться, приближаясь к значению
1
и удаляясь от сА0. Таким образом, первое из
tk
этих значений относится к устойчивому режиму, второе – к неустойчивому. (С благодарностью отмечу, что приведенное в этом абзаце
изящное рассуждение было получено студентами во время экзамена;
до того я рассуждал более громоздко.)
Полученный вывод требуется дополнить.
Во-первых, кривая на рис. 6.9 справа не заходит дальше значения
сА = сА0, поскольку правее от этой точки условие (6.15) означало бы
отрицательную концентрацию вещества В, что невозможно.
6.2. Параметрическая чувствительность и устойчивость процессов
Во-вторых, на графике корень
259
1
расположен слева от сА0. Если
tk
1
≥ cA0 , то устойчивым оказывается решение сА = сА0 и стациоtk
нарный процесс с получением продуктов невозможен: сколько ни
добавляй В, все оно будет унесено потоком и реакция заглохнет.
Таким образом, определяется необходимое условие существования
стационарного режима: достаточно большие значения среднего времени пребывания и константы скорости реакции, чтобы их произведение оказалось больше, чем 1/сА0.
В-третьих, как я уже говорил, если в начале переходного процесса сВ = 0, реакция не начнется ни при каких значениях сА, т.е. переходный процесс окончится при сА = сА0. Две траектории, отвечающие
этому случаю, направлены к точке сА = сА0, а значит, эта точка является седловой.
График траекторий процесса в фазовых координатах приведен на
рис. 6.10. Координатами выбраны сА и сВ. Область протекания процесса – первый квадрант (сА ≥ 0, сВ ≥ 0). Условию (6.15) соответствует
наклонная прямая. Возможные траектории переходных процессов
изображены стрелками. На графике обозначены два возможных ста1
ционарных режима. Точка cA =
– аттрактор (в теории аттрактор
tk
такого рода называют узлом), точка сА = сА0 – седло.
же
Рис. 6.10. Траектории переходных процессов в фазовых
координатах для автокаталитической реакции
260
Глава 6. Моделирование процессов с учетом возможной нестационарности
Устойчивость экосистем. Отмечу еще один важный случай.
Очень часто по тому же механизму потери устойчивости происходит
разрушение биоценозов. Биоценоз – это система, состоящая из всех
живых организмов (животных, растений, бактерий и др.), населяющих какой-либо участок Земли. При выбросе в окружающую среду
вредных веществ в биоценозе развиваются компенсаторные механизмы, нейтрализующие вредные влияния. Поэтому до определенного предела среда ведет себя «почти нормально» – нормальное состояние устойчиво. Но при повышении загрязнения до некоторого
критического уровня устойчивость теряется и биоценоз сразу, скачком, гибнет. Непонимание этого порождает неоправданное благодушие: дескать, выбрасываем отбросы – природа справляется; выбросим еще немного – тоже справится, в худшем случае станет немного
грязнее. На деле требуются чрезвычайная осторожность и тщательное изучение устойчивости окружающей среды, а также огромная
работа по повышению этой устойчивости.
ГЛАВА 7.
ОПТИМИЗАЦИЯ ХИМИКОТЕХНОЛОГИЧЕСКИХ ПРОЦЕССОВ
7.1. Формулирование задачи оптимизации
Для современного подхода к оптимизации характерна формализация задачи. Задача формулируется стандартным образом, после чего
дальнейшее ее решение проводится на основе четкого однозначного
рецепта – алгоритма. Однозначность в данном случае не означает,
что отсутствуют варианты решений. Наоборот, проводится сравнение многих различных вариантов. Но алгоритм точно определяет, на
каком этапе и как производится такое сравнение.
Формализация, во-первых, позволяет единообразно решать задачи
из самых различных областей. Во-вторых, формализованные задачи
приспособлены для решения на компьютерах. Применение вычислительной техники обеспечивает возможность перебора очень большого
числа вариантов и выбора из них наилучшего. Поэтому формализация
резко повышает эффективность процедуры решения задачи.
При формализации задачи оптимизации возникает важное противоречие. Задача распадается на три основных этапа: 1) формулирование
задачи, приведение ее к одной из стандартных форм; 2) нахождение
оптимальных условий на основе алгоритма оптимизации; 3) реализация оптимальных условий на практике. Методы решения на первом
и втором этапах взаимно противоположны: второй этап, как правило,
целиком формализован на основе алгоритма решения, а первый этап –
неформален. Здесь не поможет никакая математика. Первый этап решения задачи связывает конкретные особенности объекта с общим
методом решения. Если задача оптимизации плохо сформулирована,
то совершенно правильное ее решение даст результат, абсурдный для
практики. Иногда именно хорошая формулировка задачи определяет
успех оптимизации в целом. Некоторые проблемы, возникающие при
формулировании задач оптимизации, проиллюстрируем на примерах.
262
Глава 7. Оптимизация химико-технологических процессов
Пример 7.1.
1. Предположим, что мы рассматриваем процесс разложения апатита
серной кислотой с получением фосфорной кислоты:
Ca5(PO4)3F + 5H2SO4 + 5nН2О → ЗН3РО4 + HF + 5CaSO4 · nН2О.
Задачу об оптимизации реактора разложения (экстрактора) сформулируем
следующим образом: создать аппаратуру и выбрать режим так, чтобы степень
разложения апатита была наибольшей, концентрация получаемой фосфорной
кислоты – также наибольшей, а затраты – наименьшими. Дальше мы увидим,
что задача в такой постановке, как правило, нерешима; но предположим, что
все же нам удастся ее решить. Тогда окажется, что найденный «оптимум» никуда не годится на практике. Мы не учли того, что в производстве фосфорной
кислоты одна из сложнейших операций – это отделение сульфата кальция
от фосфорной кислоты. Поэтому на самом деле едва ли не важнейший момент в формулировке данной задачи – обеспечение условий кристаллизации
CaSO4, при которых получаются хорошо отделяемые от раствора кристаллы.
2. При оптимизации производства синтетического волокна необходимо
учитывать не только техническую осуществимость процесса, его экономичность, физико-механические показатели волокна, гигиенические свойства
получаемых из него тканей, но и такой весьма трудно формализуемый фактор, как мода. Причем с ростом благосостояния народа этот фактор становится все более существенным.
3. В середине позапрошлого века, в начале развития промышленности нефтепереработки, керосин рассматривался как главный продукт перегонки нефти, используемый в основном для освещения (недаром одно из его старых
названий – фотоген, т. е. светород). Бензин был нежелательным побочным продуктом с очень узкой областью применения в качестве растворителя. Поэтому
целью процесса было получение большого количества керосина. С развитием
двигателей внутреннего сгорания самым важным продуктом стал бензин, и
развитие нефтехимии (например, крекинга) было направлено на максимальный выход легких фракций. Сфера же применения керосина резко сузилась
вследствие развития электрического освещения. Появление реактивной авиации привело к новому изменению представлений о целях нефтепереработки.
Опять оптимальной стала такая схема производства, при которой получается
много керосина (хотя ценным продуктом является и бензин, а требования
к свойствам керосина существенно отличаются от требований XIX века).
4. Во время Великой Отечественной войны химическая промышленность
СССР оказалась в значительной мере разрушенной. В то же время война требовала колоссального объема химической продукции. Решение этой труднейшей проблемы было достигнуто путем всемерной интенсификации производства: наилучшей считалась работа, при которой с единицы оборудования
получали максимум продукта. После войны требование интенсификации продолжало (и продолжает) существовать, но уже далеко не всегда на нем основывают оценку работы. Более того, иногда с чрезмерной интенсификацией
приходится бороться, так как иначе страдают иные, более важные на сегодня
стороны процесса: качество продукции, экологическая безопасность. То, что
было важным в период войны, сегодня отошло на более скромное место.
7.1. Формулирование задачи оптимизации
263
Таким образом, на этапе формулирования задачи приходится учитывать физико-химические особенности процесса, его экономичность, общее развитие промышленности, рыночную конъюнктуру и
множество других обстоятельств.
Как правило, формулировка задачи оптимизации включает выбор
критерия оптимальности, установление ограничений, выбор оптимизирующих факторов и запись целевой функции.
Критерий оптимальности – это главный признак, по которому
судят о том, насколько хорошо функционирует система, работает
данный процесс, насколько хорошо решена задача оптимизации.
О работе судят по ее результатам. Поэтому критерий оптимальности
является одним из результатов работы, одним из выходов системы.
Чтобы выбранный критерий оптимальности можно было эффективно использовать на следующем этапе, он должен удовлетворять трем
основным требованиям.
1. Критерий оптимальности должен быть единственным. Это самое тяжелое требование. Дело в том, что, как правило, нас интересует ряд выходов системы и мы хотим, чтобы по всем им система была
наилучшей. Иногда говорят так: оптимальным является такое ведение технологического процесса, при котором производительность
установки и качество продукта максимальны, а затраты и потери
минимальны. При внешней привлекательности такая постановка
задачи утопична и потому объективно вредна. Так вести процесс невозможно.
Пример 7.2. Оптимизируется работа ректификационной колонны. Желательно получить максимально чистые продукты (наибольшую четкость разделения). Однако если стремиться только к улучшению этого показателя, то
«оптимальным» окажется режим при бесконечном флегмовом числе, т. е. без
питания и без отбора дистиллята. Производительность при таком режиме
равна нулю. В то же время если мы будем стремиться лишь к увеличению
производительности, то придем к противоположному, но также абсурдному решению: используя колонну просто как трубопровод, мы сможем пропустить через нее огромное количество смеси, но разделение окажется нулевым. В дальнейшем станет ясно, что можно пользоваться либо тем, либо
другим критерием (введя ограничения). Но обоими сразу воспользоваться
нельзя: они предъявляют к режиму несовместимые требования.
В настоящее время предпринимается ряд попыток разработать
процедуру оптимизации по нескольким критериям, но методики,
пригодной для широкого использования, пока нет. Мы умеем как
следует оптимизировать лишь по одному критерию. Поэтому так
важно хорошо выбрать критерий оптимальности. Сложность такого
выбора частично отражена в примерах 7.1 и 7.2. Именно неудачно
выбранный критерий может сделать всю задачу бессмысленной.
264
Глава 7. Оптимизация химико-технологических процессов
Обычно наиболее обоснованы такие экономические критерии, как
прибыль, норма прибыли, рентабельность, приведённый доход, себестоимость. Однако чаще всего характер зависимости этих критериев от входных параметров системы сложен. Для упрощения задачи
зачастую пользуются технологическими критериями, например производительностью, чистотой продукта, выходом продукта, селективностью. Каждый технологический критерий в конечном счете связан с экономикой: чем больше производительность, тем выше будет
прибыль; чем выше чистота, тем меньше будут затраты на следующих стадиях, и т. д.
При оптимизации производства в целом или его крупных подразделений естественно использовать экономические критерии.
Технологические критерии удобны при оптимизации более мелких
объектов: отдельного узла, аппарата, небольшой цепочки аппаратов, т. е. при локальной оптимизации. При их применении следует
особенно тщательно учитывать особенности процесса: критерий,
пригодный в одних условиях, может быть совершенно не применим
в других условиях.
Пример 7.3. Если проходит единственная реакция типа «реагенты → продукты», т. е. реакция, не имеющая побочных стадий, то в качестве критерия
оптимальности обычно можно принять скорость реакции r. Действительно,
чем выше r, тем при заданной степени превращения χ меньшим окажется требуемый размер аппарата Va либо при данном Va больше будет χ.
Единственная реакция будет оптимальной тогда, когда в каждой точке аппарата она протекает с наибольшей возможной скоростью. Но если есть побочные стадии, то r обычно не годится в качестве критерия оптимальности.
Ускорение целевой реакции может происходить в условиях, когда побочные
стадии ускоряются еще больше. Ускоряя целевую стадию, мы получаем низкую селективность. В этом случае приходится пользоваться более сложными
критериями. Так, в проходимом нашими студентами лабораторном практикуме рассматривается реакция, в которой из реагента А1 получают целевой
продукт А2, а также побочные продукты А3 и А4. Реакция – гомогенная, при
постоянном объеме. Рекомендуемый критерий оптимальности имеет вид
ц1c10 + ц3c3 + ц4 c4 + цv + цV Va
.
(7.1)
c2
Здесь с10 – концентрация реагента на входе аппарата; c2, c3 и c4 – концентрации продуктов на выходе из аппарата; ц1, ц3, ц4, цv и цV – множители,
задающие соответственно цену реагента, стоимость обезвреживания единицы продуктов А3 и А4, затраты на разделение и транспортирование единицы
объема реакционной смеси (с учетом необходимости циркуляции – возврата в начало процесса непрореагировавшего реагента) и затраты на амортизацию и обслуживание аппаратуры, отнесенные к единице объема. Таким
образом, критерий (7.1) имеет экономический характер, но выражен через
технологические параметры.
F=
7.1. Формулирование задачи оптимизации
265
2. Критерий оптимальности должен выражаться числом. В противном случае сопоставление разных вариантов становится крайне
затруднительным.
Пример 7.4. Предприятие разработало образцы сувениров для продажи.
Необходимо выбрать из них пять лучших, которые и будут пущены в производство. Очевидно, критерием выбора будет красота, привлекательность
сувениров. Казалось бы, этот критерий трудно выразить числом, да и без численной оценки можно выбрать, что красивее, а что хуже. Но такой выбор «без
числа» возможен лишь, если образцов мало. Если же их, например, 400, то
при выборе наверняка придется применить числа – например, оценку в баллах. Такая оценка весьма несовершенна, но все же практически неизбежна.
3. Обязательное и крайне важное свойство критерия оптимальности: его величина должна изменяться монотонно при улучшении
качества функционирования системы. Это значит, что оценивать
объект можно по принципу: «чем больше критерий, тем лучше», либо «чем меньше критерий, тем лучше», но ни в коем случае не по
принципу: «вот это значение критерия оптимально и отклоняться от
него не следует». Что требуется, «больше» или «меньше», определяется физическим или экономическим смыслом критерия. Хорошо,
когда прибыль велика, но когда себестоимость мала; когда велика
производительность, но малы потери. Умножив любой критерий
на –1, мы превратим «больше» в «меньше» и наоборот. Но вот критерий, обладающий некоторым оптимальным значением, от которого
нежелательно отклоняться, не годится. Например, в лекарственной
смеси содержание того или иного ингредиента не может являться
критерием оптимальности: иначе мы бы получили не смесь заданного состава, а максимальную концентрацию одного вещества. Если
для какого-то параметра, характеризующего систему, существует
оптимальное значение, то либо этот параметр – не критерий оптимальности, а оптимизирующий фактор (см. ниже), либо критерием
является не величина параметра, а отклонение этой величины от заданного значения.
Ограничения. Как бы хорошо ни был выбран критерий оптимальности, в большинстве задач этого недостаточно, чтобы учесть все
условия, в которых должен проходить процесс. С одной стороны, как
уже отмечалось, нас всегда интересует не один результат процесса, а
многие. С другой – слишком редко удается реализовать все значения
входных параметров, которые желательны. Условия, которые необходимо соблюдать независимо от того, как их соблюдение повлияет на
величину критерия оптимальности, называют ограничениями.
Пример 7.5. В отчете о научной работе указано, что протекание синтеза
исследовано в температурном интервале от 363 до 383 К. Нижний предел
определялся тем, что при дальнейшем снижении температуры смесь сильно
266
Глава 7. Оптимизация химико-технологических процессов
загустевала и ее не удавалось перемешать, верхний – тем, что дальнейший
рост температуры приводил к резкому падению выхода продукта. С точки
зрения формулирования задачи оптимизации (если за критерий оптимальности принять выход) нижний предел – это ограничение: независимо от
того, как снижение температуры влияет на выход, охлаждать смесь нельзя
вследствие роста вязкости. А вот верхний предел не стоит считать ограничением. Исследователи забраковали высокотемпературный режим не потому,
что не могли его реализовать, а из-за неблагоприятного влияния режима на
выход. Здесь нет необходимости в понятии «ограничение»: забраковать высокотемпературные режимы можно непосредственно по величине критерия
оптимальности.
В самом общем виде можно назвать две основные причины возникновения ограничений.
Первая : ограничения – «несостоявшиеся» критерии оптимальности. Я уже говорил, что в большинстве случаев вначале у нас есть
много показателей, которые могли бы претендовать на роль критерия оптимальности, но выбрать можно лишь один из них. Тогда по
остальным мы устанавливаем ограничения. Так, в примере 7.1, п.1
в качестве критерия можно выбрать затраты на проведение процесса, а величины степени разложения, концентрации кислоты и качества фильтрации задать в форме ограничений. В примере 7.1, п.4
констатируем: интенсивность работы оборудования может являться
критерием оптимальности, если ряд других упомянутых показателей
задан в форме ограничений.
Вторая причина – учет наших возможностей. Мы не можем задать температуру выше той, которую выдержит наш аппарат, использовать катализатор с активностью, большей, чем имеющаяся у нас
партия, и т.д. Более подробный анализ указывает на следующие
группы ограничений:
• по количеству и качеству сырья и продукции – состав сырья, как
правило, задается не нами и менять его нельзя; количество сырья
также может быть ограничено; выпуск продукции не должен быть
больше того, что можно реализовать; качество продукта не должно
быть ниже стандарта или требований заказчика;
• по условиям технологии – расход воздуха не может превышать
производительность вентилятора; температура не может быть выше
предела, при котором портится материал аппарата или катализатор;
размеры аппаратов изменять мы не можем и т. д.;
• по экономическим и конъюнктурным соображениям – капитальные затраты не должны превышать выделенной суммы; срок
ввода нового производства не должен быть позже запланированного; нельзя применять методы и устройства, защищенные чужими
патентами;
7.1. Формулирование задачи оптимизации
267
• по соображениям охраны труда и окружающей среды – это чрезвычайно важная группа ограничений, жесткость которых все возрастает.
Кроме классификации по смыслу ограничения можно различать
по формально-математическим признакам. Так, выделяют ограничения типа равенств и типа неравенств.
Ограничения типа равенств устанавливают определенное значение того или иного параметра:
fi = ai.
(7.2)
Здесь fi – один из параметров, аi – задаваемое для него значение.
Например, в конкретных условиях работы задаются численные значения, характеризующие состав сырья, размеры аппаратов, нагрузку
на аппарат и т. д.
Ограничения типа неравенств определяют пределы, в которых допустимо изменение параметров процесса:
fj ≥ aj ,
fk ≤ ak ,
(7.3)
al ≤ fl ≤ bl .
Два первых ограничения (7.3) задают односторонние пределы
(например, производительность не ниже заданной; температура не
выше той, на которую рассчитан материал). Третье ограничение –
двустороннее (например, температура жидкости в пределах от температуры замерзания до температуры кипения).
Наконец, в расчетных процедурах нахождения оптимума большую роль играет деление ограничений по следующему признаку:
ограничения 1-го рода – условия (7.2) или (7.3), где в качестве параметров f фигурируют входные факторы; ограничения 2-го рода, где
параметрами служат различные функции входов, например результаты процесса или, скажем, температуры в каких-то точках внутри
аппарата. Когда при математическом решении задачи рассматривается какой-либо режим, то он задается значениями входов. При этом
вопрос о том, не нарушены ли какие-либо ограничения 1-го рода,
проверяется непосредственно. А для проверки соблюдения ограничений 2-го рода необходимо сначала рассчитать соответствующие
параметры, что может осложнить расчет.
Пример 7.6. При оптимизации химического процесса заданы условия:
температура жидкости на входе аппарата, а также в любых точках внутри
него не должна превышать 110 0С, поскольку при такой температуре раствор вскипает и нарушаются условия его течения. При расчете оптимальных
условий значение температуры на входе – ограничение 1-го рода: мы заранее знаем, что задавать большую температуру нельзя. Но чтобы проверить
268
Глава 7. Оптимизация химико-технологических процессов
соблюдение второго условия, которое является ограничением 2-го рода, необходимо при каждом конкретном режиме рассчитать температуру по всему
аппарату, найти горячую точку и рассчитать температуру в ней.
Оптимизирующие факторы – те из входов системы, которые в процессе оптимизации относят к управляющим. Это те воздействия,
которые мы применяем для оптимизации процесса. Остальные факторы при этом не регулируются, хотя их значения, разумеется, учитывают при определении оптимальных условий: эти факторы фигурируют в задаче в качестве ограничений типа равенств.
Число оптимизирующих факторов зависит от того, на какой стадии разработки производства осуществляется оптимизация. Если
производство еще проектируется (оптимальное проектирование), то к
оптимизирующим целесообразно отнести как можно большее число
факторов. Действительно, на этой стадии варьировать факторы проще всего: изменение значений осуществляется не в действительности, а на математической модели. Поэтому здесь желательно найти
оптимальные значения максимального числа факторов.
Но задача оптимизации возникает и после пуска производства
(оптимальное управление). При этом число оптимизирующих воздействий становится существенно меньшим. Часть факторов мы уже не
можем менять, например размеры аппаратов. Но и не все остальные
факторы целесообразно теперь регулировать. Дело в том, что чем
больше управляющих факторов, тем сложнее система управления,
сложнее ее математическая модель. При очень большом числе факторов она может стать столь сложной, что компьютер, рассчитывающий оптимальные режимы, перестанет поспевать за изменением
условий протекания процесса: рекомендации по оптимизации придут, когда реализовать их уже поздно. Все это заставляет использовать для оптимального управления сравнительно небольшое число
факторов.
Целевая функция – это синоним критерия оптимальности, но это
критерий, рассматриваемый как функция входных факторов:
F = F (x1, x2,…, xn).
(7.4)
Чем больше (или чем меньше) значение F, тем лучше. Поэтому
можно дать такое определение оптимума: оптимум – это экстремум
(либо максимум, либо минимум) целевой функции. Те значения факторов хj, при которых достигается оптимум, называют оптимальными.
Таким образом, математически задача оптимизации формулируется как задача отыскания экстремума. При этом в точке экстремума
должны соблюдаться все ограничения. Поэтому во многих случаях
оптимум приходится искать на краю области допустимых значений,
за пределы которой нельзя выйти из-за ограничений (рис. 7.1). На
7.1. Формулирование задачи оптимизации
269
рисунке отрезок аb есть область допустимых значений, определяемая ограничением a ≤ x ≤ b. Максимум функции F расположен правее точки b, но оптимальным будет значение x = b, поскольку большие значения х запрещены ограничением.
Рис. 7.1. Целевая функция с оптимумом на краю допустимой области
Методы отыскания оптимума можно разделить на три основных
группы.
1. Аналитические методы. Их применяют, например, когда мы можем продифференцировать целевую функцию и искать экстремум
исходя из условия равенства нулю производных.
2. Численные, или поисковые методы. Для их применения нужно,
чтобы целевая функция была вычислимой : должен быть известен
алгоритм, по которому можно рассчитать значение критерия оптимальности при заданных значениях факторов.
3. Методы, применяемые, если целевая функция невычислима. Практически это значит, что вид функции неизвестен. Тогда остается одно:
планировать и реализовывать эксперимент так, чтобы в результате
достигнуть района оптимума. Это – экспериментальная оптимизация, составляющая важный раздел планирования эксперимента.
Особую группу задач оптимизации составляют задачи, в которых
критерий оптимальности представляет собой не функцию, а функционал (см. разд. 4.3, обсуждение формул (4.71) – (4.73)). Так бывает,
если критерий зависит не от значений каких-то факторов, а от характера их непрерывного изменения: например, если протекание переходного процесса определяется непрерывным изменением управляющего воздействия во времени или если состав смеси на выходе
из аппарата идеального вытеснения определяется профилем температуры по всей его длине. В таких задачах используют вариационные
методы (вариационное исчисление, динамическое программирование, принцип максимума), при этом методы могут реализоваться
как аналитически, так и численно, а в некоторых постановках и экспериментально. Обзор этих, а также многочисленных иных задач и
методов оптимизации содержится в [3, 40].
270
Глава 7. Оптимизация химико-технологических процессов
7.2. Оптимизация методом дифференциального исчисления
Пусть целевая функция задана формулой (7.4). Классический метод отыскания экстремума заключается в решении системы
⎧ ∂F
⎪ ∂x = 0,
⎪ 1
⎪ ∂F
= 0,
⎪
⎨ ∂x2
⎪.........
⎪
⎪ ∂F
⎪ ∂x = 0.
⎩ n
(7.5)
Левые части уравнений (7.5) – функции от факторов х1, х2, ..., хn.
Поэтому решение системы может дать значения x1опт , x2опт , ..., xnопт ,
являющиеся оптимальными значениями факторов; их совокупность
определяет наилучшее решение задачи. Если оптимизируется технологический процесс, то этому решению соответствует оптимальный
режим. Однако следует убедиться, что полученные значения действительно оптимальны. Для этого необходимо выяснить:
1) действительно ли решение системы (7.5) определяет экстремум, поскольку известно, что условию (7.5) может удовлетворять и
седловая точка, или точка перегиба;
2) получен ли экстремум нужного знака (максимум, если нас интересует максимум, или минимум в обратном случае);
3) если система имеет несколько решений, то какое из них отвечает глобальному оптимуму, а какие – локальным. Так, если зависимость
имеет несколько максимумов, то глобальным будет тот из них, который выше всех остальных; остальные будут локальными;
4) все ли ограничения соблюдаются в точке экстремума.
Рассмотрим некоторые важные задачи оптимизации.
Одна из разобранных выше задач, а именно расчет коэффициентов методом наименьших квадратов (см. разд. 2.3) – типичная задача
такого рода. В ней критерий оптимальности – сумма квадратов S;
оптимизирующие факторы – значения рассчитываемых параметров.
Ограничения в изложенном варианте отсутствуют. Система (7.5) –
это система нормальных уравнений (2.42).
Оптимальная температура единственной химической реакции.
Если химическая реакция проходит без побочных стадий, то удается
принять очень простой критерий оптимальности – скорость реакции (см. пример 7.2). Согласно схеме, данной в предыдущем разделе,
теперь нужно установить ограничения и выбрать оптимизирующие
7.2. Оптимизация методом дифференциального исчисления
271
факторы. Но часто бывает удобно сначала записать целевую функцию, а уже потом перейти к ограничениям и оптимизирующим факторам. Так поступим и мы.
Наши рассуждения будут верны практически для любой обратимой (и необратимой) реакции. Но для определенности рассмотрим
реакцию
1 по А; k1
⎯⎯⎯⎯
→
A
B.
←⎯⎯⎯
⎯
1 по В; k2
Целевая функция имеет вид
F ≡ r = A1e
−
E1
RT
cA − A2 e
−
E2
RT
cB .
(7.6)
Таким образом, наш критерий зависит от трех параметров: температуры и концентраций сА и сВ. По-видимому, эти три величины
можно было бы избрать в качестве оптимизирующих факторов. Но
необходимо учесть, что концентрации сА и сВ не относятся ко входам
рассматриваемой системы. Они сами получаются как результат реакции. Ясно, что для увеличения скорости следовало бы иметь как можно большее значение сА и как можно меньшее значение сВ. Цель же
процесса – противоположная: увеличить сВ и уменьшить сА. Поэтому
концентрации нельзя рассматривать как независимые факторы.
Итак, есть лишь один независимый фактор, которым можно влиять на F – температура. Рассматриваемая задача обычно называется
задачей об оптимальной температуре химической реакции.
Но при разных концентрациях влияние температуры может быть
различным. Поэтому будем решать задачу в такой постановке: зафиксируем некоторые значения сА и сВ и при этих значениях найдем оптимальную температуру. Таким образом, в данном решении концентрации веществ А и В выступают в роли ограничений типа равенства.
Кроме того, учтем одно ограничение типа неравенства, которое
существует в любой практической задаче: температура не может превысить некоторого максимального значения Тмакс :
Т ≤ Тмакс.
(7.7)
Прежде чем обращаться к формуле (7.5), рассмотрим два случая,
когда оптимум можно найти из физических соображений, без расчета. Если реакция необратима, т. е. А2 = 0, то в правой части формулы
(7.6) остается только первый член, который с повышением температуры все время растет. Максимум в смысле условия (7.5) отсутствует.
Тогда оптимум определяется ограничением: следует поддерживать
максимально допустимую температуру
Топт = Тмакс.
(7.8)
272
Глава 7. Оптимизация химико-технологических процессов
Пример 7.7. Реакция сгорания топлива практически необратима. В тех
случаях, когда требуется наибольшая интенсивность горения, следует поддерживать максимально достижимую температуру. На увеличение этой температуры направлены усилия при конструировании современных топок.
Если реакция обратима, но эндотермична, т. е. E1 > E2, то результат рассуждений тот же, что и в предыдущем случае. Действительно,
с повышением температуры равновесие сдвигается вправо и скорость прямой реакции возрастает. Поэтому оптимум определяется
формулой (7.6).
Пример 7.8. К рассматриваемому типу относится реакция N2 + O2 = 2NO.
Открытая еще в XVIII веке Г. Кавендишем, она нашла практическое применение лишь в начале ХХ века, когда дешевая гидроэлектроэнергия и разработка дуговых печей позволили поднять Тмакс до 3000 К. Но в дальнейшем
этот метод фиксации азота был вытеснен синтезом аммиака. Ныне прямое
окисление азота вновь обретает перспективы, что связано с повышением
уровня ограничения: после появления плазмотронов можно рассчитывать
на увеличение его конкурентоспособности.
Если реакция – обратимая экзотермическая, то к решению потребуется применить иной подход. В этом случае с повышением температуры вначале более существенным будет возрастание скорости
прямой реакции; обратная еще слишком медленна. При дальнейшем увеличении температуры обратная реакция, имеющая большую
энергию активации, начинает «нагонять» прямую. При данном составе смеси существует температура Tравн, при которой смесь находится в равновесии: r = 0; затем ход реакции смещается влево.
Где-то посередине имеется температура, при которой суммарная
скорость реакции максимальна. Это и есть оптимальная температура Топт . Для ее расчета запишем условие (7.5) для формулы (7.6):
∂r
∂
=
∂T ∂T
E1
E
− 2
⎛ − RT
⎞
RT
−
A
e
c
A
e
cB ⎟ = 0 .
1
A
2
⎜⎝
⎠
(7.9)
Здесь записана частная производная по T, поскольку она берется
при фиксированных значениях cA и cB.
Из уравнения (7.9) несложными преобразованиями можно получить формулу для оптимальной температуры:
E2 − E1
.
(7.10)
Tопт =
AEc
R ln 2 2 B
A1 E1cA
Из соотношения (7.10) следует, что чем выше cA и чем меньше cB,
тем выше Топт; по мере роста степени превращения величина Топт
уменьшается. При cB→0, согласно формуле, Топт →∞. Поэтому на начальном участке реактора следует устанавливать максимально допустимую температуру Tмакс, а с момента, когда рассчитанная по этому
7.2. Оптимизация методом дифференциального исчисления
273
уравнению Топт сравнивается с Tмакс, дальнейшее изменение температуры должно определяться уравнением (7.10). Такую зависимость
иллюстрирует кривая 1 на рис. 7.2, изображающая оптимальный ход
температуры в зависимости от степени превращения.
Рис. 7.2. Изменение оптимальной температуры в зависимости
от степени превращения для обратимой экзотермической реакции
Реально осуществить такое распределение температуры чрезвычайно трудно. Действительно, на начальном участке следовало бы
поддерживать постоянную максимальную температуру, что крайне
сложно: здесь скорость реакции очень велика, выделение тепла максимально и полностью отвести его вряд ли удастся. Поэтому применяют другие распределения, более или менее приближающиеся
к оптимальному. Так, ломаная 2 на рис. 7.2 показывает ход температуры в пятислойном каталитическом реакторе, в каждом слое которого реагирующая смесь адиабатически разогревается за счет тепла
реакции, а между слоями охлаждается в теплообменнике. Такое распределение температур приведет к несколько худшим результатам
(большему потребному объему катализатора), чем задаваемое кривой 1, но его сравнительно легко осуществить. Чем больше ступеней
катализа, тем ближе ломаная к оптимальной кривой.
Если реакцию проводят в аппарате смешения, то во всем его объеме имеем одну и ту же степень превращения. Ей соответствует одна
точка на кривой 1 (см. рис. 7.2), соответствующая оптимальной температуре для данного аппарата.
Оптимальное распределение потока по параллельно работающим аппаратам. Это одна из задач, возникающих при оптимальном
управлении. Разберем несколько упрощенный ее вариант, но и в более сложных случаях результаты получаются похожими.
274
Глава 7. Оптимизация химико-технологических процессов
Рис. 7.3. Схема распределения потока по аппаратам
Реакция 1-го порядка А → В проводится в n параллельно соединенных реакторах идеального смешения (рис. 7.3). Как оптимально
распределить поток между аппаратами? Будем считать, что в общем
случае объемы аппаратов V1, V2, …, Vn разные и что константы скорости реакции в различных аппаратах k1, k2, …, kn тоже разные (например, вследствие неодинаковой активности катализатора).
Естественно принять за критерий оптимальности сумму потерь
вещества А, т. е. считать наилучшим такое распределение, при котором потери вещества А вследствие неполноты реакции минимальны.
В каждом i-м аппарате при расходе vi эти потери в единицу времени
составляют vi cAi; тогда для всех аппаратов можно записать:
n
F = ∑ vi cAi.
(7.11)
i =1
Выразив сAi формулой (4.39), получим
n
vi cA0
vi2
.
= cA0 ∑
i =1 1 + ki ti
i =1 vi + kiVi
n
F =∑
Обозначим kiVi = ai. Величина ai характеризует относительную
производительность i-го аппарата: чем больше эта величина, тем
больше продукта может получиться в нем в единицу времени. Теперь
можно записать:
n
F = cA0 ∑
i =1
vi2
.
vi + ai
(7.12)
Прежде чем применить к целевой функции (7.12) условие (7.5),
обратим внимание на существующее в этой задаче ограничение типа
равенства: сумма расходов через все аппараты равна общему расходу
через систему:
n
∑v
i
i =1
= v.
(7.13)
7.2. Оптимизация методом дифференциального исчисления
275
Поэтому не все n расходов vi независимы. Один из них можно рассматривать как функцию от остальных n – 1. Пусть для определенности это будет vn:
n −1
vn = v − ∑ vi .
i =1
Учтем, что частная производная от этого выражения по любому vi
равна –1, поскольку v – постоянная, а под знаком суммы от vi зависит только один член, а именно vi , и частные производные от всех
остальных членов равны 0. Тогда по теореме о производной функции от функции для производной по любому vi любой функции f от vn
будем иметь:
∂f (vn ) df (vn ) ∂vn df (vn ) ∂
=
=
dvn ∂vi
dvn ∂vi
∂vi
n −1
⎛
⎞
df (vn )
v
vi ⎟ = −
−
.
∑
⎜⎝
⎠
dvn
i =1
(7.14)
Перейдем к условию (7.5). В данном случае оно даст систему из
(n – 1)-го уравнения:
⎧ ∂F
⎪ ∂v = 0,
⎪ 1
⎪ ∂F
= 0,
⎪
⎨ ∂v2
⎪ ............
⎪
⎪ ∂F
⎪ ∂v = 0.
⎩ n −1
Рассмотрим первое из этих уравнений. После сокращения на cA0
запишем его в виде
n −1
vi2
vn2 ⎞
∂ ⎛ v12
+
+
=0.
∑
∂v1 ⎜⎝ v1 + a1 i = 2 vi + ai vn + an ⎟⎠
(7.15)
Частная производная по v1 от суммы, стоящей под знаком ∑ , равна нулю, поскольку ни один член этой суммы от v1 не зависит. Тогда
vn2 ⎞
∂ ⎛ v12
+
= 0.
⎜
∂v1 ⎝ v1 + a1 vn + an ⎟⎠
Продифференцируем левую часть по v1; при дифференцировании
члена, зависящего от vn, применим формулу (7.14):
2v12 + 2a1v1 − v12 2vn2 + 2an vn − vn2
−
=0.
(v1 + a1 ) 2
(vn + an ) 2
В числителях приведем подобные, а затем прибавим и вычтем соответствующие значения ai2 :
276
Глава 7. Оптимизация химико-технологических процессов
(v1 + a1 ) 2 − a12 (vn + an ) 2 − an2
−
= 0.
(v1 + a1 ) 2
(vn + an ) 2
Поделив числители обеих дробей на их знаменатели и приведя подобные, получим:
an2
a12
=
2
(vn + an ) 2
. (v1 + a1 )
Извлечем корни и, учтя, что оба знаменателя не равны нулю, приравняем обратные величины:
v1 + a1 vn + an
=
.
a1
an
(7.16)
Окончательно получаем:
v1 vn
= .
a1 an
(7.17)
Но выбор первого аппарата был произволен, вместо него можно
выбрать любой иной. Повторив наши рассуждения (n – 1) раз, получим
v
v1 v2
=
= .... = n .
a1 a2
an
(7.18)
При оптимальном распределении расход через каждый аппарат
пропорционален относительной производительности этого аппарата. Чем больше аi , тем больше vi . Простое преобразование формулы
(7.18) дает
vn
v1
v2
,
=
= .... =
v1 + a1 v2 + a2
vn + an
что с учетом формулы (4.39) приводит к соотношению
сА1 = сА2 = … = сАn.
(7.19)
При оптимальном распределении потока концентрации вещества на выходе из всех аппаратов одинаковы. Условие (7.19) позволяет просто осуществлять оптимальное регулирование распределения потока: концентрация вещества А на выходе из всех аппаратов
должны быть одинаковой; если в каком-то аппарате она больше, чем
в остальных, расход из этого аппарата следует уменьшить, и наоборот, если сА меньше средней, расход надо увеличить.
Рассмотренный пример – одна из простых задач оптимизации
химико-технологических схем. Это важная область химической технологии [40].
7.3. Поиск оптимума численными методами
277
7.3. Поиск оптимума численными методами
Численные методы поиска применяют, во-первых, когда в точке
экстремума отсутствуют производные. Так, изменение целевой функции может носить дискретный характер, например при сравнении разных вариантов оформления процесса, когда F меняется не непрерывно, а скачком от одного варианта к другому. Но производные в точке
экстремума могут отсутствовать и у непрерывной функции. Как правило, это происходит, если экстремум расположен на краю области
допустимых значений. На рис. 7.1 максимум лежит на краю области,
в этой точке производная отсутствует. Имеется «производная слева»,
но она не равна нулю. В задачах оптимизации такую точку рассматривают как «законный» экстремум (в данном случае – максимум).
Часто бывает и так, что целевая функция в точке экстремума
дифференцируема, но она задана таким образом, что продифференцировать ее в общем виде не удается, вследствие чего приходится
обращаться к численным методам. Это обычно связано с тем, что
функция задана не формулой, а алгоритмом вычисления при заданных значениях аргументов (факторов). Если бы не было и алгоритма,
функция была бы невычислимой и следовало бы применить экспериментальную оптимизацию (см. разд. 7.4).
Наконец, иногда имеется принципиальная возможность записать
и решить систему (7.5), но соответствующие вычисления столь громоздки, что численный метод оказывается проще.
В наиболее общем виде численные методы сводятся к тому, что вычисляется ряд значений F при различных значениях аргументов; сопоставление этих значений показывает, в каком направлении нужно
двигаться в пространстве факторов, чтобы приблизиться к оптимуму.
В подавляющем большинстве случаев эти методы не дают теоретически точных значений координат оптимума – практически это и не
нужно, поскольку нам всегда достаточно знать эти координаты с задаваемой точностью. В литературе, в том числе учебной, широко освещаются методы численного поиска экстремума [3, 40]. Я ограничусь
очень кратким изложением сути некоторых самых простых методов.
Оптимизация перебором применяется, если число возможных
вариантов конечно. Тогда достаточно рассчитать целевую функцию
для всех этих вариантов и выбрать наибольшее (или наименьшее)
значение. Например, мы можем рассчитать F для случаев протекания
процесса в аппаратах всех стандартизованных размеров и выбрать
лучший вариант. Перебор легко осуществляется на компьютере, причем все варианты (например, нормали) могут быть заранее записаны
в памяти машины.
278
Глава 7. Оптимизация химико-технологических процессов
Несмотря на крайнюю простоту метода, он часто оказывается чрезвычайно эффективным, поскольку возможности перебора для машины неизмеримо выше, чем для человека. Применение перебора
позволяет найти такие варианты, до которых без компьютера дойти
практические невозможно.
Сканирование – метод, близкий к перебору, но применяемый
к непрерывным функциям. Рассмотрим для примера одномерное
сканирование – случай, когда ищется максимум функции от одного
фактора (как я уже говорил, поиск минимума осуществляется точно
так же). Будем считать, что мы задались пределами изменения фактора х от а до b. Здесь а и b – ограничения, которые можно установить в любой реальной задаче: никогда не бывает так, что мы может
задать любые, ничем не ограниченные значения х.
Таким образом имеется интервал [а, b], на котором мы хотим
отыскать экстремум целевой функции; его называют интервалом
неопределенности. При этом практически нам не нужно определять
точку экстремума абсолютно точно. Достаточно сильно сузить интервал неопределенности. Например, если мы узнаем, что оптимальная температура, соответствующая максимуму целевой функции, заключена в пределах от 380 до 381 К, то большая точность не нужна.
В промышленных условиях вряд ли удастся регулировать температуру с точностью выше 1 К. Нас устраивает интервал неопределенности [380, 381], и дальнейшее его сужение смысла не имеет.
Итак, в одномерном случае задача поиска экстремума сводится
к сужению интервала неопределенности. Методом сканирования
эта задача решается следующим образом. Выбираем целое число q –
число значений целевой функции, которое придется рассчитывать.
Находим интервал ∆x :
b−a
.
(7.20)
∆x =
q −1
Откладываем от точки а до точки b интервалы ∆х (рис. 7.4). Концы
каждого интервала назовем узлами; на рис. 7.4 каждый узел обозначен крестиком.
Рис. 7.4. Поиск экстремума сканированием:
a, b – границы интервала неопределенности
7.3. Поиск оптимума численными методами
279
В каждом узле рассчитываем F(х) (см. точки на рис. 7.4). Теперь
мы можем принять за максимум наибольшее из полученных значений – на рисунке это 4-я точка слева. К концу расчета интервал неопределенности δ составит 2∆х: истинный максимум может лежать
либо справа, либо слева от полученной наилучшей точки (штрихи на
рис. 7.4). Таким образом,
δ =2
b−a
.
q −1
(7.21)
Формула (7.21) определяет эффективность метода. При сканировании для достижения достаточно малого значения δ величина q
должна быть велика. Метод малоэффективен, но удобен для первоначального исследования функции, поскольку дает возможность
представить ее вид на всем отрезке, установить число экстремумов
и их локализацию.
Более эффективно сканирование с переменным шагом: сократив интервал неопределенности, мы продолжаем поиск внутри этого интервала, уменьшая в свою очередь ∆х. Например, двигаясь на рис. 7.4
от а к b и дойдя до 5-й слева точки, можно двинуться в обратном
направлении меньшими шагами; затем эту процедуру можно продолжить, снова двигаясь вправо и снова уменьшив шаги и т.д. Такой
вариант часто называют методом тяжелого шарика (если ищется
минимум, то движение точек по кривой функции похоже на скатывание шарика в ложбину, когда он раз за разом проскакивает нижнее положение, колеблясь около него и постепенно приближаясь
к нему).
Сканированием можно исследовать функции более чем одного
фактора. Так, участок на плоскости (факторное пространство для
двух факторов) можно покрыть сетью узлов и таким образом исследовать поведение функции на этом участке. В принципе это возможно в любом n-мерном пространстве, но по мере увеличения n
резко растет число необходимых расчетов и падает эффективность
метода.
Другие методы поиска более эффективны, но не обладают той
универсальностью, которой отличается сканирование. Их эффективность связана с тем, что это методы направленного поиска, в которых не просто исследуется область факторного пространства, а
происходит продвижение в этом пространстве в сторону искомого
экстремума. Уже описанное выше сканирование с переменным шагом означает направленность поиска: вблизи экстремума прекращается дальнейшее движение вдоль оси х и начинается сгущение точек
около экстремума.
280
Глава 7. Оптимизация химико-технологических процессов
Направленность поиска требует соблюдения некоторых условий,
ограничивающих применимость методов. Прежде всего направленный поиск дает надежный результат, если функция унимодальна.
Наиболее просто (хотя и не вполне строго) унимодальную функцию
можно определить так. В допустимой области она имеет только один
экстремум нужного знака (один максимум, если ищем максимум,
или один минимум в противном случае). Например, на рис. 7.5 функция 1 унимодальна. Функция 2 унимодальна, если ищем максимум,
и неунимодальна при поиске минимума (два минимума: при х = а и
при х = b). Функция 3 неунимодальна.
Рис. 7.5. Графики унимодальных и неунимодальных функций
Методы направленного поиска способны привести в точку одного
из экстремумов, но не позволяют установить, единственный ли это
экстремум, а если известно, что не единственный, то в какой экстремум мы попали: глобальный (экстремальный для всей области) или
локальный (другие точки могут оказаться выше в случае максимума
или ниже для минимума). Если при решении задачи оптимизации
появится подозрение, что мы встретились с неунимодальностью,
можно грубо исследовать функцию сканированием и выделить область глобального экстремума.
Еще одно важное свойство функции F, учитываемое при выборе
метода поиска, – это число факторов. Здесь различаются два основных случая. Первый, когда F зависит только от одного фактора,
F = F(x): тогда говорят об одномерном поиске. Второй, когда факторов больше одного, – многомерный поиск. Причем почти все методы
многомерного поиска принципиально применимы при любом числе
факторов n > 1, тогда как при n = 1 используются иные, одномерные,
методы. Лишь немногие методы, как, например, сканирование, применимы и для одномерного, и для многомерного поиска.
Кратко опишу два метода одномерного поиска и три метода многомерного.
7.3. Поиск оптимума численными методами
281
Дихотомия. Как и при описании сканирования, будем искать
максимум на отрезке [а, b], показанном на рис. 7.6. Для этого разделим отрезок пополам – на рисунке точка л (левая). Рассчитаем
значение F(л) в этой точке. Пока еще ничего нельзя сказать об экстремуме, кроме того, что он принадлежит нашему отрезку.
Рис. 7.6. График поиска максимума методом дихотомии
Выберем малое приращение фактора, равное ε, и поставим на отрезке правую точку п = л + ε. Рассчитаем F(п). Поскольку F(л) > F(п),
как изображено на рис. 7.6, можно утверждать, что если F(x) унимодальна, то максимум находится в левой половине отрезка.
Теперь отбросим правую половину отрезка (на ней максимума
нет). Для этого правый конец (точку b) перенесем в точку л и обозначим ее буквой b (такая операция переименования не вполне привычна для традиционной математики, но в алгоритмических языках
она чрезвычайно распространена). На рис. 7.6 этот перенос показан
стрелкой. Разумеется, при F(л) < F(п) в точку л мы перенесли бы точку а. Можно перенести конец отрезка и в точку п, но так как л и п
близки, то это почти одно и то же.
После того как правый конец отрезка перенесен, задача вернулась к исходным условиям: задан отрезок от а до b, на котором нужно найти максимум. Поэтому проводится следующий цикл расчета,
ничем не отличающийся от предыдущего, кроме значения b. Снова
делим пополам отрезок, ставим вспомогательную точку на расстоянии ε, переносим в середину либо правый, либо левый конец. Такой
алгоритм (расчет слагается из одинаковых циклов, различающихся
лишь начальными условиями) называют итерационным.
В принципе итерации можно проводить до бесконечности: делить
пополам все меньшие отрезки. Поэтому в любом итерационном алгоритме нужно задать правило останова, определяющее, когда можно
прекращать расчет, считая, что полученная точность уже достаточна.
Например, можно остановить итерации, когда интервал неопределенности окажется не больше ε:
282
Глава 7. Оптимизация химико-технологических процессов
δ=b – a ≤ ε
(7.22)
Эффективность алгоритма дихотомии определяется так: каждая
пара расчетов (точки л и п) уменьшает отрезок [а, b] вдвое. Обозначим
исходный отрезок индексом «исх». Если сделать q расчетов (q – четное), то
δ=
(b − a ) ИСХ
.
2q /2
(7.23)
Золотое сечение. Пропорция золотого сечения (деления отрезка
в среднем и крайнем отношении) определяется так. Отрезок длины l
делится на две части m и l – m так, чтобы меньшая часть относилась
к большей, как большая ко всему отрезку:
m
l−m
.
(7.24)
=
l−m
l
Легко сосчитать, что m ≈ 0,382l ;
l − m ≈ 0, 618l ;
m ≈ 0, 618(l − m) .
Рис. 7.7. График поиска максимума методом золотого сечения
Рассмотрим опять отрезок [а, b], на котором нужно найти максимум (рис. 7.7). Поиск максимума начинаем с того, что делим отрезок
слева и справа в соответствии с пропорцией золотого сечения и получаем точки л и п. Расстояние от а до л составляет 0,382 (b – а), от а
до п 0,618(b – а). В этих точках рассчитаем значения F. Как и в методе дихотомии, здесь имеем две точки л и п, но расстояние между ними не мало и вероятность того, что точка экстремума попадет между
ними, достаточно велика. Поэтому, например, если F(п) > F(л) (см.
рис. 7.7), то нельзя сказать, в какой из трех частей отрезка окажется
максимум – он может быть и в средней части отрезка (левая штриховая линия на рисунке), и в правой (правая штриховая линия). Но
в левой части (мы приняли, что функция унимодальна) максимума
быть не может. Поэтому можно ее отбросить – перенести левый конец отрезка в точку л, назвав ее а (левая стрелка). Теперь задача как
будто вернулась к исходной формулировке: найти максимум на от-
7.3. Поиск оптимума численными методами
283
резке [а, b]. Но на этом отрезке уже есть точка (точка п, см. рис. 7.7),
в которой рассчитано значение функции, причем благодаря свойству (7.24) эта точка, отсекавшая от предыдущего большего отрезка
справа ~38,2%, отсекает от нового, уменьшенного отрезка справа
~61,8%, т. е. и на новом отрезке она является точкой золотого сечения. Теперь, на новом этапе расчета мы можем назвать ее л (см. правую стрелку на рис. 7.7) и поставить на уменьшенном отрезке не две
точки для расчета F, а только одну – правую (на рис. 7.7 обозначена
треугольником). Таким образом, на каждом этапе расчета, кроме самого первого, мы должны рассчитывать F только в одной точке, что
повышает эффективность метода. В качестве правила останова можно воспользоваться формулой (7.22).
Эффективность метода определяется следующим образом. После
двух первых расчетов F и после каждого последующего остающийся интервал неопределенности составляет 0,618 предыдущего. Тогда
при q расчетах целевой функции
δ = (b − a ) ИСХ ⋅ 0, 618q −1 .
(7.25)
При q > 4 эффективность метода золотого сечения выше, чем метода дихотомии; при небольших q, порядка 10 – 20, эффективность
обоих методов близка, но при q > 20 метод золотого сечения становится заметно эффективнее.
Таким образом, если не нужно очень точно фиксировать абсциссу оптимума, то можно пользоваться любым из этих методов. Если
нужна высокая точность (или если каждый расчет громоздок), то
предпочтительнее метод золотого сечения. Впрочем, при малых q часто целесообразно ограничиться сканированием.
Пример 7.9. Желательно определить положение экстремума с точностью
до 0,0001 длины исходного интервала неопределенности. Формулы (7.21),
(7.23) и (7.25) показывают, что при сканировании для этого потребуется провести 20000 расчетов функции F, при использовании дихотомии 28 расчетов,
а при использовании метода золотого сечения 20 расчетов. Если нужна еще
большая точность, интервал неопределенности в 10 раз меньший, то потребуется 200000 расчетов при сканировании, 34 – при дихотомии, 25 – при
методе золотого сечения.
Методы многомерного поиска (случай, когда F – функция более чем одного фактора) рассмотрим в простейшем варианте, когда
оптимизация проводится без ограничений. Ограничения вносят заметные усложнения в алгоритмы поиска, но при этом их сущность,
как правило, не изменяется. Изложение буду иллюстрировать случаем двух факторов – этот случай можно изобразить на графике.
Рассмотрим поиск максимума.
284
Глава 7. Оптимизация химико-технологических процессов
Метод покоординатного спуска. Выбираем координаты начальной точки поиска х1Н и x2Н, т. е. те значения х1 и х2, от которых мы
начнем искать оптимум, единичные приращения обоих факторов
(шаги) Н1 и Н2, а также малые приращения факторов ε1 и ε2. Выбор
всех этих величин определяется физическим смыслом задачи и той
информацией о ней, которой мы располагаем заранее.
Рис. 7.8. График движения в пространстве
факторов при покоординатном спуске
Рассчитываем значение F(x1Н , x2Н) в точке 1 (рис. 7.8). Далее, не
меняя величины х2, начинаем двигаться вдоль оси х1, давая на каждом шаге этому фактору приращение H1 (или –Н1, в зависимости от
того, при движении в какую сторону будет наблюдаться рост F ). На
каждом шаге – в точках 2, 3, 4 и т. д. – проводится расчет F. Шаги продолжаются до тех пор, пока продолжается рост F. Неудачными будем
считать те шаги, на которых получено значение F меньшее, чем на
предыдущих шагах (на рисунке они обозначены крестиками). После
первого неудачного шага (точка 6) возвращаемся в предыдущую точку (в данном случае в точку 5), фиксируем величину х1 и начинаем
изменять х2, давая ему приращения Н2 или –Н2 (точки 7, 8, 9, 10 ).
Затем снова движемся вдоль оси х1 (точки 11, 12, 13 ), снова меняем направление (точки 14, 15 ) и т. д. На рис. 7.8 изображена ситуация, когда из точки 12 двигаться некуда: во всех окружающих точках
(9, 13, 14, 15 ) значение F меньше, чем в данной. Это значит, что мы
уже приблизились к максимуму и прежние крупные шаги из точки
12 переносят нас через него. Поэтому уменьшаем шаги (например,
вдвое – см. точку 16 ) и продолжаем поиск уменьшенными шагами.
Уменьшение шага может производиться неоднократно. Но в тот момент, когда эти шаги оказываются меньше, чем соответственно ε1 и
ε2, логично считать, что максимум зафиксирован достаточно точно и
можно закончить расчет, приняв лучшую точку за оптимум.
7.3. Поиск оптимума численными методами
285
Если факторов больше двух, то после движения вдоль осей х1 и
х2 производится движение вдоль осей х3, х4 и т. д. и лишь затем снова начинается движение вдоль х1. В описанном варианте движение
вдоль каждой оси осуществляется так же, как при сканировании.
Если нужна большая точность определения оптимальных значений
xi, можно поступать и по-иному : например, организовывать такое
движение, как поиск методом золотого сечения.
Метод градиента. Существует много вариантов этого метода.
Рассмотрим простейший из них. Подробно опишу также лишь случай двух факторов.
Как и в методе покоординатного спуска, вначале выберем координаты исходной точки х1Н и х2Н , шаги H1 и Н2 и малые приращения
ε1 и ε2. Движение к оптимуму начнем не вдоль какой-либо оси координат, а в направлении градиента (если ищем минимум, то в противоположном градиенту направлении). Поскольку Н1 и Н2 приняты за
единичные приращения координат, формула градиента получит вид
(полужирный шрифт означает, что выделенные величины – векторы, и сложение ведется как векторное):
∂F
∂F
(7.26)
gradF =
H1 +
H2 .
∂x1
∂x2
Ясно, что для расчета направления градиента необходимо знать
частные производные целевой функции по факторам. Для расчета производных проводится вспомогательная серия расчетов
(см. рис. 7.9). Около начальной точки 1 ставятся две вспомогательные точки: 1' на расстоянии ε1 вдоль оси х1 и 1'' на расстоянии ε2
вдоль оси х2, и в них рассчитывается функция F. Производные находим по формулам
∂F F ( x1 + ε1 , x2 ) − F ( x1 , x2 )
,
=
ε1
∂x1
(7.27)
∂F F ( x1 , x2 + ε 2 ) − F ( x1 , x2 )
.
=
ε2
∂x2
После этого делаем шаг в точку 2 для следующего расчета F. Ее
координаты находятся так:
(7.28)
xi +1, j = xij + ∆x j ,
причем
∆x j =
∂F
Hj .
∂x j
Здесь i – номер точки; j – номер фактора.
(7.29)
286
Глава 7. Оптимизация химико-технологических процессов
Дальше можно действовать по-разному. Можно определить производные в новой точке i + 1, найти новое направление градиента, сделать шаг и т. д. Но чаще поступают иначе. Если шаг оказался удачным, т. е. если Fi+1 > Fi (при поиске максимума), то делают
следующий шаг в том же направлении, подставляя в формулу (7.29)
ранее найденные значения производных. Практически наверняка
это будет уже не направление градиента: его направление в разных
точках пространства факторов – разное, если только функция F не
является линейной. Но можно надеяться, что еще один шаг в прежнем направлении снова даст приращение F нужного знака, хотя и
не максимально возможное (так как от градиента мы отклонились).
Зато мы сэкономим на том, что не будем лишний раз рассчитывать
производные. Если и этот шаг удачен, шагнем еще раз и т. д.
Рис. 7.9. Схема расчетов в методе градиента
а
б
Рис. 7.10. Схема расчета после неудачного шага
Что делать, когда шаг неудачен? Что это может означать? Очевидно,
поверхность настолько искривлена, что данное направление перестало вести нас вверх, мы «перескочили» через ту окрестность
предыдущей точки, в которой функция возрастала. Поэтому в таком
случае обычно уменьшают шаг, например вдвое. Теперь, если уменьшенный шаг в том же направлении будет удачен, нет смысла делать
еще шаг, поскольку он приведет в «плохую» точку (см. рис. 7.10, а :
7.4. Экспериментальный поиск оптимума
287
крестик – неудачный шаг, (i + 2) – точка половинного шага). В этом
случае около точки (i + 2) поставим вспомогательные точки для расчета производных по формуле (7.27), найдем новое направление градиента и двинемся по нему (на рис. 7.10 вспомогательные точки –
черные кружки, новое направление градиента – стрелка). Если же и
уменьшенный шаг не приведет в «хорошую» точку (рис. 7.10, б), то
вернемся в точку i и будем в ней искать направление градиента.
Движение продолжаем до тех пор, пока шаги не станут очень малыми. Уменьшение шагов объясняется двумя причинами: первая –
неоднократным уменьшением в тех случаях, когда большой шаг оказывался неудачным; вторая – это принципиально важнее, – то, что
вблизи оптимума производные близки к нулю и формула (7.29) дает
уже очень малые приращения.
Для останова вычислений можно использовать момент, когда оба
приращения ∆xij окажутся меньше, чем соответствующие малые величины εj.
7.4. Экспериментальный поиск оптимума
Наиболее сложен для оптимизации случай, когда мы не знаем вида
целевой функции. В этом случае единственная возможность – находить оптимум экспериментально. Теория планирования эксперимента (см. разд. 2.4) включает методы поиска оптимума в качестве
своей важнейшей части. Я не буду касаться случая однофакторной
оптимизации. В соответствии с содержанием разд. 2.4 рассмотрим
многофакторные задачи. В принципе здесь можно применять любой
из рассмотренных в разд. 7.3 методов, но при этом приходится учитывать ряд дополнительных обстоятельств.
Во-первых, вследствие наличия случайных ошибок опытные точки нельзя располагать слишком близко одну к другой. В противном
случае значения критерия оптимальности, полученные в соседних
точках, окажутся неразличимыми: различия в величине критерия
(малые, потому что точки близки) будут значительно меньше уровня
ошибки, вследствие чего не удастся опровергнуть гипотезу о равенстве этих значений.
Во-вторых, в эксперименте гораздо острее, чем в расчете, стоит
проблема эффективности поиска. Эксперимент почти всегда дороже, чем единичный расчет целевой функции. Расчетная задача, где
придется 1000 раз рассчитать F, может оказаться не очень большой
по объему. Эксперимент же по отыскиванию оптимума, требующий
100 опытов, уже очень велик.
288
Глава 7. Оптимизация химико-технологических процессов
В-третьих, при экспериментальной оптимизации характер зависимости F от факторов, как правило, бывает проще, чем при расчетной. Это объясняется тем, что ошибки опытов «сглаживают рельеф»
целевой функции. Таким образом, в эксперименте обычно можно
работать с простейшими математическими моделями – чаще всего
с многочленами 1-го или 2-го порядков.
Применительно к планированию эксперимента метод покоординатного спуска обычно называют методом Гаусса – Зайделя. Его
главное преимущество – простота. Каждое движение (сканирование) вдоль одной из осей координат означает, что от опыта к опыту
изменяется только один фактор и влияние этого фактора получается
в ясной форме однофакторной зависимости. Его недостаток – малая
эффективность, присущая однофакторному планированию эксперимента (см. разд. 2.4). Поэтому методом Гаусса – Зайделя в эксперименте пользуются не часто.
Казалось бы, отмеченная выше простота математических моделей, встречающихся в экспериментальной оптимизации, открывает
еще одну возможность. Опишем целевую функцию многочленом.
Ясно, что многочлен 1-й степени не может описать зависимость,
имеющую экстремум. Более того, и добавление взаимодействий не
позволяет этого сделать. Тогда используем многочлен 2-й степени.
Реализуем в интересующей нас области план 2-го порядка. Получив
оценки параметров многочлена, легко определить экстремум на
основе уравнений (7.5). Однако такой способ отыскания экстремума
крайне неточнен.
Исходная область пространства факторов всегда достаточно велика, и в этой большой области описание целевой функции многочленом 2-го порядка неадекватно, поскольку этот многочлен – лишь
приближенное представление неизвестной нам «истинной» функции. Кроме того, экспериментальные точки в этом случае располагаются нерационально: в большинстве своем они попадают в части
области, далекие от экстремума и поэтому неинтересные для исследователя.
Метод Бокса –Уилсона. В начале 1950-х годов был разработан
подход к оптимизации, называемый методом Бокса – Уилсона. Он
состоит в следующем. Сначала ставится одна или несколько серий
опытов, цель которых – приблизиться к оптимуму по градиенту
функции, а затем вблизи экстремума ставится план 2-го порядка и
оптимум отыскивают так, как описано выше.
В планировании эксперимента градиентный метод движения
к оптимуму называют крутым восхождением. Отличия от метода,
описанного в разд. 7.3, обусловлены ошибками опытов. По этой
7.4. Экспериментальный поиск оптимума
289
причине нельзя находить частные производные так, как там указано:
в формулах (7.27) приращения ε должны быть малы; при малых расстояниях между точками слишком сильно скажутся ошибки опытов
и оценка направления градиента будет очень сильно отклоняться от
истинного направления.
Поэтому поступим так. Вокруг исходной точки как центра построим факторный эксперимент 2р или дробный факторный эксперимент. Зависимость отклика от факторов опишем многочленом 1-й
степени (в дальнейшем, как и в разд. 2.4, будем обозначать критерий
оптимальности, он же отклик, буквой у):
y = b0 + b1x1 + b2x2 +…+ bpxp.
(7.30)
Тогда частные производные равны соответствующим коэффициентам регрессии:
∂y
= bj
∂x j
j = 1, 2,..., p .
(7.31)
С учетом этого, а также того, что за единичный шаг в направлении каждой оси uj (uj выражено в размерных, некодированных, так
называемых натуральных единицах) естественно принять интервал
варьирования δj , формула (7.29) примет вид
∆u j = b jδ j m ,
j = 1, 2,…, p .
(7.32)
Здесь m – множитель, регулирующий длину шага: шаг должен
быть не слишком мал, иначе движение будет очень медленным, но
и не слишком велик, а то можно быстро уйти в область, где направление градиента совсем иное. Удачный выбор значения m обычно
связан с достаточным опытом в применении метода. В качестве разумной, хотя зачастую и не самой лучшей, могу рекомендовать такую
оценку:
1
(7.33)
m=
j ≠0.
,
bj
макс
Выражение в знаменателе – наибольшая из абсолютных величин
коэффициентов регрессии, за исключением свободного члена. В таком случае шаг по оси наиболее сильно влияющего фактора равен
интервалу варьирования, по остальным – соответственно меньше.
Отмечу еще одну особенность расчета по уравнению (7.32). Не
следует стремиться получать значения приращений факторов со
слишком большой точностью. Наоборот, значения, найденные по
формуле (7.32), желательно округлять так, чтобы в опытах задавались удобные значения факторов. Нецелесообразно изменять от
опыта к опыту температуру на 4,263°, куда удобнее – на 4,25° или
даже на 4°. Дело в том, что направление градиента очень чувстви-
290
Глава 7. Оптимизация химико-технологических процессов
тельно к значениям принимаемых при построении плана интервалов варьирования. Но мы реально всегда задаем эти интервалы не на
основе серьезной теории, а весьма приблизительно – обычно ориентируясь на привычные круглые значения. Практически никогда мы
не можем утверждать, что интервал варьирования температуры 10° с
точки зрения какой-то теории лучше, чем интервал 11,18°. Но расчет
по формуле (7.33) даст при принятии этих интервалов существенно
разные значения. Поэтому, если мы округляем шаги по осям в крутом восхождении, у нас нет никаких причин думать, что мы замедляем (равно как и ускоряем) движение к экстремуму.
Движение по направлению крутого восхождения продолжается до
тех пор, пока у возрастает (либо убывает, если мы ищем минимум).
После этого либо ставят новый факторный эксперимент и находят
новое направление градиента, либо переходят к плану 2-го порядка,
как было рассказано выше.
Пример 7.10. Для эксперимента, рассмотренного в примере 2.31, решено
провести крутое восхождение. Правда, адекватным оказалось лишь уравнение (2.80), содержащее взаимодействие х1х2. Но часто при расчете градиента
можно рискнуть – пренебречь неадекватностью чисто линейного уравнения. Если первые же шаги покажут, что у не возрастает, то крутое восхождение невозможно и придется принимать иное решение; если же движение по
найденному направлению дает нужный эффект, то не существенно – адекватно ли уравнение (7.30).
Итак, с помощью уравнения (7.29), с учетом (2.80) и значений интервалов
варьирования, приведенных в начале примера 2.31, получаем
∆u1 = −5,5 ⋅ 4m = −22m; ∆u2 = −1,375 ⋅ 0, 05m = −0, 06875m; ∆u3 = −2 ⋅10m = −20m
и по формуле (7.33) определяем, что m = 1/5,5 = 0,1818. Тогда
∆u1 = −22 ⋅ 0,1818 = −4%; ∆u2 = −0, 06875 ⋅ 0,1818 ≈ −0, 01%; ∆u3 = −20 ⋅ 0,1818 ≈ −4 K .
Шаги по осям u2 и u3 заметно округлены.
Обычно крутое восхождение начинают из центра плана. Для данного случая приведены условия, рассчитанные по формуле (7.28), и ре