Теперь вы сможете с легкостью провести;pdf

ЮГО-ЗАПАДНЫЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
На правах рукописи
Бабков Александр Сергеевич
Интеллектуальная система поддержки принятия решений
скрининг-диагностики рака желудка на основе комбинированных
классификационных правил
Специальность 05.11.17 «Приборы, системы и изделия медицинского
назначения».
Диссертация
на соискание ученой степени
кандидата технических наук
Научный руководитель:
доктор технических наук, профессор
Серебровский Вадим Владимирович
Курск – 2014
2
СОДЕРЖАНИЕ
Введение …………………………………………………………………………. 4
Глава 1 Аналитический обзор и постановка задач исследования …………… 11
1.1 Скрининг-диагностика рака желудка …………………………………….. 11
1.2 Принципы самоорганизационного моделирования ……………………... 15
1.3 Синтез нечетких решающих правил ………………………………………. 20
Цели и задачи исследования …………………………………………………… 23
Глава 2 Модель и методы скрининг-диагностики рака желудка для
интеллектуальной системы поддержки принятия решений ………………… 26
2.1 Информационно-аналитическая модель системы поддержки принятия
решений скрининг-диагностики рака желудка ………………………………. 26
2.2 Формирование обучающих и контрольных выборок и метод оценки
классификационных возможностей структур медицинских данных ……….. 33
2.3 Метод синтеза нечетких решающих правил скрининг-диагностики рака
желудка на основе данных о структуре связей между показателями крови .. 40
Выводы второй главы ………………………………………………………….. 48
Глава 3 Разработка основных элементов интеллектуальной системы скринингдиагностики рака желудка ……………………………………………………... 49
3.1 Разработка структуры интеллектуальной системы поддержки принятия
решений скрининг-диагностики рака желудка ……………………………….. 49
3.2 Формирование пространства информативных признаков ……………….. 83
3.3 Синтез функций риска диагностики рака желудка ………………………. 90
3.4 Алгоритм управления процессом скрининг-диагностики рака желудка на
основе показателей крови и анамнеза обследуемого ……………………….. 102
Выводы третьей главы ………………………………………………………... 106
Глава 4 Результаты экспериментальных исследований ……………………. 108
4.1 Формирование обучающих и контрольных выборок …………………… 108
4.2
Математические
модели
структуры
связей
между
показателями
крови …………………………………………………………………………… 113
4.3 Диагностические возможности решающих правил …………………….. 119
3
Выводы четвертой главы ……………………………………………………... 124
Заключение ……………………………………………………………………. 125
Библиографический список ………………………………………………….. 127
Приложение …………………………………………………………………… 140
4
ВВЕДЕНИЕ
Актуальность работы. Актуальность диссертационного исследования
обусловлена
тем,
что
своевременная
диагностика
онкологических
заболеваний позволяет существенным образом снизить смертность, улучшить
качество
терапевтических
и
хирургических
последствий,
снизить
экономические затраты на лечение и последующую реабилитацию больных. В
процессе скрининга рака желудка обязательным является осуществление
анализа крови и расчета значений соответствующих онкомаркеров. Так как
состав крови отражает происходящие в организме изменения при развитии
патологических процессов, то системный анализ происходящих изменений
состава крови позволяет повысить качество скрининг- диагностики.
Достаточно оперативное осуществление системного анализа происходящих
структурных изменений врачом затруднительно в силу необходимости
обработки большого количества информации в условиях ее нечеткой
определенности. В соответствии с этим возникает потребность в разработке
интеллектуальной системы поддержки принятия решений (СППР) для
скрининг-диагностики на основе современных компьютерных технологий,
позволяющей
осуществлять
раннее
выявление
рака
желудка
и/или
формировать в процессе скрининга рекомендации о необходимости
продолжения обследования пациента в специализированных центрах или
клиниках.
Степень разработанности темы исследования. В силу различных
объективных и субъективных причин, ухудшения экологической обстановки
и роста психологического напряжения людей в современном обществе
наблюдается тенденция к ухудшению популяционных свойств здоровья.
Возникает необходимость в массовом качественном обследовании населения
с
применением
скрининговых
автоматизированных
технологий,
систем,
которые
стандартизации
позволяют
методов
и
проектировать
качественные интеллектуальные системы поддержки принятия решений для
5
выявления определенных классов заболеваний. В Российской Федерации
начиная с 1990 года ведутся разработки в области скрининга здоровья детей и
подростков (системы ВИТА-90, АКДО, АСПОН, КМАДО, АСДОК, САНУС,
КАСМОН и др.). Аналогичные системы существуют в США (фирмы «Control
Date Corp», «GETZ CORP») и других странах. Базовая автоматизированная
система скрининг-диагностики включает в себя подсистемы регистрации
пациента
автоинтервьюирования,
физиологических
и
сенсорных
проверки
систем
работы
организма,
различных
анализа
ЭКГ
и
артериального давления, результаты лабораторных анализов различных
биологических проб. К настоящему времени разработаны и эксплуатируются
системы скрининга различных групп заболеваний. Скрининг заболеваний
осуществляется по раку яичников, шейки матки, молочной железы,
предстательной железы, легких, прямой кишки, мочевого пузыря, полости рта,
кожи, поджелудочной железы. В настоящее время скрининг рака желудка
осуществляется в основном методами фото-флюорографии с двойным
контрастированием и гастроскопией в специализированных центрах или
клиниках. С этой целью применяются онкомаркеры типа РЭА, СА242, СА72.4,
СА19.9
с
диагностической
эффективностью
порядка
60-65%.
Автоматизированных скрининговых диагностических систем рака желудка в
условиях массовой диспансеризации населения не разработано, что снижает
диагностическую эффективность на ранней стадии развития заболевания и
приводит к росту летальности.
Таким образом, научно-технической задачей исследования является
повышение диагностической эффективности скрининговых систем рака
желудка на основе результатов общего анализа крови и информации об образе
жизни, жалобах и состоянии здоровья обследуемого путем применения
современных
информационных
и
компьютерных
интеллектуальных
технологий.
Работа выполнена в соответствии с федеральной целевой программой
«Предупреждение и борьба с социально значимыми заболеваниями» и с
6
научными направлениями Юго-Западного государственного университета
«Медико-экологические информационные технологии».
Объект исследования. Пациенты, у которых предполагается наличие
онкологических заболеваний желудка.
Предмет
исследования.
Методы,
математические
модели
и
интеллектуальная система поддержки принятия решений о необходимости
клинического обследования пациента в процессе скрининг-диагностики рака
желудка.
Цель работы: Разработка интеллектуальной системы поддержки
принятия решений скрининг-диагностики рака желудка, позволяющей по
результатам общего анализа крови и анамнеза определять людей с высоким
риском
наличия
исследуемого
заболевания
с
использованием
комбинированных классификационных правил принятия решений.
Для достижения поставленной цели необходимо решить следующие
задачи:
-
разработать
информационно-аналитическую
модель
скрининг-
диагностики рака желудка;
-
разработать метод оценки классификационных возможностей
структур медицинских данных для синтеза решающих диагностических
правил;
-
разработать метод синтеза нечетких математических моделей
скрининг-диагностики рака желудка на основе информации о структуре связей
между показателями крови и анамнеза пациента;
-
сформировать пространство информативных признаков для ранней
диагностики рака желудка;
-
на
репрезентативной
диагностические
решающие
обучающей
правила
для
выборке
синтезировать
интеллектуальной
системы
поддержки принятия решений скрининг-диагностики рака желудка;
- разработать алгоритм, структуру и программное обеспечение
интеллектуальной системы скрининг-диагностики рака желудка на основе
7
анализа изменений в структуре связей между регистрируемыми показателями
крови пациента;
-
провести
верификацию
полученных
диагностических
правил
соотнесения пациента к группе риска болеющих раком желудка на
репрезентативной контрольной выборке.
Научная новизна исследований. В диссертации получены следующие
результаты, характеризующиеся научной новизной:
- информационно-аналитическая модель для интеллектуальной системы
поддержки
принятия
решений
скрининг-диагностики
рака
желудка,
позволяющая с приемлемым для медицинской практики качеством по
результатам анализа крови и общей информации о состоянии пациента,
содержащейся в анамнезе, принимать решения о необходимости дальнейшего
клинического обследования;
-
метод
оценки
классификационных
возможностей
структур
медицинских данных, основанный на вычислении мер доверия к выборкам и
признаковому пространству, позволяющий повысить качество работы
решающих правил в условиях скрининга;
-
метод
синтеза
нечетких
математических
диагностики рака желудка, отличающийся
моделей
скрининг-
применением в качестве
классификаторов математических моделей, основанных на использовании мер
близости между регистрируемыми и расчетными значениями показателей
крови, что позволяет с системной точки зрения анализировать происходящие
в процессе развития заболевания структурные изменения в организме на
ранней стадии;
- диагностические решающие правила для интеллектуальной системы
скрининг-диагностики рака желудка, отличающиеся применением оценок
риска наличия заболевания по показателям, характеризующим образ жизни,
текущее состояние пациента, перенесенные заболевания и результаты общего
анализа крови как совместно, так и по отдельности;
8
- алгоритм, структура и программное обеспечение интеллектуальной
системы скрининг-диагностики рака желудка на основе анализа изменений в
структуре связей между регистрируемыми показателями крови пациента,
отличающиеся использованием синтезированных методом группового учета
аргументов математических моделей, отражающих различные взаимосвязи
между регистрируемыми показателями у больных и не больных раком
желудка людей и позволяющие формировать рекомендации по ведению
пациентов с начальными стадиями исследуемого заболевания.
Теоретическая и практическая значимость работы состоит в том, что
для
повышения
качества
медицинского
обслуживания
в
области
профилактики рака желудка разработаны:
- информационно-аналитическая модель для интеллектуальной системы
поддержки принятия решений скрининг-диагностики рака желудка; метод
оценки классификационных возможностей структур медицинских данных;
-
метод
синтеза
математических
моделей
и
комплекс
классификационных решающих правил скрининг-диагностики рака желудка;
- алгоритмическое и программное обеспечение, составляющие основу
интеллектуальной
системы
поддержки
принятия
решений
скрининг-
диагностики рака желудка, позволяющей формировать рекомендации о
необходимости обследования пациента в специализированных центрах.
Применение предложенных в диссертации методов и средств позволяет
улучшить качество медицинского обслуживания людей, имеющих высокий
риск и страдающих таким заболеванием как рак желудка.
Методология и методы исследования. Для решения поставленных
задач использовались методы теории синтеза биотехнических систем
системного анализа, статистической обработки экспериментальных данных,
теории нечетких множеств, экспертного оценивания, группового учета
аргументов, математического моделирования.
Положения,
выносимые
на
защиту:
1.
Метод
оценки
классификационных возможностей структур медицинских данных для синтеза
9
диагностических правил, основанный на применении мер доверия, позволяет
корректировать правила принятия решений с целью улучшения качества
классификации. 2. Информационно-аналитическая модель и структура
интеллектуальной
системы
поддержки
принятия
решений
скрининг-
диагностики рака желудка позволяют на основе результатов общего анализа
крови и анамнеза оценивать риск наличия заболевания и формировать
качественные
рекомендации
о
необходимости
обследования
в
специализированных центрах. 3. Математические модели, отражающие связи
между
показателями
крови,
позволяют
проанализировать
системные
изменения в структуре крови при возникновении рака желудка. 4. Нечеткие
решающие правила, основанные на анализе образа жизни, анамнеза пациента
и вычислении мер близости между значениями регистрируемых показателей
крови и их расчетными, по математическим моделям, значениями позволяют
осуществлять диагностику с приемлемым для практической медицины
качеством.
Степень достоверности и апробация результатов. Результаты
исследования показали их воспроизводимость в различных условиях,
непротиворечивость концепциям системного анализа и теории синтеза
биотехнических систем, а так же аналогичным результатам, полученным
другими
исследователями.
Методы
модели
и
алгоритмы
скрининг-
диагностики рака желудка построены на теории распознавания образов,
группового учета аргументов и нечеткой логики принятия решений и
согласуются с ранее опубликованными экспериментальными данными по теме
диссертации. Предложенные в работе методы, модели и алгоритмы переданы
в опытную эксплуатацию на кафедре факультетской хирургии медицинского
института НИУ «БелГУ» и используются в учебном процессе кафедры
биомедицинской инженерии Юго-Западного государственного университета
при обучении студентов специальности 200401. Основные теоретические
положения и научные результаты диссертационной работы докладывались,
обсуждались
и
получили
положительную
оценку
на
следующих
10
конференциях и семинарах: VI Международной студенческой электронной
научной конференции «СТУДЕНЧЕСКИЙ НАУЧНЫЙ ФОРУМ 2014»
(Москва, 2014); Международная заочная научно-практическая конференция
«Актуальные вопросы в научной работе и образовательной деятельности»
(Тамбов, 2014); Международная научно-практическая конференция «Научный
прогресс на рубеже тысячелетий - 2014»; «Математические методы в
прикладных
программы
задачах»
(Курск,
2013);
«Алгоритмы
и
математических и физических задач» (Курск, 2013); «X
MEZINÁRODNÍ VĚDECKO – PRAKTICKÁ»
(Прага 2014), на научно-
технических семинарах кафедр биомедицинской инженерии и информатики и
прикладной математики ЮЗГУ (Курск – 2012, 2013, 2014).
Структура и объем работы. Диссертация работы состоит из введения,
4 глав, заключения, приложения и библиографического списка, включающего
81 отечественных, 46 зарубежных источников, 2 ссылки на электронные
ресурсы. Работа изложена на 148 листах машинописного текста, содержит 16
рисунков и 17 таблиц.
11
ГЛАВА 1 АНАЛИТИЧЕСКИЙ ОБЗОР И ПОСТАНОВКА ЗАДАЧ
ИССЛЕДОВАНИЯ
1.1 СКРИНИНГ-ДИАГНОСТИКА РАКА ЖЕЛУДКА
Рак желудка (РЖ) представляет собой крайне актуальную проблему
современной онкологии во всем мире. По сводным эпидемиологическим
данным это заболевание в мире является четвертым наиболее частым после
рака легких, молочных желез, толстой кишки. Ежегодно диагностируется
более 930 тыс. новых случаев выявления РЖ, а одногодичная летальность
составляет более 700 тыс. (более 75%) [123].
В России это заболевание стабильно занимает второе место в структуре
онкологических заболеваний и летальности. Ежегодно РЖ заболевают 46 тыс.
человек, а одногодичная летальность составляет 56% [123]). Россия занимает
место в первой десятке в мире по уровню заболеваемости РЖ.
Среднее время от появления специфических симптомов до постановки
диагноза РЖ составляет 3 месяца, что свидетельствует как о поздней
обращаемости пациентов к врачу, так и об объективных сложностях
диагностики, о необходимости оптимизации тактики обследования на
доклиническом, т.е. поликлиническом уровне.
Вопрос о сроках диагностики опухолевого поражения желудка стоит
достаточно остро. Если в специализированных клиниках время от момента
обращения до постановки диагноза сведено к минимуму, то в общей лечебной
сети этот процесс по объективным причинам может растянуться на недели. В
нашем исследовании среднее время от момента обращения до момента
диагностики составило 15,7 дня, а в период до 30 сут морфологически
верифицированный диагноз РЖ был установлен у большинства - 416 (87,8%)
пациентов.
Более 90 дней потребовалось на верификацию процесса у 6 (1,3%)
пациентов,
что
достаточно
часто
наблюдается
при
диффузно-
12
инфильтративном варианте роста опухоли, когда характер поражения
слизистой оболочки может быть минимальным, обусловливая сложности
получения информативного биоптата.
В большинстве наблюдений (418 (88,2%)) морфологический материал
получен при эндоскопическом исследовании, тогда как из отдаленных
метастатических очагов биопсийный материал получен в 1,6% случаев.
В плане диспансерного обследования у бессимптомных пациентов
диагностическое эндоскопическое исследование выполнено в 27 (5,7%)
наблюдениях. В остальных случаях диагностику проводили при наличии
симптомов желудочного неблагополучия, либо после предшествующего
рентгенологического обследования.
Из факторов неполноценной диагностики следует отметить низкую
частоту специфического исследования гастро-биоптата на H. pylori, что
является важным аспектом проведения программ иррадикации данной
специфической инфекции. Известно, что H. pylori индуцирует опухолевую
трансформацию слизистой оболочки желудка особенно при выполнении
сохранных объемов вмешательств [123]. Этот метод является необходимым
шагом индивидуализации тактики лечения особенно в случаях раннего РЖ
после выполнения эндоскопической мукозэктомии. В нашем случае
исследование на H.pylori было проведено лишь у 23 (4,9%) пациентов.
Предоперационное стадирование является крайне важным элементом
определения тактики лечения, в том числе комбинированной и комплексной
терапии РЖ. Следует отметить, что варианты комбинированного лечения
всецело зависят от достоверности дооперационного обследования и
возможности детальной оценки распространенности процесса по критериям
cT, cN и cM. Это, в свою очередь, определяется двумя кофакторами: методами
диагностики (в зависимости от их чувствительности и специфичности) и
системами стадирования.
Из
инструментальных
методов
диагностики
для
определения
клинической стадии широко применялся эндоскопический (98,7%), УЗИ
13
брюшной полости (90,7%) и рентгенологическое обследование (64,3%).
Учитывая настоятельную необходимость исследования глубины опухолевой
инвазии стенки желудка, лимфогенной и интраперитонеальной распространенности, можно отметить, что комплексное обследование пациентов
проведено у достаточно ограниченного круга пациентов, преимущественно в
академических лечебных учреждениях. Обязательным методом исследования
пациентов с местно распространенным РЖ является лапароскопическое
исследование с выполнением перитонеального лаважа (проведено лишь у 39,2
и 11,8% пациентов соответственно, что, конечно же, ведет к недооценке
распространенности опухоли). Более специфичный метод исследования
глубины
опухолевой
инвазии
и
характера
поражения
регионарных
лимфатических узлов (эндо-УЗИ выполнен лишь у 2,5% пациентов).
Компьютерная томография (КТ) брюшной полости выполнялась у 13,7%
пациентов, что обусловлено высокой стоимостью данного метода. Столь
неполноценный
объем
диагностики
лимитирует
возможность
дооперационного определения истинной стадии и выбора метода лечения, адекватного распространенности процесса. Следует отметить, что в западных
странах частота выполнения КТ органов брюшной полости превалирует над
частотой выполнения УЗИ (52,2 и 39,1% соответственно), тогда как частота
выполнения
лапароскопии
с
лаважем
брюшной
полости
остается
неоправданно низкой - лишь 9,1 и 2,9% соответственно (рис.1).
В настоящее время в практической онкологии применяются две наиболее
часто используемые классификации РЖ. Первое и, возможно, доминирующее
положение занимает классификация Японской ассоциации по раку желудка
(Japanese Gastric Cancer Associations - JGCA). В англоязычной литературе
опубликовано
второе
издание
основных
правил по
изучению
РЖ,
базирующееся на 13-м переиздании Правил в Японии (Japanese Classification
of Gastric Cancer - 2nd English Edition) [74].
Другой
классификацией
РЖ
является
совместное
издание
Международного противоракового союза (МПС - UICC) и Американского
14
объединенного противоракового комитета (AJCC), опубликованное в 2002 г.
[56]. Между двумя этими классификациями остается достаточно много
разногласий, что находит отражение во многих публикациях, посвященных
этой крайне актуальной проблеме.
15
1.2 ПРИНЦИПЫ САМООРГАНИЗАЦИОННОГО МОДЕЛИРОВАНИЯ
Поскольку
биологические
самоорганизационному
принципу,
системы
то
построены
представляется
по
целесообразным
осуществлять их математическое моделирование, основанное на аналогичных
базисных принципах организации. Наиболее развитым в этом направлении
является метод группового учета аргументов (МГУА) [39, 40].
Построение систем моделирования по методу группового учета
аргументов (МГУА) базируется на следующих принципах:
1.
Принцип самоорганизации модели. При последовательном
увеличении сложности структуры модели значения внешних критериев
сначала уменьшаются, достигают минимума, а затем или остаются
неизменными, или начинают увеличиваться. Первое наименьшее
значение комбинации критериев определяет единственную модель
оптимальной сложности.
2.
Принцип внешнего дополнения. Задачи интерполяции относятся
к некорректно поставленным задачам, которыле имеют многозначное
решение.
Для
однозначного
их
решения
необходимо
задание
адекватного внешнего дополнения - внешнего критерия оптимальности.
Под
внешним
критерием
будем
понимать
критерий,
который
вычисляется с использованием информации, не использованной при
оценке параметров. Внутренние дополнения, т.е. критерии, не
использующие никакой дополнительной информации, при действии
помех не могут решить задачу выбора модели оптимальной сложности.
3.
Гёделевский подход при самоорганизации моделей. Теорема
утверждает, что для любой системы исходных аксиом (внешних
дополнений первого уровня) всегда можно задать такую теорему, для
доказательства которой недостаточно данной системы аксиом и
необходимы новые аксиомы – внешние дополнения. Применительно к
16
моделям самоорганизации идеи Гёделя можно интерпретировать таким
образом: по минимуму заданного внешнего критерия можно решить все
вопросы о выборе опорных функций, структуры и параметров модели,
кроме вопросов, связанных с алгоритмом вычисления и способами
использования самих критериев.
4.
Внешние критерии селекции моделей. Уравнение регрессии
выбирается по критерию минимума смещения – непротиворечивости, в
соответствии с которым требуется, чтобы модели, построенные по части
таблицы А, как можно меньше отклонялись от моделей, построенных по
части таблицы В. Критерий минимума смещения является базовым,
потому что непротиворечивость моделей является обязательным
свойством оптимальной модели.
5.
Разбиение таблицы данных на части. Основной критерий
минимума смешения требует разбиения таблицы данных на две равные
части А и В. Обычно таблица исходных данных делится на три части:
обучающая А, проверочная В и экзаменационная выборка С.
Обучающая выборка используется для получения оценок параметров
модели (например, коэффициентов регрессии), а проверочная – для
выбора структуры модели.
6.
Гипотеза селекции. При использовании принципа селекции в
кибернетике необходимо придерживаться следующих правил:
a)
для каждого поколения (или ряда селекции модели) существует
некоторое минимальное количество отбираемых комбинаций, которые
называются свободой выбора и обеспечивают сходимость многорядных
селекций модели оптимальной сложности;
b)
слишком большое количество поколений приводит к индуциту
(информационная матрица становится плохо обусловленной);
c)
чем сложнее задача селекции, тем больше нужно поколений для
получения модели оптимальной сложности.
17
7.
Принцип сохранения свободы выбора. Свобода выбора
обеспечивается тем, что на каждый следующий ряд селекции передается
не одно решение, а несколько лучших, отобранных на последнем ряде.
Д.Габор сформулировал этот принцип следующим образом: принимать
решение в данный момент времени необходимо таким образом, чтобы в
следующий момент времени, когда возникнет необходимость в
очередном решении, сохранялась бы свобода выбора решений.
8.
Применение эвристических методов. Эвристический характер
самоорганизации моделей особенно проявляется при выборе опорной
функции отдельных моделей, критериев селекции моделей, способа
регуляризации,
реализации
способа
нормирования
последовательного
переменных,
увеличения
сложности
конкретной
моделей-
претендентов.
9.
Одновременное моделирование на разных уровнях общности
языка математического описания объектов. Основным моментом в
этом
принципе
является
использование
многоуровневого
моделирования для решения задачи прогнозирования.
Самоорганизация относится к эмпирическим методам моделирования.
Эти методы в своей области применения имеют некоторые преимущества по
сравнению с теоретическими и полуэмпирическими методами построения
моделей. В тех случаях, когда мы наблюдаем параметры исследуемого
объекта, но не знаем структуры и механизма взаимодействия между
элементами сложной системы, поведение которой определяет значения
параметров, подход самоорганизации оказывается единственным надежным
средством построения моделей прогноза. С помощью самоорганизации
решение можно определить, даже если другими способами получить
результаты невозможно. Модели, полученные с помощью самоорганизации,
имеют специфическую область применения и особенно эффективны для
долгосрочного прогноза. Физические модели, полученные на основе
18
математической теории наблюдаемых объектов, могут преследовать только
полностью
определенные
опознавательные
цели
(идентификация
и
долгосрочный прогноз). Поэтому построение моделей в соответствии с
новыми объективными методами самоорганизации делает возможным вместо
допущений грубых ошибок предложить модели, которые основываются на
надежной информации и получены с помощью самоорганизации.
Внешние критерии оптимальности
Реализация выборки
делится на реализацию начальной выборки, с
помощью которой оцениваются параметры модели, и реализация проверочной
выборки, с помощью которой осуществляется выбор подходящей модели.
Критерий регулярности определяет среднеквадратичное отклонение модели
на проверочной последовательности.
Если исходить из того, что при постоянном комплексе условий качественная
аппроксимация в прошлом гарантирует качественную аппроксимацию в
ближайшем будущем, то критерий регулярности можно рекомендовать для
краткосрочного прогноза, потому что решение, полученное по новым
реализациям дает только небольшое отклонение от исходных данных. При
этом в процессе селекции можно потерять важные переменные, влияние
которых будет учтено косвенно, через другие переменные.
Очень
важным
оказывается
критерий
несмещенности (непротиворечивости) модели. Довольно часто аналитики с
большим опытом работы в предметной области даже не подозревают, что они
оперируют, по сути, с противоречивой системой уравнений. В основе
критерия непротиворечивости лежит довольно простой факт, что для одного
объекта исследования по разным выборкам данных, полученных от него при
прочих равных условиях, должны быть получены близкие модели, которые
определяют поведение объекта.
19
Критерий смещения обращается в нуль на истинной моделе. Но бывают
случаи, когда этот критерий принимает нулевое значение и на неистинных
моделях. В этом случае выборку следует разбить на три, четыре и более
подвыборок, пока не останется только одна несмещенная модель – она и будет
истинной.
Учитывая наличие хорошо проработанного математического аппарата
[39,
40],
базирующегося
организованных
на
биологических
принципах
систем,
построения
имеется
оптимально
принципиальная
возможность применения МГУА для решения такой плохо формализуемой
задачи, как скрининг-диагностика рака желудка в условиях ограниченного и
разнородного пространства информативных признаков [5, 6].
20
1.3 СИНТЕЗ НЕЧЕТКИХ РЕШАЮЩИХ ПРАВИЛ
Анализ многочисленных литературных данных, а так же собственные
исследования показывают, что задача скрининг-диагностики рака желудка
относится к классу плохо формализуемых задач с нечетко определенными и
пересекающимися
границами
классов.
В
этих
условиях
согласно
рекомендациям [19, 20, 36, 44, 46, 70, 81, 101, 102, 115, 129] целесообразно
использовать теорию нечеткой логики принятия решений, использующую
следующий понятийный аппарат.
Нечетким логическим выводом (fuzzy logic inference) называется
получение заключения в виде нечеткого множества, соответствующего
текущим значениям входов, с использованием нечеткой базы знаний и
нечетких операций.
В общем случае нечеткий вывод решения происходит за три (или
четыре) шага:
1) этап фаззификации. С помощью функций принадлежности всех
термов входных лингвистических переменных (лп) и на основании задаваемых
четких значений из универсумов входных лингвистических переменных
определяются степени уверенности в том, что выходная лингвистическая
переменная принимает конкретное значение. Эта степень уверенности есть
ордината точки пересечения графика функции принадлежности терма и
прямой «Четкое значение ЛП».
2) этап непосредственного нечеткого вывода. На основании набора
правил (нечеткой базы знаний) вычисляются значения истинности для
предпосылок всех правил на основании конкретных нечетких операций,
соответствующих конъюнкции или дизъюнкции термов в левой части правил.
В большинстве случаев это либо максимум, либо минимум из степеней
уверенности термов, вычисленных на этапе фаззификации, который
применяется к заключению каждого правила. Используя один из способов
построения
нечеткой
импликации,
получается
нечеткая
переменная,
21
соответствующая вычисленному значению степени уверенности в левой части
правила и нечеткому множеству в правой части правила.
Основным способом построения нечеткой импликации является способ
Kleene-Dienes: пусть А и В - нечеткие высказывания и μAμB - соответствующие
им функции принадлежности. Импликация А=>В определяется формулами:
А=>В ≡ Ā v В,
μА=>В (x, y) = max (1- μА (х); μВ (y)).
Однако, это не единственное обобщение оператора импликации. В
таблице 1.1 приведены другие интерпретации этого понятия, наиболее часто
применяемые на практике.
Таблица 1.1 – Типовые нечеткие операции
Larsen
μА=>В (x, y) = μА (х) μВ (y)
Lukasiewicz
μА=>В (x, y) = min (1; 1- μА (х) + μВ (y))
Mamdani
μА=>В (x, y) = max (μА (х); μВ (y))
Kleene-Dienes-Lu
μА=>В (x, y) = 1- μА (х)+ μА (х) μВ (y)
3) этап композиции (агрегации, аккумуляции). Все нечеткие множества,
назначенные для каждого терма каждой выходной лингвистической
переменной, объединяются вместе, и формируется единственное нечеткое
множество - значение для каждой выводимой лингвистической переменной
(обычно используются функции MAX или SUM).
4) этап дефаззификации (необязательный). Используется тогда, когда
полезно
преобразовать
нечеткий
набор
значений,
выводимых
лингвистических переменных к точным. В теории нечетких множеств
процедура
дефаззификации
аналогична
нахождению
характеристик
22
положения (математического ожидания, моды, медианы) случайных величин
в теории вероятности. Имеется достаточно большое количество методов
перехода к точным значениям (по крайней мере, 30).
Простейшим
способом
выполнения
процедуры
дефаззификации
является выбор четкого числа, соответствующего максимуму функции
принадлежности. Однако пригодность этого способа распространяется лишь
на одноэкстремальные функции принадлежности. Для многоэкстремальных
функций
принадлежности
часто
используются
следующие
методы
дефаззификации:
1) COG (Center Of Gravity) - "центр тяжести". Физическим аналогом этой
формулы является нахождение центра тяжести плоской фигуры, ограниченной
осями координат и графиком функции принадлежности нечеткого множества.
2) MOM (Mean Of Maximums) - "центр максимумов". При использовании
метода центра максимумов требуется найти среднее арифметическое
элементов универсального множества, имеющих максимальные степени
принадлежностей.
3) First Maximum - "первый максимум" - максимум функции
принадлежности с наименьшей абсциссой.
Таким образом в теории нечеткой логики принятия решений получен
достаточно
мощный математический
аппарат, который может быть
использован для решения поставленных в работе задач.
23
ЦЕЛИ И ЗАДАЧИ ИССЛЕДОВАНИЯ
Симптоматика рака желудка слабо проявляет себя на ранней стадии
заболевания, что приводит к достаточно высокой летальности в случае
позднего обращения к врачу. Эта проблема в настоящее время решается за
счет проведения обязательной диспансеризации и скрининг диагностики. В
процессе скрининга рака желудка обязательным является осуществление
анализа крови и расчета значений соответствующих онкомаркеров.
Поскольку состав крови как системной ткани отражает происходящие в
организме
изменения
при
развитии
патологических
процессов
то,
следовательно, системный анализ происходящих изменений состава крови с
помощью специализированных математических методов и инструментария
исскуственного
интеллекта,
позволит
повысить
качество
скрининг-
диагностики.
Достаточно
оперативное
осуществление
системного
анализа
происходящих структурных изменений врачом затруднительно в силу
необходимости обработки большого количества информации в условиях ее
нечеткой определенности. В соответствии с этим возникает потребность в
разработке интеллектуальной системы поддержки принимаемых решений
(СППР) для скрининг-диагностики на основе современных и компьютерных
технологий, позволяющих осуществлять раннее выявление рака желудка
и/или формировать в процессе скрининга рекомендации о необходимости
продолжения обследования пациента в специализированных центрах или
клиниках.
Анализ существующих в настоящее время скрининговых систем (в том
числе автоматизированных) показывает, что они не направлены прямым
образом на выявление рака желудка в силу специфичности симптоматики
ранней стадии развития заболевания.
Между тем, во время скрининга любого класса заболеваний
осуществляется сбор большого количества информации, отражающей
24
структурные изменения в организме человека при развитии патологических
процессов, приводящих к системным нарушениям в функционировании
различных физиологических систем. Подобная информация прежде всего
содержится в результатах стандартных анализов и физиологических пробах,
ответах
на
различные
опросники,
в
конкретизированных
или
неконкретизированных жалобах пациента.
В связи с этим целью диссертационного исследования является
разработка интеллектуальной системы поддержки принятия решений
скрининг-диагностики рака желудка, позволяющей по результатам общего
анализа крови и анамнеза определять людей с высоким риском наличия
исследуемого
заболевания
с
использованием
комбинированных
классификационных правил принятия решений.
Для ее реализации необходимо решить следующие задачи:
-
разработать
информационно-аналитическую
модель
скрининг-
диагностики рака желудка;
- разработать метод оценки классификационных возможностей структур
медицинских данных для синтеза решающих диагностических правил;
-
разработать метод синтеза нечетких решающих правил скрининг-
диагностики рака желудка на основе информации о структуре связей между
показателями крови и анамнеза пациента;
- сформировать пространство информативных признаков;
-
на
репрезентативной
диагностические
решающие
обучающей
правила
для
выборке
синтезировать
интеллектуальной
системы
поддержки принятия решений скрининг-диагностики рака желудка;
- разработать алгоритм, структуру и программное обеспечение
интеллектуальной системы скрининг-диагностики рака желудка на основе
анализа изменений в структуре связей между регистрируемыми показателями
крови пациента;
25
-
провести
верификацию
полученных
диагностических
правил
соотнесения пациента к группе риска болеющих раком желудка на
репрезентативной контрольной выборке.
26
ГЛАВА 2
МОДЕЛЬ И МЕТОДЫ СКРИНИНГ-ДИАГНОСТИКИ РАКА
ЖЕЛУДКА ДЛЯ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ПОДДЕРЖКИ
ПРИНЯТИЯ РЕШЕНИЙ
2.1 ИНФОРМАЦИОННО-АНАЛИТИЧЕСКАЯ МОДЕЛЬ СИСТЕМЫ
ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ СКРИНИНГ-ДИАГНОСТИКИ
РАКА ЖЕЛУДКА
В первом разделе была доказана актуальность диссертационного
исследования
и
обоснованы
возможности
и
преимущества
ранней
(доклинической) диагностики рака желудка в условиях скрининга и
телемедицины методами и средствами самоорганизационного моделирования
на основе метода группового учета аргументов (МГУА) в сочетании с
нечеткой логикой принятия решений.
В
основе
предлагаемого
диагностического
подхода
к
ранней
диагностике рака желудка лежит концепция рассмотрения крови как
соединительной ткани, системно присутствующей во всех участках
внутренних и внешних физиологических систем и органов и тем самым
несущей в значениях регистрируемых своих характеристик информацию об
изменениях в организме [78]. Особенно это проявляется в области
онкологических заболеваний, которые носят системный характер.
В процессе скрининг-диагностики или общей диспансеризации в
обязательном
порядке
осуществляется
общий
анализ крови
и
при
необходимости биохимический. К таким характеристикам относятся в первую
очередь такие показатели как концентрации эритроцитов, лейкоцитов,
лимфоцитов, гемоглобина, цветовой показатель, СОЭ, содержание глюкозы,
натрия, калия, билирубин и т.д. Эти показатели определим как частные,
первично регистрируемые, принадлежащие множеству {Х}.
27
Кроме того, установлено, что значения показателей крови на ранних
доклинических этапах развития злокачественных заболеваний организма в
целом (желудка, в частности) отличаются от значений на этапах выявленного
заболевания при обращении больного в клинику [123]. Регистрация и анализ
онкомаркеров крови в условиях массового скрининга не всегда возможно
(особенно в сельской местности).
Для разрешения возникающих противоречий между практическими
требованиями и реальными ограничениями существующих методических
приемов в работе предлагается информационно-аналитическая модель
поддержки принятия решений на этапе скрининг-диагностики рака желудка,
представленная на Рисунке 2.1.
Жалобы больного, образ
жизни, наследственность
Блок регистрации
текущих показателей
крови
База показателей
крови
Блок расчета
интегральных
показателей 1
Блок определения
риска заболевания
Блок расчета
интегральных
показателей 2
Блок синтеза
моделей
взаимосвязей между
показателями крови
Блок расчета риска
заболевания по
нечетким
самоорганизационным
моделям
Блок
принятия
решения
о
клиничес
ком
обследов
ании
База моделей
системных
взаимосвязей
Решение о
клиническом
обследовании
Рисунок 2.1 - Информационно-аналитическая модель скрининг-диагностики
рака желудка
На принятие управленческого решения о необходимости проведения
клинического обследования пациента на предмет выявления рака желудка
оказывают влияние различные факторы: образ жизни (прежде всего характер
питания и стрессовость повседневных ситуаций), жалобы пациента и другие
показатели функционирования определенных физиологических систем. Эти
28
показатели
формируются
блоком
«Жалобы
больного,
образ
жизни,
наследственность».
Основной группой анализируемых показателей ранней скринингдиагностики, возможности наличия онкологических заболеваний желудка
являются значения показателей, полученных в процессе лабораторного
анализа крови (при необходимости включая онкомаркеры: РЭА, СА242,
СА72.4, СА19.9). Информационный архив, на основании которого строятся
классификационные
математические
модели,
формируется
в
«Базе
показателей крови», куда вводятся данные из историй болезней людей с
клинически подтвержденным диагнозом «рак желудка» и значения тех же
показателей условно здоровых людей (не больных раком желудка).
Для постановки раннего диагноза по конкретным пациентам, данные его
показателей наряду с ранее описанной информацией о состоянии образа жизни
и субъективных жалоб пациента поступают в «Блок регистрации текущих
показателей крови», где осуществляется формирование соответствующего
вектора текущего состояния пациента.
Как и в классической системе распознавания образов для построения
классификационных правил формируются обучающие выборки, по которым
синтезируются в общем случае нечеткие правила принятия решений с
использованием самоорганизационных алгоритмов, обоснование применения
которых приведено в первом разделе диссертационной работы. Процедура
обучения реализуется в «Блоке синтеза нечетких моделей взаимосвязей между
показателями крови» предлагаемой информационно-аналитической модели. В
качестве исходных данных для работы этого блока используются как
традиционные
X = {х1 ,…, хn1 } ),
признаки,
так
определяющие
и комплекс
состав
крови
интегральных показателей
(вектор
(вектор
Y = { y1 ,… , yn2 } ). Значения интегральных показателей определяется по
формуле:
29
n
∑ (α i,k ⋅ (
Yk , j =
xi , j − X ω 0 i
Dω 0 i
i =1
)2 )
,
n
(2.1)
∑ α i ,k
i =1
где: Yk , j .- j – значение k-го интегрального показателя,
частного показателя крови у пациента,
Xω 0 i
xi , j - j-ое значение i-го
- среднее значение i-го частного
показателя в классе ω0 , Dω 0 i - дисперсия i-го частного показателя крови,
α i ,k ∈ [ 0,1]
- весовые коэффициенты, определяющие информационный вклад
показателя
xi в формирование интегрального показателя
Yk .
В работе информационно-аналитической системы предусмотрено
несколько вариантов определения указанных коэффициентов: экспертное
заключение
на
основе
дисперсионного
анализа,
использование
информационного критерия Кульбака или критерия Стьюдента.
По сути, значения данных интегральных показателей характеризируют
нормированное по дисперсии, взвешенное расстояние «образа пациента» в
гиперпространстве
определенных
частных
показателей
от
центра
альтернативного класса. Здесь и далее под альтернативным классом
понимается класс не больных онкологическими заболеваниями людей (в
дальнейшем именуется как класс «здоровые» - класс ω0 ).
Эти же интегральные показатели используются для решения задач
ранней диагностики рака желудка. Для этой задачи значения интегральных
показателей (формула (2.1)) вычисляются в «Блоке расчета интегральных
показателей 1» при формировании обучающих выборок и в «Блоке расчета
интегральных показателей 2» при решении диагностической задачи для
конкретного анализируемого пациента.
Результатом работы «Блока синтеза моделей взаимосвязей между
показателями
крови»
является
набор
моделей,
множественные связи между векторами признаков
характеризующих
X
и интегральные
30
показатели
Y
для основного (не болен раком желудка, класс ω0 ) и
альтернативного (класс ω1 ) классов.
Поскольку работа «Блока синтеза моделей взаимосвязей между
показателями крови» основана на использовании самоорганизационных
алгоритмов структурно-параметрической идентификации МГУА, получаемые
математические модели в общем виде представляются полиномами вида:
zi1 =
Aiw1,0l ,{ X }∨{Y }
nr
+∑
i =1
( Aiw1,li,{ X }∨{Y } ⋅
mr
∏
j =1, j ≠i1
p
zj
wl ,{ X }∨{Y }
i1,i , j
),
(2.2)
где: zi1 -переменная (из множеств {Х}, {Y}); A i1,i - весовой коэффициент терма
wl ,{ X }∨{Y }
i для модели отклика функции zi1 , Ai1,0
– свободный член для модели
wl ,{ X }∨{Y }
отклика zi1 в классе wl , (l = 0,1) на множестве {Х} или {Y}, Ai1,i
- весовой
коэффициент терма i для отклика функции zi1 в классе wl , (l = 0,1) на множестве
{Х} или {Y},
p
wl ,{ X }∨{Y }
i1,i , j
- степень аргумента j в терме i для модели отклика
функции отклика zi1 в классе wl , (l = 0,1) на множестве {Х} или {Y},; nr –
количество рядов селекции (термов полинома); mr – количество переменных
z. Термы и параметры полиномов определяются с использованием алгоритмов
МГУА [6].
Для удобства использования указанных моделей формируется «База
моделей
системных
взаимосвязей»,
в
которой
множество
идентифицированных моделей располагается по критерию информативности,
позволяя сократить время их выборки из базы.
В ходе обучения и «сортировки» обобщенное выражение (2.2)
интерпретируется в систему уравнений вида:
=
,
,
=
,
,
, }
,
=
←{
,
31
где верхний индекс «0» обозначает получение соответствующих уравнений на
объектах обучающей выборки. Al, Bl и Cl вектора настраиваемых параметров,
,
и
←{
, }
– функционалы, соответствующие структурам моделей
взаимосвязей исследуемых признаков (модели 2.2), идентифицированные
соответственно на множествах {X}, {Y} класса
.
В «Блоке расчета риска заболевания по нечетким самоорганизационным
моделям» основного класса заболеваний ω1 , используя вектора входных
признаков
X
и
Y
, по математическим моделям вида (2.2) вычисляются
значения модифицированных векторов класса ω1 вида:
*
X ω1 = FX 1 ( A1 , X ω1 ) ,
(2.3)
*
Y ω1 = FY 1 ( B1, Y ω1 ) ,
(2.4)
*
Y ω1 = FY 1←{ X 1,Y 1} (С1 , X ω1 ) .
(2.5)
Аналогично определяются модифицированные вектора для класса ω0 :
*
Xω0 = FX 0 ( A0 , X ω0 ) ,
(2.6)
*
Yω0 = FY 0 ( B0 , Y ω0 ) ,
(2.7)
*
Yω0 = F{Y 0← X 0,Y 0} (С0 , Xω0 ) .
(2.8)
По полученным векторам определяются пары мер близостей
соответственно между векторами { X ,
Y
*
}, { X 1 ,
Y
*
1
D
*
1
и
D
0
,
*
} и { X , Y },{ X 0 , Y 0 }.
Полученные значения мер близости являются аргументами для расчета
риска появления исследуемого заболевания соответствующим блоком
«расчета риска заболевания по самоорганизационным моделям».
С целью увеличения качества классификации, кроме показателей крови,
используются значения признаков, формируемых в блоке «Жалобы больного,
образ жизни, наследственность» с известной степенью риска pRtω1 по раку
желудка [74, 80, 96], значения которого выбираются из «Блока оценки риска
заболевания».
32
Окончательное решение о проведении клинического обследования
осуществляется путем агрегации указанных показателей риска в «Блоке
принятия решения о клиническом обследовании», по методике, описанной в
последующих разделах.
Поскольку параметрическая идентификация полинома КолмогороваГабора (формула (2.2)) осуществляется в условиях обучающих выборок
малого объема и «размытости» регистрируемых значений показателей крови в
процессе скрининг-диагностики, то рекомендуется применять теорию
нечеткой логики принятия решений в ее классификационной интерпретации
[46]. Реализация нечетких рассуждений используется в следующих блоках:
«Блок синтеза моделей взаимосвязей между показателями крови», «Блок
принятия решения о клиническом обследовании».
33
2.2 ФОРМИРОВАНИЕ ОБУЧАЮЩИХ И КОНТРОЛЬНЫХ ВЫБОРОК
И МЕТОД ОЦЕНКИ КЛАССИФИКАЦИОННЫХ ВОЗМОЖНОСТЕЙ
СТРУКТУР МЕДИЦИНСКИХ ДАННЫХ
Выбранный математический аппарат исследования относится к классу
обучаемых систем распознавания образов, которые для своего «обучения»
требуют специальной (обучающей) выборки, а контроль качества полученных
решающих правил производится на
контрольных
(экзаменационных)
выборках. Существует множество способов формирования указанных
выборок.
В предлагаемой работе выбран способ распределения всего объема
выборок из N объектов с известной классификацией на обучающую (N1
объект) и контрольную (N2 объекта) в соответствии с правилом «золотого
сечения». В соответствии с этим правилом объемы выборок распределяются
следующим образом: N1=0.62*N; N2=0.38*N. Количество объектов N
определяется в рамках требований к репрезентативности по статистическим
критериям и/или экспертами предметной области. Кроме того, считаем, что в
исходном множестве объектов отсутствуют идентичные друг другу, и удалена
артефактная информация.
Обучающие и контрольные выборки должны быть репрезентативны
относительно друг друга, т.е. подчиняться одним законам распределения. Для
решения этой задачи предлагается использовать следующий подход. Значения
всех используемых показателей нормируются в интервал [0+е,1-е] (е=1/N)
путем линейного преобразования. Затем вычисляется для каждого элемента
исходного множества (вектора значений различных показателей) средняя
величина значений показателей. По полученным значениям осуществляется
упорядочивание элементов исходного множества по возрастанию или
убыванию. В соответствии с выбранным соотношением N1/N2 формируются
обучающие и контрольные выборки по следующему алгоритму:
34
1.
Все «четные» элементы входят в обучающую выборку, нечетные
– в контрольную. При этом в контрольной выборке окажется половина
элементов исходного множества вместо требуемых (приблизительно 38%).
2.
Из полученной контрольной выборки в обучающую выборку
переводится каждый пятый элемент.
3.
При иных выбранных соотношениях объемов обучающей и
контрольной выборок выполняются действия пунктов 1 и 2 с пересчетом
«переводимых объектов».
Одной из основных операций, реализуемых в ходе синтеза решающих
правил,
является
процесс
обучения,
качество
которого
во
многом
определяется собираемой обучающей выборкой и составом информативных
признаков. Для того, чтобы учесть два этих существенных показателя в общем
качестве работы синтезируемых решающих правил, предлагается метод
оценки классификационных возможностей обучающих данных.
На основании анализа терминов и различных процедур обучения
процессам классификации (распознавания образов) можно сделать вывод, что
на будущее качество принятия решений влияют, с одной стороны,
качественный и количественный состав обучающей выборки и, с другой
стороны,
качественный
и
информативных
признаков.
характеризуются
такими
количественный
В
свою
состав
очередь,
показателями,
как
пространства
обучающие
выборки
репрезентативность
(как
принадлежность генеральной совокупности [14, 48, 124]), объем и экспертное
доверие.
Признаковое
пространство
можно
охарактеризовать
статистическими показателями информативности, экспертным доверием к
составу признаков и размерностью.
Указанные
качественные
и
количественные
показатели,
характеризующие обучающие выборки и пространство признаков носят в
основном
эмпирический
характер
с
явно
выраженной
нечеткостью
определений. Исходя из этого, для описания вводимых показателей с учетом
сложившейся терминологии в области нечеткой логики принятия решений и
35
теории уверенностей для обозначения целостной характеристики обучающей
выборки введем понятие меры доверия к обучающим способностям выборки
(МДВ), а для обозначения классификационной возможности пространства
признаков – меру доверия к признаковому пространству (МДП).
С учетом приоритетного использования в диссертационной работе
методологии нечеткой логики принятия решений показателям МДВ и МДП
придадим свойство меры доверия к принимаемым решениям Е.Шортлифа
[46], определив область их изменения в диапазоне от 0 до 1, в котором нулю
соответствует полное недоверие к обучающей выборке или составу
информативных признаков, а единице - полное доверие к ним.
Полное доверие к обучающей выборке и составу признаков означает,
что существует потенциальная возможность синтеза классификационных
решающих правил, которые никогда «не ошибаются».
Аналогичным образом для обучающей выборки определим понятие
меры доверия к репрезентативности выборки МДР, меры доверия к объему
выборки МДО, меры доверия экспертов к выборке МДЭВ. Для пространства
признаков мера доверия к информативной или информационной ценности
МДИ, мера доверия экспертов к составу признаков МДЭП, мера доверия к
размерности (количеству) информативных признаков МДК.
В зависимости от медико-технических возможностей задание и расчет
выбранных
показателей
может
осуществляться:
группой
высококвалифицированных экспертов; по статистическим критериям на
выборках различного, включая малого объема; с использованием смешанных
стратегий (эксперты, статистические расчеты, нечеткие конструкции и
операции над ними).
С
учетом
введенных
определений
предлагается
оценку
классификационных возможностей обучающих данных производить в
соответствии со следующим методом.
1.
Формируются обучающая и контрольная выборки по алгоритму,
описанному выше, и на экспертном уровне определяется состав показателей
36
МДВ=Ф1 (МДР, МДО, МДЭВ) и МДП=Ф2 (МДИ, МДЭП, МДК), где Ф1 и Ф2 функционалы агрегации составляющих МДВ и МДП.
2.
На экспертном уровне определяется способ расчета каждой из
составляющих показателей МДВ и МДП из следующего списка: экспертное
заключение, статистические оценки, смешанная стратегия.
При выборе способов оценки названных составляющих рекомендуется
придерживаться следующих рекомендаций.
2.1. Если основную работу выполняют эксперты (числовая оценка мер
доверия (функций принадлежностей и т.д.)), то с учетом сложности решаемой
задачи в соответствии с рекомендациями [5, 46] определяется количественный
состав экспертной группы и по результатам решения текстовых задач
определяется
согласованность
ее
работы
с
расчетом
коэффициента
конкордации W. Если W>0,7, то экспертная группа приступает к решению
поставленных задач. В противном случае состав группы качественно
корректируется.
2.2. Если для расчета мер доверия используются элементы нечеткой
логики
принятия
решений
модифицированной
под
решение
классификационных задач с применением методов разведочного анализа, то
используя
рекомендации
работ
[14,
48],
обеспечивается
синтез
комбинированных решающих правил для расчета выбранных составляющих
из следующего общего их списка:
{МДР, МДО, МДЭВ, МДИ, МДЭП, МДК}.
(2.9)
2.3. Если в ходе разведочного анализа удается установить гиперобласти
пересечения VП и объединения V0 двух альтернативных классов, то
формально показатель меры доверия к выборке может быть оценен
выражением:
МДВ* = 1 −
VП
V0 ,
(2.10)
37
где VП и V0 - характеристики (значения функций) пересечения и объединения
альтернативных классов ωl и ωr .
Показатель МДВ* может служить как для оценки МДВ, так и
использоваться в составе дополнительных показателей МДР, МДО и МДЭВ с
целью уточнения МДВ. Например, этот показатель может быть использован
экспертами для уточнения своего мнения о величине МДЭВ.
2.4. Показатель МДО может быть определен при известном объеме
обучающей выборки путем использования формулы, применяющейся для
расчета объема этой выборки nl для класса ωl по заданной величине ошибки
классификации или оценке вероятности правильного принятия решений.
Например, используя таблицу расчета объема обучающей выборки nl в
зависимости от сложности решаемой задачи S и выбираемой оценки
правильной классификации P [14], легко решается обратная задача по расчету
Р=МДО. Полагая nl известной величиной (число объектов обучающей
выборки реально формируемой для решения задач обучения) и при заданной
сложности решающего правила S определяем величину
MДО = f 0 ( nl , S ) ,
(2.11)
В работе [46] описан вариант расчета объёма обучающей выборки, как
зависимость вида:
nv = f П ( m,Wm , X , Kω , G 2 ) ,
(2.12)
где m - предварительное число возможных состояний, Wm -разность между
максимальным и минимальным значениями наблюдаемых признаков, G величина ошибки классификации, Kω - табличное значение коэффициента.
Решая обратную задачу при известной величине nv , получаем
выражение для расчета G и через него для Р=МДО:
МДО=1- G = f 0 ( m,Wm , X , Kω , m, nv ) .
(2.13)
38
В общем виде при известных, выбираемых для конкретных задач
значений
nv ,
решая
соответствующие
обратные
задачи,
получаем
статистические оценки МДО в виде зависимостей:
МДО = f 0 ( nv , C ) ,
(2.14)
где С – множество параметров, используемых для расчета nv .
2.5. При оценке МДП для расчета показателя МДИ удобно использовать
меру информативности I по Кульбаку с расчетной формулой вида:
МДИ =
I max − I
I max − I min ,
(2.15)
где I max и I min - максимальные и минимальные значения информативности
используемого признакового пространства.
3. Учитывая различную природу показателей, используемых для оценки
МДВ и МДП, а так же их различный вклад при решении различных типов
задач, целесообразно для агрегации частных показателей использовать
выражения вида:
МДВ =
α1 ⋅ МДР + α 2 ⋅ МДО + α 3 ⋅ МДЭВ
,
α1 + α 2 + α 3
МДП =
β1 ⋅ МДИ + β 2 ⋅ МДЭП + β3 ⋅ МДК
,
β1 + β 2 + β3
(2.16)
(2.17)
где α i , β j - весовые коэффициенты определяющие вклад частных показателей
в расчет МДВ и МДП соответственно.
4. Учитывая, что составляющие МДВ и МДП дополняют друг друга в
оценке классификационных возможностей используемых медицинских
данных, общую меру классификационного доверия к данным МДД будем
определять выражением:
МДД = МДВ + МДП − МДП ⋅ МДВ .
(2.18)
Мера доверия МДД может быть использована как для обучающих
(МДД0), так и для контрольных (МДДk) выборок.
39
Полученные значения мер МДД позволяют уточнять степень доверия к
синтезируемым решающим правилам, т.к. учитывают не только работу самих
классификационных правил, но и особенности тех данных, которые
привлекаются
для
процессов
обучения
автоматизированной системы классификации.
и
контроля
работы
40
2.3 МЕТОД СИНТЕЗА НЕЧЕТКИХ РЕШАЮЩИХ ПРАВИЛ
СКРИНИНГ-ДИАГНОСТИКИ РАКА ЖЕЛУДКА НА ОСНОВЕ
ДАННЫХ О СТРУКТУРЕ СВЯЗЕЙ МЕЖДУ ПОКАЗАТЕЛЯМИ
КРОВИ
Основой
предлагаемой
построения
классификационных
решающих
информационно-аналитической
модели
правил
в
является
рассмотренный в первой главе факт структурных изменений, происходящих в
работе определенных физиологических систем при развитии патологических
процессов [35]. Эти структурные изменения приводят к различиям векторов
состояния диагностируемых объектов в различных классах с точки зрения
классической теории распознавания образов. Кроме того, как показано в Главе
1, структурные системные изменения приводят к изменениям корреляционных
отношений между регистрируемыми и/или расчетными показателями.
Указанный факт отражается в математических моделях, структуры и
параметры которых априорно неизвестны. В этой связи и с учетом факта
наличия малых выборок при решении поставленных в работе задач
предлагается использовать самоорганизационные алгоритмы структурнопараметрической идентификация на основе метода группового учета
аргументов (МГУА), позволяющего синтезировать модели вида (2.2).
После
применения
алгоритмов
МГУА
(и
соответствующего
программного обеспечения) для синтеза моделей (2.2), отражающих связи
между рассматриваемыми в диагностическом процессе показателями крови, в
каждом из альтернативных классов w0 и w1 формируются наборы адекватных
для
классификации
математических
моделей
типов
(2.3-2.8)
(не
пересекающихся друг с другом, как минимум, по параметрам), которые
являются одним из основных блоков базы знаний соответствующей системы
поддержки принятия решений (СППР).
С учетом предложенной в разделе 2.1 информационно-аналитической
модели принятия решений по ранней диагностике рака желудка и идеологии
41
МГУА общий процесс синтеза нечетких правил принятия решений как основы
построения базы знаний, соответствующей СППР, предлагается осуществлять
в соответствии с методом, реализуемым следующей последовательностью
действий.
1.
Формируется
пространство
информативных
признаков:
X = { x1 , x2 ,..., xn1} - частные показатели общего анализа крови; Y = { y1 ,.y2 ,..., yn 2 }
- интегральные показатели; Q = {q1 , q2 ,..., qn 3} характеристики образа жизни,
предыдущих
и
существующих
заболеваний,
жалоб
больного,
наследственности и т.п..
2. В соответствии с рекомендациями раздела 2.2. формируются
обучающая и контрольная выборки, определяются частные составляющие мер
доверия к обучающим способностям выборки и признаковому пространству и
осуществляется расчет меры доверия к исходным данным МДД.
3. Для классов ω0 и ω1 в ходе реализации алгоритмов МГУА [6]
формируется пакет математических моделей типа 2.3-2.8, по которым в
соответствии
с
рекомендациями
[48]
рассчитываются
коэффициенты
2
2
детерминации моделей апроксимантов Rt и Rs (где t = 1,..., T номер моделей
(2.3)-(2.5) в общем их списке (класс ω1 ), s = 1,...,S - номер моделей (2.6)-(2.8)
в общем их списке моделей класса ω0 ). По величинам коэффициентов
детерминации рассчитываются частные меры доверия к адекватности
математических моделей МДМ0 и МДМ1 по отношению к их возможностям
описывать структуры связей между исследуемыми признаками для классов ω0
и ω1 .
В соответствии с рекомендациями [14] частные меры доверия МДМ0t и
2
2
МДМ1s определяются выражениями МДМ 0t = Rt и МДМ 1s = Rs .
В пакеты моделей включаются только те, у которых значения
коэффициентов детерминации превышают определенный пороговый
42
П
П
уровень Rt и Rs , задаваемый исследователем в соответствии с выбранным
уровнем ошибки первого рода по методике, описанной в [14].
4. Общая мера доверия к адекватности по отношению к возможностям
моделей описывать структуры связей между используемыми признаками для
каждого из классов определяется выражениями:
Т
МДМ 0 = 1 − ∏ (1 − МДМ 0t ) ,
(2.19)
t =1
S
МДМ1 = 1 − ∏ (1 − МДМ 0 s ) .
(2.20)
s =1
5. Мера доверия к адекватности моделей взаимосвязи МДМ для двух
альтернативных классов определяется выражением:
МДМ =
γ 0 ⋅ МДМ 0 + γ 1 ⋅ МДМ 1
,
γ 0 + γ1
(2.21)
где: γ 0 , γ 1 - весовые коэффициенты, определяющие предпочтение риска
соотнесения пациента к классу здоровых или возможно болеющих людей.
6. Синтезируются формулы определения мер соответствия результатов
текущих измерений xi и значений интегральных показателей yk с результатом
расчетов по математическим моделям (2.3)-(2.8).
Для расчета мер соответствия по аналогии с классическим понятием
функций принадлежности [81, 124] введем функцию соответствия результатов
модельных вычислений и измерений: f wl (di,l ) , f wl (d k,l ) .
В качестве базовой переменной выбраны меры близости di,l и d k,l между
измеренными xi и yk и вычисленными по формулам (2.3) - (2.8) xi * и yk *
значениями признаков и интегральных показателей:
d i ,l =
d k ,l =
xi − xi *
,
xi
yi − yi *
,
yi
(2.22)
(2.23)
43
где l - номер исследуемых классов ( l = 0,1 ).
Функции
соответствия
определяются
кусочно-линейными
зависимостями вида:
1, если d l ≤ a

b − d

l
fωl(d l) = 
, если b ≥ d l > a ,
b
−
a

0, если d l > b

(2.24)
где d l - базовая переменная определяемая по формулам (2.22) и (2.23).
График функции f wl (dl ) приведен на Рисунке 2.2.
f wl (dl )
1
bl
al
dl
d
Рисунок 2.2 - График типовой функции соответствия fωl ( d l )
Для построения графиков функций
fωl ( d l ) удобно использовать
гистограммы распределения классов ω0 и ω1 на шкалах d l и d k , построенные
на объектах обучающей выборки, а форму и параметры искомых функций
выбирать в соответствии с рекомендациями [46].
7. Уверенности UM ωl в отнесении неизвестного объекта описываемого
наборами признаков xi и интегральных показаний yk к исследуемым классам
состояний ω0 и ω1 ( ωl ) по моделям МГУА определяются выражением:
m1
UM ωl =
m2
∑ fω (dil ) + ∑ fω (d kl )
i =1
l
k =1
m1 + m2
l
,
(2.25)
44
где l = 0,1 , m1 - количество моделей, построенных по множеству признаков Х;
m2 -
количество моделей, построенных по множеству интегральных
показателей Y .
С целью учета «желаемых» взаимоотношений между значениями
ошибок первого и второго рода принятие классификационных решений может
осуществляться с использованием двух порогов Pω0 и Pω1 , относительно
которых строится Таблица 2.1 принятия решений. Если значение UM ωl не
превышает значения порога Pωl , то элемент таблицы равен нулю, в противном
случае - единице. Величины порогов Pωl определяются экспертами на этапе
обучения.
В качестве решения предлагается использовать заключения:
1 – пациент нуждается в дополнительном обследовании;
2 – вероятность присутствия рака желудка низка (пациент практически
здоров);
3 – высока вероятность присутствия заболевания раком желудка.
45
Таблица 2.1 - Диагностические заключения относительно порогов Pωl / l = 0.1
UM ω0 > Pω0 UM ω0 <Pω0
UM ω0 <Pω0
UM ω0 > Pω0 Идент
UM ω1 > Pω1 UM ω1 >Pω1
UM ω1 <Pω1
UM ω1 <Pω1
0
0
0
0
ифика
тор
(№)
ситуац
ии
1
0
0
0
1
2
0
0
1
0
1
0
1
0
0
3
1
0
0
0
1
Описание
ситуации
Дополнительное
обследование
Здоров – класс ω0
Дополнительное
обследование
Болен – класс ω1
Дополнительное
обследование
8. Для признаков, сформированных по анализу обследуемого Q, на
основании данных специальной литературы и опыта экспертов определяются
соответствующие риски по отношению к заболеванию раком желудка
pRtω1 .
Используя рекомендации по синтезу гибридных нечетких решающих правил,
обучаемых по структуре данных, разработанных на кафедре БМИ ЮЗГУ [46]
по значениям Q и pRtω1 , синтезируются частные решающие правила для
оценки уверенности UQ в классе ω1 :
UQ = FQ (Q, pRtω 1 ) .
(2.26)
9. Полученный в разделе 2.2 показатель МДД по отношению к
классификационным решающим правилам носит вспомогательный характер и
свидетельствует о том, что расчетные значения качества классификации могут
быть завышены из-за неучета свойств обучающей выборки и особенностей
признакового пространства. Чтобы этого не произошло в финальных
решающих правилах, целесообразно от показателя МДМ перейти к
соответствующей мере недоверия МНД=1─МДД. Аналогично определяется
мера недоверия по адекватности моделей для выражения (2.21): МНМ = 1 –
46
МДМ.
Общая
мера
классификационного
недоверия
определяется
выражением: МНК = МНД + МНМ ∙ (1 - МНД). Тогда с учетом свойств
всех частных составляющих, удовлетворяющих свойствам мер доверия и
недоверия теории уверенности Е. Шортлифа, а также учитывая, что показатель
Rtω 1 характерен только для класса ω1 , получаем аргументы для финальных
решающих правил вида:
U ω0 = UM ω0 − МНК ,
(2.27)
U ω1 = UM ω1 + UQ ⋅ (1 − UM ω1 ) − МНК .
(2.28)
Принятие решений о классификации по показателям U ω0 и Uω1 может
осуществляться с использованием правил с двумя порогами аналогично
алгоритму, описываемому Таблицей 2.1, такой алгоритм принятия решений
представлен в Таблице 2.2.
Для использования формирования рекомендуемых решений по Таблице
2.2 ЛПР определяет пороговые значения для U ω0 и Uω1 : PU ω0 и PU ω1 ,
соответственно.
Таблица 2.2 - Диагностические заключения относительно порогов
PU ωl / l = 0,1
U ω0 > PUω0 U ω0 <PUω0
U ω0 <PUω0
U ω0 > PUω0 Идент Рекомендуемое
U ω1 > PUω1 U ω1 >PUω1
U ω1 <PUω1
U ω1 <PUω1
0
0
0
0
0
0
0
1
ифика решение
тор
(№)
ситуа
ции
1
Дополнительное
обследование
2
Здоров – класс
0
0
1
0
1
0
1
0
0
3
1
0
0
0
1
ω0
Дополнительное
обследование
Болен – класс ω1
Дополнительное
обследование
47
10. На объектах контрольной выборки с известным решением
проверяется качество срабатывания полученных решающих правил, и, если
оно удовлетворяет экспертов, процесс обучения заканчивается. В противном
случае, используя пакеты обучающих программ кафедры БМИ ЮЗГУ,
осуществляется корректировка параметров решающих правил в сторону
минимизации ошибок классификации [28].
48
ВЫВОДЫ ВТОРОЙ ГЛАВЫ
В результате синтеза модели и разработки методов скрининг
диагностики рака желудка для интеллектуальной системы поддержки
принятия решений на основе комбинированных классификационных правил
были решены следующие задачи:
1. На основе применения методологии системного подхода к решению задачи
скрининг-диагностики онкологических заболеваний желудка разработана
информационно-аналитическая
модель
диагностики,
отличающаяся
одновременным анализом риска возможного наличия заболевания по
качественным признакам, характеризующим образ жизни, уровень здоровья и
другие показатели анамнеза обследуемого, и показателям общего анализа
крови, регистрируемым при первичном медицинском обследовании, с
использованием математических моделей, отражающих изменение связей
между информативными показателями при возникновении заболевания.
2. Разработан метод оценки классификационных возможностей обучающих
данных при формировании обучающей и контрольной выборок для системы
классификации, отличающийся вычислением численных значений мер
доверия на различных этапах формирования, что позволяет оценить степень
влияния содержимого выборок на качество обучения диагностической
системе.
3. Разработан метод синтеза нечетких решающих правил скринингдиагностики рака желудка на основе данных о структуре связей между
показателями крови, основанный на использования мер близостей между
регистрируемыми значениями показателей и расчетными при возможном
наличии или отсутствии заболевания согласно математическим моделям,
полученным методом группового учета аргументов.
49
ГЛАВА 3
РАЗРАБОТКА ОСНОВНЫХ ЭЛЕМЕНТОВ
ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ ПОДДЕРЖКИ ПРИНЯТИЯ
РЕШЕНИЙ СКРИНИНГ-ДИАГНОСТИКИ РАКА ЖЕЛУДКА
3.1 РАЗРАБОТКА СТРУКТУРЫ ИНТЕЛЛЕКТУАЛЬНОЙ СИСТЕМЫ
ПОДДЕРЖКИ ПРИНЯТИЯ РЕШЕНИЙ СКРИНИНГ-ДИАГНОСТИКИ
РАКА ЖЕЛУДКА
В Главе 1 на анализе различных информационных источников
показано, что основной проблемой лечения рака желудка является
несвоевременное обращение человека в медицинское учреждение, в котором
заболевание с помощью различных лабораторных и инструментальных
исследований диагностируется, как правило, на поздних стадиях развития
заболевания с высокой степенью летальности.
Анализ стран, в которых рак желудка распространен статистически
значительным превышением среднемирового значения (Япония, Центральная
Америка, Восточная Европа, Южная Америка, Южная Европа, Китай),
позволяет сделать вывод, что это связано с комплексным действием
следующих факторов: генетическая предрасположенность этнического
населения,
особенность
национального
питания,
уровень
развития
медицинской диагностической техники, периодичностью профилактических
осмотров, плотность проживания населения, психологическая напряженность
населения регионов (приводящая к физической (временной) невозможности
обращения к врачу и/или качественному проведению соответствующих
профилактических
осмотров),
уровень
развития
государственной
(бесплатной) медицины, соотношение уровня дохода с ценой медицинских
услуг ранней диагностики, мотивация к медицинскому обследованию,
географическая расположенность
(практически зоны с большим уровнем
50
онкологических заболеваний желудка расположены в областях «активного
солнца»).
В результате комплексного действия указанных факторов в этих и
подобных ареалах проживания людей практически не осуществляется ранняя
диагностика рака желудка. В целях разрешения противоречия между
государственной задачей снижения смертности населения от рака желудка и
сложностью организации процедуры ранней диагностики в ходе массового
профилактического осмотра, в том числе связанной с индивидуальной
ментальностью у населения, используют онкомаркеры (для рака желудка – это
РЭА, СА242, СА72.4, СА19.9). Однако, как было показано в Главе 1, эти
методы достаточно
дорогостоящие. Ни
один
из них
не
обладает
необходимыми специфичностью и чувствительностью, достаточными для
того, чтобы рекомендовать его для скрининга на наличие рака желудка [80,
101, 111].
Для оценки риска возникновения и/или наличия рака желудка и решения
упомянутых проблем широко используются различные «опросники», ответы
на вопросы которых характеризуют «образ жизни» обследуемого, и анамнез,
включающий в себя, в том числе, историю и наличие определенных
заболеваний, жалобы пациента на свое состояние в ходе опроса. Однако,
ответы на них носят ярко выраженный субъективный характер.
Предложенные в Главе 2 информационно-аналитическая модель
диагностики
рака
желудка
в
процессе
скрининга,
методы
оценки
классификационных возможностей обучающих и контрольных выборок для
систем диагностирования, расчет мер доверия к результатам каждого этапа
обучения системы, использование самоорганизационных алгоритмов для
идентификации
математических
моделей,
отражающих
связи
между
показателями общего анализа крови, который проводится в ходе практически
каждого профилактического осмотра, позволяют формализовать процессы
обучения и применения классифицирующей диагностической системы и
синтезировать интеллектуальную систему поддержки принятия решения
51
(СППР) о необходимости клинического обследования в случае превышения
риска
наличия
онкологического
заболевания
желудка
определенного
порогового значения. Структура интеллектуальной СППР представлена на
Рисунке 3.1.
СППР о необходимости клинического обследования
Решение о
документировании
Подсистема формирования рекомендации для ЛПР
МПО
МПРС
МДС
МПДок
МФИДП
МРЗПМ
МВФС
МВМД
МФРек
МРМБ
МВРА
Внешний интерфейс ЛПР
МВ
ЛПР
(мед. работник)
Решение
об обследовании в
клинике
внутренний интерфейс
МРМДДиМ
МПМБ
МИСП
МФИП
ППРР
ТПА
БДПА
ТКП
БДПКО
МИВТ
Внешний интерфейс оператора
МФПММ
Решение о
коррекции
подсистема настройки
Оператор
(медкибернетик)
подготовка
мед. карты по
анамнезу, собеседованию
и показателям
анализа крови
ДО
субъект
Рисунок 3.1 - Структура интеллектуальной системы поддержки принятия
решения скрининг-диагностики рака желудка
где:
БДПКО – база данных показателей общего анализа крови для обучения
системы классификации;
МФПММ – модуль формирования пакетов математических моделей;
МИСП – модуль информационной селекции показателей;
МРМДДиМ–модуль расчета мер доверия к данным и моделям;
ТПА – таблица показателей анамнеза и «образа жизни» обследуемого (Q);
МФИП – модуль формирования интегральных показателей;
ППРР – пакет программ расчета рисков;
52
МВМД – модуль вычисления мер доверия;
МВ – модуль визуализации;
МПДок – модуль подготовки документации;
МПРС – модуль протоколирования работы системы поддержки принятия
решений;
МДС – модуль диагностики состояния обследуемого (на предмет выявления
рака желудка);
МПМБ – модуль параметров для расчета мер близости (функций
соответствия результатов модальных вычислений и измерений – параметры a
и b для функций f ( d i ; l) и f ( d k ; l) в альтернативных классах w0 и w1;
МФРек – модуль формирования рекомендаций для ЛПР;
ТКП – таблица классификационных порогов;
МВФС – модуль вычисления значений функций соответствия результатов
модельных вычислений и измерений f ( d i ; l) и f ( d k ; l) ;
МВРА – модуль вычисления риска по анализу анамнеза и «образа жизни,
истории болезни, жалоб и т.п.»;
МРЗПМ – модуль расчета значений показателя по математическим моделям;
МРМБ – модуль расчета меры близости;
МФИДП – модуль формирования идентификационных данных пациента (по
медицинской карте);
БДПА – база данных показателей «образа жизни» и анамнеза;
МИВТ – модуль идентификации временного тренда;
ДО – данные для обучения системы;
МПО – модуль прогноза оперативности обследования;
ЛПР – лицо принимающее решение;
«Подготовка мед. карты по ….» - модуль подготовки электронной
медицинской
карты
субъекта
исследования,
включающей
в
себя
идентификационную информацию субъекта; формализованные результаты
опроса субъекта о его «образе жизни», жалобах, перенесенных и
53
существующих заболеваниях; необходимую для диагностики рака желудка
информацию из анамнеза – см. Таблицу 3.7;
Субъект – обследуемый на предмет выявления рака желудка и необходимости
дальнейшего дополнительного клинического обследования человек.
Предлагаемая интеллектуальная СППР состоит из двух подсистем:
«Подсистема формирования рекомендаций для ЛПР» и «Подсистема
настройки», взаимодействие которых между собой осуществляется с
помощью
внутреннего
интерфейса
системы.
Указанные
подсистемы
посредством внешнего дружественного интерфейса реализуют следующие
целевые функции системы:
- первая сообщает ЛПР информацию рекомендательного характера о
необходимости дальнейшего клинического обследования пациента;
- вторая осуществляет определение необходимых для нормального
функционирования модулей «Подсистемы формирования рекомендаций для
ЛПР» структур, параметров и условий.
«Подсистема настройки» включает в себя следующие информационно
взаимосвязанные модули: МФППММ, МРМДДиМ, МПМБ, ППРР ТПА,
МИСП, МФИП, БДКО, ТКПЮ, БДПА.
«Подсистема формирования рекомендаций для ЛПР» включает в себя
следующие
информационно-взаимосвязанные
модули:
МРМБ,
МВРА,
МРЗПМ, МВФС, МВМД, МДС, МФРек, МДС, МФИДП, МПДок, МВ, МПРС,
МПО.
«Подсистема настройки» взаимодействует посредством дружественного
интерфейса с оператором (врач-кибернетик), который в общем случае под
руководством ЛПР вводит в подсистему необходимую для этапа обучения
информацию: формирует БДПК, вводит пороговые значения уровней мер
доверия и уверенности.
ЛПР принимает следующие решения управляющего и корректирующего
характеров:
54
- о необходимости дальнейшего обследования пациента или группы
пациентов в клинических условиях (в том числе, в специализированных
медицинских центрах);
- о подготовке сопровождающей документации;
- об использовании дополнительной информации о работе «Подсистемы
формировании рекомендаций для ЛПР» – просмотр протокола работы
подсистемы в процессе формирования рекомендаций, визуализации работы
модулей подсистемы на экране монитора;
-
о
необходимости
коррекции
работы
модуля
«Подсистема
формирования рекомендаций для СППР» с помощью «Подсистемы
настройки», главным образом, путем изменения
классификационных
пороговых значений для мер доверия (недоверия), параметров функций
соответствия, таблицы, характеризующей «образ жизни», и данные анамнеза
показателей, режимов работы идентификационных алгоритмов МГУА,
механизма формирования обучающей и контрольной выборок, базы данных
для настройки (обучения) СППР.
Реализация последнего решения осуществляется в интерактивном
режиме под управлением оператора, который вводит в подсистему
необходимую для ее инициализации и функционирования информацию,
включая формирование БДПКО на основе БДА, ТПА, МПМБ, ввод данных о
пациенте или группы пациентов в «Подсистему формирования рекомендаций
для ЛПР».
При
достаточной
классификации
функции
ЛПР
и
Оператора
совмещаются в одном работнике.
Функции, реализуемые составляющими СППР при формировании
заключений
о
необходимости
клинического
обследования
модулей,
представлены в Таблице 3.1.
Инструментальные
и
программные
средства
(специальные
универсальные), поддерживающие СППР, представлены в Таблице 3.2:
и
55
Таблица 3.1 - Функционирование внутренних и внешних модулей СППР
№ Подсистема
п.п.
2
модули
Входная информация
4
Информация из ДО,
предаваемая
оператором
посредством
внешнего
интерфейса в
«Подсистему
настройки».
От ДО через
внешний интерфейс.
5
Таблица вида: <идентификатор
субъекта><идентификатор
показателя>.
6
Формирование базы
данных показателей
«образа жизни» и
анамнеза.
7
Оператор
Показатели крови – используются
МИСП и МФИП.
Оператор
От БДПКО в виде
таблиц; от МФИП в
виде значений
интегральных
показателей; от
оператора пороговое значение
ошибки первого рода
р.
Показатели крови в виде
электронных таблиц обучающей
и котрольной выборок для
МФПММ и МРМДДиМ.
Формирование базы
данных показателей
крови в виде
электронной таблицы.
Селекция показателей,
обладающих
классификационными
свойствами,
превышающими порог р.
1
1
Настройки
3
БДПА
2
-/-
БДПКО
3
-/-
МИСП
Выходная информация
Реализуемые функции
Управление
Оператор
56
Продолжение таблицы 3.1
1
4
2
-/-
5
-/-
3
МПМБ
4
Параметры функций
для вычисления мер
близостей между
результатами
модельных
вычислений и
измерений.
МРМДДиМ Обучающая и
контрольная
выборки в форме
таблиц (от МИСП);
структура и
параметры
математических
моделей (от
МФПММ), весовые
коэффициенты
α1 , α 2 , α 3 , β1 , β 2 , β3 ,
γ 0 , γ 1 (для
применения в
формулах (2.16),
(2.17) и (2.21)).
5
Таблица параметров функций для
вычисления мер близостей между
результатами модельных
вычислений и измерений.
Значения мер доверия: МДР, МДО,
МДЭВ, МДИ, МДЭП, МК, МДВ,
МДВ*, МДП, МДД, МДМ0, МДМ1,
МДМ, UM w0 , UM w1 , U w0 , U w1 –
передаются посредством
внутреннего интерфейса в МВМД
«Подсистемы формирования
рекомендаций для».
6
Формирование таблицы
параметров функций для
вычисления мер
близости между
результатами модельных
вычислений и
измерений.
Расчет значений мер
доверия к обучающей
выборке и
математическим в
МФПиМ моделям.
7
Оператор
ЛПР через
оператора
57
Продолжение таблицы 3.1
1
6
2
-/-
3
МФИП
4
Таблица показателей
крови (от БДПКО),
весовые
коэффициенты для
формирования
значений
интегральных
показателей по
формуле (2.1) (от
Оператора или
вычисляемые
непосредственно в
модуле –
определяется
оператором).
5
Значения интегральных
показателей в обучающей и
контрольной выборках (для
МРМДДиМ и МИСП), весовые
коэффициенты для вычисления
значений интегральных
показателей крови в «Подсистеме
формирования рекомендаций для
ЛПР» (передаются посредством
внутреннего интерфейса).
6
Формирование и
передача весовых
коэффициентов для
вычисления значений
интегрального
показателя крови,
формирование значений
интегрального
показателя для бучения
классифицирующей
системы.
7
Оператор
58
Продолжение таблицы 3.1
1
7
2
-/-
3
МФПММ
4
Обучающая выборка Таблица используемых
для синтеза моделей
показателей крови (от
МИСП), критерии
отбора моделей
(свобода выбора
принятия решений, тип
критерия
аппроксимации
(точность, корреляция,
несмещенность)
передается
Оператором
посредством внешнего
интерфейса.
5
Структура и параметры моделей
(согласно формулам (2.3) - (2.8))
для «Подсистемы формирования
рекомендаций для ЛПР»
(передается через внутренний
интерфейс) и для МРМДДиМ и
МРЗПМ.
6
Структурнопараметрическая
идентификация
математических
моделей, связей между
показателями крови
специализированным
программным
обеспечением
алгоритмов МГУА;
формирование пакетов
математических моделей
(для каждого
альтернативного класса
формируется свой
пакет), уверенность
применения которых
выше определенного
порогового уровня.
7
Оператор
59
Продолжение таблицы 3.1
1
8
2
-/-
3
ТКП
4
Таблица
классификационных
порогов мер доверия
Pw0 , Pw1 , PU w0 , PU w1 ,
формируемая ЛПР и
предаваемая
посредством
внешнего
интерфейса в
«Подсистему»
настройки
оператором в виде
вектора.
5
Таблица классификационных
порогов мер доверия Pw , Pw ,
0
1
PU w0 , PU w1 , передаваемая
посредством внутреннего
интерфейса в «Подсистему
формирования рекомендаций
для ЛПР».
6
Буферный модуль между
подсистемами СППР
(его существование
обусловлено
разделением во времени
функционирования
СППР на режимы
настройки и
непосредственное
формирование
рекомендаций для ЛПР.
7
Оператор
60
Продолжение таблицы 3.1
1
9
2
-/-
3
ТПА
4
Таблица показателей
анамнеза и образа
жизни, включающая
в себя наименование
показателя, ему
соответствующее
количество баллов,
номер процедуры,
реализующей
вычисление частных
показателей риска
наличия заболевания
формируемая ЛПР и
предаваемая
посредством
внешнего
интерфейса в
«Подсистему»
настройки
оператором в виде
таблицы.
5
Таблица показателей анамнеза и
образа жизни, включающая в себя
наименование показателя, ему
соответствующее количество
баллов, номер (адрес) процедуры,
реализующей вычисление
частных показателей риска
наличия заболевания.
6
Буферный модуль между
подсистемами СППР
(его существование
обусловлено
разделением во времени
функционирования
СППР на режимы
настройки и
непосредственное
формирование
рекомендаций.
7
Оператор
61
Продолжение таблицы 3.1
1
10 -/-
2
3
4
МИВТ «История» изменения
показателя крови
( PK ,
1
Формирования
рекомендаций
для ЛПР
МВ
PK ∉ { X }U {Y }) .
Выходная
информация модулей
«Подсистемы
формирования
рекомендаций для
ЛПР».
5
Структура и параметры
временного тренда показателя
крови РК.
Отображаемая по запросу ЛПР
информация о работе модулей
«Подсистемы формирования
рекомендаций для ЛПР».
7
6
Оператор
Структурнопараметрическая
идентификация
временного тренда,
отражающего динамику
поведения показателя
крови РК.
Отражает на экране
ЛПР
ЭВМ: пакет
математических
моделей (структуры,
параметры, меры
доверия МДМ, МДМ0,
МДМ1); значения мер
доверия и рисков;
содержимое таблиц
ТПА; значение порогов
из ТКП; выходная
информация МДС,
МПДок, МФРек,
МВРА, МПРС.
62
Продолжение таблицы 3.1
1
2
2
-/-
3
МВМД
4
Механизм
вычисления мер
доверия –
идентификаторы
программных
процедур,
реализующих
вычисление мер
доверия;
выходная
информация МПМБ,
МВРА, МРМБ.
5
Значения мер доверия для МДС.
6
Вычисление численных
значений мер доверия.
7
ЛПР
63
Продолжение таблицы 3.1
1
3
4
2
-/-
-/-
3
МДС
МПДок
4
- от МВМД –
значения мер
доверия;
- от МВФС –
значения функций
соответствия
результатов
модельных
вычислений и
измерений.
- информация из
МФрек о
рекомендациях по
показателям крови;
- информации из
МВРА о
рекомендациях по
показателям «образа
жизни» и анамнеза.
5
В МПДок, МФРек: состояние
субъекта исследования («здоров»,
«болен», «требуется
дополнительное обследование»);
меры доверия соотнесения к
6
7
Определение состояния
ЛПР
субъекта исследования,
мер доверия к результату
диагностики.
альтернативным классам: UM w ,
0
UM w1 U w0 , U w1 ; пороги мер
доверия.
Макет предоставляемого ЛПР
документа о необходимости
дополнительного клинического
обследования субъекта,
включающий в себя
идентификационные данные о
субъекте (обследуемом),
рекомендации о необходимости
обследования, значения
уверенностей UQ , UQw , UQw .
0
1
Формирование макета
ЛПР
итогового документа для
ЛПР.
64
Продолжение таблицы 3.1
1
5
6
7
2
-/-
3
МПРС
-/-
МФРек
-/-
МВ
4
Выходная
информация всех
функционирующих
при инициализации
работы СППР
модулей.
- из МВРА: значение
риска наличия
заболевания
показателям «образа
жизни» и анамнеза;
- из МВМД: значения
мер доверия.
Выходная
информации модулей
СППР.
5
Протокол работы СППР в формате:
«<Дата>:<ВРЕМЯ>:<ИДЕНТИФИКАТОР
МОДУЛЯ СППР>:<ВЫХОДНАЯ
ИНФОРМАЦИЯ>.
6
Формирование
протокола
работы СППР.
7
ЛПР
- значения уверенностей
Вычисление
значений
уверенностей,
формирование
рекомендаций
для ЛПР.
ЛПР
Визуализация
работы СППР
путем
отображения
результатов
работы модулей
системы на
экране ЭВМ.
ЛПР,
UQ , UQw0 , UQw1 ;
- рекомендации для ЛПР.
Символьная и/или графическая
информация, отображающая выходную
информацию результатов работы модулей
СППР на экране ЭВМ по запросу ЛПР или
Оператора.
Оператор
65
Продолжение таблицы 3.1
1
8
2
-/-
9 -/-
3
МВФС
4
Информация от
«Подсистемы
настройки»:
количество частных и
интегральных
показателей крови,
параметры функций
соответствия,
параметры функций
соответствия из
МПМБ .
МРЗПМ Значения
регистрируемых
показателей крови,
структура и
параметры
математических
моделей из МФПММ.
5
Значения функций соответствия
результатов модельных
вычислений и измерений для
каждого из альтернативных
классов.
6
7
Вычисление значений
ЛПР
функций соответствия
результатов модельных
вычислений и измерений
(формулы (2.22) - (2.24)).
Значения показателей крови
согласно базе данных моделей
(формируется по информации из
МФПММ).
Вычисление расчетных
значений показателей
крови.
ЛПР
66
Продолжение таблицы 3.1
1
10 -/-
2
3
4
5
6
МРМБ
Значения
показателей крови,
полученные по
математическим
моделям (МРЗПМ),
измеренное значение
показателей,
полученное от
Оператора через
интерфейсы
(внутренний и
внешний) из
медкарты от модуля
«Подготовка
медкарты…».
Значения уверенности в
отнесении неизвестного субъекта
к каждому альтернативному
классу: UM w , UM w .
1
0
Расчет значений мер
близости.
7
ЛПР
67
Продолжение таблицы 3.1
1
2
11 -/-
3
МПО
12
ЛПР
13
Оператор
4
Время развития
заболевания от его
начала до
появления метастаз
Т0,
корректирующие
параметрыa1 b1
(формула (2.29)),
структура и
параметры
временного тренда.
5
Значение критического времени
клинического
обследования,
прогноз поведения показателя
} { }).
крови (PK, PK∉{XUY
6
Прогнозирование
поведения
показателя
} { }).
крови (PK, PK∉{XUY
7
ЛПР
Принятие решений:
- о необходимости
клинического
обследования;
- о подготовке
документации;
- о коррекции
диагностической
системы (подсистемы
настройки).
Ввод информации в
СППР.
ЛПР
ЛПР
68
Продолжение таблицы 3.1
1
14
2
3
ДО
4
Результаты
обследования
субъекта (значения
показателей крови и
«образа жизни» и
анамнеза по
документам о
результатах
профилактического
осмотра, передается
в «Подсистему
настройки» через
внешний
интерфейс.
5
Информация
о
значениях
показателей крови и «образе
жизни»
и
анамнезе
для
формирования множеств для
обучения
системы
классификации
(передается в БДПКО и БДПА,
соответственно).
6
Формирование данных
для обучения системы
классификации.
7
Оператор
69
Продолжение таблицы 3.1
1
2
3
4
5
15
Подготовка
медкарты
Паспортные
данные
обследуемого;
результаты общего
анализа крови;
информация об
имеющихся
заболеваниях,
жалобах, «образе
жизни»
обследуемого.
16
Внутренний
интерфейс
Выходная
информация от
модулей:
МФПММ,
МРМДДиМ,
МИВТ, МПМБ,
ППРР, ТПА,
БДПА.
Электронная медицинская карта,
включающая только показатели
из информативного признакового
пространства
в виде таблицы, каждая строка
которой представляется в
формате:<ИДЕНТИФИКАТОР
СУБЪЕКТА
(обследуемого>;<ЗНАЧЕНИЯ
ПОКАЗАТЕЛЕЙ ОБЩЕГО
АНАЛИЗА
КРОВИ>;<ПОКАЗАТЕЛИ
«ОБРАЗА ЖИЗНИ»,
ИМЕЮЩИЕСЯ И/ИЛИ
ПЕРЕНЕСЁННЫЕ
ЗАБОЛЕВАНИЯ (ИЕ),
АНАМНЕЗ>.
Входная информация для
модулей: ПРЗПМ, МВФС,
МВМД, МФРек, МВРА.
6
7
Формирование
электронной
медицинской карты
обследуемого.
ЛПР,
оператор
Взаимодействие
подсистем СППР:
«Подсистемы
формирования
рекомендаций для
ЛПР» и «Подсистемы
настройки».
Специализ
ированное
ПО
70
Окончание таблицы 3.1
17
Внешние
интерфейсы
18
Субъект
Информация, в том Информация для ЛПР и
числе
Оператора о функционировании
управляющая, от
подсистем СППР.
ЛПР и Оператора
для подсистем
СППР.
Результаты анализов крови,
анамнез, собеседования с
обследуемым.
Организация
интерактивного режима
работы СППР с ЛПР и
Оператором.
ЛПР,
оператор
ЛПР,
оператор
71
Таблица 3.2 - Инструментальные и программные средства поддерживающие СППР
№ п.п.
1
Подсистема
модули
1
2
Формирования рекомендаций для ЛПР
МРМБ
2
-/-
МВ
3
4
5
-/-/-/-
МПРС
6
7
8
9
-/-/-/-/-
МДС
МФРек
МПДок
МВ
10
11
12
-/-/-/-
МПРС
МПО
МРЗПМ
3
Поддерживающие
инструментальные и программные
средства
4
Excel
Excel,средства отображения
символьной и графической
информации операционной
системы
Word (текстовый редактор)
МВФС
МВМД
Excel
Excel, Word (текстовый редактор)
Драйверы ОС, поддерживающие
отображение символьной и
графической информации
Word (текстовый редактор)
Excel
Специализированное ПО
72
Продолжение таблицы 3.2
13
Настройки
МФПММ
14
15
16
17
18
19
20
21
22
-/-/-/-/-/-/-/-/-/-
МРМДДиМ
МПМБ
ТПА
МИСП
МФИП
БДПКО
ТКП
БДПА
МИВТ
23
24
25
26
27
ЛПР
Оператор
ДО
Подготовка
мед.карты…
Внутренний
интерфейс
Специализированное программное
обеспечение
структурнопараметрической идентификации
моделей связи между показателями
крови (формула (2.2)) методом
группового
учета
аргументов
(МГУА)
Excel
Excel, MGUAtrend –
специализированное программное
обеспечение
Драйверы клавиатуры и «мыши»
Excel
Специализированное программное
обеспечение
73
Окончание таблицы 3.2
28
Внешний
интерфейс
Специализированное программное
обеспечение
74
Таким образом, предлагаемая структура интеллектуальной СППР
скрининг-диагностики
рака
желудка
соответствует
общей
идеологии
функционирования автоматизированных систем скринирующей диагностики,
разработанной Шаповаловым В.В. [19], и позволяет формировать в процессе
скрининг-диагностики
рекомендации
о
необходимости
обследования
пациента в специализированных центрах или клиниках. В её содержании
можно выделить следующие кластеры:
1. Кластер баз данных (КБД) поддерживается функционированием модулей
БДПКО, ТПА, МПМБ, ТКП, БДПА.
2. Кластер баз знаний (КПЗ) поддерживается функционированием модулей
МРМДДиМ, ППРР, МВМД, МДС, МВФС, МВРА, МРЗПМ, МРМБ, МИВТ,
МПО.
3. Кластер функционального обеспечении (КФО) взаимодействия КБД, КПЗ
поддерживается функционированием модулей МФПММ, МИСП, МФИП.
4. Кластер интерфейса (КИ) поддерживается функционированием модулей:
МВ, МПДок, МПРС, МФРек, МФИДП.
В качестве иллюстрации работы СППР на Рисунках 3.2-3.10 приведены
скриншоты интерфейсов работы ряда модулей системы:
1. Модуль
МФПММ
–
модуль
формирования
пакетов
математических моделей (для каждого альтернативного класса формируется
характеризующий его пакет).
Рисунок 3.2 - Скриншот «Демонстрация работы» модуля МФПММ
75
Рисунок 3.3 - Скриншот «Определение режима» модуля МФПММ
Рисунок 3.4 - Скриншот режима «Ввод информации с клавиатуры» модуля
МФПММ
Рисунок 3.5 - Скриншот режима «Назначение отклика и аргументов» модуля
МФПММ
76
Рисунок 3.6 - Скриншот режима «Задание критерия селекции» модуля
МФПММ
Рисунок 3.7 - Скриншот режима «Просмотр параметров
идентифицированной модели» модуля МФПММ
В
модуле
МФПММ
осуществляется
структурно-параметрическая
идентификация математических моделей - апроксимантов вида (2.2) с
помощью специализированного программного обеспечения, реализующего
ортогональный алгоритм МГУА между анализируемыми показателями в
альтернативных классах w0 и w1. Ввод значений показателей осуществляется
как непосредственно «Оператором», так и путем импорта из Excel. Настройка
режимов работы модели осуществляется «Оператором» в интерактивном
режиме посредством «Внешнего интерфейса».
Для каждой идентифицированной модели вычисляются значения
коэффициентов детерминации
Rt2 и Rs2 . Как указывалось в разделе 2.3, в
пакеты включаются только те модели, у которых значения коэффициентов
П
П
детерминации превышают определенный пороговый уровень Rt и Rs ,
77
задаваемый исследователем (например, для уровня ошибки первого рода
p<0.01, объемом выборки, на которой производилась идентификация,
превышающим
50
объектов,
пороговые
значения
коэффициентов
детерминации менее 0,13). Получаемые в ходе синтеза модели представлены
в формате, приведенном в Таблице 3.3. В этой таблице показан фрагмент
выходной информации модуля МФПММ (класс w0 ). Для класса w1 формат
выходной информации аналогичен.
Таблица 3.3 - Формат представления моделей апроксимантов в модуле
МФПММ
класс №
п.п.
Иденти- Постоянный
№
фикатор член модели терм
отклика (2.2) (Аi1,0) в а
Параметры
терма
Коэффициент
детерминации R2
отклика
хi
(i=1,n1)
на
множествах {X}
или {Y} в классе
w0
классе
wl , l = 0,1
1
W0
2
1
3
4
5
A0,w0x1
x1
6
w0
A1,1
1
7
8
w0
p1,1,2
( R1w0. ) 2
…
w0
p1,1,
n1
w0
A1,2
2
w0
p1,2,2
…
w0
p1,2,
n1
w0
A1,3
3
w0
p1,3,2
…
w0
p1,3,
n1
…
…
…
…
…
…
78
Окончание таблицы 3.3
1
2
Т
3
4
5
w0
0, xn1
xn1
1
A
6
w0
n1,1
A
7
(R )
…
0
Anw1,2
w0 2
n1
p
0
pnw1,1,
n1−1
2
8
w0
n1,1,1
0
pnw1,2,2
…
0
pnw1,2,
n1−1
0
Anw1,3
3
{X }
0
pnw1,3,1
…
0
pnw1,2,
n1−1
1
A0,w0y1
y1
A1,1w0
1
w0
p1,1,2
( R1w0 ) 2
…
w0
p1,1,
m1
w0
A1,2
2
{Y }
w0
p1,2,2
…
w0
p1,2,
m1
w0
A1,3
3
w0
p1,3,1
…
w0
p1,3,
m2
0
pmw1,1,
m1−1
…
0
Amw1,1
…
1
…
A0,w0ym1
…
ym1
…
…
…
S
( Rnw20 ) 2
…
0
pmw1,1,
m1−1
2
0
Amw1,2
w0
p1,2,
m1−1
…
0
pmw1,2,
m1−1
3
0
Amw1,3
0
pmw1,3,
m1−1
Включенные в «пакет математических моделей» модели используются в
модуле «Подсистема настройки» для вычисления соответствующих меры
доверия ( МДМ 0t , МДМ 1s , МДМ 0 , МДМ 1 ) для каждого из альтернативного
класса по описанным в Главе 2.3 правилам.
79
2. Фрагмент работы «Оператора» при вводе информации о пациенте в
процессе диагностики предоставлен на Рисунках 3.8 и 3.9.
Рисунок 3.8 - Скриншот «Ввод данных показателей крови при диагностике»
3. Модуль БДПКО - база данных показателей общего анализа крови.
Рисунок 3.9 – Скриншот «Форма окна редактирования базы данных»,
взаимодействия «Оператора» и БДПКО
80
4. Модуль МПО - модуль прогноза оперативности обследования.
Часто возникает необходимость оценки времени развития заболевания
(от текущего срока регистрации характеристик до момента клинического
обследования).
Обозначим время развития заболевания от его начала до момента
появления метастаз через Т0. Тогда «критическое» время от начала
регистрации показателей {X} и {Q} до клинического обследования
предлагается определять по формуле:
 T0
 a1

T = 2 ⋅ T0
b1 ⋅ T
0


, a1 ≥ 2
ситуация 3
.
, ситуация 2
, b1 ∈ [1, 2] ситуация 1
(3.1)
(Численные значения корректирующих параметров в (3.1) определяется
экспертным путем или в процессе «диалога» ЛПР с СППР в зависимости от
величины
превышения
уверенностей
соотнесения
обследуемого
к
альтернативному классу wl / l = 0;1 )
В случае постоянного наблюдения за значениями диагностических
T0
показателей (не реже, чем за период времени 10 ) осуществляется построение
прогностических
идентифицирующих
моделей
с
временной
помощью
тренд
алгоритмов
(программное
МГУА,
обеспечение
представлено в [56]). На Рисунке 3.10 приведен пример настройки режима
прогноза развития показателя.
81
Рисунок 3.10 - Скриншот «Настройка режима прогноза развития показателя»
модуля МПО
Модуль МПО на основе временного ряда, отражающего развитие
показателя крови во времени, осуществляет синтез математической модели,
включающей в себя две составляющие: тенденцию временного тренда и
колебательную, что позволяет осуществлять прогноз с учетом естественных
автоколебаний как составляющих динамики показателя.
5. Модуль БДПКО – база данных показателей общего анализа крови
(данные формируются в электронной таблице Excel, а затем импортируются в
базу данных), фрагмент которой представлен в Таблице 3.4.
Таблица 3.4 - Фрагмент данных для обучения СППР в модуле БДПКО.
Срок
№
заболевания
Цветовой
п.п. пол возраст
(лет)
Эритроциты Гемоглобин показатель Моноциты СОЭ
1
м
542
4,4
140
0,95
2
5
2
м
391
4,4
146
0,99
2
3
3
м
435
4
122
0,91
2
10
4
м
401
4,7
150
0,95
4
6
Таким образом, предлагаемая интеллектуальная СППР скринингдиагностики рака желудка, отличающаяся функциональным разделением на
две подсистемы («настройки» и «формирования рекомендаций для ЛПР») и
вычислением мер доверия к результатам функционирования модулей системы
на различных этапах ее функционирования, учитывает показатели состояния
82
пациента объективного и субъективного характеров и
формирует
рекомендации о необходимости дальнейшего клинического обследования с
указанием ЛПР коэффициентов уверенности в рекомендациях.
83
3.2 ФОРМИРОВАНИЕ ПРОСТРАНСТВА ИНФОРМАТИВНЫХ
ПРИЗНАКОВ
Одной из основных задач оптимального построения диагностических
(классификационных)
систем
является
адекватный
выбор
множества
признаков, характеризующих альтернативные классы. В рассматриваемом
случае это классы людей, возможно болеющих раком желудка и не
страдающих указанным заболеванием.
Для выбора множества признаков, обладающих необходимой степенью
классификационных возможностей, предлагается следующая методика.
Пусть задано некоторое исходное множество признаков (показателей)
{Pr}g (g – исходное количество признаков, g≠0). Требуется сформировать
множество признаков {Prо}gо (gо – количество признаков, 1≤go≤g),
обладающее наибольшими классификационными возможностями.
Поскольку при построении систем классификации прикладного
характера решается частная задача из конкретной предметной области, то на
первом этапе отбор признаков осуществляется экспертным путем (анализ
мнений специалистов и/или справочных источников). Таким образом,
формируется множество {Prоэ}gоэ (gоэ – количество признаков, отобранных
экспертным путем , 0≤goэ≤gо).
Из разницы между множествами {Pr}g и {Prоэ}gоэ возникает задача
отбора
признаков,
возможностями,
обладающих
наибольшими
апробированными,
классификационными
статистически
доказуемыми,
формализованными методами.
Для этого необходимо иметь по каждому из альтернативных классов
некоторые множества численных или иных данных. Поскольку речь идет, в
данном случае, о разведочном анализе, то с учетом их априорной
принадлежности
к
нормальному
закону
распределения,
объем
вышеупомянутых множеств может быть достаточно небольшим (15-20
элементов, согласно [29,69]).
84
В этом случае для отбора признаков используются значения
коэффициентов
Стьюдента
различий
между
двумя
выборками
на
определенном уровне ошибки первого рода. При решении диагностических
задач в медицине численное значение указанной ошибки, как правило,
принимается в диапазоне [0.05; 0.1]. Конкретное значение определяется из
предъявляемых требований к качеству диагностической системы и объему
выборок. С учетом возможной потери информативного признака для
дальнейшего построения системы классификации в условиях небольшого
объема выборок рекомендуется выбирать верхнюю границу указанного
интервала.
В Главе 2 показано, что наряду с регистрируемыми частными
показателями общего анализа крови (множеством {Х}) для повышения
качества скрининг-диагностики рака желудка рекомендуется формировать
дополнительное множество интегральных показателей (множество {Y}),
расчет элементов которого проводится по формуле (2.1). Весовые
коэффициенты
α i , k ∈ [0 ,1]
в указанной формуле (указанные коэффициенты
одинаковы для всех альтернативных классов) предлагается определять
следующими способами:
1. Путем назначения экспертами, исходя из личного опыта и анализа
информационных медицинских источников.
2. Автоматически – на основе применения определенного статистически
обоснованного математического аппарата.
3. Смешанным способом.
Во всех трех способах (особенно при применении способа 3)
необходимо иметь единые шкалы измерений и ограничений. В настоящем
диссертационном исследовании в качестве таковых были приняты:
α i, k ≥ 0 ,
n
∑α
i =1
i, k
=1 ,
(3.2)
где n – количество частных показателей множества {Х}, k – номер
интегрального показателя Y (k≥0).
85
Предлагается следующая методика определения рассматриваемых
весовых коэффициентов
α
i, k
на основе вычисления статистических критериев
(действительна только при наличии двух альтернативных классов):
1. Регистрируются для каждого из альтернативных классов значения
w
элементов множеств {X}n l / l = 0,1 (где n – количество частных показателей
(крови)).
2. По значениям коэффициента Стьюдента на заданном уровне
значимости (ошибки первого рода) осуществляется селекция показателей с
предположительно незначительными классификационными возможностями.
В результате селекции для дальнейшего формирования информативного
l
признакового пространства используется множество { X }w
mx
(где mx –
количество показателей крови, оставшихся после селекции).
3.
По
каждому
показателю
(признаку)
l
{ X }w
mx
вычисляются
коэффициенты Стьюдента различий между двумя альтернативными классами
– формируется множество {T }m , элементами которого ( ti
x
i =1,mx ) являются
значения коэффициентов Стьюдента.
4. Элементы полученного множества {T }m ранжируются по убыванию
x
или возрастанию. Строится диаграмма значений полученного ряда, по которой
исследователь определяет необходимое количество (my ,my≤mx) и «состав»
интегральных показателей путем выделения кластеров близких (по некоторой
мере исследователя) значений ранжированных коэффициентов Стьюдента.
5.
Каждому
кластеру
k
(k=1,…,my)
ставится
в
соответствие
определенный интегральный показатель Yk и соответствующее подмножество
l . Формула (3.2) модифицируется в формулу:
частных показателей { X }w
mx
α i, k ≥ 0 ,
mk
∑α
i =1
i, k
=1 .
(3.3)
6. Для каждого интегрального показателя Yk с учетом вычисленных в п.2
значений коэффициентов Стьюдента и выделенных в п.3 кластеров
86
определяются значения соответствующих весовых коэффициентов в (3.3) по
формуле:
α i, k =
t i, k
mk
∑t
i =1
Полученные
величины
.
(3.4)
i, k
весовых
коэффициентов
позволяют
в
дальнейшем формировать значения интегральных показателей из множества
{Y}.
Таким образом, множество информативных признаков
решения
задачи
обучения
системы
классификации
{Pr}g для
(диагностики)
формируется по формуле:
{Pr}g = { X }*m x + {Y }*m y + {X}*m 'ý
,
(3.5)
где { X }m ,{Y }m ,{ X }m , соответственно, множество отселектированных
x
частных
y
показателей
'ý
по
изложенной
выше
методике,
множество
отселектированных интегральных показателей, множество отобранных
экспертом
показателей.
Элементами
всех
множеств
являются
«идентификаторы» показателей.
Исходное множество частных показателей общего анализа крови
определялось экспертами – медиками в соответствии с рекомендациями [65].
Была сформирована группа из 9 высококвалифицированных экспертов
(четыре доктора наук, два кандидата наук и три врача высшей квалификации).
Коэффициент конкардации экспертов выбранной группы составил 0,86. В
результате в исходное множество анализируемых показателей были
включены: Х1 – «Эритроциты», Х2 - «Гемоглобин», Х3 – «Цветовой
показатель», Х4 – «Лейкоциты», Х5 – «Эозинофилы», Х6 –«Палочкоядерные»,
Х7 – «Сегментоядерные», Х8 – «Лимфоциты», Х9 – «Моноциты», Х10 – СОЭ.
Для решения задач диссертационного исследования требовалось
сформировать информативное множество значений показателей общего
анализа крови для скрининг-диагностики рака желудка. Рассмотрим
87
применение предлагаемой методики на основе 3 способа (смешанного) формирование множества {Prо}gо.
1 этап. В результате анализа справочной литературы [123] во множество
{ X }m'ý включены элементы: Х1 (эритроциты). Х2 (гемоглобин), Х10 (СОЭ).
2 этап. Формируем для каждого из альтернативных классов значения
элементов множеств { X }n l ,
w
l = 0,1 , n=20 (В Таблице 3.5 представлен
фрагмент).
Таблица 3.5 - Множество значений частных показателей (фрагмент)
Класс w1
1
1
2
3
4
5
5
7
8
9
10
2
3
х3
х4
0,926
7,05
0,821
7,8
0,944
8
0,870
7,3
0,882
6,15
1,020
7,1
0,900
3,7
0,875
17,6
0,611
4,2
0,952
5,1
4
х5
5
х6
6
х7
7
х8
8
х9
1
2
1
4
0
2
6
0
4
2
14
4
6
1
4
5
1
7
1
4
45
81
64
55
77
59
71
64
47
43
38
10
27
36
17
30
21
26
46
47
2
2
2
4
2
4
1
2
2
4
4
2
2
1
5
4
1
1
0
0
6
7
5
2
1
1
2
4
8
8
57
61
67
48
55
53
58
51
70
54
30
27
24
40
34
34
36
36
18
34
3
3
2
9
5
8
3
8
4
4
Класс w0
1
2
3
4
5
6
7
8
9
10
0,932
0,979
0,926
0,962
0,935
0,957
0,962
0,980
0,955
0,995
7,4
7,8
8,5
5,4
5
5,5
5,3
5,0
6,4
4,7
По сформированным множествам формируем множество {T }m .
x
88
Таблица 3.6 - Значения коэффициентов Стьюдента - t (различий между
выборками).
Показатель х3
T
2,33
х4
х5
х6
х7
1,05 0,25 0,21 0,71
х8
0,36
х9
2,92
На уровне значимости ошибки первого рода p<0.1 выделяем показатели
Х3 (цветовой показатель) и Х9 (моноциты), которые формируют множества
{ X }mwxl ,
mx = 2 ;l = 0,1 .
Поскольку у двух оставшихся показателей значения коэффициента
Стьюдента близки, то принимается решение об объединении их в единый
кластер для формирования интегральной переменной Y по формуле (2.1) с
весовыми коэффициентами: αx3 = 0.44 , αx9 = 0.56 . В этом случае, согласно (2.1),
получаем следующую формулу для вычисления интегрального показателя:
Y =
0 .44 ⋅ ( x 3 − 0 .96 ) 2 0 .56 ⋅ ( x 9 − 4 .9 ) 2
+
0 .002
5 .7
,
(3.6)
где x3, х9 – значения показателей Х3 и Х9; численные значения
математических ожиданий и дисперсий соответствующих показателей
полученных на выборке { X }mw0 .
x
Назовем этот показатель Y – «ЭрГеМо». Это обуславливается тем, что в
него входит «Цветовой показатель» и «Моноциты». Первый, в свою очередь,
рассчитывается
исходя
из
значений
показателей
«Эритроциты»
и
«Гемоглобин».
Для его включения в множество признаков, предположительно
обладающих классификационными возможностями, убеждаемся, что ошибка
первого
рода
различий
между
альтернативными
классами
менее
определенного порога 0,1.
Таким образом, множество информативных признаков (с точки зрения
классификационных («разделительных») возможностей) составляют частные
89
показатели крови – «Эритроциты», «Гемоглобин», «Цветовой показатель»,
«Моноциты», «СОЭ» и интегральный показатель «ЭрГеМо».
90
3.3 СИНТЕЗ ФУНКЦИЙ РИСКА ДИАГНОСТИКИ РАКА ЖЕЛУДКА
В процессе диагностического процесса с помощью рассмотренной в
п.3.1 системы поддержки принятия решений скрининг-диагностики рака
желудка (Рисунок 3.1) лицу, принимающему решение (медицинский
работник), предоставляется рекомендация о необходимости клинического
обследования.
Одной из составляющей формулы (2.26) является риск наличия
онкологического заболевания желудка, определенный по анализу образа
жизни,
субъективным
жалобам,
перенесенным
и
существующим
заболеваниям, возрасту обследуемого и т.д. и отраженный в анамнезе
пациента - pRt w (см. Главу 2).
1
Анализ различных информационных источников [80, 96], мнений
экспертов (практикующих врачей) позволил сформировать множество
показателей упомянутого характера (показатели множества {Q}46), разбить их
на группы по семантической нагрузке, определить баллы и составляющие
влияния группы на Rt w (назовем их групповыми показателями риска по
1
анамнезу), RQt g,w (g –номер семантической группы) - представлены в Таблице
1
3.7.
Таблица 3.7 - Факторы риска заболевания раком желудка по показателям
множества {Q}
группа Группа показателей Qg Семантика показателя
NQg
1
2
3
1
Половозрастной
фактор
Мужчины, 55 лет и старше
Женщины, 60 лет и старше
Мужчины моложе 55 лет
Женщины моложе 60 лет
Бал
л
4
RQt g,w1
1
1
0
0
FQ1
5
91
Продолжение таблицы 3.7
1
2
3
2
Страна проживания
Особенности питания
4
Употребление
алкоголя
5
Курение
3
4
5
Япония, Центральная
Америка, Восточная
Европа, Южная Америка,
Южная Европа, Китай
1
Другие страны
Чрезмерное увлечение
пищей: копченой,
острой,
соленой,
жареной (пережареной),
консервированной пищей,
длительно хранящимися
продуктами,
содержащими нитраты
Злоупотребление
0
Чрезмерное
0-10 FQ5
FQ2
FQ3
1
1
1
1
1
1
1
0-10 FQ4
92
Продолжение таблицы 3.7
6
Общее самочувствие
Понижение аппетита
8
Изменение пищевых
пристрастий
10
Постоянное повышение
температуры (370-380)
5
Ощущение тяжести
в животе после еды,
тошнота и рвота, быстрая
насыщаемость
8
8
Желудочный дискомфорт
5
Нарушение стула (поносы,
запоры)
10
Желудочно-кишечные
кровотечения
3
Опоясывающие боли
5
Увеличение объема живота
8
Похудение
5
Общая слабость, снижение
трудоспособности
5
Побледнение покровов, их
пастозность или отечность
5
Психическая депрессия
(потеря целесообразности
труда, отчужденность,
апатия)
FQ6
93
Продолжение таблицы 3.7
1
7
2
3
Ранее перенесенные Гастриты (с пониженной
кислотностью), язвы и
болезни
полипы желудка
4
5
Операции на желудке
6
Пернициозная
(злокачественная) анемия
10
5
FQ7
Резекция желудка
Неэпителиальные опухоли
желудка
Язвенная болезнь желудка
8
10
Первичные и вторичные 5
иммунодефицитные
состояния
6
Длительно существующее
воспаление желудка
Частичное
удаление 4
блуждающего
нерва
(ваготомия)
6
8
Болезнь Менетрие
Гипертрофическая
гастропатия
0-1
FQ8
9
Вирусы и бактерии
Наличие
в организме бактерии
Helicobacter pylon
10
FQ9
8
10
Семейный анамнез
11
Характер ритма
жизни
Вирус Эпштейн-Барр
Больные раком желудка
близкие родственники
Беспорядочный
Напряженный
Стрессовый
0-5
FQ10
0-5 FQ11
0-5
0-10
94
Окончание таблицы 3.7
13
Недостаток
физической
активности
Дефициты
14
Окружающая среда
12
0-5
FQ12
Витамина В12
Витамина С
Овощей и фруктов
Работа с химическими
веществами: металлическая
пыль, отходы горной
промышленности при
разработке карьеров,
камнерезанье, отработанное
дизельное топливо, радон,
асбест, никель, резина,
минеральные масла
0-5
0-5
0-5
10
FQ13
Ионизирующее излучение
8
FQ14
В таблице: Qg – группа показателей из {Q}46 (см. п.2.3); RQt g,w 1
составляющие влияния группы показателей Qg на риск возникновения и/или
наличия рака желудка ( RQt w1 ∈ [0,1] ); NQg – номер группы показателей Qg;
FQ NQ g
частный
показатель
риска,
аргумент
некоторой
функции,
определяющей значение RQt g,w в зависимости от баллов показателей Qg в
1
группе NQg.
На основании изучения литературных источников, мнения экспертов
для
каждой
функции
FQ NQ определим
правила
g
ее
вычисления,
представленные в Таблице 3.8. В таблице использованы следующие условные
обозначения:
∑
NQg
- сумма баллов в соответствующей группе
NQg
показателей из {Q}, если последних в группе более одного;
∑ball =
∑ +∑
1
2
+∑ 3 +∑ 4 +∑ 5 +∑ 6 +∑
2.85
10
+∑
11
+∑
12
+
∑
13
+∑
14
.
95
Таблица 3.8 - Формулы определения частных рисков FQ NQ g
NQg
1
Частный показатель риска FQ NQ
Для мужчин: 0 .2 ⋅ 2
Voz − 60
60
g
,
Voz − 55
Для женщин: 0 . 1 ⋅ 2 55 ,
где Voz – возраст в годах.
2
3
4
5
6
7
8
9
10
11
12
13
14
Для
0, 2 , ∑

0.1 , ∑
∑ 3 −7
0.3 ⋅ 2 7
0.4 ⋅ exp(
0.4 ⋅ exp(
0.5 ⋅
0.6 ⋅
∑
4
=1
2
=0
− 10
10
− 10
5
10
)
)
6
85
∑
7
60
0.7 , если

, если
0
1
, если

0, 9 , если

0,8 , если
0, 4 ⋅ ∑ 10
∑
∑
∑
∑
∑
8
=1
8
=0
9
= 18
9
= 10
9
=8
∑
∑
∑
0.2
, если

, если
0.1

0.02 ⋅ ∑ , если
0.02 ⋅ ∑ 12
0.02 ⋅ ∑
группы
11
≥ 10
11
∈ [5,10]
11
<5
13
0.5 , если

0.15 , если
определения
доминирующие
∑
∑
2
риска
∑
∑
10
= 18
10
< 18
pRt w1
показателей
первоначально
NQ7,
NQ8,
рассчитывается значение промежуточной переменной R:
NQ9,
анализируются
по
которым
96
0.7

0.6

R = 0.6

0,8
0,9

∑ ≥ 0.9 &
, если ∑ = 0.7 &
, если ∑ ≥ 0.2 &
, если ∑ + ∑ + ∑
, если ∑ + ∑ + ∑
, если
∑
∑
∑
9
8
7
7
8
7
9
8
7
8
7
+∑
+∑
+∑
8
<1
9
< 0.16
8
< 1.2
.
(3.7)
≥1
9
≥ 1,9
Сущность переменной R – риск наличия заболевания в условиях
практически полного отсутствия значений субъективных показателей в
анамнезе пациента при наличие таковых в доминирующих группах (что
маловероятно).
Затем рассчитывается итоговое значение общего риска:
0.5⋅ ∑ball

R
Rtw1 = 
R + 0.5⋅ ∑ball − R ⋅ 0.5⋅ ∑ball
0, если
∑ 7 +∑ 8 +∑ 9 =0

∑ +∑ +∑
, если ∑ball < 0.15
, если ∑ + ∑ + ∑
& ∑ball < 0.15
, если
7
7
8
9
=0
&
∑ball ≥ 0.15
8
≠0
9
&
∑ball ≥ 0.15
.
(3.8)
Таким образом, предлагаемая методика позволяет определить значение
риска наличия рака желудка Rt w путем анализа анамнеза пациента без
1
проведения
лабораторных
исследований
и
формирования
множеств
показателей крови { X }n1 и {Y }n 2 , имеющих количественную меру измерения.
Как отмечалось в Главе 2, данные множества позволяют сформировать
пакет математических моделей, отражающих связи между показателями в
различных альтернативных классах, по которым на одном из этапов
вычисления финальной функции уверенности U w / l = 0;1 (формулы (2.27),
l
(2.28)) определяется уверенность UM w в отнесении неизвестного
l
объекта
(пациента) по определенным значениям частных и интегральных показателей
к определенному диагностическому классу.
Для этого применяется формула (2.25), включающая в себя значения
функций соответствия результатов модельных вычислений и измерений
97
анализируемых показателей крови ( f wl (di,l ) и f wl (d k,l ) ), вычисление которой
осуществляется по формуле (2.24). Оценка параметров формулы (2.24)
осуществляется по методу, изложенному в работе [46], предполагающему
анализ пересечения «классификационных гистограмм» для альтернативных
классов, построенных на различных аргументах (показатели, разделяющие
гиперплоскости в случае применения дискриминатного анализа, иных типов
разделяющих гиперповерхностей и т.п.).
В первом приближении, учитывая малые объемы обучающих выборок
и предполагая, что значения функций f wl (di,l ) и f wl (d k,l ) коррелируют со
статистическими характеристиками значений анализируемых частных и
интегральных показателей крови, численные значения параметров a j1,l и b j1,l
формулы (2.24)
для альтернативных классов wl
предлагается оценивать
следующим образом.
Аналогично п.3.2 формируем выборки значений отобранных в п.3.2
частных и интегральных показателей крови для основного и альтернативного
классов: Х1 – «Эритроциты», Х2- «Гемоглобин», Х3 – «Цветовой показатель»,
Х9 – «Моноциты», Х10 – «СОЭ», Y – «ЭрГеМо». Обозначим элементы
сформированных множеств, в каждом из которых находится по n4 объектов
согласно [22]. В настоящем пилотном исследовании рассматривалось по 20
объектов в каждом классе (n4=20). В качестве признакового пространства для
диагностики
возможного
наличия
рака
желудка
и
необходимости
клинического обследования пациента на этапе скрининг-диагностики
используются показатели крови множества признаков, отобранные в Главе 3.2,
соответственно, для классов wl - X1wl , X2 wl , X3wl , X9 wl , X10 wl ,Ywl l = 0,1 .
Для каждого элемента данного множества первоночально вычисляются
статистические оценки значений медианы и СКО и формируются им
соответствующие множества {M}w , {σ }w для альтернативных классов w0 и w1:
l
l
{M}wl = {M1,l (X1wl ),M2,l (X2wl ),M3,l (X3wl ),M9,l (X9wl ),M10,l (X10wl ),MY,l (Yw )}wl / l = 0,1}w
l
l
(3.9),
98
{σ }wl = {σ1,l (X1wl ), σ 2,l (X2w ), σ 3,l (X3wl ), σ 9,l (X9wl ), σ10,l (X10wl ),σ Y ,l (Ywl ) / l = 0,1}wl
(3.10),
l
где {M}w , {σ }w - множества медиан и СКО для классов wl; M j1,l (Xj1w ) - медиана
l
l
l
множества { Xj1w } в классе wl , σ j1,l (Xj1w ) - СКО от медианы множества { Xj1w }
l
l
l
в классе wl, j1 – идентификатор показателя из множества { Xj1w }.
l
Приведенные рассуждения распространяются на элементы множества
{ Yw }.
l
Полученные характеристики и знания о законе распределения
случайной
hj1,1( xj1w )
величины
l
( xj1w ∈ {Xj1w } ,
l
l
на
l=0,1)
основании
рекомендаций [14] позволяют оценить значения параметров для класса w1 : a1
и b1 (для альтернативного класса w0 – a0 и b0) формулы (2.24) по следующим
формулам:
a j 1, l = 1 −
b j 1, l = 1 −
h j1 ( M
j 1, l
(X j1 w l ) + 1, 9 6 ⋅
σ
j1 , l
(X j1 w l )
n4
)
,
m a x ( h ( x j1 w l ))
h j1 ,l ( M
j1,l
(X j1 w l l ) + 3 ⋅ σ
j1 ,l
(X j1 w l ))
m a x ( h j 1, l ( x j1 w l ))
(3.11)
,
(3.12)
где a j1,l , b j1,l - параметры формул функций соответствия результатам
модельных вычислений и по анализируемому показателю крови j1 в
альтернативных классах wl из множества {Xj1}w ; max(h j1,l ( xj1w )) - максимальное
l
l
значение функции закона распределения h j1,l ( xj1w ) , n4 - количество объектов
l
σ (Xj1w )
- это доверительный интервал на
множества {Xj1}w . Величина 1,96 ⋅ j1,l
l
l
mx
уровне ошибки первого рода p≤0.01.
Для множества Yw применяются аналогичные формулы.
l
В случае нормального закона распределения функции h j1,l ( xj1w ) для всех
l
показателей значения параметров a j1,l ,
b j1,l будут одинаковы во
всех
альтернативных классах для всех показателей и равны соответственно:
99
b j1,l = 0.989 , т.к. в этом случае max( h( xj1w l )) =
a j1,l = 0.092,
1
и
(σ j1,l (Xj1w l )) 2 ⋅ 2 ⋅ π
32
bj1,l = 1− exp(− ) =1− exp(−4.5) ≈ 0.989 . В случае,
2
1.962
aj1,l =1−exp(−
) =1−exp(−0.096) ≈ 0.092,
2⋅ n4
если применение данных значений в качестве начальных ЛПР не устраивает,
поскольку интуитивно понятно, что различные показатели несут разную
информационную нагрузку в диагностическом процессе и имеют различные
точности при регистрации и доверительные интервалы, в которых их значения
являются специфичными для каждого из альтернативных классов, то
предлагается использовать поправочные коэффициенты.
Поправочные коэффициенты для формул (3.11) и (3.12), учитывающие
медианные и дисперсионные значения соответствующих показателей,
характерных для каждого из альтернативных классов wl, вычисляются как
2*σ wl (v)
∆ wl (v)
. (Здесь σ w (v) - СКО некоторой случайной величины v определенного
l
показателя из множеств {X }wm и {Y }mw относительно ее медианного значения в
l
l
x
y
классе wl (согласно разделу 3.2: mx = 5,
m y = 1 ), σ wl (v ) - диапазон изменения
значений случайной величины v определенного показателя, специфичный для
класса wl).
Применение указанных поправочных коэффициентов трансформирует
формулы (3.11), (3.12) к виду:
a j 1, l = 1 −
b j 1, l = 1 −
2 ⋅σ
∆
j 1, l
( X j1 w l )
j 1, l ( X j1 w l )
2 ⋅σ
⋅
h j1 ( M
j 1, l
( X j1 w l ) h j 1 , l ( M
⋅
∆ j 1, l ( X j1 w l )
j1,l
(X j1 w l ) + 1, 9 6 ⋅
σ
j1 , l
(X j1 w l )
n4
)
, (3.13)
m a x ( h ( x j1 w l ))
j 1, l
(X j1 w l ) + 3 ⋅ σ
j1 , l
m a x ( h j 1, l ( x j1 w l ))
(X j1 w l ))
,
(3.14)
где σ j1,l (Xj1w ) - СКО значений показателя j1 в каждом из альтернативных
l
классов wl относительно соответствующего медианного значения M j1,l (Xj1w ) ;
l
∆ j1,l (Xj1w l ) - диапазон изменения значений показателя j1 (множество Xj1w l )
100
специфический для каждого из
альтернативных классов wl. (Для
интегрального показателя Y рассуждения аналогичны.)
В результате пилотного исследования на множествах {X }wm и {Y }mw ,
l
l
x
y
применяя формулы (3.13) и (3.14), получаем следующие значения параметров
функций соответствия результатов модельных вычислений и измерений
f w (d i,l ) и f w (d k,l ) , представленные в Таблице 3.9.
l
l
Таблица 3.9 - Параметры функций f wl (di,l ) и f wl (d k,l ) для альтернативных
классов w0 и w1.
Классы
Класс w0
Показатели
Класс w1
Параметры функции
aw0
bw0
aw1
bw1
Эритроциты
0,58
0,99
0,60
0,99
Гемоглобин
0,45
0,99
0,60
0,99
Цветовой показатель
0,57
0,99
0,67
0,99
Моноциты
0,58
0,99
0,69
0,99
СОЭ
0,57
0,99
0,70
0,99
ЭрГеМо
0,66
0,99
0,70
0,99
Графики соответствующих функций f wl (di,l ) и f wl (d k,l ) представлены на
Рисунках 3.11 и 3.12.
101
1,2
эритроциты
1
гемоглобин
0,8
цветовой
показатель
0,6
моноциты
0,4
СОЭ
0,2
ЭрГеМо
0
0
0,5
1
1,5
Рисунок 3.11 - Функции f w (d ) в классе w0
0
1,2
эритроциты
1
гемоглобин
0,8
цветовой
показатель
0,6
моноциты
0,4
СОЭ
0,2
ЭрГеМо
0
0
0,5
1
1,5
Рисунок 3.12 - Функции f w (d ) в классе w1
1
Полученные функции и методика оценки степени риска заболевания
раком желудка позволяют использовать их в базе знаний СППР для
последующей оценки на основе анамнеза и результатов общего анализа крови
риска наличия у пациента рака желудка и выработать рекомендации по
дальнейшему обследованию.
102
3.4 АЛГОРИТМ УПРАВЛЕНИЯ ПРОЦЕССОМ СКРИНИНГДИАГНОСТИКИ РАКА ЖЕЛУДКА НА ОСНОВЕ ПОКАЗАТЕЛЕЙ
КРОВИ И АНАМНЕЗА ОБСЛЕДУЕМОГО
Информационно - аналитическая модель скрининг-диагностики рака
желудка, представленная на Рисунке 2.1, является основой интеллектуальной
системы поддержки принятия решений о необходимости клинического
обследования при превышении риска возникновения или наличия заболевания
«рак желудка» в ходе применения решающих правил (формула (2.26), Таблица
2.1, Таблица 2.2) (структура и функционирование СППР рассмотрены в
разделе 3.1).
После применения, описанного в разделе 2.3 метода на основе
сформированных обучающих и контрольных выборок по методике,
изложенной в разделе 2.2 в СППР, формируется база знаний, включающая в
себя:
1) Меру классификационного доверия к данным – МДД.
2) Признаковое пространство частных показателей {Х} и механизм
вычисления интегральных показателей {Y}.
3) Пакеты, полученные для каждого из альтернативных классов ω0 и ω1
математических моделей с определенным специализированным программным
обеспечением, реализующим идентификационный алгоритм МГУА структуры
и параметры (согласно формулам (2.3) – (2.8)).
4) Меры доверия к адекватности по отношению к возможностям
моделей описывать связи в структуре признакового пространства – МДМ0 и
МДМ1 (для альтернативных классов ω0 и ω1 , соответственно).
5) Меры соответствия результатов текущих измерений частных
показателей крови {Х} и значений интегральных показателей {Y} с
результатами расчетов по пакетам моделей для альтернативных классов ω0 и
ω1 - функции f (di1 ,l ) и f (d k1 ,l ) l = 0;1 ). В базе знаний СППР эти функции
103
представлены в табличном виде: матрицы параметров aω0 ; bω0 и aω1 ; bω1 (в
соответствии с формулой (2.24)).
6) Начальные значения ограничительных порогов PU ω0 и PU ω1
уверенностей U ω0 и Uω1 в рекомендуемом СППР решении, характеризуемого
векторами X и Y . Начальные значения порогов Pω0 и Pω1 уверенностей UM ω0
и UM ω1 в отнесении объекта по векторам X и Y к определенному состоянию
согласно Таблице 2.1. В случае возникновения коррекции жесткости в
принятии решения пороги UPω0 и UPω1 (пороги Pω0 и Pω1 ) в режиме диалога
Лицом Принятия Решений (ЛПР) с СППР и им соответствующие таблицы
диагностического заключения (Таблица 2.2, Таблица 2.1 - соответственно)
могут быть откорректированы.
7) Матрица соотношения каждому показателю из «образа жизни»
(анамнеза) qi1 ∈ {Q} определенному баллу и функции расчета по ним частных
{
показателей риска RQtω1
}
n3
- функций FQNQg (показатели q сгруппированы в
различные семантические определенные группы).
8) Структура и параметры функционала для вычисления риска pRtω1 :
{
pRtω1 = RF ( S Rtω1 , PRtω1 RQtω1
}
n3
).
(3.15)
Где S Rtω1 - структура, PpRtω1 - параметры функционала RF .
9) Значение меры доверия к показателям анализа МДПА.
10) Решающие правила оценки уверенности UQ (согласно формуле
(2.26)).
11) Механизм вычисления аргументов финальных решающих правил по
вычисленным значениям U ω0
и
Uω1
(по формулам (2.27), (2.28)),
реализованный в виде программных процедур.
13) Таблицы формирования решающего диагностического заключения в
условиях численного определения значений порогов Pω0 , Pω1 ,UPω0 ,UPω1 .
104
С учетом указанной информации, определяющей работу с СППР,
алгоритм управления процессом скрининг-диагностики пациента реализуется
следующей последовательностью действий:
1. Путем анализа анамнеза пациента формируется вектор значений
показателей «образ жизни, …» Q * и определяется значение риска наличия
заболевания pRtω1 .
2. По результатам общего анализа крови формируется вектор значений
X * , включающий в себя такие показатели крови как: «Эритроциты»,
«Гемоглобин», «Цветовой показатель», «Моноциты», «СОЭ».
3. В СППР рассчитывается значение интегрального показателя Y «ЭрГеМо» (реализуется вычисление по формуле (3.5)).
4. По значениям вектора X * и Y СППР определяет уверенность в
отнесении состояния к классу «здоровых» (не болен раком желудка) и «болен
раком желудка» альтернативные классы
ω0
и
ω1 , соответственно):
UM ω0 и UM ω1 . Эти значения сообщаются ЛПР.
5. По значениям UM ω0 и UM ω1 оценивается необходимость дальнейшего
клинического обследования «жесткость» принятия решения при этом в
решении диалога может осуществляться путем изменения пороговых
значений UPω0 и UPω1 (и-или Pω0 и Pω1 ) .
6. По Rtω1 , UM ω1 и МДД вычисляется значение степени финального
риска соотношения пациента к одному из альтернативных классов F finω и
0
Ffinω , последовательно применяя формулы:
1
Ffinω = UM ω0 + (1 − МДПА ⋅ pRtω1 ) − UM ω0 ⋅ (1 − МДПА ⋅ pRtω1 ) ,
0
Ffinω = UM ω1 + ( МДПА ⋅ pRtω1 ) − UM ω1 ⋅ ( МДПА ⋅ pRtω1 ) ,
(3.17)
Ffinω = F finω ⋅ МДД / l = 0;1 .
(3.18)
1
l
l
(3.16)
Примечание: формула (3.18) применяется в случае недоверия ЛПР к
классификационным возможностям используемых на этапе обучения данных.
105
7. СППР по вычисленным значениям Ffin w0 , Ffin w1 , PU w 0 , PU w1 , Pw0 , Pw1 ,
Rtω1 информирует ЛПР о состоянии пациента и необходимости клинического
обследования с указанием в данном сообщении указанных рассчитанных
величин.
8. ЛПР принимает окончательное решение о результатах диагностики
состояния пациента и необходимости дальнейших клинических обследований.
106
ВЫВОДЫ ТРЕТЬЕЙ ГЛАВЫ
Отличительными особенностями предлагаемого алгоритма принятия
решения
о
необходимости
клинического
обследования
на
предмет
подтверждения или опровержения рака желудка в процессе скринингдиагностики являются:
1.
Применение
адаптивной
системы
поддержки
принятия
решений, основой которой являются пакеты моделей для рассматриваемых
альтернативных
классов,
идентифицированные
с
помощью
самоорганизационных алгоритмов метода группового учета аргументов.
2.
Уменьшение в процессе пилотного исследования размерности
признакового пространства до 6 (5 частных показателей крови и один
интегральный), что позволяет существенным образом сократить время
принятия решения и, следовательно, повысить производительность и
улучшить эффективность диагностического процесса.
3.
Алгоритм
доклинического
диагностического
процесса
позволяет на основе применения мер доверия к результативности различных
этапов обучения классифицирующей системы формировать не только
заключение о возможном состоянии пациента, но и указывать риски принятия
решения ЛПР, что оптимизирует его работу.
4.
Интеллектуальная система поддержки принятия решения о
необходимости клинического обследования пациента по прогнозируемым
состояниям
(«болен
раком
желудка
и
нуждается
в
клиническом
обследовании», «риск наличия заболевания высок и необходимо дальнейшее
клиническое обследование», «риск наличия заболевания низкий и пациент не
нуждается в оперативном клиническом обследовании») позволяет при
скрининге осуществлять раннюю диагностику рака желудка, уменьшая
неблагоприятные последствия поздней диагностики.
5.
Полученные правила (в виде функций) определения риска
наличия заболевания раком желудка по анкетированию пациента и анализу его
107
анамнеза позволяют принимать решения о необходимости клинических
специализированных обследований в условиях отсутствия медицинского
обследования в момент анкетирования, что улучшает качество скринингдиагностики без повышения степени квалификации медицинского персонала.
В главе 3 решены следующие задачи:
- сформировано пространство информативных признаков;
- произведен синтез нечетких решающих правил скрининг-диагностики
рака желудка на основе информации о структуре связей между показателями
крови и по результатам анализа анамнеза пациента с выбором адекватных
методов классификации;
- разработаны структура программного обеспечения интеллектуальной
СППР и алгоритм скрининг-диагностики рака желудка на основе анализа
изменений в структуре связей между анализируемыми показателями крови.
108
ГЛАВА 4 РЕЗУЛЬТАТЫ ЭКСПЕРИМЕНТАЛЬНЫХ
ИССЛЕДОВАНИЙ
4.1 ФОРМИРОВАНИЕ ОБУЧАЮЩИХ И КОНТРОЛЬНЫХ ВЫБОРОК
В главе 2 рассматривались теоретические аспекты формирования
обучающих и экзаменационных выборок для построения диагностических
систем с вычислением значений соответствующих мер доверия и предложены
формулы для их вычисления.
В главе 3 показано, что в качестве наиболее информативных
показателей, обладающих наилучшими классификационными возможностями
для ранней скрининг-диагностики рака желудка могут быть использованы 5
частных (Х1 – «Эритроциты», Х2- «Гемоглобин», Х3 – «Цветовой
показатель», Х9 – «Моноциты», Х10 – «СОЭ») и один интегральный: Y –
«ЭрГеМо».
На основании полученных результатов построения диагностических
правил были сформированы две выборки для каждого из альтернативных
классов w0 и w1 объемами по 115 объектов. Данные предоставлены лечебными
учреждениями г. Курска (см. Приложение).
Половозрастное распределение «больных раком желудка» и «не
больных раком желудка» подчинялось равномерному закону распределения.
Объем выборок определялся исходя из рекомендаций [22] для обеспечения
чувствительности статистических критериев различий между классами на
контрольных выборках на уровне 0,95. В соответствии с рекомендациями,
сформулированными в главе 2, контрольные выборки содержали 75 объектов
в каждом из альтернативных классов.
В Таблице 4.1 приведены основные статистические характеристики
обучающих выборок.
109
Таблица 4.1 - Статистические характеристики показателей крови для классов
w0 и w1
Классы
Класс w0
Показатели
Класс w1
Статистические характеристики
М
D
As
Ex
M
D
As
Ex
Эритроциты
4,24
0,09
0,47
0,29
4,1
0,66
-0,09
-0,176
Гемоглобин
106,8
693
-0,55
-0,009
109
833
-0,02
-0,68
Цветовой показатель
1,17
0,46
1,06
1,14
1,06
0,21
0,42
0,566
Моноциты
6,39
10,3
0,77
0,62
4,1
4,8
2,08
9,24
СОЭ
5,43
5,66
0,96
0,57
10,8
33,3
0,93
0,63
ЭрГеМо
4,09
3,36
0,72
0,45
2,7
1,63
1,82
7,34
Примечание: M - математическое ожидание, D - дисперсия, As асимметрия, Ex – эксцесс соответствующих показателей.
Анализ таблицы 4.1 показывает, что при переходе из одного класса в
другой наблюдаются статистические отличия в характеристиках закона
распределения, что подтверждает правильность формирования признакового
пространства. Однако, наилучшие статистические отличия между собой
показывают показатели согласно критерию Стьюдента (на уровне p<0.1):
«Эритроциты», «Моноциты», «СОЭ», «ЭрГеМо». Это означает, что значения
МДП может быть оценено на уровне 0,67.
Согласно Таблицы 4.1 наблюдается пересечение классов по указанным
в ней показателям (доверительным интервалам), следовательно, по формуле
(2.10) получаем оценку МДВ* ≈ 0,83 .
Меру доверия к объему выборки определим согласно диаграмме,
приведенной в [22] по чувствительности статистических характеристик
определяем как МДО=0.95, (аналогичный результат показывают расчеты в
Excel).
110
Поскольку обучающая и контрольная выборки формировались по
предложенной в главе 2 методике, то мера доверия к репрезентативности
МДР=1.
Поскольку набор показателей определялся одновременно с анализом
литературных
источников
справочного
характера,
которые
можно
воспринимать как экспертов, и по критерию Стьюдента (см. главу 3), то меры
доверия экспертов к выборке и к составу признаков МДЭВ и МДЭП также
можно принять за 1.
В результате получаем, что согласно формуле (2.18) мера доверия к
данным МДД=0,94.
Как отмечалось ранее, контрольная и обучающая выборки при
формировании взаимно репрезентативны, то в первом приближении можно
считать, что: МДДо=МДДк=МДД=0,94.
В заключении анализа сформированных выборок рассмотрим, какие
линейные парные связи между показателями можно использовать в качестве
классификаторов. С этой целью проанализируем, как меняется парная
корреляционная матрица в альтернативных классах и соответствующие им
парные и множественные регрессии.
Значимые парные корреляционные связи в альтернативных классах
показаны на Рисунках 4.1 и 4.2 соответственно.
Х3
Х10
Х1
Х9
Х2
Y
Рисунок 4.1 - Корреляционные связи в классе w0 (сплошные линии –
положительная корреляция, пунктирные – отрицательная)
111
Х3
Х10
Х1
Х9
Х2
Y
Рисунок 4.2 - Корреляционные связи в классе w1 (сплошные линии –
положительная корреляция, пунктирные – отрицательная)
Анализ корреляционных связей подтверждает структурные изменения в
крови при заболевании раком желудка, а именно исчезает корреляция между
такими показателями, как «СОЭ», «Эритроциты» и «СОЭ», «ЭрГеМо».
Уменьшение количества значимых корреляционных связей позволяет
предположить, что анализируемое заболевание приводит к деструктуризации
процессов
управления
соотношениями
концентраций
(количеств)
определенных элементов в крови. Уравнения парной регрессии между этими
показателями включаются в базу моделей системных взаимосвязей (Рисунок
2.1) и соответствующий модуль расчета МРЗПМ СППР (Рисунок 3.1),
используемых в дальнейшем для решения диагностических задач. Модели
представляются следующими формулами:
X 10* 1, w0 = 20.53 − 3.75 ⋅ X 1
X 10* 2, w0 = 7.14 − 0.667 ⋅ Y
2
R1,10,
w0 = 0.21 ,
2
R2,11,
w0 = 0.21 ,
(4.1)
(4.2)
где здесь и далее: Rk21,k 2,w . - коэффициент детерминации модели k1 в базе
l
моделей показателя Хk2 (для Yj – k2=n1+j, в рассматриваемом случае k2=11)
альтернативного класса wl, Xk 2*k1, w - функция отклика показателя k2 модели
l
k1 в базе моделей альтернативного класса wl.
112
Заметим, что слабая корреляционная связь или ее отсутствие между
показателями сформированного признакового пространства, подчеркивает их
ортогональность, подтверждая полученные ранее высокие меры доверия.
Таким образом, сформированные обучающие и контрольные выборки
для альтернативных классов обладают достаточной мерой доверия для
использования
в
классификационном
соответствующей системы.
процессе
на
этапе
обучения
113
4.2 МАТЕМАТИЧЕСКИЕ МОДЕЛИ СТРУКТУРЫ СВЯЗЕЙ МЕЖДУ
ПОКАЗАТЕЛЯМИ КРОВИ
В информационно-аналитической модели (глава 2) и интеллектуальной
СППР (глава 3) на этапе обучения диагностической системе с помощью
специализированного
программного
структурно-параметрическая
обеспечения
идентификация
осуществляется
математических
моделей
линейного (множественная регрессия) и мультипликативного (формула (2.2))
видов, характеризующих структуру и параметры связей между показателями
(частными и интегральным) крови для рассматриваемых альтернативных
классов.
Данный
процесс
осуществляется
в
модуле
МФПММ
интеллектуальной СППР, представленной на Рисунке 3.1. Соответствующая
структурам и параметрам информация представлена в Таблицах 4.2 - 4.4.
Таблица 4.2 - Параметры модели множественной регрессии
класс показатель
(отклик)
Х1
Х2
Х3
w0
Х9
Х10
Y
Х1
Х2
Х3
w1
Х9
Х10
Y
Bi–параметр при аргументе
ВX1
ВX2
ВX3
ВX9
4,3
0,032
-4,54
-0,00118
-135,5 31,45 143,26 0,035
0,845
-0,218 0,0069 -0,00024
153,5
-35,6 1,1
-149,1 -17,6
5,76
-0,227
30,86 -0,22
7,7
-1,88 0,041
3,56
0,031
-3,74
-0,0014
-112,77 37,56 119,57 0,04
0,938
-0,247 0,00186 -0,00014
13,33
-4,07 0,12
-9,75
2,07
22,33 -0,69
8
0,478
2,75
-1,09 0,0272
A0
ВX10
0,0005
-0,0189
0,00013
-0,57
-0,34
0,00054
-0,017
0
0,034
0,02
R2
0,99
0,99
0,89
0,2
0,19
0,17
0,99
0,99
0,96
0,02
0,21
0,02
Согласно Таблице 4.1 после отсева по критерию Стьюдента незначимых
коэффициентов при термах, получаем следующие системы линейных
уравнений, описывающие связи между анализируемыми показателями:
114
 X 1w0 = 4.3 + 0.032 ⋅ X 2 w0 − 4.54 ⋅ X 3w0

 X 2 w0 = −135.5 + 31.45 ⋅ X 1w0 + 143.26 ⋅ X 3w0 + 0.035 ⋅ X 9 w0 − 0.02 ⋅ X 10 w0
 X 3 = 0.845 − 0.218 ⋅ X 1
w0
 w0

 X 9 w0 = 153.5 − 35.6 ⋅ X 1w0 + 1.1 ⋅ X 2 w0 − 149.1 ⋅ X 3w0 − 0.57 ⋅ X 10 w0
 X 10 = −17.6 + 5.76 ⋅ X 1 − 0.23 ⋅ X 2 + 30.86 ⋅ X 3 − 0.22 ⋅ X 9
w0
w0
w0
, w0
w0

Yw = 7.7 − 1.88 ⋅ X 1w + 0.04 ⋅ X 2 w − 0.34 ⋅ X 10 w
0
0
0
 0
 X 1w1 = 3,56 + 0, 031⋅ X 2w1 − 3,74 ⋅ X 3w1

 X 2w1 = −112,77 + 37,56 ⋅ X 1w1 + 119,57 ⋅ X 3w1 + 0, 04 ⋅ X 9w1 − 0, 017 ⋅ X 10w1
 X 3 = 0,94 − 0, 25 ⋅ X 1
w1
 w1

 X 9 w1 = 13,33 − 4, 07 ⋅ X 1w1 + 0,12 ⋅ X 2w1 − 9, 75 ⋅ X 3w1
 X 10 = 2, 07 + 22,33 ⋅ X 1 − 0, 69 ⋅ X 2 + 8 ⋅ X 3 + 0, 48 ⋅ X 9
w1
w1
w1
w1
w1

Yw = 2.75 − 1.09 ⋅ X 1w + 0.027 ⋅ X 2w + 0.02 ⋅ X 10w
 1
1
1
1
(4.3)
(4.4)
С учетом статистической значимости коэффициента детерминации на
уровне p<0.01 и правилом определения цветового показателя из систем (3.3) и
(3.4) в модуль МРЗПМ СППР включаются математические модели,
представленные следующими формулами:
X 1*3, w0 = 4.3 + 0.032 ⋅ X 2 − 4.54 ⋅ X 3
2
R3,1,
w0 = 0.99 ,
(4.5)
uur
uuur
uuuur
X 2*4, w0 = −135.5 + 31.45 ⋅ X 1 + 143.26 ⋅ X 3 + 0.035 ⋅ X 9 − 0.02 ⋅ X 10
X 1*5, w1 = 3, 56 + 0, 031 ⋅ X 2 − 3, 74 ⋅ X 3
2
R4,2,
w0 = 0.99 ,
(4.6)
2
R5,1,
w1 = 0.99 ,
(4.7)
X 2*6, w1 = −11277 + 37.56 ⋅ X 1 + 119.57 ⋅ X 3 + 0.04 ⋅ X 9 − 0, 017 ⋅ X 10
2
R6,2,
w0 = 0.99 .
(4.8)
Анализ значений параметров при термах в моделях показывает, что:
1. характер линейных связей в альтернативных классах не меняется;
2. у
больных
раком
желудка
людей
концентрация
эритроцитов
уменьшается в среднем на 16%, что, в свою очередь, приводит к
соответствующему изменению значения цветового показателя.
115
3. у больных раком желудка уровень гемоглобина в крови снижается в
среднем на 16% и на 20%
возрастает степень влияния на него
концентрации эритроцитов.
Таблица 4.3 - Параметры мультипликативной модели – формула (2.2) для
класса w0
отклик
A0
A1
PX1
PX2
PX3 PX9
PX10 PY
-6
Х1
2,9
2,1221∙10
2,7 -2,7
-0,1
0,1
Х2
64,3
128.33
1,3 -1,4 -0,14 1,62
Х3
0,26
0,15
0,28
0,275 0,026 -0,275
Х9
0,44
0,245
0,38
0,2 0,13
1,18
Х10
-37,04
55,07
-0,31
-0,14
0,12
Y
1,07
0,006
-0,125 0,127
1
-
R2
0,89
0,35
0,28
0,98
0,31
0,79
Таблица 4.4 - Параметры мультипликативной модели – формула (2.2) для
класса w1
отклик
Х1
Х2
Х3
Х9
Y
A0
1,77
-76,8
0,01
0,52
-0,3
A1
0,000271
215,84
0,405
0,887
0,00018
PX1 PX2
1,84
0,18
-2,4 2,46
PX3
-1,69
0,8
-0,3
-2,14
PX9
0,14
0,76
PX10
-
PY
-0,2
0,14
1,3
-
R2
0,99
0,28
0,4
0,98
0,98
Согласно информации, представленной в таблицах 4.3 и 4.4, в модуль
МРЗПМ СППР включаются математические модели,
представленные
следующими формулами:
- для класса w0:
X 1*7,w0
X 2*8,w0
X 3*9,w0
−6
= 2,9 + 2,12 ⋅ 10 ⋅
X2
2,7
⋅ X 10
1.3
1.6
= 0.26 + 0.15 ⋅
X 3 ⋅Y
1.4
X 9 ⋅ X 10
X2
0.28
0,1
2,7
X3
= 64.3 + 128.33 ⋅
⋅Y
⋅ X9
Y
0.14
0.275
0.275
2
R7,1,
w0 = 0.89,
0,1
2
R8,2,
w0 = 0.35,
⋅ X 10
(4.9)
(4.10)
0.026
2
R9,3,
w0 = 0.28,
(4.11)
116
0.38
*
X 910,
w0 = 0.44 + 0.245 ⋅ X 1
*
X 1011,
w0
*
Y12,
w0
⋅X2
Y
= −37.04 + 55.07 ⋅
= 1.07 + 0.006 ⋅
0.31
X1
X2
0.127
0.2
0.13
⋅ X3
⋅Y
1.18
2
R10,9,
w0 = 0.98,
(4.12)
0,12
⋅ X9
⋅ X9
0,14
2
R11,10,
w0 = 0.31,
2
R12,11,
w0 = 0.79,
0.125
X1
(4.13)
(4.14)
- для класса w1:
1.84
*
X 113,
w1
X2
= 1.77 + 0.000271 ⋅
2
R13,1,
w1 = 0.99,
1.7
X3
0.8
*
X 214,
w1
X3 ⋅ X9
= −76.8 + 215.84 ⋅
Y
*
X 315,
w1 = 0.01 + 0.405 ⋅ X 2
*
X 916,
w1
*
Y17,
w0
= 0.52 + 0.887 ⋅
= −0.3 + 0.00018 ⋅
Y
0.18
⋅Y
(4.15)
0.14
0.2
0.14
2
R14,2,
w1 = 0.28,
2
R15,3,
w1 = 0.4,
(4.16)
(4.17)
1.3
0.3
X3
X2
0,12
2.4
2
R16,9,
w1 = 0.28,
⋅ X9
0,76
2.14
X1 ⋅ X 3
(4.18)
2
R17,11,
w0 = 0.98.
(4.19)
Анализ полученных моделей позволяет сделать следующие выводы о
происходящих структурных изменениях в составе крови при заболевании
раком желудка с точки зрения произошедших специфических изменений,
характера связей между анализируемыми показателями:
- в анализируемых альтернативных классах в рассматриваемых моделях
присутствуют как общие для них аргументы, так и оригинальные – это говорит
о том, что состав крови определяется как общими для всего организма
«правилами», так и специфическими для определенной системной патологии,
к которой, безусловно, относится рак желудка;
117
- количество эритроцитов в крови у не болеющих раком желудка людей
характеризуется дополнительным влиянием отношения значений показателей
«ЭрГеМо» и «СОЭ», что подчеркивает уменьшение возможностей учета
количества эритроцитов в крови для диагностики рака желудка;
- при возникновении рака желудка уменьшаются классификационные
возможности показателя «СОЭ» в условиях изменения связи с «ЭрГеМо» с
отрицательно степенной на положительно степенную, что позволяет
использовать этот факт в качестве диагностической характеристики;
- количество моноцитов в крови при заболевании изменяет свою «связь» с
цветовым
показателем
с
прямой
на
обратную,
что
подчеркивает
происходящие в этом случае изменения содержания гемоглобина в
эритроцитах;
- показатель «СОЭ» при заболевании не идентифицировал функциональную
зависимость от остальных показателей методами самоорганизационного
моделирования,
что
подчеркивает
«разболансировку»
системы
кроветворения;
- в функциональных зависимостях интегрального показателя «ЭрГеМо» на
высоком уровне корреляции появляется обратная зависимость от показателя
«цветовой показатель», что, в том числе, подчеркивает необходимость учета
показателей «Эритроциты» и «Гемоглобин» при скрининг-диагностике
заболевания.
В целом, модели, идентифицированные МГУА и отражающие
структурные связи между показателями во время заболевания, имеют меньшее
количество аргументов в составе своих структур на фоне повышенной
корреляции. Это отражает факт уменьшения реактивных способностей
организма на изменения внутренней и внешней среды.
Для полученной базы моделей согласно формулам (2.19), (2.20) и (2.21)
меры доверия МДМ0, МДМ1 и МДМ приближаются к единице. Это означает,
что идентифицированные в МВПММ (Рисунок 3.1) и импортируемыми в
МРЗПМ модели адекватно отражают взаимосвязь между рассматриваемыми
118
показателями крови и могут быть использованы для решения диагностических
задач.
119
4.3 ДИАГНОСТИЧЕСКИЕ ВОЗМОЖНОСТИ РЕШАЮЩИХ ПРАВИЛ
Для анализа диагностических возможностей решающих правил
предлагаемой интеллектуальной СППР осуществлено оценочное сравнение
показателей
качества,
характеризующих
достоверность
скрининг-
диагностики, полученных по результатам дискриминантного анализа,
разработанных авторских правил (см. в главу 3), по результатам общего
анализа крови и результатов применения онкомаркеров (показатели качества
определены по данным, представленным в открытой печати).
Уверенность в диагнозе UM w в соотнесении к альтернативным классам
l
определялась по формуле (2.25) с порогами Pw = Pw = 0.66 .
0
1
Функции соответствия f wl (dl ) для вычисления уверенности UM ωl в
отнесении пациента к исследуемым диагностическим классам состояний ω0
и ω1 согласно формулы (2.25) и значений ее параметров, приведенных в
таблице 3.9 вычислялись по формулам:
- для показателей «Эритроциты» и «Моноциты» в классе ω0 :
1, если d 0 ≤ 0.58


fω0 (d 0 ) = 2.36 − 2.38 ⋅ d 0 , если 0.99 ≥ d 0 > 0.58 ;

0, если d 0 > 0.99

(4.20)
- для показателя «Гемоглобин» в классе ω0 :
1, если d 0 ≤ 0.45


fω0 (d 0 ) = 1,8 − 1,81 ⋅ d 0 , если 0.99 ≥ d 0 > 0.45 ;

0, если d 0 > 0.99

(4.21)
120
- для показателей «Цветовой показатель» и «СОЭ» в классе ω0 :
1, если d 0 ≤ 0.57


fω0 (d 0 ) = 2.31 − 2.32 ⋅ d 0 , если 0.99 ≥ d 0 > 0.57 ;

0, если d 0 > 0.99

(4.22)
- для показателя «ЭрГеМо» в классе ω0 :
1, если d 0 ≤ 0.66


fω0 (d 0 ) = 2.92 − 2.94 ⋅ d 0 , если 0.99 ≥ d 0 > 0.66 ;

0, если d 0 > 0.99

(4.23)
- для показателей «Эритроциты» и «Гемоглобин» в классе ω1 :
1, если d1 ≤ 0.6


fω1 (d1 ) = 2.48 − 2.5 ⋅ d1 , если 0.99 ≥ d1 > 0.6 ;

0, если d1 > 0.99

(4.24)
- для показателя «Цветовой показатель» в классе ω1 :
1, если d1 ≤ 0.67


fω1 (d1 ) = 3 − 3.03 ⋅ d1 , если 0.99 ≥ d1 > 0.67 ;

0, если d1 > 0.99

(4.25)
- для показателя «Моноциты» в классе ω1 :
1, если d1 ≤ 0.69


fω1 (d1 ) = 3.19 − 3.22 ⋅ d1 , если 0.99 ≥ d1 > 0.69 ;

0, если d1 > 0.99

(4.26)
- для показателей «СОЭ» и «ЭрГеМо» в классе ω1 :
1, если d1 ≤ 0.7


fω1 (d1 ) = 3.37 − 3.33 ⋅ d1 , если 0.99 ≥ d1 > 0.7 ;

0, если d1 > 0.99

(4.27)
121
В
результате
применения
формул
(4.20)
–
(4.27)
величины
d 0 , d1 , f w0 ( d 0 ), f w1 ( d1 ) имеют различные значения для различных показателей в
альтернативных классах поскольку вычисляются на различных аргументах.
Пациент соотносится к одному из альтернативных классов с учетом
пороговых значений уверенности и определенных на контрольных выборках
коэффициентов уверенности UM w по решающим правилам в соответствии с
l
таблицей (2.1).
В качестве показателей качества, характеризующих статистическую
достоверность срабатывания диагностических правил, были выбраны
диагностическая чувствительность (ДЧ), диагностическая специфичность
(ДС), прогностическая значимость положительных ( ПЗ + ) и отрицательных
( ПЗ − ) результатов испытаний и диагностическая эффективность (ДЭ).
Указанные показатели качества рассчитывались по стандартной
методике в соответствии со следующими выражениями:
ДЧ = ИП / nω1 ;
ДС = ИО / nω0 ;
ПЗ + = ИП / (ИП + ЛП ) ;
ПЗ − = ИО / ( ЛО + ИО ) ;
ДЭ = (ИП + ИО ) / (ИП + ЛП + ЛО + ИО ) ,
где ИП – истинно положительный результат, равный количеству пациентов из
класса заболеваний ω1 , правильно классифицируемых;
ЛП – ложноположительный результат, равный количеству относительно
здоровых людей класса ω 0 , ошибочно отнесенных диагностическим правилом
к классу ω1 ;
ЛО – ложноотрицательный результат, равный количеству людей из
класса ω1 , отнесенных диагностическим правилом к классу ω 0 ;
ИО – истинно отрицательный результат, равный количеству людей из
класса ω 0 , правильно классифицированных диагностическим правилом.
122
В ходе вычислительного эксперимента на контрольных выборках была
получена
следующая
таблица
распределения
результатов
скрининг-
диагностики рака желудка (таблица 4.5).
Таблица 4.5 - Распределения результатов диагностики
Обследуемые
Результаты срабатывания правил
положительные
Всего
Отрицательные
nω1 = 75
59
16
75
nω0 = 75
68
7
75
Всего
127
23
150
Согласно полученных результатов значения показателей качества
предлагаемой методики диагностики составили:
ДЧ=0,79; ДС=0,91; ПЗ + = 0,89; ПЗ − = 0,81; ДЭ=0,85.
С целью сравнения предлагаемого диагностического метода с
классификационными возможностями других статистических методов был
применен дискриминантный анализ, в ходе которого по методике, изложенной
в [19], была идентифицирована дискриминантная функция вида:
θ = 145 − 35 ⋅ X 1 + 0.9 ⋅ X 2 − 116 ⋅ X 3 − 2.6 ⋅ X 9 + 0.83 ⋅ X 10 .
Согласно
принадлежит
полученной
классу
w0 ,
функции
если
(4.28)
(4.28)
исследуемый
вычисленное
значение
пациент
функции
θ ( X 1, X 2, X 3, X 9) ≤ 0 , либо принадлежит классу w1 («болен раком желудка»),
если вычисленное значение функции θ ( X 1, X 2, X 3, X 9) ≥ 3 , либо идентификация
класса требует дополнительной информации (обследования пациента), если
вычисленное значение функции 0 < θ ( X 1, X 2, X 3, X 9) < 3 .
123
Для данного диагностического правила были проведены исследования
на контрольных выборках (см. таблицу 4.6).
Таблица 4.6 - Распределения результатов диагностики по дискриминантной
функции (4.20).
Обследуемые
Результаты срабатывания правил
положительные
Всего
отрицательные
nω1 = 75
49
26
75
nω0 = 75
59
16
75
Всего
108
42
150
Согласно полученных результатов, значения показателей качества
диагностики с применением дискриминантной функции (4.20) составили:
ДЧ=0,65; ДС=0,79; ПЗ + = 0,75; ПЗ − = 0,79; ДЭ=0,72.
Согласно
литературным
данным,
как
отмечалось
ранее,
диагностическая эффективность онкомаркеров в настоящее время составляет
0.6-0.7,
что
соответствует
уровню
эффективности
применения
дискриминантной функции (4.28), применение которой не несет за собой
дополнительных
социальных
и
экономических
затрат,
связанных
с
организацией взятия и анализа проб онкомаркеров.
Таким образом, проведенные исследования на контрольных выборках
показали повышение диагностической эффективности скрининг-диагностики
рака желудка в случае применения предлагаемой методики на 18±2% по
сравнению с существующими тестами скрининг-диагностики рака желудка и
дискриминантного анализа.
124
ВЫВОДЫ ЧЕТВЕРТОЙ ГЛАВЫ
При проведении вычислительного эксперимента по исследованию
диагностических возможностей предлагаемой интеллектуальной системы
поддержки
принятия
решений
скрининг-диагностики
были
решены
следующие задачи:
1.
Сформированные
на
основе
реальных,
клинически
подтвержденных данных, обучающая и контрольная репрезентативные
выборки для обучения и верификации разработанных в главах 2 и 3 методах,
моделях и алгоритмах, являющихся основными элементами СППР скринингдиагностики, позволяют их адекватно использовать при проведении
вычислительных экспериментов, т.к. мера доверия к данным составляет 0,94.
2.
Полученные
математические
модели
специализированным
программным обеспечением, реализующим ортогональный алгоритм метода
группового учета аргументов, адекватно отражают структуры связей между
показателями крови и позволяют применять их в системе диагностического
процесса. Анализ моделей показывает, что при заболевании возрастают
линейные и нелинейные, парные и множественные корреляционные связи
между анализируемыми показателями.
3. Определенные показатели качества предлагаемой системы скринингдиагностики рака желудка (ДЧ=0,79; ДС=0,91; ПЗ + = 0,89; ПЗ − = 0,81; ДЭ=0,85)
позволяют говорить о перспективности исследованного подхода в процессе
массовой диспансеризации населения и/или проведения профилактически
мероприятий.
125
ЗАКЛЮЧЕНИЕ
Диссертационная работа посвящена решению научных и практических
задач, связанных с повышением качества скрининг-диагностики рака желудка
за счет применения разработанной интеллектуальной системы поддержки
принятия
решений
скрининг-диагностики,
основанной
на
нечетких
диагностических комбинированных классификационных правилах, что
позволяет по результатам общего анализа крови и анамнеза определять людей
с высоким риском наличия исследуемого заболевания и формировать
соответствующие рекомендации.
В ходе проведенных исследований получены следующие основные
результаты:
1. Разработанные информационно-аналитическая модель и структура
интеллектуальной
системы
поддержки
принятия
решений
скрининг-
диагностики позволяют на основе результатов общего анализа крови и
анамнеза оценивать риск наличия заболевания и формировать рекомендации
о необходимости обследования в специализированных центрах.
2. Разработан метод оценки классификационных возможностей структур
медицинских данных для синтеза диагностических правил, основанный на
применении мер доверия, что позволяет корректировать правила принятия
решений с целью улучшения качества классификации.
3. Разработан метод синтеза нечетких математических моделей, отражающий
связи
между
показателями
общего
анализа
крови,
позволяющий
анализировать происходящие системные изменения в структуре крови при
возникновении рака желудка, что повышает эффективность скринингдиагностики рака желудка.
4. Сформировано пространство информативных признаков для ранней
диагностики рака желудка, позволяющее в процессе скрининга рака желудка
повысить качество диагностического процесса на ранней стадии заболевания
без применения специализированного обследования.
126
5. Синтезированы на репрезентативной обучающей выборке диагностические
решающие правила для интеллектуальной системы поддержки принятия
решений скрининг-диагностики рака желудка.
6.
Разработаны
алгоритм,
структура
и
программное
обеспечение
интеллектуальной системы скрининг-диагностики рака желудка на основе
анализа изменений в структуре связей между регистрируемыми показателями
крови пациента.
7. Получены нечеткие решающие правила, основанные на анализе образа
жизни, анамнезе пациента и вычислении мер близости между значениями
регистрируемых показателей крови и их расчетными по математическим
моделям
значениями,
позволяющими
осуществлять
диагностику
с
приемлемым для практической медицины качеством, где диагностическая
чувствительность равна 0,79, диагностическая специфичность - 0,91,
диагностическая эффективность - 0,85.
127
БИБЛИОГРАФИЧЕСКИЙ СПИСОК
1.
Айвазян С.А. Прикладная статистика. Классификация и снижение
размерностей [Текст] // С.А. Айвазян, В.М. Буштабер, И.С. Енюков, Л.Д.
Мешалкин - М.: – Финансы и статистика, 1989. – 607 с.
2.
Александров В.В. Анализ данных на ЭВМ (на примере СИТО). [Текст]
// В.В. Александров, А.И. Алексеев, И.Д. Горский - М.: Финансы и статистика,
1990. – 245 с.
3.
Алексахин С.В. Прикладной статистический анализ данных. Теория.
Компьютерная обработка. Области применения. Книга 1. [Текст] С.В.
Алексахин // В 2-х томах. – М.: ПРИОР, 2002. – 688 с.
4.
Алексахин С.В. Прикладной статистический анализ данных. Теория.
Компьютерная обработка. Области применения. Книга 2. [Текст] С.В.
Алексахин // В 2-х томах. – М. ПРИОР, 2002. – 423 с.
5.
Артеменко М.В., Бабков А.С. Классификация методов прогнозирования
поведения систем // Современные проблемы науки и образования. – 2013. – №
6. - URL: www.science-education.ru/113-11527 (дата обращения: 19.07.2014).
6.
Артеменко М.В., Серебровский В.В., Бабков А.С. Информационно-
аналитическая модель поддержки принятия решений в процессе диагностики
рака желудка //Фундаментальные исследования. – 2014. - №6. - С.18 - 23.
7.
Бабков А.С. Алгоритм ранней диагностики рака желудка на основе
анализа структуры показателей крови [Текст] / Системный анализ и
управление в биомедицинских системах. – М., 2014. – Т. 13 № 2. – С. 463-465.
8.
Бабков А.С. Система поддержки принятия решений ранней диагностики
рака желудка [Текст] / М.В. Артеменко, В.В. Серебровский, А.С. Бабков //
Международная заочная научно-практическая конференция «Актуальные
вопросы в научной работе и образовательной деятельности». - Тамбов, 2014.
– С. 24-26.
9.
Бабков А.С. Системная оценка коэффициентов уверенности различий
между диагностическими классами в условиях выборок [Текст] / А.С. Бабков
// VI Международной студенческой электронной научной конференции
128
«СТУДЕНЧЕСКИЙ НАУЧНЫЙ ФОРУМ 2014». – Москва, 2014.
10.
Бабков А.С. Технология применения системы поддержки принятия
решения необходимости клинического обследования рака желудка //
Материалы
международной
научно-практической
конференции
«Интегративные процессы в образовании и медицине -2014». – Курск, 2014. –
С. 24-33.
11.
Бабков А.С. Формирование выборок фактологического материала
диагностических систем с оценкой квалификационных возможностей [Текст]
/ А.С. Бабков // Международная заочная научно-практическая конференция
«Актуальные вопросы в научной работе и образовательной деятельности». Тамбов, 2014. – С. 23-24.
12.
Бабков А.С. Формирование информативного признакового множества //
X Международная научно-практическая конференция «Научный прогресс на
рубеже тысячелетий — 2014». - Прага, 2014. - С. 98-101.
13.
Бабков А.С., Серебровский В.В. Артёменко М.В. Синтез решающих
правил ранней диагностики рака желудка на основе анализа связей между
показателями крови // Материалы международной научно-практической
конференции «Интегративные процессы в образовании и медицине -2014». –
Курск, 2014. – С. 33-42.
14.
Боровников В.П. Statistica для студентов и инженеров. – М.: Компьютер
Пресс, 2011. – 301 с.
15.
Валенкевич Л.Н., Яхонтова О.И. Болезни органов пищеварения: рук-во
по гастроэнтерологии для врачей. - СПб.: ДЕАН, 2006. - 656 с.
16.
Вапник В., Червоненкис А. Теория распознавания образов. – М.: Наука,
1974. - 416 с.
17.
Васильев Н.С., Панов, В.М. «Имитационное моделирование сложных
систем» - М.: Практика, 1998.
18.
Воронцов И.М., Шаповалов В.В., Баранов А.А., Кучма В.Р.,
Маталыгина О.А. Руководство по применению автоматизированных
технологий скрининг диагностики нарушений здоровья детей в
129
образовательных учреждениях (под редакцией академика А.А. Баранова и
профессора В.Р. Кучмы) – СПб: РОШУМЗ, 2010. – 77 с.
19.
Воронцов И.М., Шаповалов В.В., Шерстюк Ю.М. Здоровье. Опыт
разработки и обоснование применения автоматизированных систем для
мониторинга и скринирующей диагностики нарушений здоровья. – СПб.:
ООО «ИПК «Коста»Б, 2006. – 432 с.
20.
Воронцов И.М., Шаповалов В.В., Шерстюк Ю.М. Здоровье. Опыт
разработки и обоснование применения автоматизированных систем для
мониторинга и скринирующей диагностики нарушений здоровья. – СПб.:
ООО «ИПК «Коста»Б, 2006. – 432 с.
21.
Гайдышев И.П. Анализ и обработка данных: специальный справочник.
– СПб.: Питер, 2001. – 752 с.
22.
Гланц С. Медико-биологическая статистика. Пер. с англ. – М.: Практика,
1999. - 259 с.
23.
Глухов А.А. Статистика в медицинских исследованиях [Текст] // А.А.
Глухов А.М., Земсков Н.А., Степанян А.А., Андреев А.Н., Рог Э.В., Савенюк
И.Н., Химина В.А. – Воронеж: Изд-во «Водолей», 2005. – 158 с.
24.
Горелик А.Л. Методы распознавания. [Текст] // А.Л. Горелик, В.А.
Скрипкин – М.: Высшая школа, 1984. – 258 с.
25.
Горелов В.Л, Мельникова Е.Н. Основы прогнозирования систем. – М.:
высш.шк., 1986. - 287 с.
26.
Горяинова Е.Р., Панков А.Р., Платогнов Е.Н. Прикладные методы
анализа статисических данных. – М:Изд.дом Высшей школы экономики, 2012.
- 310 c.
27.
Давыдов М.И., Аксель Е.М. Заболеваемость злокачественными
новообразованиями населения России и стран СНГ в 2007 г. – М.: Вестник
РОНЦ им. Н. Н. Блохина РАМН, т.20, №3 (прил. 1), 2009. – С. 120-134.
28.
Дифференциальная диагностика внутренних болезней // Под ред. В.В.
Щекотова. - Ростов-на-Дону: Феникс, 2007. - 592 с.
29.
Доверительные
интервалы
прогноза
[Электронный
ресурс]
//
130
Структурно-логические
схемы:
сайт.
—
URL:
http://схемо.рф/shemy/yekonomika/yekonometrika-v-shemah-i-tablicah-pod-redprof-orehova-s-a-2008-g/8047.html (дата обращения 29.06.2013).
30.
Дуброва, Т.А. Статистические методы прогнозирования [Текст]:
Учебное пособие для вузов // Т.А. Дуброва. - М.: ЮНИТИ-ДАНА, 2003. – 206
с.
31.
Дюк В., Эммануэль В. Информационные технологии в медико-
биологических исследованиях. – СПб: Питер, 2003. – 528 с.
32.
Елисеева Н.Н. Общая теория статистики [Текст] // Н.Н. Елисеева, М.М.
Юзбашев // Учебник под ред. И.И. Елисеевой. – 4-е изд., перераб. и доп. – М.:
Финансы и статистика, 2003. – 480 с.
33.
Емельянов С.Г. Формальные грамматики и грамматические сети.
Особенности применения при решении задач распознавания и обработки
сложноструктурированных разнородных данных и знаний [Текст] // С.Г.
Емельянов, А.В. Николаев. - М.: Высш. шк., 2005. – 251 с.
34.
Жуков Н.Н.
Метод многомерной статистической фильтрации
разновидной геологическрй информации для решения задач картирования и
прогноза. – Киев, 1997. – 48 с.
35.
Завьялов А.В. Системная организация физиологических функций в
норме и патологии: Актовая речь на заседании Ученого совета Курского
государственного медицинского университета 8 февраля 2005 г. - Курск,
КГМУ, 2005. - 20 с.
36.
Заде Л.А. Понятие лингвистической переменной и ее применение к
принятию приближенных решений. // Л.А. Заде – М.: Мир, 1976. – 312 с.
37.
Зайцев
В.М.,
Лифляндский
В.Г.,
Маринкин
В.И.
Прикладная
медицинская статистика: Учебное пособие. - Спб:ООО «Издательство
ФОЛИАНТ», 2006.- 432 с.
38.
Зайцев. М.Г., Варюхин
С.В. Методы оптимизации управления и
принятия решений. Примеры, задачи, кейсы. Изд-во Академия народного
хозяйства. -2011 . - 640 с.
131
39.
Ивахненко А.Г. Долгосрочное прогнозирование и управление сложными
системами. – М.: Техника, 1975. – 313 с.
40.
Ивахненко А.Г., Юрачковский, Ю.П. Моделирование сложных систем
по экспериментальным данным. – М.: Радио и связь, 1987. – 118 с.
41.
Исаева Н.М. Системный подход к математическому моделированию в
биологии и медицине // Н.М. Исаева, Т.н. Субботина // Вестник новых
медицинских технологий. – 2000. – Т.VII №3 - 4 .- 25 с.
42.
Касьянов В.О. Суб'єктивний аналіз. Монографія. - Киев: НАУ, 2007. -
512 с.
43.
Клюшин Д., Петунин Ю. Доказательная медицина. Применение
статистических методов . – Вильянс: Диалектика, 2008. - 320 с.
44.
Коптева Н.А. Прогнозирование возникновения заболеваний работников
сельскохозяйственного производства [Текст] // Н.А. Кореневский, В.И.
Серебровский, Н.А. Коптева - Курск: изд-во Курск, гос. с.-х. ак., 2005. – 35 с.
45.
Кореневский Н.А., Попечителев Е.П., Филист С.А. Проектирование
электронной медицинской аппаратуры для диагностики и лечебных
воздействий. - Курск: Курск. гор. типография, 1999. – 537 с.
46.
Кореневский Н.А., Рябкова Е.Б. Метод синтеза нечетких решающих
правил по информации о геометрической структуре многомерных данных //
Вестник Воронежского государственного технического университета 2011г. Т.7, №8. - С.128-137.
47.
Костенко И.П. Введение в вероятностное прогнозирование. – Ижевск:
Институт компьютерных исследований, 2004. – 316 с.
48.
Котов Ю.Б. Новые математические подходы к задачам медицинской
диагностики. - М.: Единоториал УРСС, 2004. -328 с.
49.
Кровь – индикатор стояния организма и его систем // Под ред. Р.В.
Ставицкой. – М.: МНПИ, 1999. – 160 с.
50.
Круглов В.В., Нечеткая логика и искусственные нейронные сети [Текст]
// В.В. Круглов, М.И. Дли, Р.Ю. Голунов. – М.: Физматлит, 2001. – 221 с.
132
51.
Лбов Г.С. Методы обработки разнотипных экспериментальных данных
[Текст] // Г.С. Лбов. - Новосибирск: Наука, 1981. – 287 с.
52.
Леоненков А. Нечеткое моделирование в среде MATLAB и fuzzyTECH
[Текст] // А. Леоненков. – СПб.: Изд. BNV, 2008. – 736 с.
53.
Мультипликативная
аппроксимация
методом
группового
учета
аргументов // Свидетельство об официальной регистрации программы для
ЭВМ № 2007611654 от 25.04.2007
54.
Новак В. Математические принципы нечеткой логики [Текст]:пер. с
англ. // В. Новак, И. Перфильева, И.М. Мочкрож. – М.: Физматлит, 2006. – 352
с.
55.
Новосельцев В.И. Теоретические основы системного анализа [Текст] //
В.И. Новосельцев, Б.В. Тарасов, В.А. Голиков, Б.Е. Демин // Под ред. В.И.
Новосельцева. - М.: Майор, 2006. – 592 с.
56.
Оболенский А.Н., Кореневский Н.А., Артеменко М.В. Интегральное
применение иммунных сетей и корреляционного анализа для выявления
патологий
в
электрокардиосигнале
//
Известия
Юго-Западного
государственного университета. Серия: Управление, вычислительная техника,
информатика. – 2012. - №2, Ч.3. – С. 351-356.
57.
Обрезан А.Г., Шайдаков Е.В., Стрельников А.А. Скрининг и
профилактика актуальных заболеваний. - Спб.: Спецлит Спб, 2012.
58.
Омельченко В., Демидова А. Математика. Компьютерные технологии в
медицине. – М.: Из-тво Феникс, 2010. - 592 с.
59.
Попечителев
Е.П.
Методы
медико-биологических
исследований.
Системные аспекты [Текст]: учеб. Пособие // Е.П. Попечителев. - Житомир,
1997. - 186 с.
60.
Попечителев Е.П. Системный анализ медико-биологических
исследований // Е.П. Попечителев; Санкт-Петербургский государственный
электротехнический университет им. В.И. Ульянова (Ленина) «ЛЭТИ». Саратов: Науч. книга, 2009. – 366 с.
61.
Портной Л.М., Статник Г.А. Нужна ли современная диагностика рака
133
желудка? // Медицинская визуализация, №3. – С. 23-34.
62.
Рак
желудка:
симптомы,
диагностика,
лечение,
профилактика
[Электронный ресурс]. – Режим доступа: http://natural-medicine.ru/4127-rakzheludka.html (дата обращения 18.02.2014).
63.
Рангайн Р.М. Анализ биомедицинских сигналов. Практический подход
// Пер.с англ. Под ред. А.П. Немирко. – М.: ФИЗМАТЛИТ, 2010. - 440 с.
64.
Романко В.К. Разностные уравнения. Учебное пособие. – М.:
Издательство Бином, 2006. – 113 с.
65.
Рыков А.С. Модели и методы системного анализа: принятие решений и
оптимизация// Учебное пособие для вузов . - М.: Издательский дом «Руда и
металлы», 2005. – 352 с.
66.
Соленова Л.Г., Михайловский Н.Я., Смулевич В.Б. Первичная
профилактика
рака:
Информ.
бюл.
2009.
URL:
http://www.ppr-
info.ru/attachments/158_PPR-1_9.pdf (дата обращения 29.06.2014).
67.
Соловьев И.В., Майорогв А.А. Проектирование информационных
систем. Фундаментальный курс. // под ред. В.П. Савиных. – М.:
Академический проект, 2009. – 398 с.
68.
Строгалев В.П., Толкачева И.О. Имитационное моделирование: Учеб.
Пособие. - М.: изд-во МГТУ им. Н.Э. Баумана, 2008. – 280 с.
69.
Туйман А.Е. Анализ показателей погрешности для оценки качества
прогнозирования. - Омск. - 32 с.
70.
Устинов А.Г. Автоматизированные медико-технологические системы в
3-х частях [Текст] // А.Г. Устинов, В.А. Ситарчук, Н.А, Кореневский // Под
ред. А.Г. Устинова. Монография. – Курск, КурскГТУ, 1995. – 390 с.
71.
Фролов В.Н. Управление в биологических и медицинских системах
[Текст]: учеб. Пособие // В.Н. Фролов. Под ред. д-ра техн. наук, проф. Я.Е.
Львовича и д-ра мед. наук, проф. М.В. Фролова. – Воронеж: Воронеж. гос.
техн. ун-т., 2001. – 327 с.
72.
Хадарцев А.А. Информационные технологии в медицине: монография.–
Тула, 2006. – 272 с.
134
73.
Хадарцев А.А., Соколов Э.М. Интеграция медицинской науки,
образования и практической деятельности. // В сб.: Тезисы докладов научнопрактической конференции «50 лет сотрудничества». - Тула, 1997. – С. 268271.
74.
Черноусов А.Ф. Ранний рак и предопухолевые заболевания желудка. -
М: ИздАТ, 2002. - 253 с.
75.
Черноусов А.Ф., Черноусов Ф.А., Селиванова И.М. Радикальное
хирургическое лечение раннего рака желудка. – М.: Хирургия. Журнал им.
Н.И. Пирогова, 2004. - №7.
76.
Шаповалов В.В., Ахутин В.М. Формальная модель автоматизированной
системы профилактических осмотров населения. - М.: Медицинская техника,
№1, 2002. - С. 3-7.
77.
Шаповалов В.В., Маталыгина О.А., Воронцов И.М. Эволюция
автоматизированной
системы
профилактических
осмотров
детей
в
автоматизированный комплекс для диспансерных обследований. - М.:
Медицинская техника, №3, 2005. - С. 18-21.
78.
Шебшаевич Л.Г., Алексеев А.А. Жизнь – кибернетическая медико-
биологическая системность («Геном человека», клонирование – критический
анализ). - М.: Триада Плюс, 2001. – 608 с.
79.
Шепитько Г.Е. Социальное прогнозирование и моделирование. - М.:
РИО Академии ЭБ МВД России, 2005. – 150 с.
80.
Шмак А.И Рак желудка: факторы риска, профилактика, диагностика и
лечение: метод. пособие // А.И. Шмак. - Минск, 2007. - 12 с.
81.
Яхъяева Г.Э. Нечеткие множества и нейронные сети. Учебное пособие
[Текст] // Г.Э. Яхъяева. - М.: Интернет-университет информационных
технологий; БИНОМ. Лаборатория знаний, 2006. – 316 с.
82.
Allum W.H., Powell D.J., McConkey C.C. et al. Gastric cancer: a 25 year
review // Brit. J. Surg. – 1989. – Vol. 76. – P. 535-540.
83.
Blot W.J., Devesa S.S., Kneller R.W., Fraumeni J.F. Rising incidence of
adenocarcinoma of the esophagus and gastriccardia // JAMA. – 1999. – Vol. 265. –
135
P. 1287.
84.
Chisato H., Daisuke S. The Japanese Guidelines for Gastric Cancer Screening
// Jpn. J. Clin. Oncol. – 2008. – Vol. 38 . – P. 259-267.
85.
Choi M.G., Lee J.H., Park K.J., Yang H.K., Park J.G., Lee K.U. et al.
Chronological changes of clinicopathologic features in gastric cancer // J. Korean.
Surg. Soc. – 1999. – Vol. 57. – P. 514-522.
86.
Crew K.D., Neugut A.I. Epidemiology of gastric cancer // World J.
Gastroenterol. – 2006. – Vol. 12. – P. 354-362.
87.
Dr Knut Schroeder Diagnosing Your Health Symptoms for Dummies. - John
Wiley & Sons Ltd, 2010.
88.
Dr Terry Priestman The Cancer Survivor's handbook. - Sheldon Press, 2009.
89.
Finegan W.C. Being a Cancer Patient's Carer: A Guide. - Radcliffe Publishing
Ltd, 2005.
90.
Finegan W.C. Being a Cancer Patient's Carer: A Guide. - Radcliffe
Publishing Ltd, 2005.
91.
Geiger C. The Cancer Survivors Club. - CKG Ventures Ltd, 2012.
92.
Hattori Y., Tashiro H., Kawamoto T. et al. Sensitivity and specificity of mass
screening for gastric cancer using the measurement of serum pepsinogens // Jpn. J.
Cancer Res. – 1995. – Vol. 86. – P. 1210-1215.
93.
Hosokawa O., Hattori M., Takeda T., Watanabe K., Fujita M. Accuracy of
endoscopy in detecting gastric cancer // J. Gastroenterol. Mass. Surv. – 2004. – Vol.
42. – P. 33-39.
94.
Jemal A, Bray F, Center MM, Ferlay J, Ward E, Forman D. Global cancer
statistics. - CA Cancer J Clin 2011. - P. 69–90.
95.
Jemal A., Siegel R., Ward E., Murray T., Xu J., Thun M.J. Cancer statistics,
2007 // CA Cancer J. Clin. – 2007. – Vol. 57. – P. 43-66.
96.
Kazuo Tanaka, Hua O. Wang Fuzzy Control Systems Design and Analysis: A
Linear Matrix Inequality Approach. 2001. John Wiley &Sons, INC. ISBNS: 0-47132324-1 (Hardback). – 305 p.
136
97.
Kazuo Tanaka, Hua O. Wang Fuzzy Control Systems Design and Analysis: A
Linear Matrix Inequality Approach. 2001. John Wiley &Sons, INC. ISBNS: 0-47132324-1 (Hardback). - 305 p.
98.
Kitahara F., Kobayashi K., Sato T. et al . Accuracy of screening for gastric
cancer using serum pepsinogen concentrations // Gut. – 1999. – Vol. 44. – P. 693697.
99.
Klir, George, J., Ute H. St. Clair, and Bo Yuan. Fuzzy Set Theory Foundations
and. Applications. - Prentice-Hall, Inc., 1997. - 345p.
100. Kodoi A., Yoshihara M., Sumii K. et al. Serum pepsinogen in screening for
gastric cancer // J. Gastroenterol. – 1995. – Vol. 30. – P. 452-460.
101. Korenevskii, N.A., Khodeev, D.V., Yatsun S.M. “Prediction of genesis and
development of skin diseases at bioactive sites using fuzzy decision rules”
Biomedical Engineering. Springer New York. Volume 42, Number 2 / March 2008.
pp. 60-63. ISSN 0006-3398 (Print) 1573-8256 (Online).
102. Korenevskii, N.A., Krupchatnikov, R.A., Gorbatenco, S.A. “Generation of
fuzzy network models taught on basis of data structure for medical expert systems”
Biomedical Engineering. Springer New York. Volume 42, Number 2 / March 2008.
pp. 67-72. ISSN 0006-3398 (Print) 1573-8256 (Online).
103. Kunisaki C., Ishino J., Nakajima S. et al. Outcomes of mass screening for
gastric carcinoma // Ann. Surg. Oncol. – 2006. – Vol. 13. – P. 221-228.
104. Martin S Karpeh, David P Kelsen, Joel E Tepper. Cancer of the Stomach
Cancer: Principles and Practice of Oncology, 7th Edition Published by Lippincott
Williams & Wilkins, Copyright. – 2005.
105. Miki K. Gastric cancer sc reening using the serum pepsinogen test method //
Gastric Cancer. – 2006. – Vol. 9. – P. 245-253.
106. Mukoubayashi C., Yanaoka K., Ohata H. et al. Serum pepsinogen and gastric
cancer screening // Intern. Med. – 2007. – Vol. 46. – P. 261-266.
107. Murakami R., Tsukuma H., Ubukata T., Nakanishi K., Fujimoto I.,
Kawashima T. et al. Estimation of validity of mass screening program for gastric
cancer in Osaka, Japan // Cancer. – 1990. – Vol. 65. – P. 1255-1260.
137
108. Oishi Y., Kiyohara Y., Kubo M. et al. The serum pepsinogen test as a predictor
of gastric cancer // Amer. J. Epidemiol. – 2006. – Vol. 163. – P. 629-637.
109.
Orchard A. Their Cancer, Your Journey: A Traveller's Guide for Carers,
Family and Friends. - Rainbow Heart Publishing, 2008.
110. Otsuji M., Kouno Y., Otsuji A., Tokushige J., Shimotatara K., Arimura K. et
al. Assessment of small diameter panendoscopy for diagnosis of gastric cancer:
comparative study with follow up survey date // Stomach and Intestine. – 1989. –
Vol. 24. – P. 1291-1297.
111. Parkin D.M. Global cancer statistics in the year 2000 // Lancet oncology. 2001. - Vol. 2, Sept. - P. 533-543.
112. Parsonnet J., Friedman G.D., Vandersteen D.P. et al. Helicobacter pylori
infection and the risk of gastric carcinoma // N. Engl. J. Med. – 1991. – Vol. 325. –
P. 1127.
113. Pierluigi Cocco, Mary H. Ward, Eva Buiatti Occupational Risk Factors for
Gastric Cancer: an Overview. - USA, The Johns Hopkins University School of
Hygiene and Public Health, vol. 18, No. 2, 1996. - P. 219-234.
114. Portnoi L.M., Kazantseva I.A., Isakov V.A. et al. Gastric cancer screening in
selected population of Moscow region: retrospective evaluation // Europ. Radiol. –
1999. – Vol. 9, №4. – P. 701-705.
115. Riad Taha Al-Kasasbeh, Korenevskii N.A., Ionescu F., Kuzmin A.A.
“Synthesis of the Combined Fuzzy Rules for Medical Applications with Using Tools
of Exploration Analysis”. Proc. 4th IAFA Intern. Conferece Interdisciplinary
Approaches in Fractal Analysis, Bucharest, Pomania, May 26029, 2009 ISSN 20664451, pp. 71-78.
116. Riecken B., Pfeiffer R., Ma J.L., Jin M.L., Li J.Y., Liu W.D. et al. No impact
of repeated endoscopic screens on gastric cancer mortality in a prospectively
followed Chinese population at high risk // Prev. Med. – 2002. – Vol. 34. – P. 2228.
117. Statistics and Information Department, Ministry of Health, Labour and
Welfare // Report on the health services for the elderly. – 2002.
138
118. Tashiro A., Sano M., Kinameri K., Fujita K., Takeuchi Y. Comparing mass
screening techniques for gastric cancer in Japan // World J. Gastroenterol. – 2006. –
Vol. 12. – P. 4873-4874.
119. Tsubono Y., Hisamichi S. Case control studies of screening for gastric cancer
in Japan // J. Gastroenterol Mass. Surv. – 1999. – Vol. 37. – P. 182-185.
120. Tsubono Y., Hisamichi S. Screening for gastric cancer in Japan // Gastric.
Cancer. – 2000. – Vol. 3. – P. 9-18.
121. Tsukuma H., Oshima A., Nakahara H., Morii T. Natural history of early
gastric carcer: a non#concurrent, long term, follow up study // Gut. – 2000. – Vol.
47. – P.618-621.
122. Uemura N., Okamoto S., Yamamoto S. et al. Helicobacter pylori infection and
the development of gastric cancer // N. Engl. J. Med. – 2001. – Vol. 345. – P. 784789.
123. URL: http://www.rusmedserv.com/files/labdiag/25_onkomarkery.pdf.
124. URL:
http://www.science-education.ru/113-11527
(дата
обращения:
18.02.2014).
125. Wai K. Leung, Ming-shiang Wu, Yasuo Kakugawa. Screening for gastric
cancer in Asia: current evidence and practice // Lancet. Oncol. – 2008. – Vol. 9. – P.
279-287.
126. Watabe H., Mitsushima T., Yamaji Y., Okamoto M., Wada R., Kokubo T. et
al. Predicting the development of gastric cancer from combining Helicobacter pylori
antibodies and serum pepsinogen status: a prospective endoscopic cohort study //
Gut. – 2005. – Vol.54. – P. 764-768.
127. Yamagata H., Kiyohara Y., Aoyagi K. et al. Impact of Helicobacter pylori
infection on gastric cancer incidence in a general Japanesepopulation // Arch. Intern.
Med. – 2000. – P. 1962-1968.
128. Young Min Kwon, Hyung Taek. Lim Factors associated with use of gastric
cancer screening services in KoreaWorld // J. Gastroenterol. – 2009, August 7. –
Vol. 15. – P. 3653-3659.
129. Zadeh, L.A. Advances in Fuzzy Mathematics and Engineering Fuzzy Sets and
139
Fuzzy information-Granulation Theory. Beijing Normal University Press. 2005.
ISBN 7-303-05324-7.
140
ПРИЛОЖЕНИЕ
Показатели общего анализа крови
«Не больные раком желудка»
Обучающая выборка
эритроцит гемоглоби Цветовой
ы
н
показатель
2
3
4
№ п.п.
1
1
4,2
137
0,978571
2
4,05
125
0,925926
3
3,9
125
0,961538
4
3,85
120
0,935065
5
4,2
134
0,957143
6
7
8
3,65
4,4
4
117
146
122
0,961644
0,995455
0,915
9
4,7
150
0,957447
10
4,6
144
0,93913
11
12
4,26
4,2
140
140
0,985915
1
13
14
15
16
4,5
4,5
4,4
4,4
140
150
148
143
0,933333
1
1,009091
0,975
17
4,6
149
0,971739
18
4,3
140
0,976744
19
20
21
22
4,3
4
4
3,9
141
139
133
117
0,983721
1,0425
0,9975
0,9
моноцит
ы
СОЭ ЕрГеМо
5
6
7
2,11057
3
3
1
1,52740
2
7
7
5,46307
9
5
7
3,21142
5
5
9
4,90114
8
4
3
2,10312
3
9
3
4
3
2,678
2
10 1,5226
2,10127
3
6
7
3,77321
6
3
7
3,79380
6
3
3
6
6
3,8
5,45066
9
1
7
4
4
2,68
10
2
6,044
8
4
4,909
2,66756
4
4
5
3,22976
5
4
7
5,47283
9
3
7
7
2 4,3787
5
5 3,2389
5
4
3,196
141
1
2
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
3
4,1
4
4,1
3,9
4,5
4,2
4,33
4,13
3,91
3,96
3,83
4,56
4,73
4,69
4,53
4,3
4,32
4,34
4,49
4,19
4,38
4,17
4,14
4,2
3,94
3,77
4,12
3,87
4,21
3,67
4,4
4
4,81
4,61
4,28
4,22
4,18
4,49
5,18
4,41
4,29
4
4,37
126
124
132
131
137
126
111
97
98
119
100
129
131
125
120
123
141
134
137
129
111
122
105
110
114
104
88
98
103
71
101
79
116
109
102
106
111
123
114
119
107
118
94
4
0,921951
0,93
0,965854
1,007692
0,913333
0,9
0,23
0,93
1,71
1,57
1,27
0,17
0,95
0,95
0,12
1,01
1,63
0,15
0,34
1,64
0,31
0,16
1,9
0,6
0,19
0,98
0,45
2,22
1,82
0,68
1,31
2,19
0,34
0,96
0,98
0,96
1,94
1,18
1,04
0,22
0,45
1,59
1,2
5
6
12
5
2
7
9
9
3
3
6
9
2
4
5
6
8
5
11
5
3
10
6
13
5
2
7
6
3
11
8
3
5
2
6
6
6
6
6
6
1
8
7
9
6
7
4 7,125659
3 3,2092
3 1,544976
9 4,363385
4 5,441867
3
5,436
3 1,7812
8 2,0892
6 4,1124
5 5,7308
11 1,6788
6 2,3148
4
3,218
3
3,778
6 4,5328
5 3,2444
2 6,8772
4
2,866
5 1,8296
4 6,3216
6 3,4964
5 7,3504
4
3,636
4
1,384
10 4,0036
6 3,7912
3
1,878
5 7,1368
5 5,2808
11 1,9792
5 3,3764
11 2,0836
5 3,5096
3 3,7824
5 3,7912
8 3,7824
6 4,2136
6 3,8792
5 1,0176
4 4,5768
4
4,118
4 5,7396
6
3,888
142
1
2
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
3
3,91
4,1
3,96
4,09
3,91
4,51
3,82
4,21
4,24
4,1
3,94
4,22
3,97
4,28
4,18
3,82
4,53
4,73
4,71
4,36
4,39
4,55
4,31
4,57
4,33
4,47
4,16
3,91
4,01
4,4
4,16
4,12
4,08
4,18
4,52
3,79
4,1
3,96
3,85
3,69
4,4
4,67
4,81
4
68
121
85
91
98
117
87
104
67
52
91
89
101
87
104
58
99
104
149
85
91
119
103
116
135
101
96
113
84
79
122
76
68
75
111
71
48
32
53
30
75
89
96
5
0,49
0,49
2,48
0,46
0,2
0,59
0,67
0,57
1,13
2,01
2,57
1,15
1,61
1,01
1,97
3,16
1,9
1,6
0,86
0,35
0,61
1,39
2,53
0,92
1,52
0,65
1,03
1,29
1,96
0,92
1,41
0,46
2,94
1,29
0,6
1
0,35
2,65
1,79
1,88
0,42
2,77
1,4
6
4
14
4
2
7
11
6
11
3
4
12
8
10
5
7
2
6
7
18
6
6
12
7
7
13
3
8
10
7
6
15
5
4
2
11
6
3
4
6
3
5
7
8
5
6
3
5
11
5
6
3
3
10
5
5
5
5
4
11
7
6
5
5
9
3
7
7
2
5
4
4
5
7
7
4
3
6
6
6
3
11
9
13
5
8
7
7
2,4556
8,0556
3,3312
1,3224
4,008
6,4196
3,6548
6,4108
2,1772
3,1244
7,8508
4,986
6,3084
3,2444
4,7868
2,5104
4,196
4,624
10,4584
3,514
3,6284
7,3316
5,0332
4,3248
7,9488
1,966
4,9332
6,1676
4,7824
3,7648
9,0204
3,0024
3,5336
1,6876
6,424
3,8
1,834
3,406
4,1476
2,5072
2,9848
5,1388
5,096
143
1
2
3
4
5
6
109
4,3
110
4,24
111
4,49
112
5,19
113
4,42
114
4,59
115
4,65
Экзаменационная выборка
93
77
113
82
102
114
85
2,19
0,95
1,16
0,83
1,43
1,2
1,17
9
5
8
1
8
8
3
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
32
33
34
35
134
140
151
157
136
140
152
158
132
123
124
120
109
118
93
118
127
156
120
122
129
134
132
130
121
126
113
92
103
125
113
95
73
81
0,980488
0,954545
0,94375
1,002128
0,948837
1
0,882012
1,008511
0,910345
0,9225
0,978947
0,19
1,55
1,54
0,08
0,36
1,59
0,19
0,16
0,15
1,62
1,84
0,6
0,47
0,12
1,8
1,9
0,08
1,83
0,34
0,56
0,46
1,63
0,81
8
4
4
15
7
4
1
3
5
4
5
3
10
8
3
5
5
16
6
6
10
5
1
8
6
8
6
5
4
10
10
3
4
6
4,1
4,4
4,8
4,7
4,3
4,2
5,17
4,7
4,35
4
3,8
4,82
3,95
4,21
3,58
4,28
4,18
4,7
4,34
4,37
4,54
4,57
5,18
4,29
4,17
3,91
4
3,95
4,1
4,51
4,23
4,7
4,01
3,85
9
10
9
5
4
4
5
7
6,0036
3,218
4,9904
0,9252
5,1092
5,008
2,1948
5 4,911415
5
2,66
3 2,65525
3 8,840936
5 4,337488
4
2,68
5 0,948085
5 2,123745
6 3,200552
3 2,6459
6 3,230737
3 1,7636
5
6,282
5 5,1576
10 1,7152
5 2,9584
4 3,4996
4 9,0436
4 3,4304
7
3,426
2 6,3128
5 3,6096
5
0,824
4 4,6868
4 3,4128
1
5,272
5
4,196
5 2,8352
3 3,0452
4 5,7496
3 5,8464
4 1,8824
9 2,9572
7 3,7164
144
1
2
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
3
4,11
4,41
4,69
4,71
4,31
4,48
4,42
4,59
4,67
4,29
4,01
3,98
4,81
3,91
3,6
4,7
4,53
5,19
4,3
4,34
4,17
3,96
3,95
4,24
4,69
3,84
4,22
4,12
4,41
4,03
4,72
4,62
4,3
4,49
4,16
4,43
4,28
4,39
4,08
3,98
4
108
113
112
153
109
122
137
123
118
120
97
89
71
66
50
95
100
98
110
117
114
43
83
99
47
88
76
95
99
37
144
84
69
118
98
135
88
65
122
66
5
1,31
1,97
2,2
0,2
0,45
2,27
2,23
0,24
0,64
1,89
1,28
1,32
0,24
1,17
1,51
0,08
1,85
1,26
0,79
1,2
2,15
0,17
0,55
1,28
0,99
2,24
1,74
1,62
2,87
3,17
1,59
0,98
0,36
2,21
3,21
2,13
1,39
0,36
2,28
2,5
6
10
6
5
17
8
11
12
6
3
11
7
5
3
6
3
6
8
1
8
7
12
3
7
12
2
13
8
10
8
1
19
6
6
13
8
14
9
6
16
5
5
4
6
5
7
3
2
4
5
5
5
4
5
8
12
3
8
5
4
4
6
5
12
3
6
5
6
5
4
11
5
3
5
3
8
2
4
8
8
4
7
6,1764
4,2268
3,768
9,608
4,678
7,1588
7,7012
3,4656
1,9616
6,9916
4,4832
3,3808
1,7856
3,8748
2,3444
3,3952
5,294
1,1144
4,8276
4,448
7,666
1,7548
4,162
7,2832
1,5556
8,2656
5,2456
6,3128
5,7428
1,9548
11,3396
3,7912
3,5184
8,2524
5,8924
8,7772
5,6516
3,5184
9,9632
3,9
145
«Больные раком желудка»
Обучающая выборка
Цветовой
№ п.п. эритроциты гемоглобин показатель моноциты СОЭ ЭрГеМо
1
2
3
4
5
6
7
1
4,6
142
0,93
2
9 1,5292
2
4,2
115
0,82
2
16 1,4808
3
3,4
107
0,94
2
8 1,5336
6
5
170
1,02
4
2 2,6888
8
3,6
105
0,88
2
22 1,5072
9
5,3
108
0,61
2
6 1,3884
10
4,16
132
0,95
4
10 2,658
11
4,3
145
1,01
3
4 2,1244
13
5
160
0,96
1
4 0,9824
16
3,1
108
1,05
4
12 2,702
17
4
124
0,93
3
10 2,0892
18
5,1
164
0,96
6
12 3,7824
19
4,25
138
0,97
4
26 2,6668
21
4,3
150
1,05
9
9 5,502
23
4,8
153
0,96
2
9 1,5424
24
3,6
114
0,95
1
14 0,978
25
3,35
103
0,92
17
17 9,9248
26
4,5
150
1
3
17
2,12
28
4,3
134
0,93
9
30 5,4492
30
4,7
150
0,96
3
3 2,1024
31
4,3
130
0,91
4
26 2,6404
32
3,9
136
1,05
3
4 2,142
33
3,5
117
1
5
12
3,24
34
4,6
120
0,78
2
24 1,4632
36
2,7
71
0,79
2
10 1,4676
37
3,5
102
0,87
1
16 0,9428
38
3,9
113
0,87
1
16 0,9428
39
2,7
92
1,02
3
4 2,1288
40
4,2
130
0,93
1
11 0,9692
41
3,15
97
0,92
6
12 3,7648
43
4,25
126
0,89
4
7 2,6316
46
3,9
120
0,92
4
18 2,6448
48
4,65
155
1
2
6
1,56
51
5,1
168
0,99
1
4 0,9956
52
3,9
110
0,85
2
4 1,494
53
3,5
100
0,86
3
16 2,0584
55
3,75
120
0,96
3
13 2,1024
57
4
138
1,04
2
6 1,5776
59
3
71
0,71
2
23 1,4324
146
1
2
3
60
3
62
4,65
63
4,36
64
3,76
67
5,01
69
3,13
71
3,62
75
5,32
76
3,86
80
3,9
82
4,7
83
3,6
84
3,54
85
4,62
88
5,28
89
4,71
92
3,11
93
4,38
95
2,7
97
4,45
98
3,51
101
4,41
105
4,12
106
4,65
107
4,7
108
5,27
109
4,18
113
4,42
115
4,76
Экзаменационная выборка
1
2
3
4
5
6
7
8
9
10
11
12
3
3,4
5
4
4,46
4
3,8
5,3
4,4
4,4
5
4,4
4
5
6
93
127
100
89
157
88
114
129
89
131
139
95
86
133
161
135
98
107
59
96
76
116
128
139
123
156
94
130
145
0,93
0,23
0,41
0,52
1,71
0,9
0,95
1,7
1,05
1,06
0,02
0,96
0,47
1,01
1,66
0,97
0,19
0,78
0,3
1,29
0,28
0,9
1,72
0,51
0,25
0,99
1,58
1,83
1,79
4
3
3
3
5
3
5
3
5
9
3
2
6
4
7
4
6
3
3
2
4
3
3
3
2
2
3
3
2
21
9
15
8
3
18
10
8
11
9
9
14
17
15
18
4
12
21
10
14
5
5
3
6
15
5
5
7
4
7
2,6492
1,7812
1,8604
1,9088
3,5524
2,076
3,218
2,428
3,262
5,5064
1,6888
1,5424
3,5668
2,6844
4,6504
2,6668
3,4436
2,0232
1,812
1,6876
2,3632
2,076
2,4368
1,9044
1,23
1,5556
2,3752
2,4852
1,9076
87
100
150
128
146
113
112
170
134
132
170
146
0,87
0,88
0,9
0,96
0,98
0,85
0,88
0,96
0,91
0,9
1,02
1
4
2
1
7
2
5
7
7
1
2
6
2
13
10
4
3
8
3
12
17
7
4
7
2
2,6228
1,5072
0,956
4,3424
1,5512
3,174
4,3072
4,3424
0,9604
1,516
3,8088
1,56
147
1
2
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
3
4,4
4,8
4,5
4,8
2,3
3,4
3,62
4,86
4,88
3,95
4
5,44
4,38
5,11
3,97
3,67
4,05
4,43
4,22
3,66
4,23
3,81
4,88
3,61
3,78
4,29
3,3
3,68
4,81
3,62
2,79
3
4,19
3,63
4,72
2,25
4,08
3,95
4,4
5,12
3,62
4,23
5,29
4
140
154
147
160
74
72
83
138
102
126
109
147
106
152
120
97
95
117
113
115
118
85
113
80
109
157
102
84
139
101
59
77
75
70
145
73
93
107
93
141
111
82
152
5
0,95
0,96
0,98
1
0,97
1,71
1,73
0,91
0,61
1,42
0,11
1,75
1,75
0,23
0,98
1,27
1,6
1,69
0,1
1,77
1,67
0,88
0,12
1,4
0,9
1,71
0,92
1,71
0,13
0,96
0,22
0,05
0,98
1,4
2,18
1,63
0,62
1,43
0,6
2,4
0,61
1,17
2,07
6
1
5
2
1
1
5
3
2
3
4
7
2
4
6
5
6
7
9
5
4
2
2
2
6
5
6
5
4
6
4
3
5
4
4
6
4
4
5
7
6
9
7
7
15
12
7
3
12
12
10
5
6
5
3
5
10
12
23
4
13
33
23
5
7
15
11
12
7
7
17
16
12
12
20
19
8
10
4
16
6
6
3
12
9
14
19
7
0,978
3,2224
1,5512
1
0,9868
3,5524
2,4412
1,5204
1,9484
2,8648
3,9684
1,89
3,01
3,4612
3,2312
3,9188
4,624
5,7836
2,844
3,0188
1,8548
1,5072
1,1728
3,976
3,196
4,1124
3,2048
2,9924
3,4172
2,6624
1,7768
2,822
2,6712
2,856
4,3192
2,9572
2,5128
3,4292
4,184
4,416
5,3084
4,4348
4,8308
148
1
2
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
3
4,23
3,92
4,86
4,41
3,98
4,57
4,31
4,88
4,48
4,73
2,55
2,12
4,43
5,3
3,11
4,93
4,48
4,74
2,52
2,11
4
98
94
85
67
137
111
82
126
114
131
64
52
65
131
91
83
112
130
58
54
5
0,6
0,34
1,29
0,75
2,18
1,23
0,86
1,74
1,06
2,13
0,55
2,4
1,89
2,48
1,05
0,24
1,03
2,12
0,53
2,2
6
6
4
3
6
6
3
4
6
4
3
6
3
5
6
6
6
3
4
5
4
22
19
21
12
7
14
6
12
7
5
16
11
8
5
6
10
6
8
9
11
7
3,624
2,3896
2,2476
3,69
4,3192
2,2212
2,6184
4,1256
2,7064
2,6172
3,602
2,736
3,6316
4,4512
3,822
3,4656
2,7164
2,612
3,502
2,836