close

Вход

Забыли?

вход по аккаунту

982_ппс;pptx

код для вставкиСкачать
V. ИНФОРМАЦИОННЫЕ СИСТЕМЫ,
МАТЕМАТИЧЕСКОЕ МОДЕЛИРОВАНИЕ И
СИСТЕМЫ АВТОМАТИЗАЦИИ
_____________________________________________________
УДК 004.89:004.65
Владимир Владимирович Фомин, доктор технических наук, профессор
[email protected]
Российский государственный педагогический университет им. А.И. Герцена
УЧЕТ КОГНИТИВНОГО ФАКТОРА
ПРИ РАЗРАБОТКЕ АВТОМАТИЗИРОВАННЫХ СИСТЕМ
ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
Человеко-машинные системы, автоматизированные информационные
системы, интеллектуальный анализ данных.
Man-machine systems, automated information systems, data mining.
Интеллектуальный анализ данных — собирательное название, используемое для обозначения совокупности методов обнаружения в данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [3]. Как правило, эти методы
группируются по таким научным направлениям как машинное обучение,
статистика, классификация, прогнозирование и т.д.
Применение компьютерных систем интеллектуального анализа данных требует известного искусства постановщика исследовательских задач, поскольку их решение в конечном итоге должно сочетаться с логикой
его интуитивного анализа. Ключом к успешному применению методов
интеллектуального анализа данных служит не просто выбор одного или
нескольких алгоритмов, а мастерство аналитика.
246
Таким образом, современные интеллектуальные системы являются
всего лишь инструментом (более удачным, менее удачным) в руках пользователя. Именно пользователь-аналитик выбирает соответствующий инструмент анализа и несет ответственность за результаты принимаемых
решений.
Создание программного инструментария интеллектуального анализа (ИИА) данных с широким спектром возможностей требует привлечения новых концепций, методологий, методов имеющих строгое научное
обоснование, в том числе: средств системного моделирования (CASEсредства), средств визуализации, языков программирования и т.д. Использование большого количества специализированных средств разработки
инструментария интеллектуального анализа [2, 3], отражает возможности
современных вычислительных систем при их применении в различных
областях [4] науки, экономики, техники, медицине и дает толчок к развитию информатики как интегрирующей науки.
На современном уровне развития информационных технологий, при
массовом использовании средств вычислительной техники, проблема разработки ИИА акцентируется сегодня на сроках и стоимости, удобстве
эксплуатации и способности разработанной системы к развитию и адаптации [8]. Это влечет за собой потребность в развитии формальных методов проектирования и моделирования – представления, оценки инженерных решений с учетом разноаспектных составляющих современной информационной эпистемологии на базе математического аппарата научно
обосновывающего принятие решений и реализуемого в виде автоматизированных инструментальных систем в развитии концепции индустриальной технологии разработки программного обеспечения.
Инструментарий интеллектуального анализа данных будем относить к классу сложных информационных систем управления, где аналитик, пользователь выступает лицом принимающим решение. В таком случае, общая эффективность действия сложной системы управления зависит
от ряда факторов: качества математического, программного, алгоритмического и аппаратного обеспечения, уровня профессионального мастерства оператора, взаимной приспособленности человека и компьютера как
звеньев единой комплексной системы принятия решений.
247
На сегодняшний день на первый план выходят проблемы многоуровневой адаптации человека и машины в информационных системах [5,
7, 8], решаемые в рамках таких дисциплин как эргономика, техническая
эстетика, психо-семантика, инженерная психология, когнетика, семиотика
и др.
Для обеспечения адекватности информационной модели выделим
ряд общих требований, рекомендуемых для выполнения при ее построении:
− Информационная модель должна быть наглядной, чтобы человек
мог воспринимать сведения быстро и без излишнего кропотливого анализа. В разных случаях наглядность может пониматься по-разному. Одним
из важнейших требований является правильная организация структуры
информационной модели. Большое значение имеет выбор оптимального
способа кодирования информации, определение степени упрощения;
− Информационная модель как элемент производственной среды,
длительно находящейся в поле зрения работающего человека, должна
рассматриваться при разработке не только как звено канала передачи информации, но и как объект эстетического восприятия;
− Информационная модель должна быть построена так, чтобы, с
одной стороны, облегчить оператору выполнение его функций, а с другой
– обеспечить ему возможность находить решение непредвиденных и
проблемных задач.
Характерная особенность ИИА как человеко-машинной системы –
ориентация на коллективное творчество (группа специалистов), а также на
продолжительность самого процесса интеллектуального анализа, предполагающего множественные итерации и мультисеансовый характер работы
с системой. Эти особенности находят свое отражение в архитектуре системы в виде средств, обеспечивающих ведение и коллективное использование исходных данных, промежуточных и окончательных результатов
моделирования, а также сохранение результатов сеанса и продолжение
процессов моделирования, не завершенных в предыдущих сеансах.
248
С точки зрения аналитика - пользователя ИИА важными моментами
являются:
− возможность формального представления моделей данных и
знаний в рамках единого информационного фонда;
− автоматизация накопления, изменения, хранения и представления информации;
− возможность представления иерархических и сетевых структур;
− возможность проведения локального анализа в рамках указанных уровней представления с произвольной степенью детализации;
− удобство эксплуатации с развитой системой управления, интерфейсом.
Cформулируем основные требования к информационной поддержке
ИИА:
− Основу технологии интеллектуального анализа должна составлять открытая совокупность взаимосвязанных моделей представления,
обеспечивающая необходимый уровень формализации знаний и решений;
− Методика моделирования знаний должна быть ориентирована
на совместную разработку и системный анализ разноаспектных специфицированных структур;
− Должен быть обеспечен синтаксический анализ, а так же полнота моделей представления в рамках определений пользователя;
− Оперативное представление пользователю необходимой информации о свойствах исследуемой предметной области, ее элементов и
характеристик, подготовка отчетной документации;
− Средства, предоставляемые ИИА, требуют разработки соответствующих методических материалов, владение которыми позволит использовать инструментарий более эффективно.
Выделим функции, которые должен выполнять интерфейс на современном уровне развития информационных технологий:
− Обеспечение для пользователя возможности постановки задачи
для компьютера путем сообщения только ее условий без задания программы решения;
249
− Возможность для пользователя самостоятельно формировать
операционную среду решения задачи на базе терминов и понятий из
предметной области;
− Обеспечение для пользователя естественных форм представления информации, а также выбор приемлемых для него способов организации диалога;
− Возможность изменения по желанию пользователя структуры
диалога (диалог с архитектурой меню, обмен произвольными сообщениями);
− Обеспечение работы в условиях ошибок, допускаемых пользователем в сообщениях, с использованием средств, объясняющих пользователю его ошибки и непонятные места в ходе решения задачи.
Современный ИИА представляет собой программный комплекс,
ориентированный на применение специалистами в различных прикладных
областях, предназначенный для автоматизации процессов синтеза моделей решения и решения задач распознавания и прогнозирования на основе
интегрированных в систему формальных знаний о методах и моделях
классификации. В основу ИИА положен итеративный процесс: подготовка априорной информации, определение методов и моделей решения
(знаний), обучение системы (синтез модели решения), верификация модели, распознавание (классификация данных).
Сложность извлечения и представления знаний интеллектуальных
информационных систем [1] потребовала появления новой специализации
когнитолог – специалист по знаниям, снабженный математической теорией формализации, методами и практиками извлечения знаний и адекватного их описания в рамках предметных областей.
Еще недавно бала неоспорима и до сих пор преобладает доктрина
«качественно сформированные знания – качественная интеллектуальная
система», и как следствие, прерогатива парадигмы «знания определяют
всё» или «центральная фигура в технологиях интеллектуальных информационных систем – когнитолог (специалист по извлечению и формализации знаний)». Однако, развитие компьютеров и Internet, появление огромного количества накопленной информации в электронном виде (банки
250
данных, репозитории, текстовая информация), методов и алгоритмов извлечения знаний привело к созданию новых технологий извлечения знаний и автоматизации задач, решаемых когнитологом с переносом части
его функций на пользователя интеллектуальной системы.
Важным фактором переноса не только функций когнитолга, но и
ответственности именно на лицо, принимающее решение, в современной
доктрине интеллектуальных технологий снимает серьезные противоречия:
всю вину за неопределенности и неточности знаний возлагали на «разработчика» ИИС, при этом пользователь выводов и результатов их интерпретации не брал на себя никакой ответственности.
Решение этого противоречия лежит в методологическом понимании
проблемы непротиворечивости, неопределенности, неточности данных и
знаний.
Неточность является универсальным фактором, свойственным всем
реальным параметрам. Для количественных атрибутов выделяют следующие пять базовых типов неточности [6]: объективная, ситуационная,
семантическая, методическая и генерализации.
−
Объективная неточность связана с самим "устройством"
нашего мира; сюда относятся: квантовая неточность (неопределенность
Гейзенберга); тепловая – движение атомов и молекул; релятивистская,
связанная с относительностью системы координат.
−
Ситуационная неточность определяется уровнем точности
текущего использования значения того или иного параметра.
−
Семантическая неточность "встроена" в само понятие,
связанное с данным параметром; имеет место для любых реальных
понятий.
−
Методическая
неточность
определяется
неточностью
измерения, связанной с физической природой приборов/инструментов,
неточностью эталонов, времени измерения и т.д.
−
Неточность генерализации имеет своим источником
обобщение значения какого-либо параметра у объектов некоторого класса
или выборки.
251
Сложность и многофакторность проблемы распознавания, разнообразие проблемных областей и категорий задач, отсутствие универсальных
методов решения задачи распознавания приводит к тому, что традиционная методология разработки систем распознавания, как правило, не позволяет достигнуть требуемой эффективности результатов в рамках промышленного применения.
В настоящее время существует значительное противоречие, обусловленное широтой развития формального аппарата теории распознавания образов и сравнительной «отсталостью» большинства из существующих систем распознавания, отражающейся в их ограниченности и узкой
направленности. Данное противоречие частично может быть преодолено
путем разработки интегрированных многофункциональных автоматизированных информационных систем распознавания, ориентированных на
решение широкого класса задач и допускающих адаптацию и настройку
на новую предметную область и категорию задач.
Отличительными чертами многофункциональных ИИА от других
систем подобного типа являются следующие особенности:
− относительно простая возможность интеграции в систему и использования для синтеза решений различных методов и моделей распознавания, что позволяет настроить ИИА на работу практически с любым
классом задач, которые могут быть решены с применением аппарата теории распознавания;
− поддержка различных схем синтеза модели решения задачи (в
том числе разных процедур обучения, моделей коллективного распознавания, адаптивных схем и т.д.) за счет возможности гибкой настройки
имеющихся и определения новых схем синтеза;
− поддержка многоуровневых, иерархических задач распознавания с возможностью синтеза для каждого подуровня своей подмодели
решения; структура такой задачи может быть достаточно просто представлена посредством встроенных специализированных графических редакторов и конструкторов;
− возможность использования синтезированных моделей решения
для различных типов задач, что позволяет строить достаточно обобщен252
ные модели и применять их для решения сходных задач без дополнительной настройки;
− возможность расширения функций и инструментария системы
за счет включения в неё дополнительных модулей.
− кросс-платформенность и работа в сети Internet для использования высокопроизводительной техники с функциями распараллеливания
алгоритмов обработки и хранения больших объемов данных.
При превалировании программной составляющей ИИА и при учете
дуализма «инструментарий интеллектуального анализа данных – пользователь-аналитик» акцент при разработке смещается из сугубо математических, алгоритмических категорий распознавания и прогнозирования к
информационным задачам человеко-машинного взаимодействия и управления с соответствующим включением в сферу оценки эффективности
всего процесса интеллектуального анализа, так называемого, человеческого фактора.
Библиографический список
1.
Венда, В.Ф. Системы гибридного интеллекта: Эволюция, психология,
информатика [Текст] / В.Ф. Венда. – М.: Машиностроение, 1990. – 448 с.
2.
Гаскаров, Д.В. Интеллектуальные информационные системы:
Интеллектуальная информационная технология. Экспертные системы [Текст] /
Д.В. Гаскаров, Д.В. Сикулер, И.К. Фомина. – СПб.: СПГУВК, 2004. – 362 с.
3. Дюк, В.А. Data Mining: учебный курс [Текст] / В.А. Дюк, А.П. Самойленко. – СПб.: Изд-во «Питер», 2001. – 368 с.
4.
Дюк, В.А. Применение технологий интеллектуального анализа
данных в естественнонаучных, технических и гуманитарных областях [Текст] /
В.А. Дюк, А.В. Флегонтов, И.К. Фомина //
Известия Российского
государственного педагогического университета им. А.И. Герцена. – СПб.:
СПбРГПУ, 2011. – № 138. – С. 77 - 84.
5.
Жук, Ю.А. Определение рефлексивных показателей для оценки
эффективности использования дисплейных форм наглядности [Текст] /
Ю.А. Жук, Л.В. Уткин, В.В. Фомин // Известия Российского государственного
педагогического университета им. А.И. Герцена. – СПб.: СПбРГПУ, 2011. – №
138. – С. 84 – 94.
253
6.
Нариньяни, А.С. Недоопределённость в системах представления и
обработки знаний [Текст] / А.С. Нариньяни //Изв. АН СССР. Техн.кибернетика. –
М., 1986. – № 5. – С. 3 - 28.
7.
Раскин, Д. Интерфейс: новые направления в проектировании
компьютерных систем [Текст] / Пер. с англ. Ю. Асотова. – СПб.: Символ-Плюс,
2003. – 272 c.
8.
Фомин, В.В. Оценка сложности информационных систем с учетом
человеческого фактора [Текст] / В.В. Фомин // Программные продукты и системы.
– СПб., 2007. – №4 (80). – С. 35 - 36.
__________
Анализируются возникающие противоречия и пути их решения в связи с
возрастающей функциональностью разрабатываемых автоматизированных систем
интеллектуального анализа и сложностью их человеко-машинного управления и
эксплуатации. Предлагаются меры по снижению факторов неопределенности,
непротиворечивости и неточности данных и решений, принимаемых при использовании инструментария интеллектуального анализа данных, с учетом когнитивных особенностей их информационной организации и интерфейса.
***
Examines the contradictions and their solutions in connection with the increasing
functionality of the automated systems developed by the mining and complexity of their
human-machine management and operation. Proposes measures to reduce the uncertainties and inaccuracies of data consistency and decisions taken when using data mining
tools, taking into account the peculiarities of their ergonomic specifics information organization and interface.
254
1/--страниц
Пожаловаться на содержимое документа