close

Вход

Забыли?

вход по аккаунту

Богатырёв П. Ю.Информационные, методологически и программные средства повышения эффективности накопления и систематизации информации

код для вставки
Актуальность темы исследования. В ходе деятельности любой
организации, а особенно организации, занимающейся инновационной или
иной интеллектуальной деятельностью, образуется большое количество
информационных объектов. Управление информационным пространством
компании, как правило, консолидируется в ECM-системах и является одним
из ключевых факторов ее эффективного функционирования. Доступность
информации позволяет быстрее и эффективнее принимать решения,
экономит время на выполнение известных операций, а также позволяет
накапливать опыт сотрудников и распространять его среди заинтересованных
лиц. Все это выражается в уменьшении издержек, повышении скорости и
качества производственных и сервисных процессов и, как следствие,
приводит к увеличению конкурентоспособности организации.
Информационные объекты организации можно разделить на две
категории - формализованные и неформализованные. В первую группу
входят различные документы, имеющие заранее известный набор атрибутов
и типовое содержание.
построения
архивов
Для автоматизации потоков таких документов и
для
их
хранения
существуют
эффективные
информационные системы класса ECM (Enterprise Content Management).
Однако, объекты второй группы (неформализованные) нельзя четко описать
единообразным набором свойств и для управления такими объектами
необходимо другое информационное обеспечение.
Специфика организации работы с данными объектами
особенностями
когнитивных
способностей
человека.
связана
Фактически,
информационная система выступает инструментом, дополняющим систему
долговременной памяти – мы
обрабатываем,
сохраняем
туда
извлекаем из нее некоторые сведения,
промежуточные
результаты
анализа.
Недостаточно эффективная организация этого информационного хранилища
неизбежно ограничивает эффективность работы сотрудника.
Таким образом, актуальность квалификационной работы связана с
разработкой информационных, методологических и программных средств,
учитывающих специфику объектов систематизации (неформализованные,
неструктурированные документы), специфику когнитивных способностей
человека
для организации более эффективного человеко-машинного
взаимодействия.
Объектом исследования является информационное пространство
организации, а также процессы его формирования и использования.
Предметом
исследования
эффективность
работы
с
неформализованными неструктурированными документами.
Целью квалификационной работы является разработка моделей,
методов и инструментов, повышающих эффективность занесения в систему и
поиска документов на основе признаков.
Для достижения поставленной цели необходимо решить следующие
задачи:
− описать критерии эффективности систематизации документов и
характеристики моделей систематизации;
− разработать модель описания признаков документов, в рамках
которой будут осуществляться процессы функционирования
информационного пространства организации;
− разработать методику формирования и поддержания в актуальном
состоянии информационного пространства с использованием
предложенной модели систематизации;
− разработать прототип информационной системы, реализующий
механизмы работы с информационным пространством на основе
предложенной модели;
− оценить
эффективность
разработанного
информационно-методологического
комплекса
программнопри
решении
задачи управления неструктурированными неформализованными
документами организации.
Методы исследования. При выполнении работы использовались
методы математического моделирования средствами теории множеств и
теории вероятности и математической статистики, методы имитационного
моделирования, методы экспериментальной психологии, методы построения
веб-приложений.
Научная новизна. В работе получены следующие результаты,
характеризующиеся научной новизной.
1. Предложены критерии описательной способности, описательной
емкости, сложности навигации и эффективности в целом модели
систематизации.
2. Предложена
комбинированная
модель
систематизации,
объединяющая положительные черты иерархической и теговой
моделей,
и
эффективности
устраняющая
их
недостатки
функционирования
в
контексте
информационного
пространства организации.
3. Предложена
методика
построения
и
сопровождения
информационного пространства на основе комбинированной
модели систематизации, позволяющая в определенной степени
приблизить ее показатели к значениям идеальной модели.
Практическая значимость работы. Разработана информационная,
методологическая и программная база для разработки модуля ECM систем,
расширяющего их функциональность для работы с неструктурированными,
неформализованными документами. Разработанные средства позволяют
повысить
эффективность
работы
в
информационном
пространстве
организации по сравнению с существующими инструментами, и как
следствие, открывают потенциал для
роста продуктивности работы
сотрудников и увеличению экономических и социальных показателей
деятельности организации.
Достоверность исследований определяется обоснованием выявленных
закономерностей средствами математического анализа, использовании
достижений современной когнитивной психологии, а также подтверждением
эффективности
полученных результатов методами
экспериментальной
психологии.
Реализация и внедрение результатов. Разработан прототип данного
модуля для отечественной СЭД/ECM платформы Docsvision и подготовлено
внедрение данной функциональности в состав основного продукта компании,
который имеет более 1000 внедрений на территории России и стран СНГ.
Основные положения, выносимые на защиту.
1. Формулировка критериев эффективности модели систематизации;
2. Комбинированная тегово-иерархическая модель систематизации;
3. Методика построения и сопровождения тегово-иерархической
модели при внердении;
4. Результаты оценки эффективности тегово-иерархической модели.
Способность организации успешно функционировать на конкурентном
рынке и выполнять свои социальные обязательства во многом зависит от
эффективности организации ее информационных процессов. Информация –
движущая
сила
Информационные
любого
потоки
производственного
обеспечивают
и
сервисного
процессы
процесса.
управления
и
согласования, коммуникацию между участниками работ по оперативным
вопросам, распространение знаний о способе и методах выполнения тех или
иных
операций.
Кроме
того,
с
распространение
информационных
технологий, информационные ресурсы зачастую сами по себе становятся
объектами производства. Например, среди задач исследовательского отдела
могут быть только задачи по формированию научно-исследовательских
отчетов и прототипов программного обеспечения, которые также являются
электронными файлами.
В связи с этим, одной из важных задач для обеспечения эффективной
работы компании и отдельных ее подразделений и даже сотрудников,
является
задача
систематизации
ее
внутреннего
информационного
пространства. Информационное пространство организации как правило
состоит из электронных документов двух разновидностей. Во-первых, это
формализованные документы с заранее известным набором атрибутов и
структурой. Это как правило официальная документация, призванная
обеспечивать стандартные регламентированные процедуры. В частности,
такие процедуры во многом определены при взаимодействии между
различными участниками рынка, между участниками рынка и государством,
а также при взаимодействии различных подразделений или сотрудников. К
ним относятся договора, бухгалтерская документация, заявки и другие
подобные документы. Во всех случаях, в силу регламентированности самих
процессов, существует возможность создания базы данных определенной
структуры для хранения таких документов, поскольку структура документов
определена и меняется довольно редко. Работа с подобными базами данных
успешно реализовано в составе множество современных информационных
систем класса СЭД/ECM (Системы электронного документооборота /
Enterprise Content Mangaement). Знание структуры документов позволяет при
этом обеспечивать работу различных инструментов систематизации, таких
как сортировка и фильтрация по значению тех или иных полей, группировка,
поиск и настройка различных представлений и архивов. Благодаря схожести
процессов
и
самих
документов,
данных
инструментов
оказывается
достаточно для организации эффективного доступа к необходимым
документам по мере возникновения необходимости.
Однако, существует другая разновидность информационных ресурсов,
которые
также
составляют
существенную
часть
внутреннего
информационного пространства организации. Это информационные объекты,
созданные в рамках разовых/редких процессов, в рамках исследовательских
задач, временные рабочие файлы созданные в ходе исполнения стандартных
процессов, сообщения между участниками производственных процессов и
других подобных активностях. Их объединяет отсутствие единобразности,
связанное с уникальностью самих информационных процессов. Как правило,
они имеют произвольную структуру, у них нет общего набора атрибутов, на
основе которых их можно было бы разместить в заранее подготовленной базе
данных. Единственное что применимо к подобного рода информационным
объектам - это некоторая категоризация по их семантическому содержанию.
В существующих информационных системах как правило используется
иерархическая категоризация, аналогичная той, которая используется в
файловой системе операционной системы Windows. Узлы данной иерархии
обычно называют «папками» или «директориями», а информационные
объекты «файлами». Альтернативная система категоризации заключается
использовании плоского набора категорий, каждая из которых независимо
от другой может быть сопоставлена с любым количеством объектов.
Категории в таких системах обычно называют «метками» или «тегами».
Соответственно, модобная «теговая» модель позволяет искать объекты
расположенные
на
пересечении
нескольких
категорий,
существенно
сокращая область поиска. Однако, плоская структура тегов затрудняет работу
при возникновении большого количества объектов, т.к. список самих тегов
становится слишком большим.
В нашей работе предлагается альтернативная «мультииерархическую»
модель
систематизации
организации,
занимающая
внутреннего
информационного
промежуточное
положение
пространства
между
двумя
описанными моделями – теговой и иерархической. Как в иерархической
модели
в
мультииерархической
модели
категории
располагаются
в
иерархических структурах. Однако, данных структур может быть больше
одной, так что каждая из них освещает множество объектов с различных
точек зрения. Также как в теговой модели объекты могут быть сопоставлены
с множеством категорий из различных участков модели. Соответственно, при
поиске объектов возможно построение сложных запросов, представляющих
комбинацию из различных категорий, позволяющих выполнять различные
операции над множествами категорий для сокращения области поиска
необходимого объекта. Иерархии формируются таким образом, чтобы
каждая из них соответствовала некоторому критерию, по которому
классифицируются объекты. Благодаря тому, что каждый из критериев
рассматривается независимо от других, мультииерархическая модель
получает ряд преимуществ, по сравнению с иерархической. В частности, это
влияет на ее емкость и способность к масштабированию.
Емкость определяет какое количество объектов можно разместить в
модели, без потери ее эффективности. Эффективность модели мы
определяем как ее способность к сужению области поиска. Допустим, открыв
некоторую папку в файловой системе мы сократили область поиска от всех
файлов файловой системы до той их части, которая находится в данной
папке. Соответственно, если в папке будет находится очень много файлов, то
модель будет не эффективна, т.к. она не позволяет сузить область поиска в
достаточной степени. Второй аспект, определяющий емкость модели
заключается количестве элементов модели. Более емкая модель обладает
большей эффективностью при равном количестве элементов. Количество
элементов
влияет
на
сложность
разработки
модели,
и
сложность
поддержания ее в рабочем состоянии.
Емкость иерархической модели можно выразить следующей формулой:
где
– количество объектов, которые можно разместить в системе, без
потери эффективности модели,
– максимальное количество объектов, поиск среди которых
можно считать эффективным,
– средняя ширина дерева (количество дочерних узлов)
– глубина дерева.
При
рисунке 1.
емкость мультииеархической модели показана на
Рисунок 1 – Зависимость емкости иерархической модели от глубины
дерева
Емкость мультииерархической модели определяется по формуле:
где
– количество объектов, которые можно разместить в системе, без
потери эффективности модели,
– максимальное количество объектов, поиск среди которых
можно считать эффективным,
– средняя количество категорий в критерии,
– количество критериев.
При
зависимость емкости мультииерархической
модели от количества критериев показан на рисуке 2.
Рисунок 2 - Зависимость максимальной емкости мультииерархической
модели от количества критериев при
То есть, при наличии уже трех критериев мультииерархическая модель
обладает емкость, превышающую емкость иерархической модели в сотни
раз.
Данные положения были проверены в эксперименте на базе
имитационной модели, повторяющей действия пользователя по поиску
объектов в системе. Алгоритм имитационной модели состоит из двух частей
– генерация модели систематизации и имитация действий пользователя по
поиску случайного объекта в этой модели. Генерация модели состоит в
генерации
иерархических
соответствии
с
планом
структур
и
наполнении
эксперимента.
их
объектами
Иерархические
в
структуры
генерировались случайным образом итеративно по уровням, сверху вниз, так
что у каждого узла оказывалось от 2 до 9 дочерних узлов (распределение
случайной
величины
равномерное),
поскольку
в
данном
интервале
эффективность выбора элемента из списка наиболее высокая (емкость
кратковременной памяти равна 7 ± 2). Далее генерировалось заданное
количество объектов, и они случайным образом ставились в соответствие
узлам иерархических структур, в соответствии с ограничениями, описанными
выше. Вероятность сопоставления любого объекта с любым узлом являлась
одинаковой.
Вторая часть алгоритма - имитация действий пользователя по поиску
случайно выбранного объекта, представлена на рисунке 1. Выполнение
изображенного на рисунке алгоритму соответствует одному прогону
имитационной модели, и время его выполнения является искомым временем
поиска объекта. Значение
было выбрано как 30±5.
Рисунок 1 – Алгоритм имитации действий пользователя по поиску
объекта
На рисунках 3, 4, 5 и 6 показаны результаты моделирования для 1
(иерархическая модель), 2, 3 и 4 деревьев.
Рисунок 3 - Емкостная характеристика для модели систематизации,
включающей 1 дерево
Рисунок 4 - Емкостная характеристика для модели систематизации,
включающей 2 дерева
Рисунок 5 - Емкостная характеристика для модели систематизации,
включающей 3 дерева
Рисунок 6 - Емкостная характеристика для модели систематизации,
включающей 4 дерева
Таким
образом,
было
подтверждено,
что
емкость
мультииерархической модели возрастает с ростом количества критериев
систематизации и существенно превосходит емкость иерархической модели.
Для
целей
апробации,
концепция
мультииерархической
систематизации была реализована в прототипе программной системы на базе
ECM платформы Docsvision. Прототип позволяет создавать и редактировать
узлы мультииерархической модели, сопоставлять их с информационными
объектами и производить поиск. На рисунке 7 представлен внешний вид
прототипа.
Рисунок 7 – Пользовательский интерфейс поиска объектов прототипа
Осуществление поиска с достаточной эффективностью в базе
потребовало особой формы хранения информации, о соответствии карточек
элементам мультииерархической модели. Поисковая подсистема должна
поддерживать выполнение сложных запросов, включающих:
1) Произвольное логическое условие выбора карточек, включающее
выборку по соответствию различным узлам. Например, должна
поддерживаться возможность выбора условий вида “А and (B or
C)”, где A, B и С – узлы мультииерархической модели.
2) Предоставлять возможность выполнения запросов, учитывающих
связи между узлами. Допустим, чтобы при запросе узла А можно
было получить также карточки, соответствующие всем узлам,
которые прямо или опосредовано связаны с А.
Учитывая, что количество объектов в системе может быть весьма
большим, было решено оптимизировать представление данных в БД.
Оптимизация
стала
возможна
благодаря
введению
ограничения
на
количество узлов, которые можно поставить в соответствие одной карточке.
В частности, было выбрано ограничение в 15 узлов, т.к. трудно представить
реальный
случай
использования,
когда
одна
карточка
будет
классифицироваться по более чем 15 критериям. Ограничив количество
узлов, мы получили возможность хранить соответствия между карточками и
узлами в виде одной таблицы, схема которой показана на рисунке 7.9.
Данная таблица хранит одну единственную строку для каждой
карточки, при этом в атрибутах F1-F15 хранятся идентификаторы узлов
мультииерархической модели, сопоставленные с данной карточкой. Это
позволяет осуществлять поиск карточек по заданному набору узлов без
необходимости выполнения операций JOIN между различными таблицами.
Выполнение сложных логических запросов организовано путем
представления логической формулы через таблицу положительных решений.
То есть, полный список всех сочетаний входящих в состав выражения
переменных, при которых результатом является истина.
Рисунок 7.9 – Схема таблицы, хранящей соответствия узлов
иерархической модели и карточек
Соответственно, в поисковую процедуру передаются только те строки,
для которых результат является истиным. При этом, каждая строка
кодируется побитно в двоичном представлении одного числа. Например,
строка со значениями A, B и C равными 1, 1 и 0 представляется в виде числа
3, т.к. 110 в двоичной системе счисления равно 3 в десятичной. В формате
XML данные для выражения А and (B or C) представляются следующим
образом:
<Values>
<Value>3</Value>
<Value>5</Value>
<Value>7</Value>
</Values>
Переданное
в
SQL-скрипт
XML-значение
такого
формата
преобразуется во временную таблицу, состоящую из одного столбца при
помощи
следующего
кода
(XML-строка
передается
в
параметре
@Conditions):
DECLARE @ConditionsXml xml
SET @ConditionsXml = @Conditions
CREATE TABLE #ConditionsTable (Code integer)
INSERT INTO #ConditionsTable
SELECT b.value('(./text())[1]', 'integer') AS Code FROM @ConditionsXml.nodes('/Values/Value') AS
a(b)
Используя эту временную таблицу, как будет показано далее, мы
можем написать запрос с условием WHERE следующего вида:
SELECT …
WHERE (K1 | K2 | K3 | K4 | K5 | K6 | K7 | K8 | K9 | K10 | K11 | K12 | K13
| K14 | K15) IN (SELECT Code FROM #ConditionsTable)
То есть, мы используем битовые операции для формирования решения
логического выражения для конкретной карточки, и проверяем, что данное
решение присутствует среди списка положительных решений выражения.
Таким образом, мы имеем таблицу положительных решений в виде
таблицы #Conditions и параметры выражения в соответствующих таблицах
#F1 - #F15. С использованием этих таблиц поисковый запрос будет выглядеть
следующим образом:
SELECT DISTINCT CardID, CreationDate, ChangeDate, CreatedBy, ChangedBy FROM (
SELECT
CardID, CreationDate, ChangeDate, CreatedBy, ChangedBy,
CASE WHEN K1.F IS NOT NULL THEN 1 ELSE 0 END K1,
CASE WHEN K2.F IS NOT NULL THEN 2 ELSE 0 END K2,
CASE WHEN K3.F IS NOT NULL THEN 4 ELSE 0 END K3,
CASE WHEN K4.F IS NOT NULL THEN 8 ELSE 0 END K4,
CASE WHEN K5.F IS NOT NULL THEN 16 ELSE 0 END K5,
CASE WHEN K6.F IS NOT NULL THEN 32 ELSE 0 END K6,
CASE WHEN K7.F IS NOT NULL THEN 64 ELSE 0 END K7,
CASE WHEN K8.F IS NOT NULL THEN 128 ELSE 0 END K8,
CASE WHEN K9.F IS NOT NULL THEN 256 ELSE 0 END K9,
CASE WHEN K10.F IS NOT NULL THEN 512 ELSE 0 END K10,
CASE WHEN K11.F IS NOT NULL THEN 1024 ELSE 0 END K11,
CASE WHEN K12.F IS NOT NULL THEN 2048 ELSE 0 END K12,
CASE WHEN K13.F IS NOT NULL THEN 4096 ELSE 0 END K13,
CASE WHEN K14.F IS NOT NULL THEN 8192 ELSE 0 END K14,
CASE WHEN K15.F IS NOT NULL THEN 16384 ELSE 0 END K15
FROM [dbo].[dvtable_{49A8A9AB-DC36-421D-B181-6B1B4CAF254E}] tShortcuts WITH(NOLOCK)
LEFT JOIN #F1 K1 ON K1.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F2 K2 ON K2.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F3 K3 ON K3.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F4 K4 ON K4.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F5 K5 ON K5.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F6 K6 ON K6.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F7 K7 ON K7.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F8 K8 ON K8.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F9 K9 ON K9.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F10 K10 ON K10.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F11 K11 ON K11.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F12 K12 ON K12.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F13 K13 ON K13.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F14 K14 ON K14.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
LEFT JOIN #F15 K15 ON K15.F IN (F1,F2,F3,F4,F5,F6,F7,F8,F9,F10,F11,F12,F13,F14,F15)
) AS Src
WHERE (K1 | K2 | K3 | K4 | K5 | K6 | K7 | K8 | K9 | K10 | K11 | K12 | K13 | K14 | K15) IN (SELECT
Code FROM #ConditionsTable)
ORDER BY ChangeDate DESC
Во внутреннем запросе мы делаем выборку из основной таблицы
соответствия карточек и узлов мультииерархической модели, объединяя ее с
временными таблицами параметров #F1 - #F15 при помощи операции LEFT
JOIN, попутно определяя, имеется ли значение параметра среди одного из
столбцов F1 – F15. Если в качестве параметра передан набор узлов, то строки
карточки дублируются для каждого из узлов. В выходных данных запроса мы
анализируем результаты объединения: если какой-то из узлов поставлен в
сопоставление данной карточке, то в зависимости от номера параметра,
соответствующий столбец результата K1-K15 принимает значение 1, 2, 4, 8
… 16384 (то есть, 1, 01, 001, 0001… в двоичном представлении), либо 0, если
карточка не сопоставлена узлу.
Внешний запрос использует внутренний запрос в качестве источника,
выбирая только те карточки для которых выполняется логическое условие.
Для этого он объединяет через логичесикий оператор «или» столбцы K1-K15,
и
проверяет,
что
получившийся
результат
находится
в
таблице
положительных решений выражения. Таким образом, вся поисковая
процедура реализуется через простые запросы на выборку, реализуя при этом
алгоритм фильтрации по сложному логическому условию с возможностью
иерархического поиска.
Заключение
Современные
информационные
организации
технологии
во
как
всех
правило
активно
сферах
своей
используют
деятельности.
Информационные системы применяются для задач управления, накопления
знаний и обмена опытом, отчетности перед государственными органами,
организации
производственных
процессов,
коммуникации
между
сотрудниками и для множества других задач. В ходе всех этих процессов
формируется
большое
количество
информационных
объектов
самой
различной природы и структуры. Часть из этих объектов формализованы и
могут быть обработаны формальными методами при помощи сохранения в
базах данных с заранее описанной структурой метаданных. Это как правило
регламентированная
официальная
документация,
связанная
со
взаимодействием с контрагентами и государством – договора, ведомости,
первичная бухгалтерская документация, некоторые внутренние заявки и
распоряжения. Для работы с подобными документами существует множество
эффективных
технических
решений
класса
СЭД/EMC
от
разных
производителей, как отечественных так и зарубежных.
Однако, помимо формализованных документов существует также
значительный пласт информационных объектов, которые не поддаются
единообразному описанию. Это различные рабочие документы, результаты
обсуждений, письма, данные собранные в ходе решения специфичных, в том
числе
исследовательских
и
инновационных
задач
и
т.д.
Согласно
определениям [23], подобные информационные объекты также попадают в
поле деятельности ECM систем, однако в существующих продуктах работа с
подобными объектами ограничивается использованием стандартных моделей
систематизации, которые не могут обеспечить высоких показателей
масштабируемости и эффективности.
Среди
стандартных
информационного
способов
пространства
систематизации
организации
внутреннего
можно
выделить
иерархическую и теговую модели, а также инструменты вроде поиска,
сортировки, фильтрации, графического выделения, закладок и т.д.
В данной работе была предложена мультииерархическая модель
систематизации, которая занимает промежуточное положение между
иерархической и теговой моделями. Аналогично теговой модели , в
мультииерархической модели возможно сопоставление информационных
сразу объектов с несколькими узлами, а также поиск по пересечению
нескольких узлов. При этом, как в иерархической модели узлы образуют
иерархические структуры. Однако, выделяется не одно дерево, а несколько
иерархий
образующих
лес.
Каждая
иерархия
классифицирует
информационные объекты с определенной точки зрения по различным
критериям. В результате процесс сопоставление объектов с узлами модели
представляется как многокритериальный анализ принадлежности объекта к
различным категориям предметной области. Подобный подход позволяет
более точно описывать объекты предметной области, а также делает более
эффективной процедуру поиска, т.к. каждый из критериев рассматривает
независимо от других.
Математический
анализ
сравнения
иерархической
и
мультииерархической моделей показал, что благодаря усовершенствованной
процедуре поиска объектов и независимости критериев в структуре модели
мультииерархическая
модель
обладает
значительно
превосходящими
показателями емкости и масштабируемости. В частности, уже при
классификации
по
трем
критериям
с
пятью
категориями
мультииерархическая модель превосходит по емкости иерархическую в
сотни раз. При этом, мультииерархическая модель имеет в десятки раз
меньше узлов, что делает более простым ее разработку, сопровождение и
преобразование.
Результаты
математического
анализа
были
подтверждены
имитационной моделью. В ходе эксперимента имитировались действия
пользователя по поиску объекта в моделях различных конфигураций – с
одним деревом (иерархическая модель), двумя, тремя и четырьмя деревьями
с различным количеством узлов (от 10 до 50). Результаты эксперимента
показали, что с ростом количества деревьев емкость мультииерархической
модели возрастает, как и было описано теоретически.
Для апробации основных положений исследования был реализован
прототип информационной системы на основе платформы Docsvision.
Прототип позволяет создавать и редактировать мультииерахическую модель,
ассоциировать с ее узлами карточки и производить поиск. При этом была
разработана эффективная форма представления сопоставлений между узлами
мультиирархической модели и информационным объектами, позволяющая
реализовать процедуру поиска с запросом в виде логической формулы любой
сложности, а также выборкой по связанным узлам в виде простого SELECT
запроса. Реализованная таким образом процедура поиска может обеспечить
быстрый отклик системы при запросах любой сложности и большом
количестве объектов в системе.
Таким образом, можно считать, что цели работы, заключающиеся в
разработке новых способов систематизации внутреннего пространства
организации достигнуты. Предложенный метод существенно превосходит
существующие решения и может значительно повысить эффективность
управления неформализованным содержимым организации в рамках ECMсистем.
Основное содержание диссертации изложено в следующих работах:
Публикации в изданиях, рекомендованных ВАК России:
1. Богатырѐв П.Ю., Коськин А.В. Систематизация информации при
реализации инновационных проектов IT-компаниями / г. Орел,
Информационные системы и технологии №2, 2016 – с. 51-58
2. Богатырѐв П.Ю., Коськин А.В. Структура информационного
пространства организации с применением теоретико-множественного
подхода к систематизации информации / Информационные технологии, Том
22, №10, 2016. С. 723-727.
Статьи и материалы конференций:
1. Богатырѐв П.Ю. Автоматизация процесса систематизации и анализа
информации в ходе производства и воспроизводства знаний / ИСиТ-2013, г.
Орел
2. Богатырѐв П.Ю., Коськин А.В. Принципы повышения эффективности
передачи сведений в письменной речи / ИТНОП-2014, г. Орел
3. Концептуальные ограничения объектно-ориентированного подхода в
сопоставлении с естественным языком / ИСиТ-2015, г. Орел
4. Богатырѐв П.Ю. Потенциальное направление развития языков
программирования в сторону приближения к моделям естественного языка /
II Международная научно-практическая конференция «Проблемы и
достижения в науке и технике», г. Омск, 2015.
5. Богатырѐв П.Ю. Интеграция средств объектного и структурного анализа
при разработке программных систем / Международная научно-практическая
конференция Закономерности и тенденции развития науки в современном
мире, г. Стерлитамак, 2015.
6. Богатырѐв П.Ю. Подход к документированию архитектуры объектноориентированных программ при помощи структурных моделей /
Международная научно-практическая конференция "Современное состояния
и перспективы развития технических наук", г. Уфа, 2015.
1/--страниц
Пожаловаться на содержимое документа