close

Вход

Забыли?

вход по аккаунту

Голиков В. А. Разработка проектов в бизнес-среде на основе современных методов анализа больших данных

код для вставки
Министерство образования и науки РФ
Орловский государственный университет имени И.С.Тургенева
На правах рукописи
подпись аспиранта
Голиков Виктор Андреевич
Научно-квалификационная работа на тему:
«Разработка проектов в бизнес-среде на основе современных методов
анализа больших данных»
Направление подготовки: 38.06.01 «Экономика»
направленность (профиль): «Экономика и управление народным
хозяйством: экономика, организация и управление предприятиями,
отраслями, комплексами – промышленность»
Научный руководитель д.э.н., профессор, Никитин Святослав Аркадьевич
(ученая степень, ученое звание, ФИО)
Орел-2018
Актуальность работы. Развитие биржевой деятельности в России
привело к появлению нового класса экономических систем компаний,
ведущих операционную деятельность на валютных, сырьевых рынках и
рынке ценных бумаг, а также инвестирующие частных. Автоматизация
электронной коммерции в совокупности с увеличением объемов торговых
операций привели к существенному увеличению количества сделок,
возрастанию конкуренции и возникновению большого количества данных,
подлежащих анализу для принятия актуальных и обоснованных решений о
покупке
или
продаже.
Множество
сделок,
значительный
объем
обрабатываемых данных, временная и содержательная вариативность
выделения существенных элементов экономических данных, быстрые
изменения курсов, влияние новостей в реальном времени на принятие
решений по сделкам, в целом, порождают многомерные массивы данных,
повышают неопределенность принятия решений. Комбинация поисковопереборных и оптимизационных этапов в процессе анализа рыночной
ситуации и генерации управленческих решений создают большое количество
возможных альтернатив развития ситуации, что требует применения
аппаратно-программных систем поддержки принятия решений (СППР).
Среди различных моделей и методов прогнозирования развития
экономической
ситуации
существенную
роль
играют
методы
интеллектуального анализа данных (ИАД, Data Mining) для поиска скрытых
закономерностей в неструктурированных данных. В номенклатуре методов
Data Mining, подходящих для выявления скрытых закономерностей
изменения
экономической
ситуации,
метод
секвенциалыюго
анализа
является базовым для нахождения содержательно-временных повторений
(шаблонов)
в
последовательностях
событий,
описываемых
набором
экономических показателей об электронных торгах. В традиционной
постановке
задача
секвенциального
анализа
рассматривается
как
однократная обработка единственного набора экономических параметров с
последующей генерацией одного набора шаблонов, используемых для
управленческих решений. Вместе с тем характерные для систем электронных
торгов большие объемы анализируемых данных, недетерминированный
характер задачи выбора торговой стратегии приводят к тому, что
необходимы повторные, снижающие актуальность принимаемых решений
итерации обработки данных в СППР с новыми параметрами поиска,
приводящие в конечном итоге к получению множества решений не для
одного параметра, а для интервала, задаваемого лицом, принимающим
решение (ЛПР).
Модели
управления
организациями
и
управление
рисками
рассматривались в работах Д.А. Новикова, С.А. Баркалова, В.Н. Буркова и
др. Методы управления и принятия решений рассматривались в работах А.Г.
Чхартишвили, О.И. Ларичева и др. Теоретические и практические вопросы
анализа, создания и использования СППР были рассмотрены такими
учеными, как Э.А. Трахтенгерц, В.А. Геловани, А.А. Башлыков, И.У. Ямалов,
О. М. Проталинский и др. Исследования методов Data Mining проводились в
работах Р. Агравала, Р. Срикната, А.А. Багресяна, М.С. Куприянова, В.В.
Степаненко, И.И. Холода и др. Вместе с тем, вопросы генерации множества
альтернатив в условиях интервального задания параметров нашли лишь
частичное отражение в известных работах. Для выполнения анализа данных
и последующего принятия решений в трейдинговой деятельности созданы
пакеты прикладных программ: MetaTrader, Elwave, MetaStock. Для этих
программных
пакетов
характерны
слабые
возможности
анализа
по
интервалам входных параметров, ограниченное количество генерируемых
вариантов
развития
ситуации
или
недостаточно
количество
анализируемых макроэкономических факторов.
Объективные требования по обработке множества показателей
(абсолютные и относительные значения изменений курсов, изменения
макроэкономических показателей, изменения, фондовых индексов и
объемов торгов) приводят к необходимости выполнения мноrокр rrных
итераций, на которых выполняется генерация и выбор альтернатив, что
требует избыточных временных затрат и вступает в противоречие с
необходимостью оперативной поддержки управленческих решений в
процессе трейдинrовой деятельности.
Целью работы является повышение оперативности генерации
альтернатив для управленческих решений в условиях обработки больших
массивов экономических данных, а также повышение обоснованности
генерируемых альтернатив для управленческих решений.
Научной
поддержки
задачей
принятия
закономерностей
в
является
решений,
разработка
метода
обеспечивающего
экономических
данных
и
алгоритма
поиск
с
скрытых
возможностью
интервального задания параметров.
Объекrом исследования являются процессы и информационные
технологии
управления
торговыми
операциями
в
трейдинrовых
компаниях.
Предметом
исследования
являются
методы
и
алгоритмы
управления электронными торгами в трейдинrовой компании
и
структурно-функциональная организация СППР по торговым операциям
для трейдинговой компании.
Задачи исследования. Достижение поставленной цели исследования
обуславливает
необходимость решения следующих частных задач:
1.
Анализ
современных
инструментальных
средств
поддержки принятия решений для управления торговыми операциями в
процессе
трейдинговой
деятельности.
Обоснование
направления
диссертационных исследований.
2.
Разработка метода поддержки принятия решений на
основе секвенциального анализа, алгоритмизация метода с учетом
специфики создания СППР для трейдинrовых компаний.
3.
Разработка
структурно-функциональной
организации
системы поддержки принятия решений, поддерживающей разработанный
метод, а также важнейших блоков обработки множеств и кортежей,
составленных из экономических данных.
Экспериментальная проверка разработанных метода и
4.
алгоритмов поддержки принятия решений.
Методы исследования основываются на положениях теорий:
управления в организационно-технических системах, принятия решений,
теории систем, теории сложности, а также методах интеллектуального
анализа
данных,
математической
статистики,
комбинаторики,
квалиметрии.
Достоверность
и
обоснованность
результатов
исследования
подтверждается: соответствием практических результатов и оценок
моделирования,
программными
экспериментами
по
применению
разработанного метода поддержки принятия решений (ППР) к данным о
значениях курсов валют и акций; корректным использованием законов и
положений теории множеств и положений конструктивной математики;
рецензированием
технических
патентной
печатных
конференциях,
экспертизой
работ,
их
обсуждением
семинарах
кафедры
разработанного
на
ПОВТ,
устройства
научноа
также
определения
префиксно-суффиксных свойств последовательностей.
Положения, выносимые на защиту и научная новизна.
Метод поддержки принятия решений, базирующийся на методе
1.
секвенциалъного
анализа
обеспечивающий
AprioriAll,
генерацию
альтернатив для принятия решений в условиях интервального задания
параметров при поиске скрытых закономерностей в экономических данных.
Существенными отличиями метода являются:
-
наличие
этапа
ранжирования
последовательных
шаблонов,
выполняющего отбор приоритетных альтернатив для управленческих
решений;
-
использование
различных
пороговых
значений
множеств и кортежей на различных этапах метода.
для
обработки
2.
Алгоритм
поддержки
принятия
решений,
основанный
на
разработанном методе. Отличиями алгоритма являются:
-
сохранение промежуточных результатов обработки данных для
оперативной актуализации результатов анализа и повторного использования
промежуточных результатов при многократном анализе исходных данных;
-
представление промежуточных данных в виде деревьев, позволяющее
сократить время генерации альтернатив для управленческих решений в
случае интервального задания параметров;
-
использование
параметра
достоверности
при
ранжировании
управленческих альтернатив, что упорядочивает работу ЛПР в условиях
неопределенности данных.
3.
Структурно-функциональная организация системы поддержки
принятия решений для управления торговыми операциями в трейдинговых
компаниях, отличающаяся наличием:
-
модуля актуализации промежуточных результатов анализа;
-
информационных связей, позволяющих ЛПР задавать параметры
анализа в виде интервалов значений;
-
хранилища промежуточных результатов анализа, позволяющего
обрашаться к структурированным промежуточным данным без избыточных
временных затрат на повторную генерацию в случае многократных запусков
алгоритма поддержки принятия решений;
модуля максимизации последовательностей с аппаратной реализацией
операции определения суффиксно-префиксных свойств.
Предложенная
структурно-функциональная
организация
СППР
позволяет раздельно настраивать пороговые количественные характеристики
образующих результат множеств и кортежей, что обеспечивает доступ к
б6льшему количеству наборов данных, необходимых для принятия решений.
Структура СППР спроектирована с учетом возможных итераций уточнения
результатов с новыми значениями параметров анализа.
Практическая значимость работы.
Разработаны
метод
и
алгоритм
поддержки
принятия
решений,
позволяющие выполнять поиск скрытых закономерностей в экономических
данных с интервальным заданием параметров, и на основе обнаруженных
закономерностей осуществлять генерацию альтернатив для управленческих
решений. Использование в алгоритме представления данных в виде дерева
позволило
уменьшить
благодаря
исключению
временную
сложность
интервального
анализа
процедур
генерации
потенциально
частых
последовательностей и поиска генерируемых последовательностей в базе
транзакций.
Разработанный
алгоритм
позволяет
ЛПР
осуществлять
интервальный анализ и генерацию альтернатив, а также повышает
достоверность генерируемых приоритетных альтернатив для управленческих
решений благодаря использованию расширенного перечня параметров для
ранжирования.
На основе синтезированной структурно-функциональной
1.
организации СППР, применяемой в управлении торговыми операциями
трейдинговой компании, созданы программные модули выявления скрытых
закономерностей
в
данных
в
виде
интегрированные
в
суmествующие
последовательных
СППР
и
шаблонов,
хранилища
данных.
Программные модули выполняют обработку ретроспективных данных об
изменении курсовых значений на биржевых рынках, генерируют наборы
последовательных шаблонов и формируют альтернативы для управленческих
решений для ЛПР в текущей ситуации, основываясь на количественных
показателях
и
возможном
финансовом
результате
от
трейдинговой
деятельности.
2.
Алгоритмизация
разработанного
метода
поддержки
принятия решений позволила создать программные модули, отличающиеся
вложенными
структурами
представления
и
унификацией
алгоритмов
обработки экономических данных. Реализация модулей СППР позволила
сократить время генерации последовательных шаблонов в среднем на 18,3%
в случае заданий на анализ с интервалом параметров. Использование
дополнительных параметров для ранжирования альтернатив повысило
достоверность принимаемых решений на 7,3%.
Разработано специализированное устройство параллельной
3.
обработки префиксно-суффиксных свойств последовательностей, которое
позволяет сократить время выполнения отдельных этапов обработки
кортежей, составленных из наборов экономических данных. Устройство
отличается параллельной обработкой всех диагоналей матрицы совпадений,
что позволяет уменьшить временные затраты на генерацию альтернатив для
управленческих решений; также возможно применение устройства в
автономных
системах
высокочастотный
электронных
трейдинг.
торгов,
Разработанное
ориентированных
устройство
на
имеет
самостоятельную ценность для систем обработки символьной информации в
рамках продукционной парадигмы.
Структура и объем работы. Диссертация состоит из введения, четырех
глав, заключения, списка литературы (90 наименований) и приложения.
Основной текст изложен на 154 страницах, содержит 40 рисунков и 12
таблиц.
КРАТКОЕ СОДЕРЖАНИЕ РАБОТЫ
Во
введении
диссертационной
приводится
работы,
обоснование
формулируется
цель
актуальности
и
научные
темы
задачи
исследований, излагаются основные результаты, включающие научную
новизну и практическую значимость, приводятся основные научные
положения, выносимые на защиту.
Первая rлава посвящена анализу методов, используемых в СППР
компаний для управления процессами электронной коммерции. Показана
важность
в
процессе
управления
поисково-расчетных
действий
по
выявлению скрытых закономерностей в экономических данных масштаба Big
Data.
Компании используют транзакционные системы учета покупок, системы
мониторинга рынка и субъектов экономики, влияющих на рынок, а также
другие источники данных, сохраняя описания событий, что позволяет
исследовать
ретроспективные
экономические
данные
и
принимать
актуализированные и обоснованные управленческие решения по торговым
операциям.
Принятие решений о направлениях деятельности и использовании
финансовых ресурсов принимается на различных уровнях иерархии
трейдинговых
компаний. Старший
стратегические
решения
об
менеджмент
основных
компании
направлениях
принимает
использования
финансовых ресурсов (рынки, ценные бумаги, допустимый уровень риска).
Непосредственно трейдеры принимают текущие решения о выполнении
торговых операций. При принятии решений трейдерами должны учитываться
основные стратегические направления, определяемые в рамках подсистемы
стратегического
управления,
текущая
ретроспективных
данных
рыночной
о
рыночная
ситуации.
ситуация,
набор
Итоговый
успех
(финансовый результат) деятельности трейдинговой компании зависит от
своевременности и обоснованности принимаемых трейдерами
решений,
поэтому большую важность в общем цикле управления представляет анализ
данных о рыночной ситуации, выбор управленческих решений трейдером и
учет эффектов от реализации выбранных управленческих альтернатив.
Большие масштабы данных, недетерминированное развитие рыночной
ситуации и неопределенность состояния рынка в буд ущем приводят к
неопределенности в принятии решений трейдером. С целью снижения
неопределенности
принятия
решений
в
трейдинговых
компаниях
используются СППР, выполняющие анализ ретроспективных данных и
генерирующих приоритетные альтернативы управленческих решений с
учетом текущей рыночной ситуации. Место СППР в схеме деятельности
трейдинговой компании представлено на рис. 1.
Трейдинrовая компания
----
1
Рис. 1 Место СППР в схеме деятельности трейдинговой компании
Учет перечня факторов, влияющих на результаты принятия решений,
требует
от
СППР
выполнения
генерации
альтернативных
торговых
стратегий, оценки возможных финансовых результатов трейдинmвой
деятельности
и
снижения
неопределенности
в
принятии
решений.
Использование СШIР в управленческом цикле функционирования компании
также позволяет осуществлять упреждающее выполнение комплекса этапов
анализа данных и генерации вариантов решений на основе динамично
выявляемых скрытых закономерностей из текущих и ретроспективных
экономических данных.
С целью построения альтернативных прогнозов для обработки данных
масштаба Вig Data в СППР компаний используются методы технического
анализа, what-if анализ, корреляционно-регрессионный анализ, различные
методы Data Mining. Широко используются предметно-ориентированные
аналитические системы, основанные на статистической обработке данных.
Для принятия решений важны сведения о последовательности событий.
Такая задача является подклассом задачи поиска ассоциативных правил и
носит название «секвенциальный анализ».
Возможность использования последовательного шаблона как основания
для расчета экономического результата операционной деятельности в
условиях изменения рыночной ситуации в соотвепcтвии с событиями
шаблона позволяет перейти от анализа рыночной ситуации к принятию
решений о торговых операциях на основе альтернатив, получаемых в
результате применения секвенциального анализа.
Наиболее известными коммерческими СППР, обеспечивающими анализ
данных и поддержку принятия решений для работы на электронных
торговых площадках, являются: MetaTrader компании MetaQuotes Software
Согр. (Кипр), Elwave компании Elliot wave software (Нидерланды), MetaStock
компании Equis Intemational (США), QUIK компании ARQA Technologies
(Россия, Новосибирск). Основные возможности данных СППР представлены
в таблице 1.
Таблица 1 Основные возможности СППР для электронного трейдинга.
Возможности СППР
MetaTrader Elwave
MetaStock QUIК
Объяснение результата
Частичное
Есть
Нет
Нет
Автоматический учет
Возможен
Нет
Нет
Возможен
Технический анализ
Есть
Оrраничен Есть
Есть
Автоматические
Есть
Нет
Нет
Есть
Ограничено Нет
Есть
Есть
Есть
Нет
Ограничено
макроэкономических
Факторов
уведомления о новостях
ЭКОНОМИЮ!
и рьшка
Программирование
автоматческих
стратегий
Возможности
расширения внешними
модулями
Нет
У большинства представленных в таблице 1 СППР ограничены
возможности
по
представленных
учету
СППР
не
макроэкономических
реализуются
параметров.
возможности
анализа
В
с
интервальным заданием параметров, а также отсутствуют элементы
аппаратной акселерации обработки данных.
Использование выявленных шаблонов выступает как базовая фаза
управления электронными сделками, она позволяет ЛПР соотносить
текущее развитие ситуации с характерными для прошлых периодов
времени последовательностями событий и формировать управленческие
решения из выявленных содержательно-временных закономерностей в
исходных
неструктурированных
данных.
Синтез
приоритетных
альтернатив для управленческих решений осуществляется на основе
отбора
шаблонов,
удовлетворяющих
заданному
ЛПР
условию
оптимизации.
Во второй главе решается задача разработки метода ППР на основе
метода секвенциального анализа AprioriAll. Отличительная особенность
разработанного метода расширение его возможностей по интервальному
заданию параметра поддержки, а также повышение оперативности
генерации альтернатив для управленческих решений.
В задаче секвенциального анализа задан алфавит свойств !R = {i1,i2,
…,i""'}, где ik символ алфавита !R, ik Е !R, п 91 =1!R 1 мощность (размер)
алфавита. Из символов R задаются
наборы
свойств (множества) i,
i= {i 1}, . . ,lk, = {ik,} , ... , Ik,k, ={ik,,i.,}, 1.,..1.= {ik, ,... ,i.J, где i• Е!R, {k1,k,, ...,k.1}
индексы
свойств
в множестве
!R,
n1
=1t/i1. Так же задан алфавит
источников событий V ={v1,v2 , … ,v.v}, где v. источник, п,. =iV 1, причем V п
9t = е, задано множество событий D = {d 1 ,d,, ...,d.0 } , принадлежащих
какому-либо из источников,
где
dk
событие,
п0 =1 D1 мощность
множества событий. Каждое событие dk есть набор элементов, d• =(v,t,i),
где v источник, t время события, i
набор свойств события
d•.
Поддержкой Р(i) набора свойств i называется отношение количества
источников событий, содержащих в событиях набор i , к общему количеству
источников событий: Р(i) =1V1 1 / 1V 1, где V 1
содержащих набор I , V
1
множество источников,
= {v.,,v.,,...,v .}, где набор свойств события dk,
принадлежащего источнику.
Перед началом анализа ЛПР устанавливает значение минимальной
поддержки Рmin для уменьшения пространства поиска и получения
последовательностей из практически значимых частых наборов. Набор
свойств i называется частым, если
его
поддержка Р(i) не меньше
установленной минимальной поддержки Pmin: P(l) Pmin. Частый набор
свойств обозначается как, амножество
={f.,,J;,...,f,,F}, nF мощность
возможностей
генерации
секвенциального
анализа
частых
множества
F.
альтернатив
вводится
наборов
В целях
на
новый
как
F,
F
расширения
основе
результатов
параметр,
называемый
минимальная поддержка последовательностей наборов Р;; (или минимальная
р= последовательности
поддержка последовательностей). Поддержка
s, s =< in,/n,...,/ Im >, определяется как отношение количества источников
событий, содержащих последовательность s в общей последовательность
событий, к количеству источников событий:
множество
источников,
в
P(s)=I V' -VI, где V'
последовательностях
наборов
которых
содержится последовательность s .
Основная
вычислительная
нагрузка
в
традиционном
методе
AprioriAll определяется обработкой наборов свойств с возрастающим в
процессе анализа количеством обрабатываемых элементов, а также
необходимостью генерации кортежей на основе перебора комбинаций
свойств исходных объектов.Для генерации актуализированных решений
разработан метод ППР на основе метода AprioriAII (таблица 2), типы
обрабатываемых объектов разделяются на множества (М) и кортежи (К).
Этап метода
Обрабатыва Тип Процесс
емые
объе
объекты
кта
Входные
данные
l. l генерация
наборов
кандидатов
1.2 выбор
частных
наборов
2.1
хеширование
множества
частых
наборов
2.2 построение
ориентированн
ого дерева
последователь
ностей
3.1 построение
частых
последователь
ностей
3.2
максимизация
частых
последователь
ностей
3.3
ранжирование
последователь
ных шаблонов
Наборы
свойств
М
Наборы
свойств
М
Построение
пересечений и
объединений
Поиск вхождений
Частые
наборы
свойств
Множество
событий
Частые
наборы
свойств
М
Хеширование
Множество
частых
наборов
Последоват
ельности
исходного
множества
К
Генерация дерева
Множество
последовательносте событий
й
O(i)
Последоват
ельность
событий
К
Построение
конкатенаций
О(nD)
Частые
К
последовате
льности
Поиск вхождений
Частые
К
последовате
льности
Сортировка
Трансформ
ированное
дерево
событий
Множество
частъ1х
последоват
ельностей
Оценка
вычислительн
ой сложности
частного
алгоритма
О(nR)
О(nD)
О(nF)
O(ns)
Управленче О(n3 ln(n3 ))
ски е
альтернати
вы
Новизна метода ППР определяется добавлением этапа многомерного
ранжирования последовательных шаблонов, что позволяет осуществить
переход от параметрической генерации последовательных шаблонов к
генерации альтернатив для управленческих решений, осуществляемой на
основе упорядоченных по количественным показателям и возможным
финансовым результатам от реализации торговой стратегии в соответствии с
шаблоном. Также вместо единого порогового значения, применяется два
пороговых
значения:
порог
для
наборов
свойств
и
порог
для
последовательностей, что позволяет получать дополнительные варианты
наборов последовательных шаблонов, а также многократно использовать
промежуточные результаты анализа для различных значений поддержки
последовательностей и выполнять построение последовательных шаблонов
без избыточных затрат времени на построение трансформированного
множества событий. Многократное использование промежуточных данных
позволяет осуществлять их актуализацию, т.е. обновление структуры с
темпом поступающих данных.
Для
повышения
обоснованности
генерируемых
альтернатив
выполняется расширение списка параметров, используемых в ранжировании
для
определения
приоритетных
альтернатив.
Вводится
показатель
достоверности, используемый в смежном с секвенциальным анализом поиске
ассоциативных правил. Для расчета применительно к последовательным
шаблонам в методе поддержки принятия решений анализируемый кортеж
вида s = < f,, >=< B,N > представляется в виде ассоциативного правила вида
В
N, где В префикс s длиной k, N суффикс s длиной n-k, В =< f, ,f ,,..., f,
>, N =< f,.,,...,f,, >, и вычисляется отношение поддержки префикса шаблона к
поддержке целого шаблона:
где Conf показатель достоверности.
Получаемые значения достоверности позволяют упорядочить работу
ЛПР при использовании шаблонов с низкими значениями поддержки.
На основе метода был разработан алгоритм ППР, новизна которого
заключается в том, что на этапе построения ориентированного дерева
последовательностей
вместо
традиционной
последовательностей
выполняется
генерация
генерации
множества
трансформированного
набора последовательностей в виде дерева, в узлах которого находятся
частые
наборы
и
данные
для
определения
последовательностей. Схема алгоритма представлена на рис. 2
поддержки
Рисунок 2 - Схема алгоритма поддержки принятия решений на
основе разработанного метода
Генерация
последовательных
шаблонов
осуществляется
с
использованием дерева последовательностей для выбора и проверки
поддержки частых последовательностей, что позволяет выполнять
генерацию
альтернатив
с
помощью
однократного
обхода
дерева
последовательностей событий. Это позволяет уменьшить число итераций
поиска в результате отказа от шагов непродуктивной генерации
последовательностей со значением поддержки ниже минимального.
В
работе
генерация
последовательных
шаблонов
как
конструктивный процесс описывается продукционной системой вида: РМ
= {F , З ,Y,D' }, где F алфавит продукционной системы из частых наборов
, З стратегия построения последовательных шаблонов, D' дерево
последовательностей событий, У набор ограничений, используемых при
построении множества последовательных шаблонов.
Получаемые
в
результате
работы
алгоритма
управленческие
альтернативы представляют собой шаблоны, дополненные показателями для
деятельности: вариантом входа в позицию и вариантами выхода из позиции с
прибылью или с убытком.
Разработанный
алгоритм
позволяет
однократно
выполнять
вычислительно затратную предобработку данных. Для каждого элемента из
набора входных параметров однократно выполняется этап по выбору и
максимизации последовательностей. Сокращение временной сложности в
условиях диапазонного задания входных параметров повышает актуальность
генерируемых альтернатив для управленческих решений.
Третья глава диссертации посвящена разработке структуры СППР для
управления
торговыми
операциями
в
трейдинговых
компаниях
с
использованием разработанного метода ППР, выполняется детальная
алгоритмизация шагов разработанного алгоритма, осуществляется введение в
структуру СППР модуля для аппаратной поддержки вычислительно
затратной операции по обработке пересечений последовательностей. В
результате использования модульной структуры достигается расширение
функциональности СППР путем введения новых модулей: хранилища
промежуточных результатов анализа, блока актуализации. Хранилище
промежуточных результатов позволяет сохранять направленное дерево
последовательностей для использования при новых заданиях на анализ.
Модуль актуализации позволяет сохранять соответствие между базой
транзакций и построенным деревом последовательностей при добавлении
новых
транзакций
возможности
по
в
базу.
заданию
Информационные
интервала
связи
обеспечивают
параметров.
Структурно-
функциональная организация СППР представлена на рис. 4. Новые и
подвергшиеся
модификации
модули
и
связи
вьделены
цветом
и
утолщенными линиями. Структура модуля генерации последовательных
шаблонов (МГПШ) в составе компонента приобретения знаний представлена
на рис. 5. Структура блоков анализа данных в МГПШ представлена на рис. 6
Рисунок 4 - Структурно-функциональная организация системы поддержки
принятия решений
Для разработанного блока актуализации (рис. 4) создан алгоритм
актуализации дерева последовательностей, его использование позволяет
поддерживать соответствие между изменяющимися данными базы событий и
многократно использовать дерево последовательностей без избыт очных
затрат на его построение.
Рисунок 5 - Модель структурно-функциональной организации СППР
Выявление скрытых закономерностей основывается на многократной
обработке массивов данных, при этом размер обрабатываемой единицы, как
правило, имеет меняющиеся . границы . Данные обстоятельства для
экономических
систем
реального уровня сложности (в которых
выполняется обработка сотен показателей рыночной ситуации, обновление
данных выполняется десятки раз в минуту) обуславливают необходимость
перехода к аппаратным ускорителям отдельных шагов алгоритмов .
Операция поиска пересечений двух последовательностей используется на
многих шагах анализа. Аппаратная реализация этой операции возможна с
использованием специализированного устройства параллельной обработки
префиксно-суффиксных свойств последовательностей.
В работе решена актуальная
разработке
метода
и
научная
алгоритма
задача,
поддержки
заключающаяся
принятия
в
решений,
обеспечивающего поиск скрытых закономерностей в экономических данных
с
возможностью
поставленная
цель
интервального
по
задания
повышению
параметров,
достоверности
и
и
достигнута
оперативности
альтернатив для управленческих решений.
В ходе решения поставленной задачи получены следующие основные
результаты:
Создан метод поддержки принятия решений на основе метода
секвенциального анализа данных. Новизна метода определяется добавлением
этапа ранжирования последовательных шаблонов, что позволяет осуществить
переход к генерации альтернатив для управленческих решений на основе
упорядоченных по количественным показателям и возможным финансовым
результатам. Также вместо единого порогового значения, при меняется два
пороговых значения: для наборов свойств и для· последовательностей, что
позволяет получать дополнительные варианты наборов последовательных
шаблонов, а также многократно использовать промежуточные результаты
для различных значений поддержки последовательностей и выполнять
построение шаблонов без избыточных за· трат времени на построение
трансформированного множества событий.
1.
Разработан алгоритм поддержки принятия решений на основе
созданного метода. Реализуются возможности повторного использования
промежуточных результатов при многократном анализе исходных данных
с интервалами параметров за счет применения модифицированной
структуры хранения промежуточных данных, что позволяет уменьшить
время генерации альтернатив для управленческих решений. Расширение
перечня
параметров,
по
альтернатив,
позволило
упорядочить
работу
которым
увеличить
ЛПР
в
выполняется
достоверность
условиях
ранжирование
результатов
неопределенности
и
данных.
Разработан алгоритм актуализации промежуточных результатов анализа,
позволяющий добавлять в промежуточные результаты анализа новую
информацию,
сокращая
количество
запусков
генерации
дерева
последовательностей при обновлении данных.
2.
Разработана
трейдинговой
структурно-функциональная
организация
СППР, особенностями являются наличие модуля для
поддержки работы алгоритма поддержки принятия решений, модуля
актуализации
промежуточных
результатов
анализа,
модуля
максимизации последовательностей с аппаратной реализацией операции
сравнения и определения префиксно-суффиксных свойств, позволяющего
снизить затраты времени на соответствующем этапе алгоритма, модуля
генерации альтернатив, выполняющего ранжирование по расширенному
списку параметров, а также информационных связей, позволяющих
задавать
параметры
обеспечивающих
анализа
в
функционирование
виде
интервалов
значений
модифицированных
и
элементов
системы.
Разработано
устройство
определения
префиксно-суффиксных
свойств и сравнения пары последовательностей, обрабатываемых в
процессе анализа данных о трейдинговой деятельности, отличающееся
безотступной
параллельной
обработкой
всех
диагоналей
матрицы
совпадений элементов последовательностей. Использование аппаратной
реализации отдельных шагов интеллектуального анализа позволяет
сократить время генерации альтернатив для управленческих решений
пропорционально длине обрабатываемого кортежа
СПИСОК
ПУБЛИКАЦИЙ,
СОДЕРЖАЩИХ
ОСНОВНЫЕ
РЕЗУЛЬТАТЫ РАБОТЫ
1. Голиков В. А. Баранов И.В Технологии Big Data и их применение на
современном промышленном предприятии [Текст] / Вестник ОрелГИЭ
2. Голиков В. А. Применение технологии Big data в финансовом секторе
[Текст]
/
Известия
Тульского
государственного
университета.
Экономические и юридические науки
3. Голиков В. А. Big data – новый подход формирования бизнес-знаний
[Текст]
/
Известия
Тульского
государственного
университета.
Экономические и юридические науки
4. Голиков В. А. Большие данные в современном мире [Текст] / Менеджмент
современных технологий в интегрированных структурах
1/--страниц
Пожаловаться на содержимое документа