close

Вход

Забыли?

вход по аккаунту

- Cisco Connect

код для вставкиСкачать
Обеспечение и контроль
качества услуг
Обеспечение качественного пользовательского опыта за счет
единого мониторинга производительности сети и приложений
Пётр Еропкин, региональный менеджер по развитию
бизнеса в России и СНГ
Всем
знакомая
история …
Ирина Ивановна, ГлавБух
Алексей, Дир. по ИТ
Недопонимание
между
Бизнесом и ИТ
Бизнес
ИТ
Я могу обеспечить
доступность
99.99% …
Общие затраты на связь
составили >45% от ИТ
бюджетов 2013
Что нужно бизнесу
ИТ инфраструктура
Ок, а какие
требования по
задержкам при
работе с ней у вас
есть?
TCO CRM системы может
превысить $1,000,000 за 3
года для 500 пользователей –
2013 год.
itunes
Инвестиции для
бизнеса
Необходимая ИТ
инфраструктура
82% компаний в Европе
испытывают проблемы с
производительностью
корпоративных приложений –
2012 год
…крупные компании
регулярно зависят от
приложений, критичных для
бизнеса, работающих через
LAN – 2013 год
itunes
Реакция
бизнеса
Взгляд со стороны
инфраструктуры
Вы имеете ввиду Internet ?
О каких конкретно приложениях вы
говорите?
Вы уверены, что для них скорость
через сеть с качеством best effort
будет достаточна?
Давайте поместим
эти функции в
облако!
Это может стоить дороже…
Это же
мой
бюджет
NetSuite
itunes
Инновации,
предлагаемые
бизнесом
Решение
специалистов
ИТ
… мы тоже не понимаем…
NetSuite
itunes
Бизнес реальность
Ответ ИТ
Из чего складывается опыт пользователей?
Работа сети
Производительность
элементов сети, включая
файрволы,
балансировщики
+
Работа приложений
Время ответа приложений,
определяемое скоростью
работы приложения и
инфраструктуры
WAN/Internet
+
Бизнес-процессы
Различные факторы, такие
как дозвон до колл-центра,
скорость реакции
на тикеты
Как часто происходят сбои в сети?
EMA Global Study – Network
Management Megatrends
•
•
•
•
Network, Application and
Storage domains all have
similar failure rates
50% of the respondents have
outages on these domains
several times a month
90% of respondents have
outages at least once in 2
months.
It is important to have
visibility across these different
domains
В чем причина сбоек?
EMA Global Study – Network
Management Megatrends
• Most issues require
collaboration across multiple
domain/technology teams
• Network issues are by far the
largest reason for performance
degradation issues
• Performance of server and
storage systems is also
important to troubleshoot
application issues
Сколько инструментов нужно для выявления причин…?
EMA Global Study – Network
Management Megatrends
• Very few have a unified view of
their infrastructure
• Even small companies are using
3-5 tools
• Medium and Large Enterprises
have on average 10 tools to
monitor performance
…результат
CIO
Что же делать CIO?
Бизнес
Служба ИТ
Ответ:
Единая платформа мониторинга
производительности
ИТ инфраструктуры и приложений
Что такое мониторинг производительности ИТ инфраструктуры и
приложений? И кому это нужно?
Мониторинг производительности ИТ инфраструктуры: Network Performance Management (NPM)
• Сбор данных с телекоммуникационного и ИТ оборудования и из систем управления
• Расчет показателей загрузки и производительности для ресурсов и ИТ сервисов (например, IP VPN)
Мониторинг производительности приложений: Application Performance Management (APM)
• Сбор данных о пользовательских транзакциях и индикаторах производительности приложений с пробников и агентов
• Получение данных с уровня приложений непосредственно из сети на базе flow-технологий (например, Netflow) и технологий DPI
NPM-based
Метрики сетевых
устройств
Большинство
компаний
Сквозные метрики
сети, метрики ИТинфраструктуры
Некоторые
компании
APM-based
Использование SLA
подхода в разрезе
подразделений
компании
Видимость
качества
приложений
Редкие компании
Почему важен интегрированный
мониторинг ИТ-инфраструктуры
+ приложений?
Обеспечение пользовательского опыта
Use case:
Use Case: От “неработающей сети” к “партнерству”
Apple iTunes!!
iCloud sync
1. Хелпдеск видит и
демонстрирует
пользователю
причину проблемы
2. Хелпдеск может сам
позвонить
пользователю и
устранить проблему
3. Восприятие
эффективности и
профессиональности
ИТ повышается
1. Пользователь звонит
в хелпдеск
2. Жалоба, что сеть
совсем не работает
Опыт пользователей:
Негативный
Восприятие бизнесом:
непрофессиональные
ИТ-шники
Опыт пользователей:
Положительный
Apple iTunes
(TCP)
Восприятие бизнесом:
ИТ – работают!
Use case:
Use Case: Максимизация эффективности КСПД
1. Бизнес видит
неправильное
использование ресурсов
КСПД
Gaming?!
2. ИТ может контролировать
бизнес-критичные
приложения и
обеспечивать их
необходимыми ресурсами
1. ТОП3 приоритетов в
расходах компаний в
2013 – Расширение
полосы (IDC)
3. ИТ может обоснованно
доказать и сделать
бизнескейс, когда полоса
действительно нужна
2. Сложность в защите
бюджета – бизнесу
нужны
доказательства
4. ИТ помогает в достижении
бизнес-целей при
минимальных расходах
Опыт пользователей:
Противоречивый
Восприятие бизнесом:
Слишком большие
и необоснованные
траты на КСПД
Опыт пользователей:
Продуктивный
Восприятие бизнесом:
КСПД – важный актив
компании
Use case:
Use Case:
1. Географически
распределённой компании
необходимо
консолидировать ИТ
системы
2. ИТ должны определить
нагрузки по регионами и
приоритизировать задачи
консолидации
3. Далее ИТ проанализирует по
площадкам трафик на
сервера приложений и
выберет кандидатов
Опыт пользователей:
продуктивный
Восприятие бизнесом:
Моя ИТ команда
помогает планировать
и экономить деньги
Найти способ сэкономть
France is
analyzed first
Les Ulis has greatest traffic
overall, and server based
Use case:
Use Case:
1. У пользователя
возникли проблемы с
веб-приложением ,
работающем на вебсервере,
расположенном в
частном облаке
2. ЦОД обладает
инструментами
анализа приложений
3. ИТ анализирует
распределение
трафика при
приложениям в
рамках этого сервиса
Поиск причин медленной работы приложений
2
3
Traffic distribution
Use Case:
4. ИТ анализирует ресурсы в
данном ЦОДе
Поиск причин медленной работы приложений
4
5. Видит, что
производительность
внутренней сети между
серверами и телеком.
оборудованием в норме
Troubled server
6. Обнаруживает индикаторы
высокой нагрузки на вебсервере и сервере БД
7. На общем трафике из ЦОДа
есть предупреждения, из-за
высокого объем и задержек
8. ИТ переключается на карту
серверов, связанных с
приложением
5
7
6
8
Use Case:
Поиск причин медленной работы приложений
ИТ находит причину проблемы
между сервером СУБД и
вербервером
Опыт пользователей:
продуктивный
Восприятие бизнесом:
ИТ быстрое, отвечает
на задачи бизнеса
Troubled server
Database issue
Как выбрать подходящую систему
унифицированного мониторинга
производительности
5 важных шагов
5 Факторов успеха
1. Гибкое и масштабируемое решение, способное поддержать расширение и
изменение вашей ИТ инфраструктуры
Расширяемый, уже готовый (out-of-the-box - OOB) сбор данных по
производительности с сетевых устройств, северов, СХД, систем управления, …
Но как управлять новыми технологиями, моделями, вендорами и
специфическими метриками, которые не поддерживается из коробки?
Сложности быстро меняющегося многовендорного ландшафта
•
•
•
Метрики хранятся в различных местах
• Стандартные MIB, вендоские MIB,
текстовые файлы, данные доступные
только через CLI, базы данных EMS,…
Различные метрики могут использоваться
для расчёта KPI
• Например, данные по задержки могу
учитывать ICMP ping, IP SLA, Y.1731
DMM, MPLS OAM, Carrier Ethernet
SOAM, …
Новые устройства или экзотические
устройства могут не поддерживаться OOB
Давая возможность модифицировать содержимое коробки…
…InfoVista дает прозрачный
инструмент с возможностью:
•
Менять существующие KPI или создавать
новые
•
Расширять объектную ресурсную
модель, чтобы учитывать новые
технологии, оборудование и метрики
•
Получать данные через SNMP, SOAP,
плоские файлы, DB, или загрузки из CLI
ИЛИ использовать партнёрский сервис для
интеграции новых устройств!
Сеть построена на оборудовании различных вендоров
Пример расчёта мульивендорного KPI для 3G Cell
VistaMart “External” formula for
Nokia NetAct
Call Set up Success Rate for
Voice
VistaMart “external” formula for
Huawei M2000
“It took our Australia Tier 1 customer 3 minutes to add this KPI. And data was
M2000 Function Set IDs and
available for self reporting in the next hour”
NetAct Table and Column
Name mappings
Raw Counter IDs
5 факторов успеха
1. Гибкое и масштабируемое решение, способное поддержать расширение и изменение
вашей ИТ инфраструктуры
2. Масштабируемость от небольших инсталляций до размера операторских сетей,
чтобы удовлетворить требованиям крупнейших компаний
3-х уровневая архитектура, обеспечивающая необходимую
производительность платформы и масштабируемость для крупных компаний
Interactive,
On-Demand Reports
and Dashboards
Single Management
Console
Activation,
Provisioning
and Inventory Solutions
Automated Orchestration
Schedule and
Email Reports
Unified Presentation and Collaboration
Live Standby
Replication
Business, Service, Infrastructure
Data Models
Self-service
reporting
and dashboarding
KPI Generation
Central Database
Redundant Consolidation and Aggregation
Real-time
Alert Notification
N+1 Failover
Network EMSs:
CiscoANA, Huawei U2000,
Ericsson, NSN NetAct,
Alcatel-Lucent SAM 5620,
...
Discovery
Device and
Interface Polling
DPI Appliances
(Physical/Virtual)
NetFlow
Appliances
(Physical/Virtual)
Bulk File
Upload
Distributed Collection and Analysis
Data Collection via Active/Passive Polling using:
SNMP, WMI, VMware API, ICMP, DPI, Network Flow Analysis (NetFlow, IPFIX, J-Flow, sFlow, cFlow),
CSV, XML, Cisco IP SLAs, Juniper RPM, Huawei NQA, CLI, XML CLI, …
Real-time Mass Data
Export and Extraction
3-х уровневая архитектура, обеспечивающая необходимую
производительность платформы и масштабируемость для крупных компаний
Interactive,
On-Demand Reports
and Dashboards
Single Management
Console
Activation,
Provisioning
and Inventory Solutions
i.
Schedule and
Email Reports
Unified Presentation and Collaboration
Более 2.1 миллиарда
Live Standby
транзакций в день Replication
Automated Orchestration
Business, Service, Infrastructure
Data Models
ii.
KPI Generation
Central Database
80% крупнейших
Redundant Consolidation
Aggregation
операторов
вand
мире
Real-time
Alert Notification
N+1 Failover
Device
and
DPI Appliances
iii.Interface
Автоматическое
Appliances
Polling
(Physical/Virtual)
(Physical/Virtual)
распознавание новых
Distributed Collection and Analysis
устройств
NetFlow
Network EMSs:
CiscoANA, Huawei U2000,
Ericsson, NSN NetAct,
Alcatel-Lucent SAM 5620,
...
Discovery
Self-service
reporting
and dashboarding
Bulk File
Upload
Data Collection via Active/Passive Polling using:
SNMP, WMI, VMware API, ICMP, DPI, Network Flow Analysis (NetFlow, IPFIX, J-Flow, sFlow, cFlow),
CSV, XML, Cisco IP SLAs, Juniper RPM, Huawei NQA, CLI, XML CLI, …
Real-time Mass Data
Export and Extraction
5 Факторов успеха
1. Гибкое и масштабируемое решение, способное поддержать расширение и изменение
вашей ИТ инфраструктуры
2. Масштабируемость от небольших инсталляций до размера операторских сетей,
чтобы удовлетворить требованиям крупнейших компаний
3. Гибкая сервисная модель
Инструментарий контроля – сервисная модель и сквозная видимость
качества услуги
Путь предоставления услуги
Backbone router
•
Media Gateway
WAN Interface
MPLS LSP
•
Virtual Interface
C
E
Business
Измерения SLA
•
Услуга предоставляется
через множество
сетевых элементов
Деградация параметров
на сетевых устройствах
негативно влияет на
качество услуги
InfoVista позволяет
смотреть на услугу
целиком,
анализировать ее
качество и заботиться
об удовлетворенности
абонентов
Управления SLA ИТ-сервисов на уровне подразделений компании
Крупная компания может иметь
подразделения работающие в различных
рабочих календарях и часовых поясах.
•
Задание рабочих календарей, включая часовой
пояс для подразделений, офисов и регионов.
•
Исключение планового и внепланового тех.
обслуживания из расчёта SLA.
•
Перерасчет SLA после внеплановых тех.
обслуживания.
•
Расчёт day-to-month SLA
Пример превращения данных сервисной модели в наглядный
инструмент поиска проблемных мест в сети
Высокий объем
трафика превышает
выделенную полосу
Высокий объем
трафика приводит к
потере пакетов
Проблема доступности между
двумя сайтами
5 Факторов успеха
1. Гибкое и масштабируемое решение, способное поддержать расширение и изменение
вашей ИТ инфраструктуры
2. Масштабируемость от небольших инсталляций до размера операторских сетей,
чтобы удовлетворить требованиям крупнейших компаний
3. Гибкая сервисная модель
4. Полностью настраиваемые отчеты и метрики
Полностью настраиваемый портал на HTML5
Ваши отчеты
Ваше лого
Ваши цвета
Ваши
подразделения
Ваши SLA
Кастомизируемые дашборды для мониторинга в реальном времени
… с возможностью траблшутинга с частотой опроса в 1 секунду…
5 Факторов успеха
1. Гибкое и масштабируемое решение, способное поддержать
расширение и изменение
вашей ИТ инфраструктуры
2. Масштабируемость от небольших инсталляций до размера
операторских сетей,
чтобы удовлетворить требованиям крупнейших компаний
3. Гибкая сервисная модель
4. Полностью настраиваемые отчеты и метрики
5. Мультивендорный Flow и DPI анализ
Как можно анализировать данные по работе приложений?
Традиционный flow-based APM
До LAYER 4 (port-based)
Информация по нагрузке приложений :
•
•
•
•
Какую полосу пропускания использует
приложение?
Детали по площадке, IP source, destination,
interface, protocol (udp, tcp, icmp)
Включая информацию по CoS (e.g. ToS field)
Ограниченное распознавание приложений
•
На основе портов или NBARv1
•
Т.е. трафик типа ОТТ может
отображаться как http/websphere
application server
Современный DPI APM
До LAYER 7
Информация по нагрузке и
производительности приложений :
•
Расширяемое, на основе сигнатур,
распознавание приложений
•
Время ответа приложений, от
пользователя до сервера (для
площадки, для приложения)
•
Качество пользовательского опыта по
голосу и видео
•
Сетевая задержка, задержка клиента,
задержка приложения Network delay,
client delay, application delay
Платформа InfoVista для объединенного мониторинга
производительности ИТ-инфраструктуры и приложений
I’m a hero!
Исправление
недопонимания между
Бизнесом и ИТ
Бизнес результат
InfoVista Unified NPM + APM Solution
Значимость ИТ
www.infovista.com
1/--страниц
Пожаловаться на содержимое документа