close

Вход

Забыли?

вход по аккаунту

код для вставкиСкачать
Рекомендация МСЭ-R BT.1867
(03/2010)
Технологии управления объективным
качеством визуального восприятия
для радиовещательных приложений,
использующих стандарт ТВ малой
четкости в присутствии эталонной
полосы с уменьшенной шириной
Серия BT
Радиовещательная служба
(телевизионная)
Рек. МСЭ-R BT.1867
ii
Предисловие
Роль Сектора радиосвязи заключается в обеспечении рационального, справедливого, эффективного и
экономичного использования радиочастотного спектра всеми службами радиосвязи, включая спутниковые
службы, и проведении в неограниченном частотном диапазоне исследований, на основании которых
принимаются Рекомендации.
Всемирные и региональные конференции радиосвязи и ассамблеи радиосвязи при поддержке
исследовательских комиссий выполняют регламентарную и политическую функции Сектора радиосвязи.
Политика в области прав интеллектуальной собственности (ПИС)
Политика МСЭ-R в области ПИС излагается в общей патентной политике МСЭ-Т/МСЭ-R/ИСО/МЭК,
упоминаемой в Приложении 1 к Резолюции 1 МСЭ-R. Формы, которые владельцам патентов следует
использовать для представления патентных заявлений и деклараций о лицензировании, представлены по
адресу: http://www.itu.int/ITU-R/go/patents/en, где также содержатся Руководящие принципы по выполнению
общей патентной политики МСЭ-Т/МСЭ-R/ИСО/МЭК и база данных патентной информации МСЭ-R.
Серии Рекомендаций МСЭ-R
(Представлены также в онлайновой форме по адресу: http://www.itu.int/publ/R-REC/en.)
Серия
Название
BO
Спутниковое радиовещание
BR
Запись для производства, архивирования и воспроизведения; пленки для телевидения
BS
Радиовещательная служба (звуковая)
BT
Радиовещательная служба (телевизионная)
F
Фиксированная служба
M
Подвижная спутниковая служба, спутниковая служба радиоопределения,
любительская спутниковая служба и относящиеся к ним спутниковые службы
P
Распространение радиоволн
RA
Радиоастрономия
RS
Системы дистанционного зондирования
S
Фиксированная спутниковая служба
SA
Космические применения и метеорология
SF
Совместное использование частот и координация между системами фиксированной
спутниковой службы и фиксированной службы
SM
Управление использованием спектра
SNG
Спутниковый сбор новостей
TF
Передача сигналов времени и эталонных частот
V
Словарь и связанные с ним вопросы
Примечание. – Настоящая Рекомендация МСЭ-R утверждена на английском языке в
соответствии с процедурой, изложенной в Резолюции 1 МСЭ-R.
Электронная публикация
Женева, 2010 г.
 ITU 2010
Все права сохранены. Ни одна из частей данной публикации не может быть воспроизведена с помощью каких
бы то ни было средств без предварительного письменного разрешения МСЭ.
Рек. МСЭ-R BT.1867
1
РЕКОМЕНДАЦИЯ МСЭ-R BT.1867
Технологии управления объективным качеством визуального восприятия для
радиовещательных приложений, использующих стандарт ТВ малой четкости*
в присутствии эталонной полосы с уменьшенной шириной**
(2010)
Сфера применения
В настоящей Рекомендации описываются методы оценки воспринимаемого качества
видеоизображения в радиовещательных приложениях, использующих стандарт ТВ малой четкости
(LDTV), когда может быть доступен ухудшенный эталонный (RR) сигнал, например посредством
канала вспомогательных данных, меток, метаданных и т. п.
Ассамблея радиосвязи МСЭ,
учитывая,
a)
что на протяжении длительного времени возможность автоматического измерения качества
телевизионного сигнала считается ценным ресурсом отрасли;
b)
что в Рекомендации МСЭ-R BT.1683 описываются объективные методы измерения
воспринимаемого качества видеосигнала цифрового телевизионного радиовещания стандартной
четкости в присутствии полномасштабного эталонного сигнала;
c)
что
в
Рекомендации МСЭ-R BT.1833
описываются
мультимедийные
системы
радиовещательной передачи мультимедийных и информационных приложений для подвижного
приема на портативные приемники;
d)
что ТВ малой четкости (LDTV) все чаще используется для радиовещательной передачи
мультимедийных и информационных приложений для подвижного приема;
e)
что в Рекомендации МСЭ-T J.2461 описываются технологии объективного измерения
качества визуального восприятия, применимые к приложениям LDTV в присутствии уменьшенной
эталонной полосы;
f)
что объективное измерение воспринимаемого качества видеосигнала может эффективно
дополнять методы субъективной оценки,
отмечая,
a)
что применение LDTV в основном предназначено для просмотра на небольших экранах,
таких как экраны, имеющиеся на портативных и переносимых приемниках,
*
ТВ малой четкости (LDTV) обозначает разрешение видеосигнала с меньшим числом пикселей, чем указано
в Рекомендации МСЭ-R BT.601. Применимая к LDTV Рекомендация МСЭ-R находится на рассмотрении.
**
Метод измерения с ухудшенным эталонным сигналом для объективного измерения качества
воспринимаемого видеосигнала оценивает характеристики систем, сравнивая свойства, полученные из
неискаженного входного сигнала, или эталона, видеосигнала на входе в систему и сигнала с ухудшенными
характеристиками на выходе системы.
1
Рекомендация МСЭ-T J.246 доступна по адресу: <http://www.itu.int/rec/T-REC-J.246-200808-P/en>.
Рек. МСЭ-R BT.1867
2
рекомендует,
1
что руководящие указания, обзоры и ограничения, приведенные в Приложении 1, следует
использовать для применения моделей объективного измерения качества видеосигнала,
определенных в п. 2 раздела рекомендует;
2
что приведенную в Приложении 2 модель объективного измерения качества видеосигнала
следует использовать для радиовещательных приложений, использующих LDTV, когда доступен
сокращенный эталонный сигнал, как описывается в Приложении 2.
Приложение 1
1
Введение
В настоящей Рекомендации описываются методы оценки воспринимаемого качества видеосигнала
радиовещательных приложений, использующих LDTV, когда доступен ухудшенный эталонный
сигнал.
Метод измерения с ухудшенным эталонным сигналом может использоваться, когда свойства,
полученные из эталонного видеосигнала, легко доступны в точке измерения, как может быть в случае
измерений на личном оборудовании, или на лабораторной установке, или в закрытом окружении.
Методы оценки основаны на обработке видео в форматах разрешения VGA, CIF и QCIF.
Материал для валидационного испытания состоял как из множества примеров ухудшений из-за
кодирования, так и из разных примеров условий ошибок передач, например, ошибок в двоичном формате,
отброшенных пакетов. В случае, когда рассматриваются искажения в кодировании видеосигналов, кодер
может использовать разные методы сжатия, например MPEG-2, H.264 и пр. Модели из данной
Рекомендации могут использоваться для наблюдения за качеством развернутых сетей с целью
обеспечения их эксплуатационной готовности. Визуальные эффекты ухудшения характеристик могут
включать как пространственное, так и временное ухудшение, например, повторение кадров, пропуск
кадров, уменьшение частоты кадров. Модели из данной Рекомендации также могут использоваться для
лабораторных испытаний видеосистем. При использовании для сравнения различных видеосистем для
определения точности модели в данном конкретном контексте рекомендуется использовать
количественный метод, например, как в Рекомендации МСЭ-T J.149. Данная Рекомендация считается
подходящей для услуг, предоставляемых на скорости 4 Мбит/с или меньше для подвижных приемников.
Для проверки пригодности для каждой разрешающей способности разрешены следующие условия:
–
–
QCIF (четвертичный общий формат изображения (176 × 144 пикселей)): от 16 кбит/с до 320 кбит/с.
CIF (общий формат изображения (352 × 288 пикселей)): 64 кбит/с – 2 Мбит/с.
–
VGA (видеографическая матрица (640 × 480 пикселей)): 128 кбит/с – 6 Мбит/с.
ТАБЛИЦА 1
Используемые при вычислении моделей факторы
Испытательные факторы
Ошибки передачи с потерей пакетов
Формат разрешения видеосигнала QCIF, CIF и VGA
Скорость передачи битов видеосигнала
– QCIF: от 16 кбит/с до 320 кбит/с
– CIF: 64 кбит/с – 2 Мбит/с
– VGA: 128 кбит/с – 6 Мбит/с
Временные ошибки (пауза с пропуском) максимальной длительностью 2 с
Рек. МСЭ-R BT.1867
3
ТАБЛИЦА 1 (окончание)
Испытательные факторы
Частота видеокадров от 5 кадров/с до 30 кадров/с
Схемы кодирования
H.264/AVC (MPEG-4 часть 10), MPEG-4 часть 2 и другие три соответствующие схемы кодирования.
(См. Примечание 1.)
Применение
Наблюдение за качеством в реальном времени без прерывания обслуживания в источнике
Наблюдение за качеством в удаленной точке, когда для свойств, полученных из видеопоследовательности
источника, доступны побочные каналы
Измерение качества для наблюдения за системой хранения или передачи, использующей технологии сжатия
и развертывания видеосигнала, или однократное прохождение или каскадное соединение таких технологий
Лабораторные испытания видеосистем
ПРИМЕЧАНИЕ 1. – Валидационные испытания моделей включают видеопоследовательности, закодированные
при помощи 15 различных кодеков видеосигнала. Перечисленные в таблице 1 5 кодеков чаще всего
применялись для кодирования видеопоследовательностей, и любые рекомендованные модели могут считаться
подходящими для оценки этих кодеков. Дополнительно к этим пяти кодекам была создана небольшая группа
тестовых последовательностей при помощи следующих кодеков: H.261, H.263, H.263+2, JPEG-2000, MPEG-1,
MPEG-2, H.264 SVC и других собственных систем. Можно отметить, что некоторые из этих кодеков
использовались только для форматов разрешения CIF и QCIF, так как ожидалось, что они будут применяться
для этих форматов только в полевых условиях.
Прежде чем применять модель к последовательностям, закодированным при помощи одного из этих
кодеков, пользователь должен внимательно проверить ее прогнозируемые рабочие характеристики
для определения того, достигнет ли эта модель применимых прогнозируемых характеристик.
2
Применение
Применение моделей оценки, описанных в данной Рекомендации, включает, но не ограничивается:
1
оценку, техническое описание и проверку приемлемости кодека в соответствии с
ограниченной точностью, как описано ниже;
2
наблюдение за качеством в реальном времени без прерывания обслуживания;
3
наблюдение за качеством в удаленной точке, когда доступны побочные каналы для функций,
полученных из исходной видеопоследовательности;
4
измерение качества для наблюдения за системой хранения или передачи, использующей
технологии сжатия и развертывания видеосигнала, или однократное прохождение или
каскадное соединение таких технологий;
5
лабораторные испытания видеосистем.
3
Ограничения
Описанные в данной Рекомендации модели оценки нельзя использовать вместо субъективных
испытаний. Значения корреляции между двумя правильно разработанными и выполненными
субъективными испытаниями, т. е. в двух разных лабораториях, обычно находятся в диапазоне 0,950,98.
2
H.263+ – это специальная конфигурация Рекомендации МСЭ-Т H.263 (1998 г.).
Рек. МСЭ-R BT.1867
4
Если данная Рекомендация используется для проведения сравнения видеосистем, например сравнения
двух кодеков, для определения точности модели в данном конкретном контексте рекомендуется
использовать количественный метод, например, как в Рекомендации МСЭ-T J.149.
Модели в данной Рекомендации были проверены при помощи измерения видеосигнала,
демонстрирующего фиксацию кадров до 2 с.
Модели из данной Рекомендации не прошли проверку для измерения видеосигнала, имеющего
постоянно растущую задержку, например видеосигнала, который не сбрасывает пропущенные кадры
после фиксации кадра.
Следует отметить, что в случае новых технологий кодирования и передачи, создающих дефекты
изображения, не включенные в данную оценку, объективные модели могут дать неверные
результаты. Здесь необходима субъективная оценка.
Описание моделей
4
В Приложении 2 описаны следующие модели:
Модель A (Приложение 2) − Университет Yonsei, защищающий (VQEG), Корея (Республика
Южная Корея).
Дополнение 1
к Приложению 1
Полученные данные экспертной группы по качеству видеосигнала (VQEG)
Неофициальная группа, которая называется VQEG, провела исследования измерений
воспринимаемого качества видеосигнала и представила отчет 9-й и 12-й Исследовательским
комиссиям МСЭ-T и 6-й Исследовательской комиссии по радиосвязи. В ходе недавно завершенного
исследования Мультимедийной фазы I группа VQEG оценивала рабочие характеристики алгоритмов
измерения прогнозируемого восприятия эталонного видеосигнала с ухудшенными характеристиками
для форматов QCIF, CIF и VGA.
Исходя из представленных доказательств на этом этапе МСЭ-R может порекомендовать следующий метод:
Модель A (Приложение 2) − Университет Yonsei, защищающий (VQEG), Корея (Республика
Южная Корея).
В таблицах 2, 3 и 4 представлены информативные детали рабочих характеристик модели в
испытаниях Мультимедийной фазы I VQEG.
ТАБЛИЦА 2
Формат разрешения VGA: Информативное описание рабочих характеристик модели
в испытаниях Мультимедийной фазы I VQEG: Средние значения для 13 субъективных испытаний
Статистические данные
Yonsei RR10k
Yonsei RR64k
Yonsei RR128k
PSNR(1)
Корреляция
0,803
0,803
0,803
0,713
RMSE(2)
0,599
0,599
0,598
0,714
Коэффициент постороннего
значения
0,556
0,553
0,552
0,615
(1)
PSNR: отношение пикового сигнала к шуму.
(2)
RMSE: среднеквадратичная ошибка.
Рек. МСЭ-R BT.1867
5
ТАБЛИЦА 3
Формат разрешения CIF: Информативное описание рабочих характеристик модели
в испытаниях Мультимедийной фазы I VQEG: Средние значения
для 14 субъективных испытаний
Статистические данные
Yonsei RR10k
Yonsei RR64k
PSNR
Корреляция
0,780
0,782
0,656
RMSE
0,593
0,590
0,720
Коэффициент постороннего
значения
0,519
0,511
0,632
ТАБЛИЦА 4
Формат разрешения QCIF: Информативное описание рабочих характеристик модели
в испытаниях Мультимедийной фазы I VQEG: Средние значения
для 14 субъективных испытаний
Статистические данные
Yonsei RR1k
Yonsei RR10k
PSNR
Корреляция
0,771
0,791
0, 662
RMSE
0,604
0,578
0,721
Коэффициент постороннего
значения
0,505
0,486
0,596
Все средние значения корреляции первичного анализа для моделей RR VGA равнялись 0,80, а PSNR
составляло 0,71. Корреляция отдельной модели для некоторых экспериментов равнялась 0,93. Среднее
значение RMSE для моделей RR VGA везде составляло 0,60, а PSNR – 0,71. Средний коэффициент
постороннего значения для моделей RR VGA имел значения в диапазоне от 0,55 до 0,56, а для PSNR –
0,62. Все предложенные модели имели более высокие статистические значения производительности, чем
PSNR в 7 из 13 экспериментов. На основе каждого измерения каждая модель RR VGA входила в группу
из моделей с самыми лучшими рабочими характеристиками столько раз:
Статистические данные
Yonsei RR10k
Yonsei RR64k
Yonsei RR128k
PSNR
Корреляция
13
13
13
7
RMSE
13
13
13
6
Коэффициент
постороннего значения
13
13
13
10
Средние значения корреляции первичного анализа для моделей RR CIF все равнялись 0,78, а PSNR
составляло 0,71. Корреляция отдельной модели для некоторых экспериментов равнялась 0,90. Среднее
значение RMSE для моделей RR CIF везде составляло 0,59, а PSNR – 0,72. Средний коэффициент
постороннего значения для моделей RR CIF имел значения в диапазоне от 0,51 до 0,52, а для PSNR – 0,63.
Все предложенные модели имели более высокие статистические значения производительности, чем
PSNR в 10 из 14 экспериментов. На основе каждого измерения каждая модель RR CIF входила в группу
из моделей с самыми лучшими рабочими характеристиками столько раз:
Статистические данные
Yonsei RR 10k
Yonsei RR64k
PSNR
Корреляция
14
14
5
RMSE
14
14
4
Коэффициент постороннего
значения
14
14
5
Средние значения корреляции первичного анализа для моделей RR QCIF все равнялись 0,77 и 0,79,
а PSNR составляло 0,66. Корреляция отдельной модели для некоторых экспериментов равнялась 0,89.
Рек. МСЭ-R BT.1867
6
Среднее значение RMSE для моделей RR QCIF везде составляло 0,58 и 0,60, а PSNR – 0,72. Средний
коэффициент постороннего значения для моделей RR QCIF имел значения 0,49 и 0,51, а для PSNR – 0,60.
Все предложенные модели имели более высокие статистические значения производительности, чем
PSNR как минимум в 9 из 14 экспериментов. На основе каждого измерения каждая модель RR QCIF
входила в группу из моделей с самыми лучшими рабочими характеристиками столько раз:
Статистические данные
Yonsei RR1k
Yonsei RR10k
PSNR
Корреляция
14
14
5
RMSE
14
14
4
Коэффициент постороннего
значения
12
13
4
Приложение 2
Методы Модели A с эталонным сигналом с ухудшенными характеристиками***
СОДЕРЖАНИЕ
Стр.
1
Введение....................................................................................................................................
7
2
Модели EPSNR с эталонным сигналом с ухудшенными характеристиками .....................
7
2.1
Контурное PSNR .........................................................................................................
7
2.2
Выбор свойства из видеопоследовательности источника .......................................
12
2.3
Пространственная/временная регистрация и настройка усиления/сдвига ............
15
2.4
Вычисление EPSNR и пост-обработка ......................................................................
18
2.5
Оптимальная ширина полосы побочного канала .....................................................
19
Дополнение 1 ......................................................................................................................................
20
*** Эта
модель идентична модели, описанной в Приложении A Рекомендации МСЭ-T J.246.
Рек. МСЭ-R BT.1867
7
Введение
1
Хотя PSNR широко применялось в качестве средства измерения объективного качества видеосигнала,
также сообщается, что оно не точно отражает воспринимаемое качество видеосигнала. В результате
анализа воспринимаемого человеком качества видеосигнала, был сделан вывод, что зрение человека
чувствительно к ухудшению качества на границах. Другими словами, когда пиксели на контурах
видео замутнены, эксперты, скорее всего, дадут низкую оценку видеосигнала, даже если значение
PSNR высоко. На основе данного наблюдения были созданы модели с эталонным сигналом с
ухудшенными характеристиками, которые в основном измеряют ухудшение качества на контурах.
На рисунке 1 показано, как работает модель с эталонным сигналом ухудшенного качества. Свойства,
которые будут использованы для измерения качества видеосигнала в точке наблюдения, извлечены
из видеопоследовательности источника и переданы. В таблице 5 приведены значения ширины полос
побочного канала для свойств, которые проходили проверку в испытании VQEG MM.
РИСУНОК 1
Блок-схема модели с эталонным сигналом с ухудшенными характеристиками
Видео последовательность
источника
Передатчик
Канал
Извлечение свойств
для измерения качества
видеосигнала
Приемник
Полученная
видеопоследовательность
Канал
RR
модель
BT.1867-01
ТАБЛИЦА 5
Ширина полосы побочных каналов
Видеоформат
Испытываемая ширина полосы
QCIF
1 кбит/с, 10 кбит/с
CIF
10 кбит/с, 64 кбит/с
VGA
10 кбит/с, 64 кбит/с, 128 кбит/с
2
Модели EPSNR с эталонным сигналом с ухудшенными характеристиками
2.1
Контурное PSNR
Модели с эталонным сигналом с ухудшенными характеристиками (RR) в основном измеряют ухудшение
качества на контурах. В этих моделях алгоритм выделения контуров, прежде всего, применяется к
видеопоследовательности источника, чтобы определить контурные пиксели. Затем измеряется ухудшение
качества этих контурных пикселей посредством вычисления среднеквадратичной ошибки. Из
среднеквадратичной ошибки вычисляется контурное PSNR (EPSNR).
Разрешается использовать любой алгоритм выделения контуров, хотя в результате могут
наблюдаться небольшие отличия. Например, для выделения контуров можно использовать любой
оператор градиента. Было предложено несколько операторов градиента. Во многих алгоритмах
выделения контуров при помощи градиентных операторов сначала вычисляются изображение с
8
Рек. МСЭ-R BT.1867
горизонтальным градиентом gгоризонтальное(m,n) и изображение с вертикальным градиентом
gвертикальное(m,n). Затем по следующей формуле можно рассчитать величину градиента изображения:
g (m, n)  g горизонтпа льное (m, n)  g вертикальное (m, n) .
Наконец, для того чтобы найти контурные пиксели, к величине градиента изображения g(m, n)
применяют операцию определения порога. Другими словами, пиксели, значения величины
градиентов которых превышают пороговое значение, считаются контурными пикселями.
На рисунках со 2 по 6 показана процедура. На рисунке 2 показано исходное изображение. На
рисунке 3 показано изображение с горизонтальным градиентом gгоризонтальное(m,n), которое получено в
результате применения к исходному изображению на рисунке 2 оператора горизонтального
градиента. На рисунке 4 показано изображение с вертикальным градиентом gвертикальное(m,n), которое
получено в результате применения к исходному изображению на рисунке оператора вертикального
градиента. На рисунке 5 показано изображение величины градиента (контурное изображение), а на
рисунке 6 показано контурное изображение в двоичном коде (изображение маски), полученное в
результате применения к изображению величины градиента на рисунке 5 определения порога.
РИСУНОК 2
Изображение источника (исходное изображение)
BT.1867-02
Рек. МСЭ-R BT.1867
9
РИСУНОК 3
Изображение с горизонтальным градиентом, которое получено в результате применения
к исходному изображению на рисунке 2 оператора горизонтального градиента
BT.1867-03
РИСУНОК 4
Изображение с вертикальным градиентом, которое получено в результате применения
к исходному изображению на рисунке 2 оператора вертикального градиента
BT.1867-04
10
Рек. МСЭ-R BT.1867
РИСУНОК 5
Изображение величины градиента
BT.1867-05
РИСУНОК 6
Контурное изображение в двоичном формате (изображение маски), полученное в результате применения
к изображению величины градиента на рисунке 5 определения порога
BT.1867-06
С другой стороны, для определения контуров можно использовать измененную процедуру. Например,
сначала к исходному изображению можно применить оператора вертикального градиента, создав
изображение с вертикальным градиентом. Затем к изображению с вертикальным градиентом
применяется оператор горизонтального градиента, создавая измененное изображение с
последовательным градиентом (изображение с горизонтальным и вертикальным градиентом). Наконец,
чтобы найти контурные пиксели, к измененному изображению с последовательным градиентом можно
применить операцию определения порога. Другими словами, пиксели измененного изображения с
последовательным градиентом, градиенты которых превышают пороговое значение, считаются
контурными пикселями. На рисунках с 7 по 9 показана измененная процедура. На рисунке 7 показано
Рек. МСЭ-R BT.1867
11
изображение с вертикальным градиентом gвертикальное (m,n), которое получено в результате применения к
исходному изображению на рисунке 2 оператора вертикального градиента. На рисунке 8 показано
измененное изображение с последовательным градиентом (изображение с горизонтальным и
вертикальным градиентом), которое получено в результате применения к изображению с вертикальным
градиентом на рисунке 7 оператора горизонтального градиента. На рисунке 9 показано контурное
изображение в двоичном коде (изображение маски), полученное в результате применения к
измененному изображению с последовательным градиентом на рисунке 8 определения порога.
РИСУНОК 7
Изображение с вертикальным градиентом, которое получено в результате применения
к исходному изображению на рисунке 2 оператора вертикального градиента
BT.1867-07
РИСУНОК 8
Измененное изображение с последовательным градиентом (изображение с горизонтальным
и вертикальным градиентом), которое получено в результате применения к изображению
с вертикальным градиентом на рисунке 7 оператора горизонтального градиента
12
Рек. МСЭ-R BT.1867
РИСУНОК 9
Контурное изображение в двоичном коде (изображение маски), полученное в результате применения
к измененному изображению с последовательным градиентом на рисунке 8 определения порога
BT.1867-09
Отмечается, что оба метода могут рассматриваться, как алгоритмы определения контуров. Можно
выбрать любой алгоритм определения контуров в зависимости от свойств видеоизображения и
алгоритмов сжатия. Однако рабочие характеристики одних методов могут быть лучше других.
Поэтому в этой модели сначала применяется оператор определения контуров, создавая контурные
изображения (рисунки 5 и 8). Затем создается изображение маски (контурное изображение в двоичном
коде) посредством применения к контурному изображению определения порога (рисунки 6 и 9). Другими
словами, пиксели контурного изображения, значения которых меньше порогового te, устанавливаются на
нуль, а пиксели с равным или большим значением порога устанавливаются в ненулевое значение. На
рисунках 6 и 9 показаны изображения маски. Так как видео может просматриваться в виде
последовательности кадров или полей, описанная выше процедура может применяться к каждому кадру
или полю видео. Так как эта модель может использоваться для видео на основе полей или на основе
кадров, для указания на поле или кадр будет использоваться термин "изображение".
2.2
Выбор свойства из видеопоследовательности источника
Поскольку данная модель является моделью RR, из каждого изображения или источника
видеопоследовательности необходимо извлечь свойства. В модели EPSNR RR из каждого
изображения извлекается определенное количество контурных пикселей. Затем место и значения
пикселя кодируются и пересылаются. Однако для некоторых видеопоследовательностей количество
контурных пикселей может быть крайне невелико, если используется фиксированное пороговое
значение. В сценарии худшего случая оно может равняться нулю (пустые изображения или
изображения с очень низкой частотой). Для того чтобы решить эту проблему, если количество
контурных пикселей изображения меньше заданного значения, пользователь может уменьшить
пороговое значение, пока количество контурных пикселей не будет больше заданного значения.
С другой стороны, можно выбрать контурные пиксели, которые соответствуют самым большим
значениям изображений с горизонтальным и вертикальным градиентом. Когда в кадре нет контурных
пикселей, например пустые изображения, можно случайным образом выбрать необходимое
количество пикселей или пропустить этот кадр. Например, если из каждого кадра надо выбрать
10 контурных пикселей, можно отсортировать пиксели изображений с горизонтальным и
вертикальным градиентом в соответствии с их значениями и выбрать 10 самых больших значений.
Однако в результате данной процедуры в идентичных местах может быть множество контурных
пикселей. Для того чтобы решить эту проблему, сначала можно выбрать несколько раз необходимое
Рек. МСЭ-R BT.1867
13
количество пикселей изображения с горизонтальным или вертикальным градиентом, а затем в
случайном порядке выбрать из отобранных пикселей изображения с горизонтальным или
вертикальным градиентом необходимое количество контурных пикселей. В проверенных в ходе
мультимедийных испытаний VQEG моделях необходимое количество контурных пикселей выбрано
случайным образом из большого объема контурных пикселей. Этот объем контурных пикселей
получен посредством применения к градиентному изображению операции определения.
В RR моделях EPSNR местоположение и значения контурных пикселей закодированы. Отмечается,
что во время процесса кодирования можно применять обрезку. Для того чтобы не выбирать
контурные пиксели в обрезанных областях, модель выбирает контурные пиксели в центральной
области (рисунок 10). В таблице 6 приведены размеры после обрезки. Также в таблице 6 приведено
количество необходимых для кодирования местоположения и значения контурного пикселя битов.
ТАБЛИЦА 6
Требования к битам для каждого контурного пикселя
Видеоформат
Размер
Размер после
обрезки
Битов для
местоположения
Битов для значения
пиксела
Всего битов
на пиксел
QCIF
176 × 144
168 × 136
15
8
23
CIF
352 × 288
338 × 274
17
8
25
VGA
640 × 480
614 × 454
19
8
27
РИСУНОК 10
Пример обрезки (VGA) и центральной области
13
13
BT.1867-10
Рек. МСЭ-R BT.1867
14
Модель выбирает контурные пиксели из каждого кадра в соответствии с разрешенной шириной
полосы (таблица 5). В таблицах 7 и 8 приведено количество контурных пикселей на кадр, которые
можно передать для испытываемой ширины полосы.
ТАБЛИЦА 7
Количество контурных пикселей на кадр (30 кадров/с)
Видеоформат
1 кбит/с
10 кбит/с
QCIF
1
14
64 кбит/с
CIF
13
85
VGA
12
79
128 кбит/с
158
ТАБЛИЦА 8
Количество контурных пикселей на кадр (25 кадров/с)
Видеоформат
1 кбит/с
10 кбит/с
QCIF
1
17
64 кбит/с
CIF
16
102
VGA
14
94
РИСУНОК 11
Блок-схема модели
Начало
Пространственная/временная
регистрация с полным
поисковым диапазоном
Оценка усиления/сдвига
Для каждого возможного пространственного
сдвига (∆x, ∆y) применяется временная
регистрация, использующая окно, и
вычисляется EPSNR. И, наконец, выбирается
в качестве VQM самое большое значение EPSNR
BT.1867-11
128 кбит/с
189
Рек. МСЭ-R BT.1867
2.3
15
Пространственная/временная регистрация и настройка усиления/сдвига
Прежде чем вычислять разницу между контурными пикселями в исходной видеопоследовательности и
пикселями в обработанной видеопоследовательности, которая является видеопоследовательностью,
принятой приемником, сначала модель применяет пространственную/временную регистрацию и
настройку усиления/сдвига. Во-первых, для обнаружения глобальных пространственных и временных
сдвигов наряду со значениями усиления и отступа применяется алгоритм полного поиска (рисунок 11).
Затем, для каждого возможного пространственного сдвига (∆x, ∆y) выполняется временная регистрация, и
вычисляется EPSNR. И, наконец, в качестве системы показателей качества видеосигнала (VQM)
выбирается EPSNR с самым большим значением.
В точке наблюдения обработанную видеопоследовательность следует согласовать с контурными
пикселями, извлеченными из исходной видеопоследовательности. Однако, если ширина полосы
побочных каналов невелика, доступно лишь небольшое количество контурных пикселей исходной
видеопоследовательности (рисунок 12). Следовательно, временная регистрация может быть неточна,
если эта временная регистрация осуществляется посредством одного единственного кадра
(рисунок 13). Для того чтобы решить данную проблему, модель использует окно для временной
регистрации.
Вместо
того
чтобы
использовать
отдельный
кадр
обработанной
видеопоследовательности, модель, для отыскания оптимального временного сдвига, создает окно,
которое состоит из нескольких соседних кадров. Эта процедура показана на рисунке 14.
Среднеквадратичная ошибка в пределах окна вычисляется по следующей формуле:
MSEокна 
1
N win
E
SRC (i )  EPVS
(i) 2 ,
где MSEокна является среднеквадратичной ошибкой окна, ESRC(i) – это контурный пиксел в пределах
окна, который имеет соответствующий пиксел в обработанной видеопоследовательности, EPVS(i) – это
пиксел в обработанной видеопоследовательности, соответствующий контурному пикселу, а Nwin – это
общее количество контурных пикселей, использованных для вычисления MSEокна. Это
среднеквадратичная ошибка окна используется как разница между кадром в обработанной
видеопоследовательности и соответствующим кадром в исходной видеопоследовательности.
Размер окна можно определить, изучив характеристики обработанной видеопоследовательности. Для
стандартного применения рекомендуется окно, соответствующее двум секундам. С другой стороны,
могут применяться окна с разными размерами, и будет использоваться лучшее, в котором самое
маленькое значение среднеквадратичной ошибки.
РИСУНОК 12
Выбор контурных пикселей в исходной видеопоследовательности
BT.1867-12
Рек. МСЭ-R BT.1867
16
РИСУНОК 13
Согласование обработанной видеопоследовательности с контурными пикселями исходной видеопоследовательности
SRC
PVS
BT.1867-13
РИСУНОК 14
Согласование обработанной видеопоследовательности с контурными пикселями при помощи окна
SRC
1
2
3
4
PVS
1
2
3
4
Кадр, который необходимо согласовать
BT.1867-14
Когда исходная видеопоследовательность закодирована с высоким коэффициентом сжатия, кодер
уменьшает количество кадров в секунду, а обработанная видеопоследовательность имеет
повторяющиеся кадры (рисунок 15). На рисунке 15 обработанная видеопоследовательность не имеет
кадров, соответствующих некоторым кадрам из исходной видеопоследовательности (2-й, 4-й, 6-й,
8-й кадры). В этом случае для расчетов среднеквадратичной ошибки модель не использует
повторяющиеся кадры. Другими словами, эта модель выполняет временную регистрацию при
помощи первого кадра (действительного кадра) каждого повторяющегося блока. Поэтому на
рисунке 16 для временной регистрации используются только три кадра (3-й, 5-й, 7-й кадры) в
пределах окна.
Рек. МСЭ-R BT.1867
17
РИСУНОК 15
Пример повторяющихся кадров
SRC
PVS
A
B
C
D
E
F
G
H
1
2
3
4
5
6
7
8
A
A
C
C
E
E
G
G
1
2
3
4
5
6
7
8
BT.1867-15
РИСУНОК 16
Обработка повторяющихся кадров
SRC
PVS
A
B
C
D
E
F
G
H
1
2
3
4
5
6
7
8
Z
Z
B
B
D
D
F
F
1
2
3
4
5
6
7
8
BT.1867-16
Можно получить обработанную видеопоследовательность с нерегулярным повторением кадров, что
может привести к применению метода временной регистрации, использующего окно для создания
неточных результатов. Для решения этой проблемы можно локально настроить каждый кадр в
пределах указанного значения, например ±1, как показано на рисунке 18, после временной
регистрации при помощи окна. Затем проводится локальная настройка, которая дает минимальную
MSE, которая используется для вычисления EPSNR.
РИСУНОК 17
Окна с разными размерами
Кадр, который необходимо согласовать
PVS
A
B
C
D
E
F
G
H
I
1
2
3
4
5
6
7
8
9
Размер окна 3
Размер окна 5
Размер окна 7
BT.1867-17
Рек. МСЭ-R BT.1867
18
РИСУНОК 18
Локальная настройка временной регистрации при помощи окна
SRC
PVS
A
B
C
D
E
F
G
H
I
J
K
L
1
2
3
4
5
6
7
8
9
10
11
12
A
A
A
1
2
3
C
C
C
G
G
G
J
4
5
6
7
8
9
10
Кадр, который необходимо согласовать
2.4
J
J
11
12
BT.1867-18
Вычисление EPSNR и пост-обработка
После выполнения временной регистрации, вычисляется среднее значение разницы между
контурными пикселями исходной видеопоследовательности и соответствующими пикселями
обработанной видеопоследовательности, которое может рассматриваться в качестве контурной
среднеквадратичной ошибки обработанной видеопоследовательности (MSEedge). Наконец, по
следующей формуле вычисляется EPSNR (контурное PSNR):
 P2 
,
EPSNR  10 log10 
 MSE 
edge


где:
p:
пиковое значение изображения.
При кодировании мультимедийного видеосигнала может наблюдаться повторение кадров из-за
уменьшения частоты кадров и фиксации кадров из-за ошибок в передаче, которые ухудшат
воспринимаемое качество видеосигнала. Для того чтобы справиться с этим эффектом, прежде чем
вычислять EPSNR, в модели применяется следующая настройка:
MSE freezed _ frame _ considered  MSEedge 
K  N total _ frame
N total _ frame  N total _ freezed _ frame
,
где MSEfreezed_frame_considered – среднеквадратичная ошибка, которая учитывает повторяющиеся и
фиксированные кадры, Ntotal_frame – общее количество кадров, Ntotal_freezed_frame, K – постоянные.
В модели, тестируемой в ходе мультимедийного испытания VQEG, K было установлено на 1.
Когда значение EPSNR превышает определенный порог, качество восприятия становится
насыщенным. В этом случае существует возможность установить верхнюю границу EPSNR. Более
того, когда желательно линейное соотношение EPSNR и DMOS (средняя экспертная оценка
разницы), можно применить кусочно-линейную функцию, как показано на рисунке 19. В модели,
тестируемой в ходе мультимедийного испытания VQEG, значение 50 было присвоено только верхней
границе, так как использовалась подгонка многочленной кривой.
Рек. МСЭ-R BT.1867
19
РИСУНОК 19
Кусочно-линейная функция для линейного соотношения
EPSNR и DMOS
Изнутри
Внутрь
L1 L2
U1 U2
BT.1867-19
2.5
Оптимальная ширина полосы побочного канала
В данном Дополнении приведено сравнение рабочих характеристик по мере увеличения ширины
полосы побочного канала. Для формата QCIF наблюдается, что коэффициенты корреляции почти
насыщены на скорости примерно 10 кбит/с. После чего увеличение ширины полосы дает примерно
1% улучшения. Для формата CIF наблюдается, что коэффициенты корреляции почти насыщены на
скорости примерно 15 кбит/с. После чего увеличение ширины полосы дает примерно 0,5% улучшения.
Для формата VGA наблюдается, что коэффициенты корреляции почти насыщены на скорости
примерно 30 кбит/с. После чего увеличение ширины полосы дает примерно 0,5% улучшения.
Модели EPSNR с эталонным сигналом с ухудшенными характеристиками для объективного
измерения качества видеосигнала основаны на контурном ухудшении. Эти модели можно внедрять в
реальном времени с умеренным применением вычислительных возможностей. Эти модели хорошо
подходят для приложений, которые требуют наблюдения в реальном времени за качеством
видеосигнала, когда доступны побочные каналы.
R
R
1
RR k
2
RR k
3
R k
R4
R k
R5
R k
R
6
RR k
7
RR k
8
R k
R9
R k
R
1
RR 0k
1
RR 1k
1
R 2k
R1
RR 3k
1
RR 4k
1
RR 5k
1
RR 6k
1
R 7k
R1
R 8k
R1
RR 9k
2
RR 0k
2
R 1k
R
2
R 2k
R
2
R 3k
R2
R 4k
R2
RR 5k
2
RR 6k
2
R 7k
R
2
RR 8k
29
k
R
0,74
k
0,78
0, 8
R
RR
R4
3k
k
0,82
R
R5
R k
R
6k
RR
7
RRk
R R 8k
9
RR k
10
RR k
1
RR 1k
1
R 2k
R
1
R 3k
R1
R 4k
R
1
R 5k
R
1
R 6k
R1
R 7k
R1
R 8k
R
1
R R 9k
20
RR k
2
R 1k
R2
R 2k
R2
3
R k
R
2
R 4k
R
25
R k
R
26
R k
R2
R 7k
R
2
R 8k
R
29
k
RR
1k
RR
2k
RR
3k
RR
4k
RR
5k
RR
6k
RR
7k
RR
8k
RR
9k
RR
10
k
RR
11
RR k
12
RR k
13
k
RR
14
k
RR
15
RR k
16
RR k
17
k
RR
18 k
RR
19
k
RR
20
k
RR
21
RR k
22
RR k
23
RR k
24
k
RR
25
k
RR
26
k
RR
27
RR k
28
k
RR
29
k
0, 8
R2
R
R
1
RR k
2
RR k
3
R k
R4
R k
R5
R k
R
6
RR k
7
RR k
8
R k
R9
R k
R
1
RR 0k
1
RR 1k
1
R 2k
R1
RR 3k
1
RR 4k
1
RR 5k
1
RR 6k
1
R 7k
R1
R 8k
R1
RR 9k
2
RR 0k
2
R 1k
R
2
R 2k
R
2
R 3k
R2
R 4k
R2
RR 5k
2
RR 6k
2
R 7k
R
2
RR 8k
29
k
0, 9
RR
1k
Корреляция
1
Корреляция
20
Рек. МСЭ-R BT.1867
Дополнение 1
к Приложению 2
Оптимальная ширина полосы побочного канала
На рисунке 20 показаны коэффициенты корреляции для разных значений ширины полосы побочных
каналов для наборов видеосигнала в формате QCIF. Очевидно, что эти коэффициенты корреляции почти
насыщены на скорости примерно 10 кбит/с. После чего увеличение ширины полосы дает примерно
1% улучшения.
РИСУНОК 20
Улучшение рабочих характеристик по мере увеличения ширины полосы побочных каналов (QCIF)
QCIF
0, 7
0, 6
0, 5
0, 4
0, 3
0, 2
0, 1
0
0,84
QCIF
0,76
0,72
BT.1867-20
Рек. МСЭ-R BT.1867
21
На рисунке 21 показаны коэффициенты корреляции для разных значений ширины полосы побочных
каналов для наборов видеосигнала в формате CIF. Очевидно, что эти коэффициенты корреляции почти
насыщены на скорости примерно 15 кбит/с. После чего увеличение ширины полосы дает примерно
0,5% улучшения.
РИСУНОК 21
Улучшение рабочих характеристик по мере увеличения ширины полосы побочных каналов (CIF)
RR
95
k
RR
90
k
RR
85
k
RR
80
k
RR
75
k
RR
45
k
k
RR
65
k
RR
70k
RR
40
k
k
RR
60
k
RR
35k
k
RR
55
k
RR
25
k
RR
30
k
k
RR
50
k
RR
10
k
RR
15 k
RR
20k
0,9
k
CIF
0,8
0,7
Корреляция
0,6
0,5
0,4
0,3
0,2
0,1
k
R9
5
k
R
R
R9
0
k
k
R
R
85
k
R
80
R
k
RR
75
k
RR
70
k
R
R6
5
k
R
R6
0
k
R
55
R
RR
50
RR
45
R
R4
0
k
R3
5
R
RR
30
k
R2
5
R
k
RR
20
RR
15
R
R1
0
0
RR
85
k
RR
90
k
RR
95
k
RR
80
k
RR
60
k
0k
RR
75
k
RR
55
k
RR
50
k
RR
45
k
RR
40
k
RR
35k
k
0,82
RR
10
k
0,825
0,815
0,81
0,805
5k
R
R9
k
0k
R
R9
85
80
k
R
R
75
k
R
R
70
5k
k
RR
RR
R
R6
55
R
R6
50
5k
0k
5k
k
R
R
RR
RR
4
R
R4
k
5k
30
R
R3
RR
k
5k
20
R
R2
RR
RR
1
0k
0,8
R
R1
Корреляция
0,83
RR
25
k
RR
30
k
RR
15k
RR
20k
0,835
RR
65
k
RR
70k
CIF
0,84
BT.1867-21
Рек. МСЭ-R BT.1867
22
На рисунке 22 показаны коэффициенты корреляции для различных значений ширины полосы побочных
каналов для наборов видеосигнала в формате VGA. Очевидно, что эти коэффициенты корреляции почти
насыщены на скорости примерно 30 кбит/с. После чего увеличение ширины полосы дает примерно
0,5% улучшения.
РИСУНОК 22
Улучшение рабочих характеристик по мере увеличения ширины полосы побочных каналов (VGA)
RR
10k
RR
2 0k
RR
30
k
RR
40k
RR
50k
RR
60
k
RR
70k
RR
80k
RR
90k
RR
10
0k
RR
110
k
RR
12
0k
RR
13
0k
RR
140
k
RR
150
k
RR
16
0k
RR
170
k
RR
1 80
k
RR
190
k
VGA
0,9
0,8
0,7
Корреляция
0,6
0,5
0,4
0,3
0,2
0,1
19
0k
k
R
RR
R1
80
0k
0k
RR
17
k
16
RR
R
R1
50
0k
0k
RR
14
k
13
RR
20
0k
R1
R
RR
11
0k
k
10
90
RR
0k
R8
R
RR
k
k
70
RR
60
k
RR
50
k
RR
40
k
30
RR
RR
0k
R2
R
RR
10
k
0
30
k
RR
40k
RR
50k
RR
60
k
RR
70k
RR
8 0k
RR
90 k
RR
100
k
RR
110
k
RR
1 20
k
RR
13
0k
RR
1 40
k
RR
1 50
k
RR
16
0k
RR
170
k
RR
180
k
RR
190
k
VGA
RR
10
k
0,835
0,825
0,82
0,815
0,81
0,805
0k
19
80
k
RR
0k
R1
R
0k
17
RR
16
k
RR
50
0k
R1
R
0k
14
RR
13
k
20
RR
R1
11
0k
R
0k
RR
10
90
0k
k
RR
RR
k
R8
R
70
60
k
RR
50
k
RR
k
40
RR
RR
k
30
RR
0k
R2
R
10
k
0,8
RR
Корреляция
0,83
RR
20k
RR
0,84
BT.1867-22
______________
1/--страниц
Пожаловаться на содержимое документа