close

Вход

Забыли?

вход по аккаунту

;pdf

код для вставкиСкачать
Министерство образования и науки Российской Федерации
Международная академия наук высшей школы
Санкт-Петербургский государственный электротехнический университет "ЛЭТИ"
Санкт-Петербургский государственный университет
аэрокосмического приборостроения
Санкт-Петербургский государственный университет кино и телевидения
Санкт-Петербургский государственный университет телекоммуникаций
им. проф. М. А. Бонч-Бруевича
Санкт-Петербургское НТОРЭС им. А. С. Попова
ОАО "НИИТ"
ЦНИИ "Электрон"
Группа компаний "ИСТА"
ООО "Итриум СПб"
Корпорация DNK
ООО "Технолит"
11-я МЕЖДУНАРОДНАЯ КОНФЕРЕНЦИЯ
«ТЕЛЕВИДЕНИЕ:
ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
«TELEVISION:
IMAGES BROADCASTING & PROCESSING»
25 июня – 26 июня 2014 г.
Программа конференции
Санкт-Петербург
2014
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
ПРОГРАММНЫЙ КОМИТЕТ
Н. В. Лысенко, профессор, проректор по образовательной деятельности СПбГЭТУ –
председатель;
К. Ф. Гласман, профессор, заведующий кафедрой «Видеотехника» СПбГУКиТ –
сопредседатель;
А. А. Гоголь, профессор, зав. кафедрой «Телевидение и видеотехника» СПбГУТ –
сопредседатель;
Б. С. Тимофеев, профессор СПбГУАП – сопредседатель;
В. С. Гутин, зам. председателя СПбНТОРЭС им. А. С. Попова;
А. А. Камшилин, профессор Университета Копио, Финляндия;
Канг Ук, Ph.D., «SOI-KOREA Center», КERI, Корея;
И. Н. Пустынский, профессор ТУСУР, Томск;
В. С. Титов, профессор, заведующий кафедрой КТУ, Курск;
А. А. Умбиталиев, профессор, генеральный директор ОАО «НИИТ»;
Р. Хедке, профессор Университета Висбаден, Германия;
Чжоу Ливей, профессор Политехнического Университета, Пекин, КНР.
ОРГКОМИТЕТ
Н. В. Лысенко, профессор, проректор по образовательной деятельности СПбГЭТУ –
председатель;
А. К. Цыцулин, профессор, зам. генерального директора ОАО «НИИТ» по науке – зам.
председателя;
Г. В. Левко, зам. главного инженера ОАО «НИИТ» – зам. председателя;
А. А. Манцветов, доцент кафедры «Телевидение и видеотехника» СПбГЭТУ – зам.
председателя;
А. М. Мончак, зам. заведующего кафедрой «Телевидение и видеотехника» СПбГЭТУ по
учебной работе – зам. председателя.
П. С. Баранов, ассистент кафедры «Телевидение и видеотехника» СПбГЭТУ– зам.
председателя;
СЕКРЕТАРИАТ ОРГКОМИТЕТА
А. А. Чиркунова, ассистент кафедры «Телевидение и видеотехника» СПбГЭТУ;
А. Ю. Дмитриева инженер кафедры «Телевидение и видеотехника» СПбГЭТУ;
Е. Ю. Пучка инженер кафедры «Телевидение и видеотехника» СПбГЭТУ;
2
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Содержание
Пленарное заседание .................................................................................................................. 5
А. А. Манцветов, А. К. Цыцулин Пути достижения предельной чувствительности
телевизионных камер................................................................................................................. 5
Баранов П.С. Современные тенденции проектирования телевизионных камер ................. 8
Обухова Н.А., Мотыко А.А., Папаян Г.В., Uk. Kang Алгоритмы предообработки
изображений в экспертно-консультирующей телевизионной системе диагностики рака
шейки матки. ............................................................................................................................ 12
Тимофеев Б.С., Мотыко А.А. Перспективы развития видеосистем мониторинга
дорожной обстановки .............................................................................................................. 16
Секция 1. Формирование видеосигналов. Твердотельные фотоприемники ................ 20
Л.Д. Ложкин Колориметрически точное цветовоспроизведения в телевидении .............. 20
Сизиков В.С., Экземпляров Р.А. Оценка параметров функции рассеяния точки по
спектру искаженного изображения ........................................................................................ 24
И.И.Сальников Методы удаления бинарных изображений локальных областей по
заданным размерным условиям .............................................................................................. 28
Н. П. Корнышев Информационный подход к моделированию процесса
фотоэлектронного преобразования ........................................................................................ 34
А.В. Кузнецов Оптимальная фильтрация пирометрического сигнала при ограниченной
скорости изменения температуры объекта............................................................................ 36
Баранов П.С Методы повышения качества изображения формируемого цветной
одноматричной телевизионной камерой ............................................................................... 42
Баранов П.С Мультиспектральная ТВ камера на одноматричном ФП .............................. 48
Баранов П.С., Манцветов А.А. Реализация малых времен накопления в МПЗС .............. 52
Секция 2. Цифровая обработка и компрессия видеоданных. .......................................... 55
Попов А. С., Капустин В. В., Курячий М. И. Интерактивная система эфирного
цифрового телевизионного вещания с повышенной помехоустойчивостью .................... 55
Кирьянов К.А. Некорректные задачи восстановления искаженных изображений на 32разрядных цифровых сигнальных процессорах с фиксированной точкой ........................ 59
Фисенко В.Т., Можейко В.И., Фёдоров Д.А., Фисенко Т.Ю. Масштабирование
изображений в телевизионных и компьютерных системах визуализации ........................ 65
Фисенко В.Т., Вилесов Л.Д., Можейко В.И., Фёдоров Д.А., Фисенко Т.Ю. Оценка
эффективности дополненного сигма-точечного фильтра Калмана в задачах
сопровождения маневрирующей цели ................................................................................... 69
Кузьмин С.А. Интегральные показатели точности алгоритмов обнаружения движущихся
объектов .................................................................................................................................... 73
Кузьмин С.А. Этапы обработки видеоинформации для достижения высокой точности
сегментации .............................................................................................................................. 77
Березин В.В., Зинкевич А.В.,Фахми Ш.С. Варианты реализаций дискретного вейвлет
преобразования на базе системы на кристалле ..................................................................... 81
Березин В.В., Зинкевич А.В., Фахми Ш.С. Постановка задачи о рюкзаке как способ
определения аппаратной и программной составляющей при реализации устройств в
системах на кристалле ............................................................................................................. 84
3
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Березин В.В., Лабецкий А.В., Костикова Е.В., Фахми Ш.С. Транспортные
видеоинформационные системы: Задачи сжатия и распознавания .................................... 86
Березин В.В., Лабецкий А.В., Фахми Ш.С. Распознавание и определение параметров
объектов изображений............................................................................................................. 91
Секция 3. Телевизионные системы специального назначения ....................................... 95
В. И. Челпанов, Н. П. Корнышев, А. В. Кузнецов, С. Б. Торицин Первые промышленные
телевизионные установки ....................................................................................................... 95
Толочков Д. В. «Автоматическое определение основных параметров стереосъемки» .... 99
Слюсаренко С.А. Компьютерное моделирование виртуальной стереокамеры ............... 103
Чафонова В. Г. Метод формирования стереопары с возможностью автоматической
коррекции рассогласования изображений по параметрам масштаб и поворот ............... 107
Птицына А. С. Система видеонаблюдения за процессом перегрузки ядерного топлива на
АЭС ......................................................................................................................................... 111
Авдоченко Б.И., Зайцева Е.В, Кирпиченко Ю.Р., Курячий М.И, Пустынский И.Н.
Особенности построения активно-импульсных телевизионно-вычислительных систем
(АИТВС), работающих в сложных условиях контроля и наблюдения ............................ 117
Обухова Н.А., Николюк О.А. Алгоритм сегментации бликов в экспертно консультирующей телевизионной системе диагностики рака шейки матки. ................. 120
Чиркунова А.А. Пространственное разрешение оптико-электронной аппаратуры для
системы дистанционного зондирования Земли из космоса ............................................... 123
А.В. Морозов Оценка максимальной дальности обнаружения удаленного объекта в
неблагоприятных метеоусловиях ......................................................................................... 127
Г.В. Левко, А.В. Морозов, А.А. Чиркунова Телевизионная система пригоризонтного
наблюдения ............................................................................................................................. 130
4
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Пленарное заседание
Руководитель пленарного заседания – Проректор СПбГЭТУ "ЛЭТИ",
проф. Н. В. Лысенко
А. А. Манцветов, А. К. Цыцулин
СПбГЭТУ каф. ТВ, ОАО «НИИТ»
Пути достижения предельной чувствительности
телевизионных камер
Рассмотрены пути повышения чувствительности телевизионных камер на
твердотельных фотоприемниках – методы увеличения квантовой эффективности и
снижения уровня шумов. Получены выражения для чувствительности КМОП-сенсоров
с активным пикселом. Показано, что интегральная чувствительность КМОП-сенсора с
накоплением потенциала не зависит от размера пиксела. Рассмотрены составляющие
шумов КМОП-сенсоров. Предложены направления повышения чувствительности
КМОП-сенсоров с активным пикселом.
Ключевые слова: твердотельный фотоприемник, КМОП-сенсор, чувствительность, шумы
фотоприемников.
Анализ основных фотоэлектрических характеристик и параметров фотоприемников
(ФП) на основе технологии приборов с зарядовой связью (ПЗС) проведен в целом ряде
отечественных статей и монографий [1-4]. Чувствительность матричных ПЗС определяется
квантовой эффективностью и шумами считывания в выходном устройстве. В настоящее
время квантовая эффективность лучших матричных ПЗС достигает 100% в широком
диапазоне длин волн [5], а собственные шумы могут быть снижены до единиц электронов
[5, 6]. В настоящее время предложены технологии электронного умножения заряда в ПЗСрегистрах, позволяющие снизить эффективный уровень шумов считывания ниже одного
электрона [5, 7].
В тоже время анализа характеристик чувствительности для перспективных ФП на
основе технологии комплементарных структур метал-оксид-полупроводник (КМОП) в
отечественных литературных источниках нет.
Современные КМОП ФП можно условно разделить на два больших класса – с
накоплением потенциала, когда полезный видеосигнал формируется за счет разряда емкости
обратносмещенного фотодиода, заряженного изначально до напряжения питания, и с
накоплением заряда, когда фотодиод находится под постоянным потенциалом и для
считывании видеосигнала накопленный заряд переносится в плавающую диффузионную
область, к которой присоединен усилительный транзистор.
Второй тип пиксела использует в том числе технологии, присущие приборам с
зарядовой связью (ПЗС) и значительно более сложен в производстве. Большинство
современных КМОП ФП используют активные пикселы с накоплением потенциала.
Найдем интегральную чувствительность КМОП ФП с накоплением потенциала, т. е.
зависимость полезного видеосигнала от освещенности. Будем считать, что
фотогенерированные носители заряда образуются непосредственно в фотодиоде и диффузия
носителей, образовавшихся за его пределами, в фотодиод отсутствует.
Пусть под действием импульса сброса RS емкость фотодиода CPD зарядилась до
потенциала питания UDD. Заряд на емкости фотодиода составит Q = U ∙ C . Под
5
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
действием освещенности E, выраженной в лк, за время накопления TН в фотодиоде
образуется заряд [4]
Q =E∙
K ∙ A ∙ Tн ∫
∙
k
∫
S(λ) ∙ ϕ (λ)dλ
ν(λ) ∙ ϕ (λ)dλ
,
где K – коэффициент усиления аналогового усилителя, AP – площадь пиксела, k=683 лм/Вт –
фотометрический коэффициент, λmax – максимальная длина волны спектральной
чувствительности ФП, λmin – минимальная длина волны спектральной чувствительности ФП,
ν(λ) – кривая видности зрительного анализатора человека, ϕ’(λ) нормированная спектральная
плотность мощности источника света, S(λ) – спектральная чувствительность ФП, в А/Вт.
S(λ) = λ ∙ q ∙ θ(λ)⁄h ∙ c, где λ – длина волны света, q – заряд электрона, θ(λ) – спектральная
зависимость квантовой эффективности ФП, h – постоянная Планка, c – скорость света.
Полезный видеосигнал будет равен U = |Q ⁄C |, знак модуля применен из-за того,
что уровень видеосигнала под действием света снижается. С учетом того, что C = CУД ∙ A ,
где CУД- удельная емкость фотодиода, обычно составляющая единицы фФ/мкм2, выражение
для полезного видеосигнала примет вид
U =E∙
K ∙ Tн ∫
∙
k ∙ CУД ∫
S(λ) ∙ ϕ (λ)dλ
ν(λ) ∙ ϕ (λ)dλ
,
т. е. видеосигнал КМОП ФП с активным пикселом не зависит площади фоточувствительного
элемента – фотодиода. Полученное выражение дает возможность фирмам-производителям
уменьшать размер фотодиода вплоть до 1 мкм, практически без потери чувствительности.
Для нахождения пороговой чувствительности, т. е. значения освещенности,
реализующей заданное отношение сигнал/шум, необходим анализ составляющих шумов
КМОП ФП с активным пикселом.
Рассмотрим составляющие шумов КМОП ФП, образующиеся в процессе накопления
сигнала. Данные составляющие аналогичны компонентам, образующимся при накоплении в
фотодиодах матричных ПЗС со строчным переносом [7]. В литературе принято
составляющие шумов nш характеризовать числом шумовых электронов e, однако в КМОП
ФП с накоплением потенциала логичным будет использование среднеквадратического
отклонения потенциала Uш = q ∙ nш ⁄C , В.
В процессе накопления полезного сигнала неминуемо образуется фотонный шум [2]
nшф = n , где nS – число накопленных фотоэлектронов. Соответственно Uшф =
q ∙ n C Данная компонента шума определяется непосредственно эмиссией фотонов из
источника света и является глобальным ограничением чувствительности всех ФП.
Помимо накопления полезных, фотогенерированных носителей, в фотодиоде
образуются носители, генерированные темновым током полупроводника. Количество
темновых электронов nтт = jтт ∙ A ∙ Tн ⁄q, формируемый ими сигнал темнового тока Uтт =
jтт ∙ A ∙ Tн ⁄C
и соответствующие им шумы nштт = √nтт = jтт ∙ A ∙ Tн ⁄q, Uштт =
jтт ∙ A ∙ Tн ∙ q C
Uштт =
.
С
jтт ∙ Tн ∙ q⁄CУД ∙ A
учетом
выражения
для
емкости
фотодиода
т. е. шумы темнового тока, выраженные в вольтах с
увеличением размера пиксела уменьшаются.
Сброс потенциала фотодиода после каждого цикла накопления приводит к появлению
шума сброса, или так называемого КТС-шума [3]. Среднеквадратическое отклонение шума
6
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
сброса может быть найдено как
СБР
=
∙
∙
, где T – абсолютная температура и K –
. В ФП на основе ПЗС шум сброса эффективно
постоянная Больцмаан, ШСБР =
∙ ⁄
подавляется схемой ДКВ, однако в КМОП ФП технологически сложно реализовать ДКВ и
значительно чаще используется схема двойной выборки при которой из выборки полезного
видеосигнала вычитается значение, получившееся после сброса потенциала фотодиода до
уровня напряжения питания UDD. Это позволяет подавить разброс напряжения смещения
усилительного транзистора в различных пикселах, т. е. уменьшить геометрический шум,
однако приводит к увеличению дисперсии шума сброса в два раза и, соответственно,
среднеквадратического значения шума в √2 раз.
При считывании через усилительный транзистор, включенный по схеме истокового
повторителя вносит две составляющие шумов – фликкер-шум со спектральной плотностью
вида 1/f и тепловой шум канала транзистора. Фликкер-шум эффективно подавляется схемой
ДКВ или же схемой двойной выборки. Тепловые шумы канала транзистора подробно
рассмотрены в [3].
При открывании ключевого транзистора также образуется шум сброса, т. к. при этом
происходит перезаряд емкости видеошины. В числе электронов этот шум сброса nСБРВ =
q или в вольтах UШСБРВ = K ∙ T⁄C
, где CVBUS – емкость вертикальной
K∙T∙C
видеошины.
На основе полученных выражений для полезного видеосигнала и составляющих шумов
может быть получено значение пороговой чувствительности КМОП ФП.
На основе вышесказанного можно сделать вывод о том, что оптимальной стратегией
построения пиксела является использование фотодиода минимальных размеров (емкости) с
микролинзой, максимально собирающей световой поток. Данная стратегия открывает путь к
созданию КМОП ФП с цифровым пикселом, а также с обработкой видеосигнала
непосредственно в пикселе, т. к. в нем образуется достаточно места для размещения АЦП,
схемы двойной коррелированной выборки (ДКВ) и других устройств обработки
видеосигнала.
Библиографический список
1. К. Секен, М. Томпсет. Приборы с переносом заряда/Пер. с англ. под ред. В. В. Поспелова и Р. А. Суриса.
М.: Мир, 1978, 327 c.
2. Твердотельное телевидение/Л. И. Хромов, Н. В. Лебедев, А. К. Цыцулин, А. Н. Куликов. М.: Радио и
связь, 1986. 184 с.
3. Носов Ю. Р., Шилин В. А. Полупроводниковые приборы с зарядовой связью. М.: Сов. Радио, 1976, 144 с.
4. О. С. Вахромеева, А. А. Манцветов, К. А. Шиманская. Характеристики чувствительности телевизионных
камер на матричных приборах с зарядовой связью//Известия вузов России. Радиоэлектроника. 2004. Вып. 4.
С. 25-35.
5. www.e2v.com.
6. www.teledynedalsa.com.
7. www.onsemi.com.
Achieving maximum sensitivity television cameras
Mantsetov A. A., Tsytsulin A. K.
Saint Petersburg Electrotechnical University “LETI”, Television subdepartmant, OAO “NIIT”
Consider ways of increasing the sensitivity of the solid-state image sensors television
cameras - methods of increasing the quantum efficiency and noise reduction. The expressions
for the sensitivity active pixel CMOS-sensor are getting. It is shown that the integral sensitivity
CMOS-sensor with the potential accumulation does not depend on the pixel size. Considered
the components of noise CMOS-sensors
Solid-state image sensor, CMOS-sensor, Sensitivity, Solid-state image sensor noises
7
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Баранов П.С.
СПбГЭТУ каф. ТВ
Современные тенденции проектирования
телевизионных камер
Рассмотрены основные тенденции в проектировании телевизионных камер.
Показано, что традиционные способы повышения чувствительности и разрешающей
способности практически достигли своего технологического и теоретического
предела. Приведены примеры построения телекамер на массиве фотоприемников (1х2,
2х2, 4х4) и с фотоприемниками с новыми структурами кодирующих светофильтров.
Ключевые слова: проектирование телекамер, тенденции развития ФП.
Обзор рынка КМОП фотоприемников(ФП), проведенных известным агентством Yole
Développement [1], показал что в течении 2012-2018 рынок будет показывать стабильный
рост в 10-20%. Кроме того, будут активно внедрятся технологии повышающие (рисунок 1)
чувствительность, разрешающую способность –(Back-Side Illumination (BSI), 3-х мерная
структура ФП( 3d-stack), освоения технологического процесса в 65нм и размера пиксела в 0.9
мкм, новые структуры кодирующих светофильтров (CFA). Кроме того ведутся разработки по
внедрению технологий обеспечивающие новое качество для телевизионной камеры – гибкие
материалы, органические материалы чувствительные к свету, мультиспектральные ФП.
Несмотря на это, ФП на основе кремния для телевидения в видимом спектральном
диапазоне, ближнем ИК и УФ, на ближайшие 10 лет останутся доминирующими.
Рисунок 1. Тенденции развития ФП
Спектральные квантовые характеристики для идеального ФП, МПЗС с технологией
BSI от E2V [2], и КМОП-сенсора от SONY [3], представлены на рисунке 2. Из графиков
можно видно, что потенциальной рост квантовой эффективности в видимом диапазоне длин
волн может составить от 15 до 40 %, но не более, в силу физических ограничений. Поиск
новых способов повышения чувствительность является крайне актуальной задачей.
На рисунке 3 представлена зависимость уменьшения размера пиксела от времени [4].
Менее чем за 10 лет размер пиксела для КМОП фотоприемника достиг значений 1.1 мкм, что
близко к технологическому и теоритическому пределу построения телекамер. Кроме того
дифракционный предел не позволяет создать оптическую систему обеспечивающую кружок
рассеяния менее 0.9 мкм при достаточно широком диапазоне относительных отверстий.
8
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Поиск новых способов повышения разрешающей способности является крайне актуальной
задачей.
IMX174
BSI E2V CCD
Ideal
IMX174
Рисунок 2. Спектральная квантовая
эффективность
Рисунок 3. Тенденция уменьшения размера
пиксела
Цветные одноматричные телевизионные камеры для получения информации о
спектральном составе источника света используют монохромные ФП с нанесенной на
поверхность структурой кодирующих светофильтров (СКС). На рисунке 3,а представлен
наиболее распространенная на данный момент СКС (используется более чем в 95 %
телекамер).
Если считать объектив телекамеры идеальным, то первым каскадом обработки
оптического сигнала, который далее преобразуется в видеосигнал ФП, является СКС. Такие
параметры СКС как размер шаблона СКС, расположение мультиплексных компонент в
частотной области, светопропускание фильтров - определяют потенциальное качество
изображения, получаемое одноматричной телекамерой. Экспериментально и теоретически
[5, 6] показано, что СКС Байера уменьшает чувствительность телекамеры в 6 -10 раз, по
сравнению с черно-белой. Разрешающая способность телекамер на ФП со СКС Байера
составляет от 60 до 75% от потенциально возможной, кроме того восстановленное
изображение сильно подвержено цветовым артефактам.
Поиск новых СКС значительно повышающих качество изображения, формируемого
цветными одноматричными телевизионными камерами, является крайне актуальной задачей.
Однако на сегодняшний момент не синтезирована СКС, обеспечивающая одновременное
повышение разрешающей способности и чувствительности по сравнению со СКС Байера, а
также использующая быстрые и эффективные алгоритмы восстановления полноцветного
изображения. Наиболее характерные варианты применяемых альтернативных СКС
представлены на рисунке 3
СКС X-trans (см. рисунок 3,б) от компании Fujifilm [7] позволяет повысить
разрешающую способность на 15-20%, однако алгоритм обработки изображения крайне
ресурсоемкий. При работе с видеопотоками заметность цветовых артефактов существенно
возрастает, а также резко падает разрешающая способность.
СКС Clarity+ (см. рисунок 3,в) от компании Aptina [8] позволяет повысить
чувствительность на 3-5 дБ, однако, разрешающая способность сопоставима со СКС Байера,
однако заметность цветовых артефактов несколько выше.
9
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Одним из главных направлений развития телекамер – является уменьшение размеров
ФП. Трехмерная КМОП технология [2] позволяет разместить секцию цифровой и
аналоговой обработки в глубине полупроводника, при этом размер кристалла будет
ограничен фактически только зоной накопления.
а
б
в
Рисунок 3. Структуры кодирующих светофильтров
В ближайшие несколько лет будут внедряться телевизионные системы, построенные на
массиве ФП [9]. Количество ФП в одно телекамере может лежать в пределах от 2 до 16
(рисунок 3). Активный интерес к данным системам обусловлен тем, что подобные
телевизионные камеры привносят новые функции, которые не были доступны
одноматричным телекамерам. К наиболее очевидным преимуществам телекамер на массиве
ФП можно отнести:
· Возможность составления карты глубины пространства;
· Оценка расстояний до объектов;
· Перефокусирование на выбранный объект уже после захвата изображения;
· Расширение динамического диапазона;
· Увеличения разрешающей способности;
· Увеличение чувствительности;
· Уменьшение стоимости модуля ФП;
· Составление 3D моделей объектов.
а
б
Рисунок 3. Модульная телекамера на основе массива фотоприемников 4х4 и карта глубины пространства
В последнее время появился интерес к созданию компактных одноматричных
телевизионных камер с несколькими спектральным диапазонами (ближний ИК, Ближний
УФ) , кроме видимого. Подобные телекамеры нашил бы применение в автомобилестроении
(противотуманные камеры, камеры ночного видения), домашней медицине (диагностика
слизистых оболочек, анализ сосудов), охранном телевидении, системах контроля качества
продуктов и других областях. Сложность создания подобных телекамер на данный момент
обусловлена недостаточной теоретической базой для синтеза СКС, которые бы обеспечили
качество изображения в видимом диапазоне сопоставимое с существующими
10
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
одноматричными камерами, при этом разрешение в дополнительны спектральных каналах
должно быть не менее 0.7 от разрешения ФП.
Библиографический список
1. Dr. Eric Mounier , Paul Danini, Jean-Luc Jaffard, Status of the CMOS Image Sensor Industry, Yole
Développement 2014.
2. www.e2v.com
3. http://www.sony.net
4. High Performance Silicon Imaging: Fundamentals and Applications of CMOS and CCD Sensors, Edited by
Daniel Durini, Woodhead Publishing, pp -450
5. А.А., Мягкая Н.П., Плохих Д.П., Чекунова И.С. Разрешающая способность цветных одноматричных
телевизионных камер//Вопросы радиоэлектроники. Сер. Техника телевидения. 2008. Вып. 2. С. 38-49.
6. О. С. Вахромеева, А. А. Манцветов, К. А. Шиманская. Характеристики чувствительности
телевизионных камер на матричных приборах с зарядовой связью//Известия вузов России.
Радиоэлектроника. 2004. Вып. 4. С. 25-35.
7. http://fujifilm-x.com/development_story/en/sensor/
8. http://www.aptina.com/Aptina_ClarityPlus_WhitePaper.pdf
9. http://linximaging.com/
Modern trends in the design of television cameras
Baranov P.S
Saint Petersburg Electrotechnical University “LETI”, Television subdepartmant
The main trends in the design of the television cameras are considered. It is shown that
the traditional ways of improving sensitivity and resolution have almost reached their
technological and theoretical limit. We present examples of cameras on the array of
photodetectors (1x2, 2x2, 4x4) and photodetectors with new structures encoding filters.
Design of television cameras, trends in the design photodetectors.
11
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Обухова Н.А., Мотыко А.А., Папаян Г.В., Uk. Kang
СПбГУАП
Korean Electrotechnology Research Institute
Алгоритмы предообработки изображений в
экспертно-консультирующей телевизионной системе
диагностики рака шейки матки.
Предложены алгоритм совмещения изображений, полученных в разных условиях
освещения и существенно отличающихся друг от друга по яркости и цвету и алгоритм
формирования области интереса (region of interest – ROI). Алгоритм формирования ROI
позволяет исключить из рассмотрения ткани, не подлежащие анализу, а также
медицинские инструменты и различные артефакты. Алгоритмы реализованы и
апробированы в экспертно-консультирующей телевизионной системе диагностики рака
шейки матки.
Ключевые слова: предобработка изображений в медицинских системах, совмещение
мультиспектральных изображений, выделение области интереса.
Повышение эффективности медицинских диагностических систем предполагает
разработку систем нового типа, а именно экспертно-консультирующих телевизионных
систем.
Принципиальной особенностью разрабатываемой экспертно-консультирующей
телевизионной системы диагностики рака шейки матки
является использование
информации, полученной как на основе анализа невизуальной информации (результаты
анализов, данные анамнеза и др.), так и на основе анализа изображений. Для проведения
диагностики используют изображения полученные в белом свете, белом поляризованном
свете и в свете флуоресценции при возбуждение с длинами волн 360нм, 390нм, 430нм,
390нм с лазерной подсветкой 635нм.
Эффективность анализа медицинских изображений в значительной мере определяется
их предобработкой.
Предобработка включает:
·
стандартные процедуры повышения качества изображений: гамма-коррекцию,
подавление шумов, цветокоррекцию, увеличение контраста и т.д.
·
специальные процедуры обработки медицинских изображений: совмещение
медицинских снимков, снятых в различных условиях освещения;
автоматическую сегментацию зоны интереса - участка на изображении, для
которого целесообразно проводить дальнейший анализ; удаление бликов на
изображениях.
Изображения, полученные в белом свете и в свете флуоресценции имеют друг
относительно друга значительные смещения, обусловленные методикой их получения. Это
делает невозможным многопризнаковый анализ по всей совокупности изображений, так как
изображения одних и тех же особенностей имеют различные координаты от снимка к
снимку.
12
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Для совмещения изображений
корреляции [1]:
предложен алгоритм, основанный на фазовой
·
исходные изображения представляют в полутоновом формате;
·
изображения обрабатывают
высокочастотного шума;
·
изображения бинаризируют, применяя адаптивный порог значение которого в
точке (x,y) вычисляют как свертку сигнала изображения в окрестности точки
(x,y) с Гауссовой функцией.
·
для каждого изображения вычисляют взаимный спектр мощности с опорным
изображением, смещение которого принимают нулевым:
R=
медианным
Ga o Gb
G aG b
фильтром
для
подавления
*
*
,
где Ga - результат преобразования Фурье для обрабатываемого изображения,
Gb - результат преобразования Фурье для опорного изображения, ° произведение Адамара двух матриц.
·
с помощью обратного преобразования Фурье вычисляют взаимную
корреляционную функцию изображений r(x,y) и находят ее максимум, который
определяет пространственные смещения:
r ( x, y ) = F -1 {R},
Dx, Dy = max(r ( x, y ))
x, y
.
Основными преимуществами предложенного подхода по сравнению с алгоритмами,
работающими в сигнальной плоскости, является возможность совмещения изображений
существенно отличающихся друг от друга по яркости и цвету, а также устойчивость к
шумам, окклюзии и подобным негативным факторам, характерным для медицинских
изображений.
На рисунке 1 приведен результат работы алгоритма: слева представлены исходные
изображения, полученные в различных режимах, справа – изображения после вычисления и
компенсации сдвигов.
На реальном медицинском изображении изображение шейки матки занимает всего
около 70% снимка. Остальная часть может содержать другие ткани, медицинские
инструменты, различные артефакты. Наличие нерелевантной информации затрудняет
дальнейшую обработку и анализ данных, поэтому необходимо выделить только практически
значимую область изображения – область интереса.
Для автоматической сегментации области интереса предложен следующий алгоритм:
·
изображение обрабатывают гауссовым фильтром Gσ с небольшим параметром
размытия σ для подавления шума:
L2 ( x, y ) = L1 ( x, y ) * G s
,
13
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
1
Gs =
e
2p s 2
(x
2
+ y2
)
2s 2
,
где * - знак свертки, L2(x,y) - яркость пикселя обработанного изображения,
L1(x,y) - яркость пикселя исходного изображения.
·
выполняют конвертацию изображения в цветовое пространство Lab и выделяют
слои с координатой a [2];
·
осуществляют кластеризацию методом К-средних с целью разделения
изображения на области по цветовому признаку;
·
проводят морфологическую фильтрацию (операцию закрытия) для сглаживания
границ выделенных областей:
A · B = (A + B ) - B ,
где A – битовая матрица бинарного изображения, B – матрица структурного
элемента, «+» морфологическая операция наращивания, «-» морфологическая
операция эрозии.
·
выбирают наибольшую область, принадлежащую к целевому классу, то есть
определяют искомую область интереса на изображении.
Рис. 1. Результат работы алгоритма компенсации смещений
На рисунке 2 показаны результаты основных шагов работы алгоритма.
Проверка алгоритмов реализована на 167 сериях изображений, полученных при
клинических испытаниях разрабатываемой системы. Серия – это набор изображений,
полученных от одного пациента в различных условиях освещения.
Проведенные
эксперименты показали область интереса выделена корректно для 95% изображений, задача
совмещения изображений решена корректно для 93% изображений.
14
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Шаг 1
Шаг 4
Шаг 2
Шаг 5
Шаг 3
Шаг 6
Рис. 2. Результаты основных шагов алгоритма поиска зоны интереса.
Библиографический список
1. Harold S. Stone, "A Fast Direct Fourier-Based Algorithm for Subpixel Registration of
Images", IEEE Transactions on Geoscience and Remote Sensing, V. 39, No. 10, Oct. 2001,
pp.2235-2242.
2. Das A, Kar A, Bhattacharyya D,"Elimination of Specular reflection and Identification of
ROI: The First Step in Automated Detection of Uterine Cervical Cancer using Digital
Colposcopy" IEEE Imaging Systems & Techniques Penang, Malaysia, pp 237-141, 2011.
The algorithms of images preprocessing in expert television system for cervical cancer
diagnosis.
N. Obukhova, А. Motyko
Saint-Petersburg State University of Aerospace Instruments.
The algorithm of image shift compensation for images obtained in different lighting
conditions, algorithm of region of interest (ROI) segmentation are proposed. The algorithm
for ROI segmentation allows to exclude tissue, not subject to analysis , medical instruments
and various artifacts . The algorithms implemented and tested in the expert television system
for cervical cancer diagnosis.
Keywords: image preprocessing in medical systems , the multispectral images shift compensation , the region
of interest segmentation.
15
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Тимофеев Б.С., Мотыко А.А.
Санкт-Петербургский государственный университет аэрокосмического
приборостроения.
Перспективы развития видеосистем мониторинга
дорожной обстановки
Проведен обзор возможностей современных систем транспортного мониторинга.
Проанализированы основные недостатки. Предложены пути совершенствования
комплексов транспортного мониторинга, приведены перспективные алгоритмы
обработки видеоданных для видеосистем наблюдения за дорожной обстановкой. Даны
результаты экспериментального исследования алгоритмов.
Ключевые слова: видеосистемы транспортного мониторинга, цифровая обработка изображений,
панорамные видеосистемы, видео измеритель скорости, определение автомобильных номеров.
Телевизионные системы транспортного мониторинга используют для наблюдения за
магистралями, фиксации нарушений ПДД, сбора данных о параметрах потока. Анализ
современных систем транспортного мониторинга позволяет сделать следующие выводы.
Системы решают частные задачи (определение скорости, запись видео, идентификация
номеров) в зависимости от технической оснащенности.
Практически не существует систем, способных оценивать основные параметры
транспортного потока (скорость, плотность) с помощью анализа видеоданных, без
применения дополнительной аппаратуры (радаров, лазерных дальномеров). Это делает
систему сложной в эксплуатации, допускает разрыв между результатами измерения скорости
и зафиксированным автомобилем.
Системы видеонаблюдения, состоящие из ряда камер, не создают целостной картины
окружающего пространства, что затрудняет восприятие и анализ оперативной обстановки на
дороге.
Можно сформулировать основные требования к перспективным видеосистемам
транспортного мониторинга нового поколения.
Многокамерная система должна формировать видеоданные в форме удобной для
восприятия мегапиксельной панорамы с широким углом обзора и высоким разрешением,
превосходящим широкоугольные камеры HD формата.
Подсчет и измерение скоростей автомобилей (определение параметров потока) должно
быть реализовано исходя из анализа видеоряда. Преимущество панорамной системы одновременное сопровождение всех объектов в зоне контроля с привязкой скорости к
конкретному автомобилю.
Для идентификации транспортных средств должен быть реализован алгоритм
автоматического распознавания номеров всех автомобилей в поле зрения системы.
Схема алгоритма синтеза панорамы для видеосистемы [1] приведена на рисунке 1.
Отличительной особенностью алгоритма является его адаптация к условиям
низкодетальных сюжетов, содержащих большие участки дорожного полотна и малое число
характерных точек. Разработанный алгоритм основан на двухкритериальной оценке
параметров уравнений трансформации. Наряду с классическим для данной процедуры
16
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
учетом общего числа характерных точек N, соответствующих гипотезе, принимается во
внимание средняя достоверность точек D:
1
N
D = åi =1 d i ,
N
где достоверность каждой точки di определяют с помощью итеративного алгоритма,
основанного на так называемой мере поддержки [2].
Рис. 1. Схема алгоритма синтеза панорамы.
Разработанный алгоритм [3] определения скорости основан на анализе видеоряда, а
именно данных о траектории и об относительном увеличении проекции транспортного
средства на плоскости кадра по мере его приближения:
æ Dx × (L1 / k - f ) × h ö æ Dy m × (L1 / k - f ) × h ö æ (k - 1) × L1 ö
÷÷ + çç
÷÷ + ç
v = v + v + v = çç m
÷ ,
f × Dt
f × Dt
è
ø è
ø è Dt × k ø
2
2
X
2
Y
2
2
2
Z
где Dxm, Dym - смещения проекции транспортного средства в плоскости растра, L1- дистанция
начала сопровождения, f - фокусное расстояние, Dt - интервал сопровождения, k 17
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
коэффициент увеличения площади проекции. Это позволяет оценить реальную скорость
движения автомобиля без использования дополнительной аппаратуры. При реализации
алгоритма измерения не требуется трудоемкая калибровка камеры, а использование
накопления данных по времени и пространству путем учета изменения размера всей
площади изображения автомобиля на интервале сопровождения позволяет повысить
точность измерения по сравнению с известными методами. Схема приведена на рисунке 2.
Рис. 2. Схема алгоритма определения скорости.
Для идентификации номеров транспортных средств синтезирован алгоритм [4] на основе методов
контурного анализа и морфологической фильтрации. Первым шагом является выделение на изображении
вертикальных линий с помощью фильтра (Рис. 3):
Рис. 3. Иллюстрация работы алгоритма сегментации номеров.
é- 1 2 - 1ù
FV = êê- 1 2 - 1úú.
êë- 1 2 - 1úû
Далее с помощью морфологической операции "наращивания" получают препарат, где
заполнены промежутки между вертикальными линиями. Номерные пластины сегментируют
посредством анализа формы замкнутых областей, которые затем подвергают контурному
анализу для выделения символов. Распознавания символов осуществляют с помощью
стандартных библиотек.
Экспериментальные исследования алгоритмов дали следующие результаты.
18
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
·
·
Для 97% автомобилей абсолютная максимальная ошибка определения скорости
не превышает 3 км/ч, среднее значение ошибки - 1.49 км/час
Для 85% автомобилей были корректно распознаны регистрационные номера.
Библиографический список
1. Тимофеев
Б.С.,
Мотыко
А.А.
Формирование
панорамного
представления
видеоизображений,
получаемых от нескольких камер.// Сб. док. 7-й международной
конференции
«Телевидение: передача и обработка изображений»,29-30 июня 2009г,
СПб, ЛЭТИ, сс.180-185
2. Alkaabi, S. and Deravi, F. "Iterative Corner Extraction and Matching for Mosaic Construction". In
Proceedings of CRV. 2005, pp.468-475.
3. Тимофеев Б.С., Мотыко А.А. Измерение скоростей автомобилей путем анализа видео
последовательности// Информационно-управляющие системы, № 1, СПб,2012 г.,сс.2-7
4. Тимофеев Б.С., Мотыко А.А. Алгоритмы сегментации планки номерного знака// Сборник докладов
Научной сессии ГУАП, апрель, 2014г., СПб, 2014г.
Prospects for the development of video system for road traffic monitoring.
B.S. Timofeev, А.A. Motyko
Saint-Petersburg State University of Aerospace Instrumentation.
The paper describes the review of modern video systems for road monitoring. The main
disadvantages are analyzed. The ways of improving are shown and there are described useful
algorithms of digital image processing. The results of carried out experiments are given.
Keywords: image processing, video systems for road traffic monitoring, license plate recognition, panoramic
video systems.
19
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Секция 1. Формирование видеосигналов.
Твердотельные фотоприемники
Руководители секции –д.т.н., проф. А. К. Цыцулин (ОАО "НИИТ")
Зам. Руководителя – к.т.н. доц. А.А. Манцветов (СПбГЭТУ «ЛЭТИ»)
Секретарь секции – инженер каф. ТВ Е.Ю. Пучка
СПбГЭТУ «ЛЭТИ», 2-й корп., пом. 2311
Л.Д. Ложкин
Поволжский государственный университет телекоммуникаций и
информатики
Колориметрически точное цветовоспроизведения в
телевидении
Показано, что цвета, координаты цветности которых находятся внутри
треугольника цветового охвата экрана телевизионного возможно воспроизвести
колориметрически точно, т.е. без цветовых искажений. Предложен способ реализации
телевизионной системы с колориметрически точным воспроизведением цветности
изображения.
Координаты цвета и цветности, порог Мак Адама, цветовые искажения, телевизионная система.
Профессор Н.Д. Нюберг предложил в 1948 г. использовать три понятия точности
воспроизведения цвета [1].
Роберт Хант дал академическое определение шести возможных уровней
цветовоспроизведения [2]:
1. Спектральное цветовоспроизведение;
2. Колориметрическое цветовоспроизведение;
3. Точное цветовоспроизведение;
4. Эквивалентное цветовоспроизведение;
5. Согласованное цветовоспроизведение;
6. Выделенное цветовоспроизведение.
Из шести определений, сформулированных Р. Хантом, остановимся на втором, а
именно «Колориметрическое цветовоспроизведение».
Колориметрическое
цветовоспроизведение
(colorimetric
color
reproduction)
определяется метомерным соответствием репродукции оригинальному изображению, при
котором оба имеют одинаковые CIE-трехстимульные значения. Итогом, является
воспроизведение по восприятию, но только в тех случаях, когда оригинал и его репродукция
имеют одинаковый размер, окружение и рассматриваются при свете источников с
одинаковыми спектральным распределением энергии и фотометрической яркостью. Однако,
автор [3] не считает равенство яркости обязательным требованием колориметрического
цветовоспроизведения.
В существующей телевизионной системе, телевизионная трехцветная камера
формирует три видеосигнала, которые некоторым образом кодируются и передаются на
телевизионный приемник. Но, по сути, сама телевизионная камера является прибором для
20
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
измерения цвета (колориметром) параллельного действия. Поэтому, можно считать
видеосигналы видеокамеры, пропорциональны координатам цвета. Тогда необходимые
значения видеосигнала можно определить из матричного уравнения, а именно:
=
=
=
∙
( +
( +
+ ),
.
(1)
(2)
+ ).
Из (1) следует, что для воспроизведения цвета с координатами Χ, Υ, Ζ необходимы
видеосигналы
,
и
, а значит и координаты цветности в соответствии с (2). При
расчете величин видеосигналов
,
,
для передаваемых цветов, цветности которых
находятся за пределами цветового охвата экрана телевизионного приемника, будет иметь
место отрицательное значение величин видеосигнала, и что бы избежать этого, необходимо
приравнять отрицательные значению нулю. На рис. 1 показаны цветовые искажения при
использовании идеальной цветной трехцветной камеры, а в телевизионном приемнике в
качестве экрана применена тот же кинескоп стандарта ЕС. Обозначение на этом рисунке
тоже, что и на рис. 2.
Рис. 1. Цветовые искажения в телевизионной системе, полученные путем передачи сигналов цвета и
воспроизведенные на экране, имеющий прибор с использованием люминофоров (кинескоп стандарт EC)
21
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Как видно из рис. 1, цветности, находящиеся в внутри цветового треугольника
основных цветов экрана телевизионного приемника, оригинала изображения совпадают с
воспроизводимым изображением на экране телевизионного приемника. Остальные
координаты воспроизводимых цветов (за пределами треугольника цветового охвата)
находятся на наиболее кратчайшем расстоянии от стороны треугольника основных цветов
экрана телевизионного приемника.
На рис. 2 показана добавляемая схема. Рассмотрим эту схему. Принятый сигнал с
телецентра поступает на первый вход вычислительного устройства (1), на второй вход этого
устройства поступают из постоянного запоминающего устройства (2) девять величин
обратной матрицы, приведенной в выражении (5). Значения этих коэффициентов
определяется единожды, и зависят от типа экрана телевизионного приемника, а еще лучше
однажды измеренные координаты цветности основных цветов для конкретного
телевизионного экрана и расчета коэффициентов обратной матрицы. В вычислительном
устройстве происходит вычисления величин видеосигналов
,
,
для
воспроизведения на экране цвета с координатами X, Y, Z. В вычислительном устройстве (1)
должна быть использована простая логика, а именно, если значение любого вычисленного
значения
,
,
меньше 0, то его значение приравнивается 0.
Рис. 2. Добавляемый узел в телевизионный приемник
Известно, что практическая реализация двухгорбной кривой спектральной
чувствительности, затруднена, и на практике гораздо легшее реализовать одногорбую
кривую спектральной характеристики чувствительности, например с кривой, предложенной
Д. А. Шкловером, или одногорбую кривую красного канала в этом случае будем иметь
искаженные координаты цвета на определенную величину. Обычно измерение координат
цветности с помощью классического колориметра параллельного действия (в нашем случае
мы предложили считать трехцветную телевизионную камеру именно таким прибором)
производится с точностью ∓ 0.01 ÷ 0.05, что составляет от 1.75 до 8.7 порогов Мак Адама.
Не обходимо, так же учесть, что согласно [4, 5] допустимые отклонения координат
цветности основных цветов составляют ∓ 0.01, что также приводит к дополнительным
цветовым искажениям порядка 2 порогов Мак Адама.
Таким образом, показано, что практически можно значительно уменьшить цветовые
искажение в телевидении, при этом упрощается схема камерного канала телецентра, но
повышаются требования к спектральным характеристикам чувствительности самой
трехцветной телевизионной камеры. Также должны быть повышены требования на
уменьшение разброса координат цветности однотипных телевизионных экранов при их
22
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
массовом изготовлении, либо их измерении с точностью рекомендованных ГОСТом. При
этом незначительно усложняется схема самого телевизионного приемника.
Библиографический список
1. Хант Р.И.Г. Цветовоспроизведение. 6 – издание. Перевод Шадрин А.Е. Санкт-Петербург, 2009, с. 888.
2. Измайлов Ч. А. Сферическая модель цветоразличения. М.: МГУ, 1980. — 171 с.
3. ГОСТ 19432 – 76. Телевидение цветное. Основные параметры системы цветного телевидения.// М.,
Госстандарт. -1976.
4. Ложкин, Л.Д. Дифференциальная колориметрия (Монография) Л.Д. Ложкин. – Самара: ИУНЛ ПГУТИ,
2010. – 320 с.
Colorimetrically accurate color reproduction in TV
L.D. LOZHKIN
Volga State University of Telecommunications and Informatics
It is shown that color chromaticity coordinates of which are inside the triangle gamut
screen television may play a colorimetric exactly, ie without color distortion. Provides a
method for implementing a television system with colorimetrically accurate color reproduction
of images.
Color coordinates and chrominance threshold Mac Adam, color distortion, television.
23
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Сизиков В.С., Экземпляров Р.А.
СПб Университет ИТМО, СПб ГПУ ИМОП
Оценка параметров функции рассеяния точки
по спектру искаженного изображения
Предложен новый способ оценки параметров функции рассеяния точки по спектру
искаженного изображения. В случае смазывания изображения его спектр сжимается в
направлении смаза, что дает возможность оценить направление и величину смаза D. В
случае дефокусирования спектр также деформируется пропорционально радиусу
дефокусирования r и это позволяет оценить r. Приведены численные примеры.
Ключевые слова: искажения (смаз, дефокусирование) изображения, параметры искажения,
спектр изображения
Задача
восстановления
изображения,
подвергнутого
смазыванию
или
дефокусированию, весьма чувствительна к точности знания параметров искажения – к
величине D и углу q смаза в случае смазывания или к радиусу дефокусирования r в случае
дефокусирования изображения. На рис. 1 приведено в качестве примера смазанное
изображение, а также его восстановление (в отсутствие шумов) путем решения
интегрального уравнения Фредгольма I рода методом параметрической фильтрации Винера
с использованием m-функций системы MatLab fspecial, imfilter, deconvwnr [1–3]. Если
параметры смазывания q и D заданы правильно, то восстановление получается вполне
удовлетворительным (рис. 1б), а если параметры заданы с погрешностями (даже
небольшими), то восстановление получается неудовлетворительным (рис. 1в).
Рис. 1. Изображение cameraman.tif 256 ´ 256 : смазанное под углом
q = 65o , величина смаза D = 50 пкс
q = 65o и D = 50 (б) и при q = 67 o , D = 52 (в)
Поэтому актуальной является задача повышения точности оценки параметров
искажения изображения. Известны следующие способы такой оценки: по штрихам на
изображении (рис. 1а) в случае смазывания [1, 4], по размытию точек (например, звезд) на
изображении в случае дефокусирования [1, 2, 4], по калибрующему изображению [5] и др.
В данной работе предлагается новый способ оценки параметров функции рассеяния
точки (ФРТ), или аппаратной функции – по двумерному спектру искаженного изображения.
(а); восстановленное при
24
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Пусть ось x (и x) направлена вдоль смаза. Тогда 2-мерное преобразование Фурье (ПФ), или
спектр изображения g ( x, y ) равно
¥ ¥
G ( w1 , w2 ) =
ò ò g ( x, y ) ei (w1 x + w2 y ) dx dy ,
(1)
-¥ -¥
где при наличии смаза ( D x ¹ 0 ) g ( x, y ) = (1 D x ) ò
Dx
x
w (x, y ) dx , а в отсутствие смаза( D x = 0 )
g ( x, y ) = w ( x, y ) . Здесь g и w – интенсивности на смазанном и на неискаженном
изображениях соответственно. Запишем (1) в виде набора 1-мерных интегралов:
¥
G ( w1 , w2 ) =
é¥
ù
ò êê ò g ( x, y ) eiw1 x dx úú eiw2 y dy
- ¥ ë- ¥
û
(2)
или
¥
é¥
ù
(3)
ò êê ò g ( x, y ) eiw2 y dy úú eiw1 x dx .
- ¥ ë- ¥
û
Записи (2) и (3) можно трактовать как вычисление 2-мерного ПФ через набор 1-мерных
ПФ. При этом запись (2) соответствует случаю, когда при каждом значении y вычисляется 1мерное ПФ (внутренний интеграл в (2))
G ( w1 , w2 ) =
)
g y ( w1 ) =
¥
ò g ( x, y ) eiw1 x dx
(4)
-¥
вдоль x (вдоль смаза). При этом при вычислении ПФ через ДПФ максимальная частота
дискретизации w1 max = 2p D x
(по аналогии с частотой Котельникова–Найквиста). В
результате смазывания изображения вдоль x происходит сжатие 2-мерного спектра
G ( w1 , w2 ) вдоль w1 (уменьшение w1 max ), причем тем большее, чем больше смаз D x . Это
связано с тем, что при смазывании подавляются высокие частóты Фурье.
А запись (3) соответствует случаю, когда при каждом x вычисляется 1-мерное ПФ
)
g x ( w2 ) =
¥
ò g ( x, y ) eiw2 y dy
(5)
-¥
вдоль y (перпендикулярно смазу). При этом сжатие спектра G ( w1 , w2 ) вдоль w2
практически не происходит, а именно, w2 max = 2p h y , причем D y = 0 , а h y – шаг
дискретизации по y, равный 1 пкс.
На рис. 2 представлены спектры (2-мерные ПФ) неискаженного и смазанного
изображений в виде Re G ( w1 , w2 ) (близкий, но более контрастный результат дает
амплитудно-частотная характеристика | G ( w1 , w2 ) | ). При этом нулевые частóты w1 = w2 = 0
обычно располагаются на краю спектрограммы. Чтобы этого избежать, была выполнена
перегруппировка элементов спектра с помощью m-функции fftshift [6], в результате частóты
w1 = w2 = 0 (т.е. начало координат) расположились в центре спектрограммы (рис. 2).
25
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
В результате смазывания изображения изменился его спектр, а именно, в направлении
смаза произошло сжатие спектра (уменьшилась w1 max , что особенно четко видно вдоль
пунктира–смаза на рис. 2б), а в направлении, перпендикулярном смазу, спектр не испытал
сжатия (рис. 2 б, в). При этом с ростом величины смаза D x эффект сжатия спектра
усиливается. По спектру можно оценить угол q, величину w1 max (идя вдоль пунктира на рис.
2б,в от центра до «почернения» спектрограммы) и величину смаза: D x = 2p w1 max .
Рис. 2. 2-мерное ПФ изображения cameraman.tif. а – ПФ неискаженного изображения; б – ПФ смазанного
изображения,
q = 65o , D x = 10 пкс ; в – ПФ смазанного изображения, q = 65o , D x = 50 пкс (пунктир –
направление смаза и осей x и w1)
Эффект сжатия спектра проявляется также для дефокусированных изображений,
причем во всех радиальных направлениях (рис. 3).
Рис. 3. 2-мерное ПФ изображения cameraman.tif.а – ПФ неискаженного изображения; б –
ПФ дефокусированного изображения (ФРТ – однородный диск радиуса r = 5 пкс ); в – ПФ
дефокусированного изображения, r = 20 пкс
Таким образом, используя спектр искаженного (смазанного или дефокусированного)
изображения, можно оценить параметры его искажения (угол q и длину D смаза или радиус r
дефокусирования), т.е. оценить функцию рассеяния точки (ФРТ, PSF), или аппаратную
функцию (АФ). Построена модель и программно реализован алгоритм поиска по спектру
26
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
искаженного изображения направления и длины смаза для случая прямолинейного
равномерного смазывания, а также радиуса дефокусирования для случая однородной
круговой ФРТ.
Работа выполнена при поддержке РФФИ (грант № 13-08-00442).
Литература
1. Сизиков В.С. Обратные прикладные задачи и MatLab. – СПб.: Лань, 2011. 256 с.
2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. – М.: Техносфера, 2006. 1072 с.
3. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. – М.: Техносфера,
2006. 616 с.
4. Сизиков В.С., Экземпляров Р.А. Последовательность операций при фильтрации шумов на искаженных
изображениях // Оптич. журнал. 2013. Т. 80, № 1. С. 39–48.
5. Остриков В.Н., Плахотников О.В. Идентификация функции рассеяния точки канала наблюдения по
калибрующему изображению посредством метода наименьших квадратов // Оптич. журнал. 2006. Т. 73, № 2.
С. 26–30.
6. Дьяконов В., Абраменкова И. MATLAB. Обработка сигналов и изображений. Спец. справочник. – СПб.:
Питер, 2002. 608 с.
Sizikov V.S., Ékzemplyarov R.A.
Estimating parameters of the point spread function by spectrum of distorted image.
St. Petersburg University ITMO, St. Petersburg State Polytechnic University
Annotation. A new way for estimating parameters of the point spread function (PSF)
using spectrum of distorted image is proposed. In the case of image smearing, its spectrum
contracts in the direction of smear, which gives a possibility to estimate the direction and
quantity of smear D. In the case of defocusing, a spectrum is also deformed proportionally to
defocusing radius r and this makes possible to estimate r. Numerical examples are given.
Keywords: distortions (smearing, defocusing) of image, parameters of distortion, spectrum of image.
27
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
И.И.Сальников
Пензенский государственный технологический университет
Методы удаления бинарных изображений
локальных областей по заданным размерным
условиям
В работе представлен сравнительный анализ методов размерной селекции для
бинарных изображений. Рассмотрены метод медианной фильтрации, методы на
основе одноэтапной и двухэтапной сегментации, а также метод следящего анализа.
Бинарное преобразование сопровождается помехами, которые формируются при
бинаризации ложных изображений, имеющих яркость выше порогового уровня. При этом
большую роль играет значение порогового кода, который должен быть сформирован исходя
из статистических свойств изображения полезного объекта и окружающего фона. В работе
[1] проанализированы различные способы формирования порогового уровня. Бинарные
изображения, ограниченные пространственной связностью пикселей, представляют собой
локальные области (ЛО). Далее, после бинаризации широко используется размерная
селекция, задача которой – удалить ЛО с размерами меньше или больше определенных.
1. Метод удаления ЛО с использованием медианной фильтрации основан на
ранжировании по яркости пикселей в пределах заданного окна анализа DАН и присвоении
текущему элементу значения яркости S(k) (i,j), равного среднему (медиане) из результата
ранжирования. Удаляются локальные области (ЛО), для которых размеры:
1
DX £ ( DАН + 1) .
2
(1)
Алгоритм чрезвычайно прост в реализации, но обладает рядом недостатков. На рис. 1.
представлен результат медианной фильтрации при размере анализа DАН = 15, из которого
следует, что элементы с размерами Dx ≤ 8 на рис.1,б удаляются полностью.
а)
б)
Рис. 1. Медианная фильтрация: исходное бинарное изображение (а),
результат фильтрации с размером окна анализа DАН =15, (б)
Для изображений ЛО с Dx > 8 наблюдаются искажения (рис.1,б):
– “откусывание частей” для ЛО, имеющих углы, ориентированные в ортогональном
развертке направлении;
– “прилипание” малой ЛО к большой, что наблюдается при наличие разрыва между
ними размером меньшим 0,5 DАН ;
28
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
– смещение результата фильтрации влево на 0,5 DАН .
2. Метод удаления ЛО на основе одноэтапной сегментации.
Особенностью алгоритма сегментации [1] является растровый принцип поэлементного
анализа, при котором в пределах исходного растра (ИР) последовательно формируется 5-ти
связанный формат и выполняется разметка ЛО, когда каждой ЛО присваивается свой номер.
Под сегментацией подразумевается разделение пространственно-связанных ЛО и
измерение пространственных параметров – координат геометрических границ ЛО,
габаритных размеров ЛО, а также координат центра тяжести ЛО. Особенностью
разработанного в [1] алгоритма является ориентация на параметры телевизионного
изображения, когда анализ выполняется построчно за время формирования кадра в
соответствие с временным видеосигналом. При этом результат формируется одновременно с
формированием ТВ-кадра, чем достигается высокое быстродействие устройства. В данной
работе приводятся результаты программной реализации алгоритма сегментации бинарных
изображений, ориентированной на возможность размерной селекции ЛО, необходимость в
которой возникает при бинаризации реальных изображений, получаемых цифровой
фотокамерой.
Программная реализация выполнена в среде визуального программирования
C++Builder в виде модуля, входящего в программное обеспечение (ПО) растрового анализа
и преобразования изображения и данных “РАПИД”. В результате работы программного
модуля <Растровая разметка> исходное бинарное изображение (БИ) разделяется на ЛО,
характеризующиеся пространственной связностью. Анализ выполняется построчно и
поэлементно аналогично телевизионному растру (рис.2,а). В алгоритме сегментации
используется 5-ти элементный формат связности, полнота и достаточность которого
доказана в [1]. При этом исходное бинарное изображение представляет собой массив
бинарных пикселей Si,j , где i – номер элемента по оси 0x, а j – по оси 0y исходного растра.
0
х
a
b
d
e
c
y
а)
б)
Рис. 2. Исходный растр (а) и 5-элементный формат связности (б)
Тогда 5-ти
элементный формат
анализа связности представляется в виде
примыкающих к текущему элементу Si,j элемента Si–1,j для текущей j–строки и элементов Si–
1,j–1, Si,j–1, Si+1,j–1 для предыдущей (j–1)-строки. При этом текущий элемент растра Si,j = e и
примыкающие к нему элементы растра Si–1,j–1= a, Si,j–1= b, Si+1,j–1 = c, Si–1,j = d. При
выполнении разметки элементам БИ присваиваются номера – Na, Nb, Nc, Nd. Позиционное
29
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
положение элементов растра abcde включается в формат кода варианта связности КВС в
виде:
KВС = a × 23 + b × 22 + c × 21 + d × 20 , где a,b,c,d,е Î{ 0;1 }.
(1)
На основании анализа всех вариантов связности используется общее выражение для
функции назначения номера текущего элемента:
N e = e[ F ( n ,0 ) N n + F ( n ,3 Ú 11) min{ N c , N d } + F ( n ,10 ) min{ N c , N a } +
+ F (n,1 Ú 5 Ú 7 Ú 9 Ú 13 Ú 15) N d + F (n,2) N c + F (n,4 Ú 6 Ú 12 Ú 14) N b + F (n,8) N a ] , (2)
при n = K ВС – фильтрующая функция,
где n – текущее значение КВС, F ( n, K ) = ì1,
í
ВС
при n ¹ K ВС
î0,
выделяющая различные варианты КВС.
Для каждой ЛО формируются текущие координаты геометрических границ, которые
сохраняются в специальных массивах. Если ЛО с номером Ne закончилась на строке y = n,
для этой ЛО выводятся координаты геометрических границ {XЛ; XП; YВ; YН} ∈ Ne . Также
выводятся координаты {XSAi; YH} последней точки данной ЛО (рис.3).
Номер закончившейся ЛО записывается в стек окончившихся номеров на обратном
ходе (ОХС) для строки y = n+1, когда определяется, что на прямом ходе (ПХС) на строке y =
n+1 номер ЛО не использовался для разметки (на рис. 3 – Ne = 7). Если на ПХС на
следующей строке y = n+2 появляется новая ЛО, то для ее разметки используется номер
(Ne=7), извлеченный из стека окончившихся номеров. Использование стека для
закончившихся номеров позволяет избежать переполнения используемых номеров, но
измеренные пространственные параметры ЛО существуют для конкретной ЛО только на
интервале ОХС после окончания ЛО с данным номером.
YВ
y=1
……
y=j
……
XЛ
ЛО
Ne=7
XП
y=n
y = n+1
y = n+2
Ne=7
YН
{XSAi;YH}
Рис. 3. Сегментация и формирование координат геометрических размеров ЛО
В этой связи дальнейшие действия по отношению к размеченной ЛО должны быть
выполнены сразу же по окончании ЛО, не дожидаясь окончания анализа всего исходного
растра. При этом определяются: координаты геометрических границ ЛО; координаты
геометрического центра ЛО; координаты центра тяжести ЛО; площадь ЛО; размеры ЛО для
размерной селекции ЛО и другие пространственные параметры.
В этот момент в данном методе общая разметка в пределах ИР приостанавливается и
выполняется алгоритм удаления ЛО: – определяется условие удаления;
30
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
U min = 1, если( DX & DY ) £ Dmax – для удаления ЛО с меньшими размерами;
U max = 1, если( DX & DY ) ³ Dmin – для удаления ЛО с большими размерами;
(3);
– выполняется анализ в пределах растра геометрических границ (РГГ);
– последовательно для каждого пикселя S BI (i, j ) = 1 выполняется стирание.
На рис.4, б представлен результат удаления ЛО с размерами Dmin = 50 пикс. Большая
ЛО-1 удаляется (серый цвет), но при этом наблюдаются ошибки удаления – пропадание ЛО2 с размерами меньшими Dmin = 50 пикс. и “откусывание” части ЛО-3, разметка которой еще
не закончилась. Данные недостатки не позволяют широко использовать данный метод.
а)
б)
в)
г)
Рис. 4. Удаление ЛО: исходное БИ (а); ошибки при одноэтапной сегментации (б); при
двухэтапной сегментации для ЛО с размерами больше Dmin = 50 (в); при двухэтапной
сегментации для ЛО с размерами меньше Dmax = 20 (г)
3. Метод удаления ЛО на основе двухэтапной сегментации. На рис. 4,в,г показан
результат работы алгоритма, основанного на методе удаления ЛО при двухэтапной
сегментации в пределах РГГ. Видно, что недостатки одноэтапного метода устранены.
Удаление ЛО как с большими заданных размеров (рис.4,в), так и с меньшими заданных
размеров (рис.4,г) выполняется нормально. Данный метод заключается в следующем.
1. Выполняется сегментация всего БИ в пределах исходного растра ИР в направлении
«вправо-вниз».
2. Как только появляется признак, что закончилась разметка ЛО с данным номером,
то формируется условие удаления и выполняется 2-х этапная сегментация БИ в пределах
РГГ.
3. Выполняется 1-й этап сегментации в пределах РГГ и в направлении «влево-вверх».
4. При выполнении сегментации 1-го этапа просматриваются все пиксели и выносятся
решения:
– пиксель принадлежит полезной ЛО, которая должна быть удалена;
– пиксель принадлежит ЛО, которая не должна быть удалена;
– пиксель принадлежит части ЛО с другим номером, которая сливается с основной
частью и которая должна быть удалена.
5. В специальной памяти стекового типа запоминаются все характерные моменты в
пределах РГГ, то есть формируется «история» разметки ЛО.
31
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
6. Выполняется 2-й этап сегментации в пределах РГГ и также в направлении «влевовверх».
7. Удаляются пиксели: – принадлежащие основной ЛО, которая всегда будет иметь NЛО
= 1, так как с этого номера начиналась разметка ЛО в пределах РГГ;
– принадлежащие части ЛО, вначале размечаемой с NЛО ≠ 1, а затем после слияния,
также принимающие номер NЛО = 1.
8. Оставляются пиксели: принадлежащие другой ЛО, имеющей NЛО ≠ 1 (рис. 4,а ЛО2); принадлежащие ЛО, которая еще не закончилась, и которая частично входит в РГГ (рис.
4,а ЛО-3).
На рис. 4, в представлен результат удаления ЛО-1 при условии удаления ЛО с
большими, чем Dmin = 50, размерами. ЛО-2 и ЛО-3 остались без искажений. На рис. 4, г
представлен результат удаления ЛО-2 при условии удаления ЛО с меньшими, чем Dmax = 20,
размерами. ЛО-1 и ЛО-3 остались без искажений.
4. Метод удаления ЛО на основе следящего анализа. Основан на определении
направления анализа в каждом текущем пикселе. На рис. 5,а показаны позиции элементов,
примыкающих к анализируемому элементу S(i,j), на рис.5,б показан пример следящего
анализа. Начинается следящий анализ аналогично предыдущим двум методам, то есть
сначала выполняется сегментация всего БИ в пределах исходного растра ИР в направлении
«вправо-вниз». Как только появляется признак, что закончилась разметка ЛО с данным
номером, то формируется условие удаления (3) и если U min ÚU max = 1 , то выполняется
следящий анализ БИ в пределах РГГ, который заключается в следующем.
1. Первым элементом в следящем анализе является элемент S(i,j) (рис.5,б), который
был последним на предварительном этапе – сегментации БИ в пределах ИР. Четкого
направления дальнейшего анализа, как в предыдущих двух методах, для данного метода –
нет.
8
1
2
y
j+2
7
6
3
5
4
j+1
j
x
i-2
i-1
i
i+1
i+2
а)
б)
Рис. 5. Метод удаления ЛО на основе следящего анализа
2.
Для начального элемента S(i,j) выполняется анализ соседних элементов,
примыкающих ребром, или углом, в соответствие с позициями, показанными на рис.5,а.
3. Формируется код позиций соседних пикселей:
8
K S (i, j ) = å q × 3( p -1)
(4)
p =1
32
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
где p ={1,..8} – номер позиции; q = {0, 1, 2, 3} – код условия, причем, (0) – нет пикселя; (1) –
есть пиксель, но не было анализа; (2) – есть пиксель, и он уже проанализирован; (3) – нет
пикселя и эта позиция уже проанализирована.
4. Сформированный код позиций KS(i,j) сохраняется в стековой памяти.
5. Выполняется чтение KS(i,j) и его анализ. Если все разряды равны 0 или 2, то элемент
S(i,j) стирается.
( p)
6. Если для кода позиций какой-то разряд k S = 1 , то выполняется смещение анализа в
( p)
ту позицию, для которой k S = 1 . При этом в KS(i,j) “1” заменяется на “2” и
KS(i,j)сохраняется в стековой памяти.
7. Для смещенного пикселя повторяется анализ, формирование кода позиций и
( 2)
сохранение в стеке. Например, из стековой памяти читается k S = 1 . Это соответствует
пикселю S(i+1,j+1), для которого формируется код позиций KS(i+1,j+1) = 0 0 2 0 0 0 1 1 , и
затем сохраняется в стековой памяти. В дальнейшем, при анализе этого кода, направление p
(6)
= 6, соответствующее разряду k S = 2 ,
уже не будет анализироваться, так как это
соответствует пикселю S(i,j), анализ которого выполнялся ранее.
Метод следящего анализа более сложен в реализации, но он позволяет удалять ЛО
любой сложности, например такие, как ветвящиеся и спиралевидные БИ [2].
Библиографический список
1.Сальников И.И. Растровые пространственно-временные сигналы в системах анализа изображений. –
М.: Физматлит, 2009. – 248 с.
2. Сальников И.И. Методы построчного и следящего поэлементного анализа сложных бинарных
изображений. // Научно-методический журнал «XXI век: итоги прошлого и проблемы настоящего - плюс».
Серия технические науки. Информационные технологии. - Пенза: Изд-во Пенз.гос.технол.ун-та, №10(14),
2013.- С.53-60.
33
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Н. П. Корнышев,
ОАО «НИИПТ «Растр», Великий Новгород
Информационный подход к моделированию
процесса фотоэлектронного преобразования
Рассматривается информационный подход к моделированию процесса
фотоэлектронного преобразования с целью количественной оценки возможных
ограничений порогового контраста
Принято различать информационный и физический подходы к моделированию [1]. В
отличие от физического при информационном подходе определяется лишь преобразование
входного сигнала в выходной без изучения внутренних процессов. Моделируемое
устройство представляется «черным» ящиком с известной функцией, алгоритмом или
условием преобразования входного сигнала. Соответственно, математическая модель, в
которой реализуется информационный подход, может быть названа «информационной
моделью».
Рассматриваемая
модель
представляет
процесс
фотоэлектронного
преобразования в виде «черного ящика», на входе и выходе которого имеют место
пуассоновские процессы, функционально связанные между собой. Эта связь вытекает из
закона сохранения энергии, согласно которому фотон не может создать больше одного
фотоэлектрона, в результате чего квантовый выход не превышает единицы.
Информационный подход позволяет решить задачу компьютерного моделирования
процесса фотоэлектронного преобразования с целью количественной оценки возможных
ограничений порогового контраста простым приближенным образом, а именно, путем
имитации случайного поведения моделируемого объекта с последующим накоплением
результатов и их статистической обработкой.
Алгоритм моделирования заключается в следующем. Генерируется пара случайных
чисел X1 и X'1, распределенных по закону Пуассона с параметром распределения λ.
Параметр распределения λ соответствует математическому ожиданию числа фотонов на
входе. Случайные числа X1 и X'1 сравниваются между собой, и выбирается минимальное из
них, т. е. берется минимум из двух случайных реализаций: Y=min{X1, X'1}. Эта операция
позволяет обеспечить условие преобразования Y≤X. Получаемое случайное число Y
принимается в качестве выходной реализации, т. е. случайного числа фотоэлектронов,
распределенной также по закону Пуассона.
Процесс генерации и сравнения повторяется n раз и определяется математическое
ожидание для Y. Отношение математического ожидания N1 числа фотонов на входе
(соответствует уровню сигнала на входе) к математическому ожиданию N2 фотоэлектронов
на выходе (соответствует уровню сигнала на выходе) дает оценку коэффициента мощности
F=
N1 Y12
=
N 2 Y22 моделируемого звена, где ψ1 и ψ2, соответственно, отношение сигнал-
шума
шум на входе и выходе моделируемого процесса, поскольку среднеквадратическое
отклонение фотонного шума на входе равно
на выходе равно
N1 , а среднеквадратическое отклонение шума
N2 .
34
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Коэффициент мощности шума на который в свою очередь связан с величиной
порогового контраста соотношением К 2 = К1 F , где К1, и К2, соответственно, пороговый
контраст на входе и выходе моделируемого процесса. Данное соотношение вытекает из
ψпор
ψпор
K1 =
K2 =
N1
N2
известной формулы А. Роуза [2], согласно которой
, а
, где ψпор априорно задаваемое пороговое отношение сигнал-шум.
Далее процесс повторяется для другого параметра распределения λ. В результате
получается оценка (рис. 1) зависимости коэффициента F мощности шума от среднего числа
N1 фотонов.
Рис. 1. Зависимость коэффициента F мощности шума от среднего числа N1 фотонов, полученная в
результате компьютерного моделирования процесса фотоэлектронного преобразования на основе
информационного подхода
Интуитивно понятно, что при большом числе фотонов на входе никаких ограничений
не должно быть. С другой стороны, понятно также, что возможное ухудшение порогового
контраста в процессе фотоэлектронного преобразования весьма незначительно и не может
превышать оценки, которая получается, например, в частном случае, когда учитывается
независимый и весьма малый (на уровне фотонного шума) термогенерационный шум.
Полученный при компьютерном моделировании результат (рис. 1) совпадает с
интуитивно ожидаемым, поскольку при большом числе фотонов на входе (начиная с 1000)
коэффициент мощности шума F ® 1 и, следовательно, ограничения не проявляют себя. При
уменьшении числа фотонов на входе (менее 1000) коэффициент мощности шума возрастает,
однако, не превышает оценки F = 2 , получаемой в указанном выше частном случае учета
независимого малого (а именно с уровнем, равным
N1 ) термогенерационного шума.
Литература
1. Автоматизация проектирования радиоэлектронных средств» / учебное пособие для вузов; под ред. О.В.
Алексеева. М.: Высш. шк., 2000. 478с.
2. Роуз А. Зрение человека и электронное зрение. Пер. с англ. 1977. 216с.
35
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
А.В. Кузнецов
ОАО «НИИПТ «Растр», г. Великий Новгород
Оптимальная фильтрация пирометрического
сигнала при ограниченной скорости изменения
температуры объекта
Аннотация: Предложена статистическая модель пирометрического сигнала от
объектов с ограниченной скоростью изменения температуры, позволяющая
реализовать методы оптимальной фильтрации, получены выражения для расчёта
импульсной характеристики оптимального фильтра. Представлены результаты
экспериментальной проверки полученных выражений методами программного
моделирования.
Основным фактором, ограничивающим предельно достижимую точность измерения
температуры телевизионными (ТВ) пирометрическими методами при устранении
методических погрешностей, является шум видеотракта ТВ пирометра, включающего в себя
пирометрический датчик (ТВ модуль), канал связи и устройство ввода видеосигнала в
компьютер. При этом разнообразие свойств объектов измерений и параметров термических
процессов приводят к сложности создания достаточно общей статистической модели
сигнала, что делает затруднительным проектирование универсального алгоритма
фильтрации. Как правило, на практике ограничиваются межкадровым усреднением оценки
измеренного значения температуры в прямоугольном скользящем окне, при этом размер
окна в большинстве случаев выбирается эмпирическим путём, что часто приводит к
существенно неоптимальным результатам.
Тем не менее, можно выделить большую группу задач температурного контроля в
промышленности, для которых априорно известны минимально и максимально возможные
значения температуры объекта Tmin и Tmax, а также минимально и максимально возможные
значения модуля скорости изменения температуры vmin и vmax. Для таких процессов
распределение плотности вероятности скорости изменения температуры объекта можно
представить в виде:
1
ì
, при v min £ v £ v max
ï
pv (v) = í 2 (v max - v min )
(1)
ïî0, в противном случае
В общем случае, при возможных скачкообразных изменениях режима нагрева или
структуры объекта (например, отслоение окалины), процесс v(t) можно полагать близким к
дельта-коррелированному белому шуму. Тогда процесс изменения температуры объекта T(t),
описываемый стохастическим уравнением:
(2)
dT (t ) / dt = v(t ) ,
должен быть отнесён к нестационарным процессам с независимыми приращениями,
дисперсия которых есть монотонно возрастающая функция времени [1, 2]. Однако,
поскольку в действительности значения температуры всегда ограничены диапазоном
(Tmin; Tmax), дисперсия процесса T(t) должна быть конечной величиной, что может быть
36
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
учтено методом отражающих границ [1]. Согласно этому методу, если некоторая реализация
T0(t) процесса T(t) пересекает границу T=Tmax при t = τ, то эта реализация заменяется другой
реализацией T1(t), совпадающей с T0(t) в интервале (0; τ), при этом плотность вероятности
результирующего процесса T(t) примет вид [1]:
pT (T , t ) = pT0 (T , t ) + pT0 (2Tmax - T , t ), - ¥ < T £ Tmax
Тогда при введении второй отражающей границы при T=Tmin распределение плотности
вероятности значений температуры будет близко к равномерному:
ì 0, при T < Tmin и Tmax < T
pT (T ) = í
-1
î[Tmax - Tmin ] , при Tmin £ T £ Tmax
и иметь математическое ожидание:
(3)
M T = (Tmin + Tmax ) / 2 .
(4)
Это согласуется с представлением о том, что для универсального ТВ пирометра, не
ориентированного на конкретную задачу, значения температуры объекта следует полагать
равновероятными в пределах границ диапазона измерений.
Принятая модель позволяет сделать допущение о стационарности и эргодичности
процесса T(t), что делает возможным определение импульсной характеристики фильтра,
минимизирующего средний квадрат ошибки воспроизведения пирометрического сигнала,
методами оптимальной линейной фильтрации [3] при наличии в видеотракте ТВ пирометра
аддитивного нормального белого шума.
Поскольку белый шум имеет дисперсию мгновенных значений σN2, равную его
спектральной плотности мощности SN [3], последняя может быть определена из априорно
известного максимального отношения сигнал/шум SNR на выходе фотоприёмника. Для
максимального размаха сигнала от уровня «чёрного» до уровня «белого» Uб = 1:
s2
1
,
S N = s 2N = N U б2 =
U б2
SNR 2
(5)
Положим спектральную излучательную способность объекта на эффективной длине
волны λэфф [4] постоянной, а зависимость размаха выходного сигнала фотоприёмника от
спектральной энергетической яркости объекта - линейной (ПЗС-матрица). Тогда зависимость
размаха сигнала от температуры объекта u(Т) при u(Тmax)=Uб = 1, на основании приближения
Вина [4] будет иметь вид:
é c
u (T ) = exp ê 2
êë l эфф
æ 1
1 öù
çç
- ÷÷ú ,
è Tmax T øúû
(6)
где с2 = 1,43879×10-2 м К - постоянная излучения.
Используя (6) и (2), определим скорость изменения пирометрического сигнала как:
w(t , T ) =
где
f (T ) =
du (t ) d
du dT
= u (T (t )) =
= f (T ) v(t ) ,
dt
dt
dT dt
(7)
é c æ 1
1 öù
exp ê 2 çç
- ÷÷ú .
l эфф T 2
ëê l эфф è Tmax T øûú
c2
Тогда распределение плотности вероятности процесса w(t):
37
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
1
ì
, при
ï
p w ( w, T ) = í 2 f (T ) (vmax - vmin )
ïî0, в противном случае
f (T ) v min £ w £ f (T ) v max
,
(8)
Процесс w(t) – центрированный, с дисперсией, которая зависит от температуры:
¥
2
DW (T ) = ò w pW ( w, T ) dw =
-¥
f (T ) v max
ò
f (T ) v min
3
3
1 v max - v min 2
dw =
f (T ) ..(9)
f (T ) (v max - v min )
3 v max - v min
w2
Учитывая (3), дисперсия распределения процесса w(t) по обеим координатам:
3
3
Tmax
Tmax
- vmin
vmax
1
1
1
DW =
D w (T ) dT =
f 2 (T ) dT . (10)
ò
ò
3 Tmax - Tmin vmax - vmin T
Tmax - Tmin T
min
min
Процесс w(t) можно также полагать близким к дельта-коррелированному процессу,
спектральная плотность мощности которого SW постоянна и равна его дисперсии:
SW = DW .
(11)
Тогда спектральную плотность мощности SU(ω) флуктуационной составляющей
сигнала u(t) приближённо можно определить как результат прохождения процесса w(t) через
идеальный интегратор:
1
1
SU (w) =
SW =
DW .
(12)
w2
w2
Поскольку интегрирование (12) приводит к нестационарному процессу, функция SU(ω)
будет отличаться от действительно имеющей место в области частот, близких к нулю.
Фактически, в (12) не учтёно использование в модели сигнала метода отражающих границ.
Тем не менее, в первом приближении выражения (5), (10) и (12) позволяют определить
коэффициент передачи оптимального фильтра, минимизирующего средний квадрат ошибки
воспроизведения процесса u(t) [3]:
SU (w)
1
K ( jw) =
e - jwt 0 =
e - jwt 0 ,
(13)
2
SU (w) + S N
1 w
1+
SNR 2 D w
где t0 – групповая задержка фильтра.
Соответствующий (13) физически реализуемый дискретный нерекурсивный
оптимальный фильтр имеет частотную характеристику [5]:
¥
H ( jW ) = å
k = -¥
где:
- jW
1
1+
1
SNR 2 DW
(W + 2p k )
e
N -1
2
,
(14)
2
W = w t d - нормированная частота (td – период дискретизации); ( N - 1) / 2 – групповая
задержка фильтра.
Импульсную характеристику фильтра можно определить непосредственно
вычислением обратного преобразование Фурье от частотной
характеристики (14),
определённой на интервале (-π; π):
38
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
p
h ( n) = ò
-p
1+
1
1
SNR 2 DW
- jW
e
W
N -1
2
e j W n dW,
(15)
2
где
n = 0, 1, 2.. N - 1.
На практике выбор порядка фильтра N, очевидно, должен определяться как
возможностью ограничения его импульсной характеристики членами, превышающими
некоторый заданный порог, так и максимально допустимой групповой задержкой.
Для проверки полученных соотношений было проведено программное моделирование
фильтрации в среде Mathcad. Исходный пирометрический сигнал UT в соответствии с (1) (3) и (6), и шум UN в соответствии с (5) формировались в виде последовательностей длиной
М = 10242 элементов. На вход фильтра порядка N = 31, синтезированного в соответствии с
(10) и (15), подавалась сумма последовательностей:
X i = U Ti + U N i , i = 0...M - 1
(16)
В результате расчёта вычислялась последовательность Y на выходе фильтра из М-(N-1)
элементов, при этом устранялась групповая задержка:
ù
N -1
N -1
ê
...M - 1 Yq =
.
å h(n) X æ N -1 ö ú, q =
N -1
2
2
ê
+n ÷ ú
ç q0
n
=
2
è
ø û
ë
å h( n)
1
N -1é
(17)
n=0
Средний квадрат ошибки фильтрации определялся как:
1
DY =
å Yq - X q 2 .
M - ( N - 1) q
[
]
(18)
Для оценки эффективности фильтрации полученные результаты сравнивались с
теоретическим значением минимального среднего квадрата ошибки воспроизведения
сигнала при оптимальной фильтрации, определяемым в соответствии с известным
соотношением [3], которое с учётом (5) и (12) может быть преобразовано следующим
образом:
1
DW
1
2
1 SU (w) S N (w)
1
SNR 2 dw .
dw = ò w
(19)
ò
p 0 SU (w) + S N (w)
p0 1 D + 1
W
w2
SNR 2
Кроме того, аналогично (18) рассчитывался средний квадрат ошибки при фильтрации
последовательности X фильтром с равномерной маской h(n) = const =1 (усреднение) для
различных значений размера маски L. В этом случае выходная последовательность Р
формировалась в соответствии с выражением:
e2 =
¥
¥
ù
1 L -1 éê
ú.
Pq ( L) =
(20)
å X
L n = 0 ê æç q - L -1+ n ö÷ ú
ë è 2 øû
Результаты расчётов для пирометрического сигнала при Tmin = 1400 K и Tmax = 2000 K
при различных значениях максимальной и минимальной скорости изменения температуры
объекта и различных значений отношения сигнал/шум представлены на рис. 1 и 2.
39
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Для пирометрического сигнала при vmin = 0,1 К/отсчёт и vmax = 10 К/отсчёт значения
среднего квадрата ошибки оптимальной фильтрации, рассчитанные в соответствии с (19),
составили: 3,247×10-4, 1,624×10-4, и 6,495×10-5, для отношения сигнал/шум SNR = 20, 40 и
100 соответственно. Как видно (см. прямые 4 - 6 на рис. 1), эффективность проведённой
фильтрации достаточно близка к теоретическому значению, что позволяет сделать вывод о
справедливости принятых допущений и применимости методов оптимальной фильтрации в
рамках решаемой задачи. Также необходимо отметить, что, как и следовало ожидать,
фильтрация с равномерной маской, даже при оптимальном размере маски, оказывается
менее эффективной (см. кривые 1-3 на рис. 1).
Рис. 1 – Средний квадрат ошибки фильтрации при vmin = 0,1 К/отсчёт, vmax = 10 К/отсчёт, при равномерной маске
и отношении сигнал шум 1 – 20; 2 – 40; 3 – 100, в зависимости от размера маски, а также средний квадрат
ошибки оптимальной фильтрации для N = 31 при отношении сигнал шум 4 – 20; 5 – 40; 6 – 100
Рис. 2 – Средний квадрат ошибки фильтрации при SNR = 40, vmin = 0,1 К/отсчёт, при равномерной маске и
значении vmax: 1 - 10 К/отсчёт; 2 – 20; 3 – 30, в зависимости от размера маски, а также при оптимальной
фильтрации для N = 31 и значении vmax: 4 - 10 К/отсчёт; 5 – 20; 6 – 30
40
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Анализируя кривые на рис. 2, можно отметить, что с увеличением значения vmax
выигрыш в эффективности оптимальной фильтрации перед усреднением возрастает; кроме
того, оптимальное значение размера окна усреднения уменьшается, а снижение
эффективности усреднения при отклонении размера окна от оптимального происходит более
резко, что, по-видимому, объясняется сближением статистических характеристик сигнала и
помехи.
Анализируя кривые на рис. 2, можно отметить, что с увеличением значения vmax
выигрыш в эффективности оптимальной фильтрации перед усреднением возрастает; кроме
того, оптимальное значение размера окна усреднения уменьшается, а снижение
эффективности усреднения при отклонении размера окна от оптимального происходит более
резко, что, по-видимому, объясняется сближением статистических характеристик сигнала и
помехи.
Таким образом, оптимальная фильтрация, проводимая в соответствии с
предложенными соотношениями, позволяет уменьшить (в ряде случаев – существенно)
ошибку воспроизведения пирометрического сигнала по сравнению с широко применяемым
на практике усреднением.
Список литературы
1.
2.
3.
4.
Тихонов В.И., Миронов М.А. Марковские процессы. М.: Сов. радио, 1977.
Левин Б.Р. Теоретические основы статистической радиотехники. М.: Радио и связь, 1989
Зюко А.Г. Помехоустойчивость и эффективность систем связи. М.: Связь, 1972
Свет Д.Я. Оптические методы измерения истинных температур. М.: Наука, 1982
5. Бушнев Д.В., Романов А.В. Теоретические основы цифровой обработки сигналов.
Воронеж: Воронеж. гос. техн. ун-т, 2005
41
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Баранов П.С,
СПбГЭТУ каф. ТВ
Методы повышения качества изображения
формируемого цветной одноматричной
телевизионной камерой
Определена триада параметров, определяющих качество телевизионной камеры.
Рассмотрена модель формирования цветного изображения, учитывающая оптическое
преобразование входного сигнала, преобразование фотоприемником и другими
электрическими каскадами, а также алгоритмы программной обработки. Предложен
способ
повышения
разрешающей
способности,
помехоустойчивости
и
чувствительности цветной телекамеры за счет использования новых структур
кодирующих светофильтров. Рассмотрены существующие СКС, а также проблемы
синтеза СКС с заданными параметрами. Предложена СКС обеспечивающая повышения
разрешающей способности на 30 % и чувствительности на 4.5 дБ по сравнению с
телекамерами со СКС Байера.
Ключевые слова: разрешающая способность, чувствительность телекамеры, одноматричная
телевизионная камера, структура кодирующих светофильтров.
Вопрос оценки качества изображения, формируемого телевизионной камерой,
достаточно сложный и неоднозначный. До сих пор не выработано строгой методики оценки
качества изображения, не регламентированы параметры и критерии, по которым
производить анализ. Подходя к вопросу анализа качества изображения, формируемого
телевизионной камерой, с точки зрения общей радиотехники то можно выделить триаду
параметров – разрешающая способность, чувствительность, помехоустойчивость.
Под разрешающей способностью будем понимать количество черных и белых штрихов
приходящихся на высоту растра, воспроизводимых с заданным критерием качества. Под
критерием качества подразумевается отсутствие на воспроизводимом изображении
цветовых артефактов.
Под чувствительностью будем понимать пороговую чувствительность, которая
определяется освещенностью или облученностью, при которой на выходе фотоприемника
формируется заданное отношение сигнал/шум.
Под помехоустойчивостью будем понимать устойчивость телекамеры, в процессе
формирования цветного изображения, к появлению различных артефактов. Артефакты могут
быть различными по своей природе, заметности для глаза человека, постоянными или
переменными от внешних воздействий.
На рисунке 1 представлена достаточно общая модель формирования цветного
изображения в одноматричной телевизионной камере. Блоки 1-3 отвечают за оптическое
преобразование сигнала, 4- отвечает за преобразование свет-сигнал и обработку аналогового
сигнала. 5- 7 отвечает за цифровую обработку изображения. Каждый блок обработки на
рисунке 1 влияет на несколько параметров, определяющих качество изображения.
Например, размер пиксела ФП, определяет максимально возможное разрешение
телекамеры, однако с его уменьшением падает чувствительность. Поэтому необходимо
42
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
выбирать компромиссное решение исходя из поставленных задач. Аналогичные
рассуждения можно привести для ФНЧ, СКС, алгоритма интерполяции и другой обработки
изображения.
Если рассматривать задачу улучшения качества изображения, формируемого
телекамерой, как одновременное повышение разрешающей способности, чувствительности
и помехоустойчивости к артефактам, то количество степеней свободы, которыми обладает
разработчик, настолько велико, что подобная задача в литературе практически не
рассмотрена.
Рисунок 1. Модель формирования цветного изображения. 1 – Оптическая система, 2 – фильтр нижних
пространственных частот (ФНПЧ), 3 – структура кодирующих светофильтров (СКС), 4 - монохромный
фотоприемник, 5- блок предварительной обработки, 6 блок интерполяции, 7 блок постобработки
В подавляющем большинстве случаев оптимизируется одни параметр, при этом
используется значительно более простая модель преобразования изображения, нежели на
рисунке 1. При этом, например, в результате оптимизации телекамеры по разрешающей
способности может существенно снизиться чувствительность, а также скорость обработки
изображения, поскольку в исходной модели отсутствовали блоки, отвечающие за данные
параметры.
По сравнению черно-белой телевизионной камерой, одноматричная схема
формирования цветного изображения со СКС Байера имеет следующие особенности:
·
Чувствительность ниже в 6-10 раз, из-за нанесенных светофильтров основных
цветов [1];
·
Разрешающая способность составляет от 0.6 до 0.75 от разрешения ФП. Из-за
прореживания спектральных каналов основных цветов, необходимо проводить
восстановление полноцветного изображения, что в свою очередь
сопровождается цветовыми артефактами [2];
43
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
·
Требуются значительно большие вычислительные ресурсы из-за необходимости
интерполяции (наибольший вклад), цветокоррекции, баланса белого и других
операций [3].
В теоретически [1, 2, 4] и эмпирически показано, что именно СКС Байера вносит такие
существенные ограничения при построении цветной телевизионной камеры. С момента
изобретения СКС Байера в 1976 году, было предположено множество структур (некоторые
представлены на рисунке 2), обеспечивающих повышение хотя бы одного параметра,
влияющего на качество изображение. Несмотря на это, ни одна СКС на сегодняшний момент
не смогла заменить СКС Байера, которая используется более чем в 95% цветных камерах.
Рисунок 2 Примеры структур кодирующих светофильтров
Сложность
создания
СКС,
обеспечивающей
одновременное
повышение
чувствительности, разрешающей способности, а также помехоустойчивости (к цветовым
артефактам) телевизионной камеры связано с несколькими причинами.
Первая, не достаточно изучено степень влияния СКС на качество восстанавливаемого
изображения. Вторая, не разработано методологии анализа характеристик телекамеры на ФП
с произвольной СКС. Третья, не разработан алгоритм синтеза СКС с заданными
параметрами. В случае простого перебора всех возможных вариантов – поиск может
занимать десятки и сотни лет. Четвертая, не достаточно проработан универсальный алгоритм
интерполяции.
До недавнего времени, отсутствие теоретической базы для решения задачи синтеза
СКС приводило к тому, что поиск новых СКС ограничивался только логическими
умозаключениями и догадками при выборе размера шаблона, его геометрии, спектрального
состава.
В работах [5-7] приведены теоретические основы для анализа изображений
полученных с помощью различных СКС. Авторами были предложены несколько СКС,
44
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
превосходящие СКС Байера по помехоустойчивости и разрешающей способности. Оценка
чувствительности телекамеры с прилагаемыми СКС в данных работах не была произведена.
В работе [8] приведен подход к анализу характеристик телекамеры с произвольной
СКС. Результаты полученные автором, позволяют оценить степень влияния СКС на
ключевые параметры телекамеры.
В рамках работы над диссертацией автором был разработан алгоритм синтеза СКС. С
помощью предложенного алгоритма были полученные известные в [5-7] СКС, что
подтверждает правильность работы.
Также с помощью данного алгоритма была синтезирована не известная на данный
момент СКС (рисунок 3), превосходящая СКС Байера на 30% по разрешающей способности
и на 4.5 дБ по чувствительности. Начальные условия для работы алгоритма следующие:
·
размер шаблона 2х4,
·
используемые цвета в шаблоне состоят из суммы основных цветов с весами (0,
0.5, 1);
·
компоненты цветности не могут располагаться в частотной области на
вертикальных и горизонтальных осях компоненты яркости;
·
среди всех СКС удовлетворяющих предыдущим ограничениям выбирается СКС
с минимальной нормой матрицы восстановления.
На рисунке 3 представлена предложенная автором СКС, а также примеры
восстановления изображения. По сравнению со СКС Байера предлагаемая СКС значительно
повышает помехоустойчивость изображения к цветовым артефактам. Разрешающая
способность с новой СКС в канале яркости сопоставима с черно-белой телекамерой.
На рисунке 4 представлены зависимости среднеквадратического отклонения (СКО)
шума на изображении восстановленного после СКС Байера и предложенной СКС от
цветовой температуры источника света (в тысячах К). Во всем диапазоне цветовых
температур выигрыш предложенной СКС по чувствительности составляет порядка 4.5 дБ.
Предлагаемые СКС такими фирмами как Sony, Aptina, TrueSense Imaging Inc. не
позволяют одновременно повысить чувствительность телекамеры и разрешающую
способность. В данной работе удалось синтезировать СКС, которая обеспечивает повышение
всей
триады
параметров
(чувствительность,
разрешающая
способность,
помехоустойчивость) телекамеры. Алгоритм восстановления для предложенной СКС не
требует значительных вычислительных ресурсов, что позволяет достичь существенного
повышения качества для видеоизображений с большой потоком данных. Недостатком
предложенной СКС является использование семи спектральных фильтров, которые не
производятся на данный момент (поскольну не было необходимости в из разработке).
Совершенствование методологии анализа характристик телекамер с прозвольной СКС,
а также алгортма синтеза СКС с заданными параметрами в будуещем позволят получить
СКС, которая заменит СКС Байера в цветных одноматричных телекамерах.
45
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
б
а
в
г
д
е
ж
Рисунок 3. Сравнение предложенной СКС со СКС Байера. (а-предложенная СКС, б – СКС Байера, в –
восстановленное изображение текста после СКС Байера, г – восстановленное изображение текста
после предложенной СКС, д– оригинальное изображение штриховой миры, е– восстановленное
изображение штриховой миры после СКС Байера, ж – восстановленное изображение штриховой миры
после предложенной СКС)
СКС Байера
Предложенная
СКС
Рисунок 4. Сравнение предложенной СКС со СКС Байера
46
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Библиографический список
1. П.С. Баранов, В.В. Козлов, А.А. Манцветов. Чувствительность цветных одноматричных
телевизионных камер//Вопросы радиоэлектроники. Сер. Техника телевидения. 2012. Вып. 1. С. 58-71.
2. А.А., Мягкая Н.П., Плохих Д.П., Чекунова И.С. Разрешающая способность цветных одноматричных
телевизионных камер//Вопросы радиоэлектроники. Сер. Техника телевидения. 2008. Вып. 2. С. 38-49.
3. Single-Sensor Imaging. Methods and Applications for Digital Cameras. Ed. by R. Lukac. Boca Raton, USA:
CRC Press. 2009. 626 p.
4. О. С. Вахромеева, А. А. Манцветов, К. А. Шиманская. Характеристики чувствительности
телевизионных камер на матричных приборах с зарядовой связью//Известия вузов России.
Радиоэлектроника. 2004. Вып. 4. С. 25-35.
5. L. Condat, “A new color filter array with optimal sensing properties,”in Proc. IEEE Int. Conf. Image
Process., Nov. 2009, pp. 457–460.
6. P. Hao, Y. Li, Z. Lin, and E. Dubois, “A geometric method for optimal design of color filter arrays,” IEEE
Trans. Image Processing, in press, 2011.
7. Hirakawa K., Wolfe P. Spatio-spectral color filter array design for optimal image//Transactions On Image
Processing. V. 17. Iss. 10, October 2008. P. 1876-1890
8. П.С. Баранов. Анализ характеристик телекамер на фотоприемниках с произвольной структурой
кодирующих светофильтров //Вопросы радиоэлектроники. Сер. Техника телевидения. 2014. Вып. 1. С. 1829.
Methods of improving the quality of images formed by single sensor color television camera
Baranov P.S
Saint Petersburg Electrotechnical University “LETI”, Television subdepartmant
The Triad parameters that determine the quality of the television camera are defined.
Model of color image formation, taking into account the optical transformation of the input
signal, convert the photodetector and other electric cascades and software processing
algorithms are considered. Method for increasing resolution, noise immunity and sensitivity
color camera through the use of new structures encoding filters are provides. The existing CFA
and CFA synthesis problem with the specified parameters are considered. CFA with increasing
resolution by 30% and sensitivity by 4.5 dB compared to cameras with Bayer CFA are
provided.
Resolution, sensitivity camera, single-sensor television camera, color filter array.
47
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Баранов П.С,
СПбГЭТУ каф. ТВ
Мультиспектральная ТВ камера на одноматричном ФП
Рассмотрены
принципы
построения
мультиспектральных
телекамер.
Рассмотрены перспективные направления проектирования спектрозональных систем
на одном фотоприемнике. Предложена собственная структура кодирующих
светофильтров, обеспечивающая выделение видимого диапазона и ближнего
инфракрасного. Произведено сравнение предложенной СКС с известными аналогами.
Ключевые слова: мультиспектральные изображения, одноматричный фотоприемник, сструктура
кодирующих светофильтров.
В настоящее время мультиспектральные изображения и информация, полученная на их
основе, активно используется в таких областях как университетские исследования, сельское
хозяйство, сортировка и анализ качество продуктов питания, медицина, машинное зрение,
военная промышленость и других сферах человеческой жизни [1].
На рисунке 1 представлены основные способы построения мультиспектральных
телекамер [2-3].
а
б
в
Рисунок 1. Традиционные способы построения мультиспектральных телекамер на матричных ФП
К недостаткам построения телекамер с устройством перемещения фильтров (рисунок
1,а) можно отнести существенные габариты, также то, что данная схема не позволяет
получать мультиспектральные изображения в реальном времени, поскольку захват кадров от
различных спектральных каналов происходит последовательно во времени.
К недостаткам построения мультиспектральных систем, на основе нескольких
независимых телекамер, можно отнести существенные габариты, сложность оптической
системы и обработки изображения, а также цена.
К недостаткам построения телевизионной камеры с использованием дихроичной
призмы, можно отнести существенные габариты, а также значительное увеличение системы
из-за использования нескольких ФП.
Цветную телевизионную камеру можно рассматривать как спектрозональную систему
с тремя каналами R,G,B. Причем цветные телевизионные камеры прошли стадию
формирования по последовательной схеме, затем с помощью дихроичных призм, и на
данный момент более 95 % камер – используют один ФП со СКС Байера, для формирования
цветного изображения.
48
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Компания Imec [1], которая занимается созданием новых поколений микро- и
наноэлектронных приборов, которые будут массово производиться через 3-10 лет, видит
большое будущее в обрасти мульти и гиперспектральных телевизионных систем на одном
ФП.
На рисунке 2 показаны основные концепты построения гиперспектральных ФП [1].
Клинообразный ФП (а), позволяет сформировать до 100 различных спектральных
диапазонов, однако область применения телекамер на данном ФП ограничена
сканирующими системами.
а
б
в
Рисунок 2. Концепты построения гиперспектральных ФП.
ФП (б) со спектральными выделенными областями (32 области по 256х256 пикселей)
требует дополнительного оптического узла - дубликатора, который повторяет входной
сигнал, на каждую область. Разрешающая способность в каждом канале существенно ниже,
по сравнению с монохромным ФП. Главным преимуществом данного решения является то,
что за одну экспозицию одновременно формируется гиперспектральное изображение.
Наиболее перспективным способом формирования мульти- и гипер-спектрального
изображения моно считать использование структуры кодирующих светофильтров (СКС).
СКС осуществляет разделение оптического сигнала по спектральным каналам, а также
производит дискретизацию выделенных каналов в плоскости ФП. При этом нет
необходимости в использовании оптического дубликатора. Размеры телекамеры при этом
существенно снижаются. Imec [1] на данный момент использует СКС с 16 спектральными
каналами, при этом размером шаблона равен 4х4. СКС фактически производит
прореживание входного оптического сигнала в 4 раза по горизонтали и вертикали. Если
использовать алгоритм интерполяции недостающих отсчетов, то возможно несколько
повысить разрешение.
Imec [1] тесно сотрудничает как с производителями ФП, так и разработчиками
телекамер. Уже на сегодняшний день порядка 10 фирм производят компактные
гиперспектральные телекамеры на одном ФП (с различными принципами формирования).
Использование большого количества спектральных каналов от 10 и выше на одном ФП
приводит к значительному падению разрешения. Большой интерес представляет создания
ФП чувствительного в видимом диапазоне (VIS) и имеющего одни или два дополнительных
канала (ближний инфракрасный, ультрафиолетовый и др.).
49
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
СКС обеспечивающие 4 спектральных канала, известны в литературе. На рисунке 3
представлены результаты восстановления после дискретизации сигнала СКС (1-[4], 2-[5], 3[6],). Видно, что в видимом диапазоне, изображения 1-3 сильно подвержены цветовым
артефактам, что не позволяет ФП с подобными СКС заменит существующие ФП со СКС
Байера. В ИК-канале также заметны существенные структурные артефакты.
2
1
3
Proposed
Рисунок 2. Концепты построения гиперспектральных ФП.
Автором была предложена СКС обеспечивающая наилучшее качество восстановления
в 4 спектральных каналах по сравнению с известными СКС. Для предложенной СКС
использовался линейный алгоритм восстановления. Если применять более сложные и
ресурсоемкие адаптивные алгоритм, то возможно полностью устранить цветовые артефакты
и достичь разрешения в каждом спектральном канало 0.8-0.9 от разрешения монохромного
ФП.
СКС является крайне эффективным способом повышения качества изображения. В
зависимости от задачи можно синтезировать СКС для существенного повышения
чувствительности, разрешающей способности, помехоустойчивости телекамеры. Кроме того
за счет использования СКС можно получить изображения более чем в 3-х спектральных
каналах.
Библиографический список
1. http://www2.imec.be/
2. http://www.pixelteq.com/
3. http://www.vision-systems.com/
50
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
4. Lu, Y. M., Fredembach, C., Vetterli, M., and Susstrunk, S., "Designing color filter arrays for the joint
capture of visible and near-infrared images," Proc. of IEEE Int. Conf. on Image Processing (ICIP), 3797-3800,
(2009).
5. Sadeghipoor, Z., Lu, Y. M., and Susstrunk, S., "Correlation-based joint acquisition and demosaicing of
visible and near-infrared images," Proc. of IEEE Int. Conf. on Image Processing (ICIP), 3226-3229, (2011).
6. D. Kiku, Y. Monno, M. Tanaka and M. Okutomi, " Simultaneous capturing of RGB and additional band
images using hybrid color filter array" Proceedings of IS&T/SPIE Electronic Imaging (EI), Digital Photography X,
2014 (articles in press).
The multispectral single-sensor camera
Baranov P.S
Saint Petersburg Electrotechnical University “LETI”, Television subdepartmant
The main trends in the design of the television cameras are considered. It is shown that
the traditional ways of improving sensitivity and resolution have almost reached their
technological and theoretical limit. We present examples of cameras on the array of
photodetectors (1x2, 2x2, 4x4) and photodetectors with new structures encoding filters.
The principles of design of multispectral television cameras are considered. The
perspective directions of design the multispectral of systems on one photodetector are
considered. The new color filter array providing allocation of visible range and the neighbor
infrared is offered. Comparison of offered CFA with known analogs is made.
Multispectral imaging, single-sensor, color filter array.
51
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Баранов П.С., Манцветов А.А.
СПбГЭТУ каф. ТВ
Реализация малых времен накопления в МПЗС
Рассмотрены основные методы реализации малых времен накопления в ТВ
камерах. Показано, что использование ЭОП существенно ограничивает область
применения ТВ камер на их основе. Предложен метод реализации времен накопления до
40 нс на МПЗС. Проведено экспериментальное исследование приложенного метода.
Малые время накопления, МПЗС, ЭОП, электронный затвор.
В активных телевизионно-лазерных системах используются телевизионные камеры со
временами накопления, составляющими доли микросекунды. Для реализации столь малых
времен накопления использовались стробируемые электронно-оптические преобразователи
(ЭОП). Времена включения/выключения ЭОП могут составлять единицы наносекунд [1]. В
тоже время, использование ЭОП имеет целый ряд недостатков: невысокий квантовый выход
фотокатода, проблемы сочленения с твердотельным фотоприёмником, в том числе потеря
преимущества жесткого растра, большая масса и габаритные размеры, очень высокая
стоимость и малый ресурс работы.
С этой точки зрения представляет интерес реализация малых времен накопления
непосредственно на матричном ПЗС [2]. В стандартном режиме работы матричного ПЗС со
строчным переносом время накопления определяется интервалом от момента окончания
импульса сброса зарядовых пактов в подложку SUB, рис. 1а до окончания импульса
считывания накопленных зарядовых пакетов из фотодиода в вертикальный ПЗС-регистр UH.
Уровень UM соответствует потенциальной яме в регистре, уровень UL – потенциальному
барьеру. Подача высокого потенциала UH формирует глубокую потенциальную яму под
электродом, достаточную для переноса зарядовых пакетов из фотодиодов. Необходимо
отметить, что накопление пакетов во время действия импульса UH продолжается.
UH
UH
Тнак
Тнак
UM
UM
UL
UL
SUB
SUB
а
б
Рис.5 Временные диаграммы импульсов управления накоплением и
считыванием в режиме электронного затвора: общепринятый режим для
длительного накопления а, режим стробирования б.
В предлагаемом методе [2] импульс SUB формируется таким образом, что он
уничтожает все заряды, образовавшиеся до и после интервала накопления, рис. 1б. В таком
случае минимальная длительность интервала накопления зарядов будет определяться
длительностью фронтов импульса SUB.
52
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
На рис. 2 представлены результаты эксперимента по получению времени накопления,
равного 40 нс в матричном ПЗС ICX659AL фирмы Sony. В процессе эксперимента импульс
маломощного лазера по времени сдвигался относительно интервала накопления. На рис. 2
представлены различные случаи временного положения импульса лазера относительно
интервала накопления: с перекрытием по времени, до интервала накопления и после него.
Рядом с различными случаями приведены изображения пучка лазера, полученные на экране
видеомонитора.
а
б
в
Рис 2. Результаты экспериментального исследования макета активной телевизионно-лазерной импульсной
системы. Изображения катафота, полученные при несовпадении отраженного светового импульса с интервалом
накопления – а, при полном совпадении – б при частичном перекрытии – в; осциллограммы видеосигнала –
верхняя, интервала накопления – средняя, импульса лазера – нижняя
Экспериментально подтвержденное время накопления в 40 нс позволяет измерять
дальность до объекта с точностью 6 метров. При длительности импульса лазера более
времени накопления, взвешивание сигналов соседних кадров позволяет на порядок повысить
точность – до долей метра. Проведенный энергетический расчет показал, что для уверенного
измерения дальности при размере катафота 0,1 м, поверхностная плотность энергии должна
53
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
составлять 0,1 Дж/км2. Такую плотность энергии может обеспечить твердотельный лазер на
алюмо-иттриевом гранате.
Указанный метод стробирования накопления может быть использован для повышения
контрастов изображений в активных телевизионно-лазерных импульсных системах,
работающих в рассеивающих средах, например, в воде. Стробирование матричного ПЗС
может отсечь нежелательные отражения от дальностей больших и меньших интересующей.
Стробирование матричного ПЗС может оказаться полезным при наблюдении
различного вида физических экспериментов, например, при наблюдении взрывов, пролетов
заряженных элементарных частиц в искровых камерах и т. д.
Особый интерес представляет возможность создания телевизионного импульсного
дальномера, позволяющего определять не только расстояние до объекта, но и углы по
направлению на него. Наиболее актуально применение такого дальномера в системах
сближения и стыковки КА.
Структурная схема такой системы приведена рис. 2. Активный КА содержит на борту
импульсный лазер с оптической системой, а также телевизионную камеру, работающую в
режимах телевизионного просмотра и в стробируемом режиме. Углы поля зрения камеры и
оптической системы лазера согласованы. На пассивном КА установлена специальная
мишень (катафот) [3]. Измерение расстояния осуществляется выбором такой задержки
интервала накопления относительно момента излучения импульса, чтобы фотоприёмник
воспринял отраженный от мишени свет.
Для минимизации начального определения расстояния до пассивного КА используется
изменение длительности и положения интервала накопления по принципу дихотомии,
широко используемого в АЦП поразрядного уравновешивания.
Полученные для активной телевизионно-лазерной импульсной системы результаты
говорят о существенно большей эффективности твердотельного решения по сравнению с
использовавшимися ранее системами с ЭОП.
Библиографический список
1. www.hamamatsu.com
2. А. А. Умбиталиев, А. К. Цыцулин, А. А. Манцветов, В. В. Козлов, А. Е. Рычажников, П. С. Баранов,А. В.
Иванова, Управление режимом накопления в твердотельных фотоприемниках Оптический журнал вып. 11,
том 79 2012 С. 84-92.
3. Манцветов А.А., Зубакин И.А., Козлов В.В. Цыцулин А.К. Адаптация космической телевизионной
системы к этапам наблюдения объектов // Вопросы радиоэлектроники, сер. Техника телевидения. 2012. В. 1.
С. 29–43.
Implementation of small accumulation times in CCD
Baranov P.S., Mantsetov A. A.
The basic methods of implementing small accumulation times in the TV cameras. It is shown that the use of
Image intensifier significantly limit the scope of the TV cameras on them. A method is proposed implementation
accumulation times up to 40 ns at CCD. An experimental study of the applied method.
Small accumulation time, CCD, Image intensifier, electronic shutter.
54
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Секция 2. Цифровая обработка и компрессия
видеоданных.
Руководитель секции – д.т.н., проф. В. В. Березин (СПбГЭТУ)
Зам. руководителя – д.т.н., проф. Ш.С. Фахми (СПбГЭТУ)
Секретарь секции – инженер каф. ТВ А.Ю. Дмитриева
СПбГЭТУ «ЛЭТИ», 2-й корп., пом. 2405
Попов А. С., Капустин В. В., Курячий М. И.
Томский государственный университет систем управления и
радиоэлектроники, г. Томск
Интерактивная система эфирного цифрового
телевизионного вещания с повышенной
помехоустойчивостью
В статье рассмотрена возможность введения обратной связи между
передатчиком и приемником в системах эфирного цифрового телевизионного вещания c
целью повышения их помехоустойчивости.
Ключевые слова: интерактивное телевидение, обратная связь, цифровое эфирное телевидение.
Согласно Федеральной целевой программе (ФЦП) «Развитие телерадиовещания в
Российской Федерации на 2009–2015 годы» для преодоления информационного неравенства
в РФ и обеспечения более чем 95% населения эфирное цифровым телевизионным вещанием
общедоступными программами, необходимо построить 3600 новых объектов сети.
Правительственная комиссия по развитию телерадиовещания в РФ 22 сентября 2011 года
приняла решение о переводе создаваемой сети цифрового эфирного телевидения на вещание
в стандарте DVB-T2. Вследствие этого снизилась актуальность исследований и их
результатов, связанных со стандартом DVB-T. Напротив, на данный момент стало актуально
решение задач, связанных со стандартом DVB-T2 [1].
Так же перспективно решение задач, возникающих при проектировании и внедрении 3го и последующих частотных мультиплексов (в основном коммерческих), эксплуатацию
которых государство регламентирует не так жестко, как 1-го и 2-го.
При
проектировании
системы
цифровых
телевизионных
передатчиков,
задействованных в трансляции сигнала стандарта DVB-T2, обычно завышают ее параметры,
чтобы добиться 95% вероятности покрытия помехоустойчивым сигналом заданной
территории. Для выполнения задачи по охвату населения региона вещанием пакетами
телевизионных программ, система эфирного цифрового телевидения должна быть
обеспечена формированием зоны обслуживания с заданным уровнем напряженности поля
(излучаемой мощностью).
Определить выходную мощность передатчика для обеспечения заданной
напряженности электромагнитного поля в точке приема можно несколькими методами
(формула Введенского, модели Окамуро-Хата), но в указанных методах/моделях не
учитываются граничные условия, которые могут существенно влиять на размеры зон
55
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
покрытия и соответственно на охват территорий. Обычно ситуация осложняется тем, что при
расчете необходимой выходной мощности (или напряженности поля) нужно учитывать и
другие параметры: тип модуляции сигнала, скорость транспортного потока, высоту подвеса
передающей антенны и т. д. При этом возникают и нечисловые характеристики, такие как
субъективная оценка качества принимаемого изображения [2].
Недостатком методов для планирования зон покрытия является их ограниченность в
оперировании комбинациями параметров модуляторов цифровых телевизионных
передатчиков (защитный интервал, символьная скорость, количество несущих частот и т.д.).
Для оценки влияния атмосферных явлений на уровень сигнала на входе приемника,
была организована его регистрация в 9:00, 12:00, 15:00 и 18:00 с 11 по 31 октября 2013 года в
г. Томске, по адресу ул. Вершинина, 47 (рис. 1).
Рис. 1
На рис. 1 приведен график зависимости уровня сигнала на входе приемника от времени
суток и погодных условий с 11 по 31 октября 2013 года. Точечным пунктиром изображен
теоретический уровень сигнала для данного места приема после применения алгоритма
повышения помехоустойчивости в системе с обратной связью - 45,5 дБмкВ.
Из графика видно, что за указанный период уровень сигнала изменялся в диапазоне от
43 до 48 дБмкВ, что существенно для районов с неуверенной зоной приема сигнала и может
приводить к ухудшению или пропаданию изображения.
Для проверки эффективности предложенной системы с обратной связью в реальных
условиях был проведен натурный эксперимент. В качестве источника формирования сигнала
обратной связи был организован пункт измерений (на удалении в 43,1 км по «квазигладкой»
поверхности от передатчика) и пункт управления, который находился в непосредственной
близости от передатчика. По определенной команде из пункта измерений, которая
формировалась на основе анализа параметров входного сигнала приемника, пункт
управления изменял мощность передатчика на значение согласно полученной ранее
зависимости. Корректировка мощности передатчика составила плюс/минус 100 Вт (от +1,5
до -1,5 дБмкВ). При номинальной излучаемой мощности передатчика в 2000 Вт, был
установлен рабочий режим на время эксперимента 1800 Вт. На рис. 2 приведен график
изменения уровня сигнала на входе приемника без обратной связи и с ее использованием.
Эксперимент был проведен на базе филиала РТРС «Кемеровский ОРТПЦ» в городе
Кемерово при условиях указанных выше. Возможные технические остановки трансляции
56
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
пакета программ РТРС-1 и изменения излучаемой мощности на период с 01 по 06 октября
2013 года с 00 ч. 00 мин. по 06 ч. 00 мин. местного времени были согласованы с Генеральной
дирекцией РТРС.
Рис. 2
До применения обратной связи в системе эфирного цифрового телевизионного
вещания уровень сигнала на входе приемника в зоне неуверенного приема изменялся от 38
до 41 дБмкВ, что приводило к искажению изображения вплоть до его полной потери. После
введения обратной связи удалось компенсировать неконтролируемое снижение уровня
сигнала на входе приемника, тем самым повысить помехоустойчивость системы,
(изображение не пропадало, его искажения не зафиксированы).
В лабораторных условиях проверены варианты реализации системы с управлением
обратной связью за счет изменения параметров передачи сигнала (символьной скорости,
количества несущих, типов модуляции). В реальных условиях подобное изменение
параметров не рекомендовано к постоянному использованию ввиду снижения скорости
передачи данных в угоду повышения помехоустойчивости системы и протекания
переходных процессов после переключения ее настроек. Меры по повышению
помехоустойчивости за счет уменьшения скорости передачи данных целесообразны,
например, в случае включения сигналов гражданской обороны и чрезвычайных ситуаций,
когда важны максимальная зона покрытия передатчика в совокупности с максимальной
помехоустойчивостью, так как достаточно транслировать только одну программу [3].
На рис. 3 приведены выходные и входные параметры интерактивной системы
эфирного цифрового телевизионного вещания с обратной связью для оценки зон покрытия
цифровых телевизионных передатчиков.
При изменении одного или нескольких входных параметров приемника (прямой канал
связи), например, из-за усиления помех в канале в следствии ухудшения погодных условий,
на вход передатчика по заранее установленным зависимостям (обратный канал связи)
подается корректирующий сигнал о необходимости изменения выходных параметров
передатчика. Это способствует оперативному регулированию степени помехоустойчивости
системы и увеличению размера зон покрытия сети цифрового телевещания.
57
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Передатчик
Выходные параметры:
y1, y2….yn
Выходная мощность,
Прямой канал
Функции
зависимости
выходных и входных
параметров
(интерактивный блок)
Приемник
Входные параметры:
x1, x2….xn
Уровень сигнала,
MER,
preVBER,
postVBER,
Gray Value
Обратный канал
Рис. 3
Библиографический список
1. Серов А. В. Эфирное цифровое телевидение DVB-T/H. — СПб.: БХВ-Петербург, 2010. — 464 с.
2. Цифровое телевидение в видеоинформационных системах: моногр. / А.Г. Ильин, Г.Д. Казанцев, А.Г.
Костевич, М.И. Курячий, И.Н. Пустынский, В.А. Шалимов. – Томск: Томск. гос. ун-т систем упр. и
радиоэлектроники, 2010. - 465 с.
3. Попов А.С. Оценка уровня помехоустойчивости одночастотных систем цифрового эфирного
телевизионного вещания // Докл. Том. гос. ун-та систем управления и радиоэлектроники. – 2013. – № 3 (29).
– C. 175–179.
Interactive system of digital terrestrial television broadcasting with high noise immunity
Popov Alexander, Kapustin Vyacheslav, Kuryachiy Mikhail
Tomsk state university of control systems and radio electronics
The article discusses the possibility of introducing a feedback between the transmitter and
receiver systems in terrestrial digital television broadcasting to increase their immunity.
Keywords: interactive TV, feedback, digital terrestrial television.
58
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Кирьянов К.А.
ОАО «НИИ точной механики»
Некорректные задачи восстановления
искаженных изображений на 32-разрядных
цифровых сигнальных процессорах с фиксированной
точкой
Аннотация. В данной работе кратко описаны алгоритмы устранения смаза и
дефокусирования изображений путем решения интегральных уравнений Фредгольма I
рода, но основное внимание уделено реализации их на цифровых сигнальных процессорах
семейства C64x+ фирмы Texas Instruments, ядро которых не имеет аппаратной
поддержки операций с плавающей точкой. Кратко уделено внимание разным методам
решения задачи, рассказано об особенностях программной реализации во встроенных
системах, разработанных на основе цифровых сигнальных процессоров (ЦСП) фирмы
Texas Instruments.
Ключевые слова: искаженное изображение, методы восстановления, цифровой сигнальный
процессор (ЦСП).
1. Соотношения, описывающие алгоритмы
Основные соотношения (уравнения),
непрерывного процесса, имеют вид [1–4, 8]:
описывающие исследуемые
задачи
для
¥
ò h( x - x) wy (x) dx = g y ( x) + dg ,
(1)
ò ò h( x - x, y - h) w(x, h) dx dh = g ( x, y) + dg ,
(2)
-¥
¥ ¥
-¥ -¥
где h – функция рассеяния точки (ФРТ), в большинстве случаев пространственно-инвариантная (разностная), w и g – распределение интенсивности по неискаженному и искаженному изображениям соответственно, δg – помеха. В (1) ось x направлена вдоль смаза, а
y играет роль параметра.
Соотношения (1) и (2) являются интегральными уравнениями (ИУ) Фредгольма I рода.
ИУ (1) (точнее, набор 1-мерных ИУ) обычно используется в задаче смазывания, а (2) – в
задаче дефокусирования изображения. ИУ (1) решается методами квадратур или
преобразования Фурье (ПФ) с регуляризацией Тихонова. ИУ (2) в случае пространственноинвариантной ФРТ решается методами 2-мерного ПФ с регуляризацией Тихонова или
параметрической фильтрации Винера, а в случае пространственно-зависимой ФРТ
используется, например, метод итеративной регуляризации Фридмана. Результаты
восстановлений изображений с помощью этих методов приведены в [1–3].
2. Реализация алгоритмов на архитектуре с фиксированной точкой.
Работа с изображениями требует достаточно большого объема памяти. Для задач
обработки изображений в большинстве случаев, и для исследуемых алгоритмов в частности,
памяти внутри кристалла недостаточно для полноценной работы. Массив обрабатываемых
59
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
данных размещается на внешней подключаемой памяти. Тем не менее, лучше всего
выбирать процессор с наиболее возможным объемом памяти внутри кристалла. Таким
образом, был выбран оценочный (отладочный) модуль TMDSEVM6457L на базе
микропроцессора TMS320C6457, имеющий 2048k памяти внутри кристалла. На борту
модуля установлены 2 микросхемы памяти по 128 Мбайт. Более подробно об архитектуре
процессоров семейства C6000 рассказано в [6-7]
Для большинства типовых алгоритмов обработки изображений (таких как
кодирование/декодирование по разным стандартам JPEG или MPEG) вполне достаточно
работы с целыми числами [6], а, следовательно, все может быть реализовано на процессоре с
фиксированной точкой. Для исследуемых задач всегда требуется работать с нецелыми
(вещественными) числами, а еще лучше – использовать числа с двойной точностью. Это
обусловлено тем, что рассматриваемые задачи являются некорректными (существенно
неустойчивыми). Другими словами, при небольших погрешностях в правой части
(небольшой помехе δg) погрешность решения (распределения интенсивности по
неискаженному изображению w) будет существенной. Причиной повышения
неустойчивости является увеличение помехи правой части δg. Помеха может расти с
округлением, усечением значения правой части. Из сказанного понятно, что исследуемые
алгоритмы невозможно реализовать исключительно в целых числах, так как будет
производиться слишком грубое усечение результата, что приведет к недопустимо высоким
погрешностям. Ядро процессоров C64x+ не имеет поддержки арифметики с плавающей
точкой [5-7]. Одним из вариантов решения этой проблемы является измененная
интерпретация целых чисел. При обработке используется обычное целое число, сдвинутое
влево на Q разрядов. Таким образом, разряды от 0 до Q-1 являются дробной частью, или
отрицательными степенями 2 как показано на рисунке 1. Этот подход использован в
специально разработанной для процессоров с фиксированной точкой библиотеке IQMath [3,
5]. Однако при этом возникает ограничение по целочисленной части. Учитывая разрядность
ядра процессора (32 бит) и то, что работа осуществляется со знаковыми числами (старший
разряд отводится под знак) для целочисленной части операнда отводится 32 – (Q+1)
разрядов. Возникает ситуация, когда при росте значения операнда, знаковый разряд может
изменить свое состояние, что приведет к сильному искажению его значения, а
соответственно и к чрезвычайно высокой погрешности восстановления. Ниже изложены
особенности реализации методов с использованием такого подхода, и ограничений на его
применение.
Рис 1. Выбор положения точки в 32-разрядном значении и его обозначение.
60
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Реализация 1-мерной задачи. В работе рассматривается частный случай, когда ось x
направлена вдоль смаза, а y – выступает в роли параметра. Таким образом, имеем набор 1мерных ИУ по каждой строке изображения. Решение одномерной задачи можно выполнить
2-мя способами: методом квадратур и методом с использованием ПФ, тот и другой – с
регуляризацией Тихонова. Практика показала, что для 1-мерных задач, использование
изложенного подхода к решению возможно, но с соблюдением некоторых условий. Оба
метода решения потребовали отдельного рассмотрения. Для обоих методов выявлены
требования к количеству разрядов под дробную часть Q (параметр GLOBAL_Q).
Зависимость погрешности восстановления от количества
разрядов, отводимого под дробную часть, при α=0,007
3
2,5
σ_rel
2
1,5
1
0,5
0
13
14
15
16
17
18
19
20
21
22
GLOBAL_Q
Рис 2. Зависимость погрешности восстановления от параметра GLOBAL_Q.
Для метода квадратур характерно следующее: поскольку обращаемая матрица при
малых a плохо обусловлена, всегда есть опасность переполнения. Поскольку операция
обращения матрицы – это работа исключительно с вещественными числами, то точность
довольно сильно зависит от количества разрядов после точки. Другими словами, всегда есть
опасность потерять точность: либо грубо округлив результат, либо взяв много разрядов под
дробную часть, что приведет к переполнению при вычислении какого-либо коэффициента
матрицы, что даст неудовлетворительный результат. Как показала практика, наилучшее
качество восстановления получается при GLOBAL_Q = 19÷21. На рисунке 2 приведена
зависимость погрешности восстановления изображения от параметра GLOBAL_Q при
фиксированном параметре регуляризации α. Из него видно, что в этом методе больше
разрядов требуется под дробную часть, но, в то же время, при GLOBAL_Q=22 уже возникает
переполнение. На рисунке 3 приведена зависимость погрешности восстановления от
параметра регуляризации при восстановлении на персональной ЭВМ (ПК) с использованием
плавающей точки, и на ЦСП TMS320C6457. Для графика погрешности восстановления на
ЦСП исключена область малых α из за резкого возрастания погрешности. Это явление
объясняется тем, что в области малых α возрастает неустойчивость, растет целочисленная
часть коэффициентов матрицы, возникают сильные искажения. Из последнего графика
видно, что восстановление на ЦСП с фиксированной точкой в данном примере (в точке
минимума) получилось даже с чуть меньшей погрешностью, чем на ПК. В качестве вывода
можно сказать, что метод дает вполне удовлетворительные результаты восстановления.
Для метода ПФ был применен алгоритм БПФ Кули-Тьюки, а соответственно,
требуется расширять границы области решения до ближайшей степени 2. Сам алгоритм
61
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
БПФ был реализовал в целых числах без использования функций ,библиотеки IQMath.
Поворачивающие коэффициенты были вычислены с помощью программной поддержки
операций с плавающей точкой (функции, эмулирующие операции с плавающей точкой). Для
методов, использующих вычисление ПФ, которое ни что иное как вычисление интеграла от
Погрешность восстановления смазывания методом квадратур на
ПК и на ЦСП (без неустойчивой области) при GLOBAL_Q = 20.
0,6
0,5
ЦСП
σ_rel
0,4
ПК
0,3
0,2
0,1
0
0,00001
0,0001
0,001
0,01
0,1
1
α
Рис. 3. Зависимость от α погрешности восстановления методом квадратур с регуляризацией на ПК
и ЦСП (без учета сильно неустойчивой области)
произведения функций, а следовательно операция умножения с накоплением, необходимо
отводить больше разрядов уже под целочисленную часть. В процессе накопления может
возникнуть ситуация (для простоты понимания например в обычном дискретном ПФ в
середине вектора данных), когда значение увеличилось настолько, что разрядной сетки уже
не хватает, и знаковый бит меняет значение. Дальнейшее вычисление уже просто не имеет
смысла, потому, что произошло искажение данных. Таким образом, в процессе
экспериментов, как видно на рисунке 4, наилучшие результаты восстановления для метода
ПФ получились при GLOBAL_Q=9÷13. А когда GLOBAL_Q=14, происходит переполнение,
и резко возрастает погрешность восстановления изображения.
Для метода ПФ был применен алгоритм БПФ Кули-Тьюки, а соответственно,
требуется расширять границы области решения до ближайшей степени 2. Сам алгоритм
БПФ был реализовал в целых числах без использования функций ,библиотеки IQMath.
Поворачивающие коэффициенты были вычислены с помощью программной поддержки
операций с плавающей точкой (функции, эмулирующие операции с плавающей точкой). Для
методов, использующих вычисление ПФ, которое ни что иное как вычисление интеграла от
произведения функций, а следовательно операция умножения с накоплением, необходимо
отводить больше разрядов уже под целочисленную часть. В процессе накопления может
возникнуть ситуация (для простоты понимания например в обычном дискретном ПФ в
середине вектора данных), когда значение увеличилось настолько, что разрядной сетки уже
не хватает, и знаковый бит меняет значение. Дальнейшее вычисление уже просто не имеет
смысла, потому, что произошло искажение данных. Таким образом, в процессе
экспериментов, как видно на рисунке 4, наилучшие результаты восстановления для метода
ПФ получились при GLOBAL_Q=9÷13. А когда GLOBAL_Q=14, происходит переполнение,
и резко возрастает погрешность восстановления изображения.
62
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Из описанного выше можно сделать вывод, что для задачи устранения смазывания,
сводимой к решению одномерной задачи, при соблюдении некоторых условий, для на ЦСП с
фиксированной точкой получаются вполне приемлемые результаты. Качество
восстановления по методу квадратур выше, но он медленнее. Для восстановления с
использованием обращения матрицы по методу Гаусса-Жордана потребовалось около 1
минуты времени, тогда как для восстановления методом ПФ (тот и другой с регуляризацией
Тихонова) потребовалось всего около 3с.
Реализация 2-мерной задачи. Практика показала, что подход к решению в целых
числах (и с использованием библиотеки IQMath) для задачи восстановления
дефокусированных изображений методом ПФ с рег. Тихонова не годится вообще.
Причиной тому послужил слишком большой динамический диапазон данных при
вычислении 2-мерного БПФ (даже 64 разрядов не всегда достаточно для хорошего
отображения.). Этот метод может быть реализован лишь с помощью программной
поддержки плавающей арифметики на процессоре с фиксированной точкой (эмуляции
Погрешность восстановления смазывания методом ПФ с
регуляризацией Тихонова на ПК и на ЦСП при GLOBAL_Q = 13, p=0,5.
0,9
0,8
ЦСП
p=0,5
0,7
σ_rel
0,6
ПК p=0,5
0,5
0,4
0,3
0,2
0,1
0
0,00001
0,0001
0,001
0,01
0,1
1
α
Рис. 4.12. Зависимость погрешности восстановления методом ПФ с регуляризацией Тихонова на
ЦСП при GLOBAL_Q=13 и p=1
плавающей точки), или для этого требуется процессор с аппаратной поддержкой плавающей
точки (семейства С67x+ или C66x+).
Зависимость погрешности восстановления от количества
разрядов, отводимого под дробную часть, при α=0,002
5
4,5
4
3,5
σ_rel
3
2,5
2
1,5
1
0,5
0
6
7
8
9
10
11
12
13
14
15
GLOBAL_Q
Рис. 4. Зависимость погрешности восстановления от положения точки для метода ПФ с
регуляризацией Тихонова
63
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Для использования метода итеративной регуляризации Фридмана разрядной сетки
волне достаточно, можно выбрать GLOBAL_Q=16 (в середине разрядной сетки процессора)
При этом результаты получаются практически не отличающиеся от тех, которые получаются
на ПК.
По времени, быстрее (как и для случая смазывания) работает метод с использованием
ПФ, в особенности с применением метода БПФ Кули-Тьюки. Для восстановления этим
методом требуется около 6÷7с, в то время как для метода Фридмана для выполнения одного
восстановления на ЦСП потребовалось от 10 до 15 минут в зависимости от количества
итераций. Кроме всего, метод итераций Фридмана очень критичен к начальному
приближению.
В качестве общего заключения надо отметить, что для обработки изображений
разрядность процессора должна быть не менее 32, и чтобы получить хоть в какой-то мере
приемлемые временные характеристики – требуется процессор с тактовой частотой не ниже
450МГц и желательно с аппаратной поддержкой операций с плавающей точкой.
Литература
1. Сизиков В.С. Обратные прикладные задачи и MatLab. – СПб.: Лань, 2011. 256 с.
2. Гонсалес Р., Вудс Р. Цифровая обработка изображений. – М.: Техносфера, 2006. 1072 с.
3. Кирьянов К.А., Сизиков В.С. Программирование задач восстановления искаженных изображений на
C/C++ в сигнальных микропроцессорах фирмы Texas Instruments // Научно-технический вестник ИТМО
2012, № 6 (82), с77-81
4. Верлань А.Ф. Сизиков В.С. Интегральные уравнения – Киев «Наукова думка» 1986 544 с.
5. Фингер Р. Библиотека функций IQMath для C64x+ с плавающей точкой в ЦСП с фиксированной
точкой. Компоненты TI // Бюллетень научно-технич. информации. 2011. Вып. 2(30).
6. Qureshi S. Embedded Image Processing On the TMS320C6000™ DSP. – Springer Science+Business
Media, Inc. USA. 2005.
7. Kehtarnavaz N. Real Time Digital Signal Processing Based on TMS320C6000. University of Texas at
Dallas. – Burlington: Newnes. USA.
8. Кирьянов К.А. Инструментальная реализация алгоритмов реконструкции искаженных изображений
// Труды международной конференции Graphicon, Санкт-Петербург, 2010.
64
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
1
1
Фисенко В.Т., 1 Можейко В.И., 2Фёдоров Д.А., 1Фисенко Т.Ю.
Филиал ОАО «Корпорция «Комета» - «НПЦ ОЭКН», г. Санкт-Петербург
2
Национальный Исследовательский Университет Информационных
Технологий, Механики и Оптики (НИУ ИТМО), г. Санкт-Петербург
Масштабирование изображений в телевизионных
и компьютерных системах визуализации
В докладе рассмотрены методы масштабирования при визуализации изображений.
Наряду с классическими подходами, внимание уделено полифазным схемам сплайнфильтров, реализуемым в реальном времени. Приведены таблицы коэффициентов
полифазных фильтров для преобразования форматов PAL/Industry standard.
Ключевые слова: передискретизация, интерполяция, полифазный фильтр, BC –сплайны,
Mitchell-Netravali, Catmull-Rom.
Введение. В аналоговых телевизионных системах формат изображения определяется
числом активных телевизионных строк и числом активных элементов в строке, в цифровых
системах изображение представляет матрицу отсчетов. В системах компьютерной графики
элементы изображения квадратные. В соответствии с рекомендациями ITU-R BT.709-3
«Parameter values for the HDTV standards for production and International Programme Exchange»
в разделе 2 «Picture characteristics» устанавливается квадратный пиксел. Таким образом,
HDTV основывается на квадратных пикселах, подобно экрану компьютера. Стандартное
телевизионное изображение (SD) в системах 625/50 состоит из 576 активных строк по 720
прямоугольных (неквадратных) активных элементов. Следовательно, в системах
визуализации при отображении мультиформатного контента необходимо выполнять
преобразования форматов изображения.
Термин aspect ratio (AR – отношение сторон) впервые был введен в рекомендации ITUR BT.601 (ранее CCIR 601) «Студийные параметры кодирования цифрового телевидения для
стандартного 4:3 и широкоэкранного 16:9 форматов» и определял пропорции
телевизионного изображения. В соответствии с ITU-R BT.601 в системах 625/50 для
оцифровки компонентных видео сигналов введена частота дискретизации яркостного
сигнала 13,5 МГц. ITU-R BT.601 определила, как можно вычислить отношение сторон
пиксела (PAR ― pixel aspect ratio) для формирования изображений с квадратным пикселом.
При формате кадров 4:3 число квадратных пикселов в строке равно 576*4/3=768 элементам
при активном числе строк 576. Частота дискретизации для формирования квадратных
пикселов составляет 14,75 МГц, а стандарт получил в иностранной литературе название
"Industry standard".
В ГОСТ Р 53540 - 2009 «Цифровое телевидение. Широкоформатные цифровые
системы. Основные параметры. Аналоговые и цифровые представления сигналов.
Параллельный цифровой интерфейс» указано, что предпочтительным для цифрового
вещательного телевидения высокой четкости является полное отображение изображения с
форматом кадра 4:3 и числом отображаемых элементов изображения 768 x 576. В связи с
этим актуальной является задача передискретизации изображений для преобразования
прямоугольных пикселов в квадратные и наоборот для систем визуализации.
Постановка задачи. Необходимо заменить двумерный массив амплитуд сигнала,
заданный на сетке отсчетов, некоторым другим массивом, положения отсчетов которого
определяются коэффициентами масштабирования. Эта задача решается интерполяционными
методами. Интерполяция предназначена для восстановления непрерывных значений
65
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
амплитуды сигнала изображения по ее дискретным значениям [1]. Широко применяется
разделение интерполяционного преобразования на два независимых - сначала производится
интерполяция по строкам, а затем по столбцам [2,3]. Поэтому рассмотрим интерполяцию
изображения по строкам, интерполяция по столбцам производится по аналогичным
формулам в направлении столбцов изображения.
Известно, что при дискретизации непрерывного сигнала с частотой Котельникова,
вдвое превышающей максимальную частоту спектра этого сигнала, исходный непрерывный
сигнал может быть точно восстановлен путем пространственной фильтрации отсчетов с
помощью sinc фильтра с бесконечным носителем. В графических приложениях используется
оконный метод, при котором значение функции sinc(x) умножается на некоторую оконную
функцию. Главная задача при разработке такого фильтра - получить частотную
характеристику фильтра наиболее близкую к частотной характеристике идеального НЧ
фильтра. То есть фильтр должен пропускать сигнал с максимальным коэффициентом в
полосе низких частот и максимально подавлять сигнал боковых полос с тем, чтобы
уменьшить артефакты, вызванные наложением спектров. Одним из фильтров,
удовлетворяющих этим требованиям, является фильтр Ланкцоса (Lanczos). Импульсная
характеристика такого фильтра имеет вид:
ì
1
,
x=0
ï sin (px ) sin (px / N )
LanczosN ( x ) = í
, x¹0 и
p
x
p
x
/
N
ï
,
x³N
0
î
x<N .
(1)
Обычно применяют фильтры с малым числом боковых лепестков (N=2, N=3). Фильтры
Ланкцоса используются в таких программах как VirtualDub, IrfanView и др., реализованы на
процессоре семейства NeuroMatrix [4]. Основной недостаток таких фильтров возникновение
«звона», обусловленного отрицательными значениями коэффициентов боковых лепестков.
Однако при N=2 наличие отрицательных боковых лепестков приводит к подчеркиванию
верхних частот, повышая кажущееся разрешение изображения.
Распространенным видом интерполяции является полиномиальная интерполяция.
Использование полиномов низкой степени позволяет избежать многочисленных
нестабильностей, возникающих при применении полиномов высоких степеней. Но они не
являются гладкими кривыми. Полином третьей степени, называемый кубическим сплайном,
позволяет получать более высокое качество изображений при масштабировании. В [5]
введены двухпараметрические симметричные кубические сплайны, являющиеся гладкими в
смысле непрерывности значений функции и ее первых производных и сохраняющими
амплитуду выходного сигнала. Импульсные характеристики этих фильтров имеют вид:
ì
,
x <1
(12 - 9 B - 6C ) x 3 + (- 18 + 12 B + 6C ) x 2 + (6 - 2 B )
ï
1ï
3
2
(2)
k ( x ) = í(- B - 6C ) x + (6 B + 30C ) x + (- 12 B - 48C ) x + (8 B + 24C ) , 1 £ x < 2 .
6ï
0
,
иначе
ïî
Все BC—сплайны определяют локальный кубический сплайн на интервале между
двумя соседними отсчетами, используя еще 2 дополнительных отсчета: предыдущий и
последующий.
Сплайн (2) при B=C=1/3 получил название сплайна Митчелла – Нетравали (MitchellNetravali), а при B=0; C=0,5 — сплайн Кэтмулла-Рома (Catmull-Rom). Импульсные
характеристики этих сплайнов представлены на рис. 1. Они имеют отрицательные боковые
66
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
лепестки, более того, фильтр Кэтмулла-Рома имеет импульсную характеристику очень
близкую к импульсной характеристике Lanczos2.
Полифазная фильтрация. Интерполяционная формула имеет вид:
f (x ) =
2
å k ( x - n) f (n ) .
(3)
n = -1
В соответствии с (2) получаем формулы для вычисления коэффициентов полифазного
фильтра для сплайна Кэтмулла-Рома:
q1 (k ) = (- x3 + 2 x 2 - x ) 2
q 2 (k ) = (3x3 - 5 x 2 + 2 ) 2
(4)
q 3 (k ) = (- 3 x3 + 4 x 2 + x ) 2
q 4 (k ) = (x3 - x 2 ) 2
где x=t(k); x 2 = t 2 (k ) , x3 = t 3 (k ) , k― номер фазы.
Рис.1. Импульсные характеристики КИХ-фильтров k(x): сплошная- Catmull-Rom, пунктирная - MitchellNetravali; точками - Lanczos2.
Формулы для вычисления коэффициентов полифазного фильтра Ланкцоса при N=2:
sin px cos(px 2 )
q1 (k ) = p( x + 1) p( x + 1) 2
sin px sin (px 2 )
q 2 (k ) =
px
px 2
.
(5)
sin px cos(px 2)
q3 (k ) =
p(1 - x) p(1 - x ) 2
sin px sin (px 2 )
q 4 (k ) = p(2 - x) p(2 - x ) 2
Длина рассмотренных фильтров равна 4.
Получение коэффициентов полифазных фильтров при произвольном коэффициенте
масштабирования при реализации фильтра Ланкцоса (5) требует вычисления
тригонометрических функций, в то время как вычисление коэффициентов фильтра
Кэтмулла-Рома ограничивается операциями умножения, сложения и вычитания.
Алгоритм масштабирования с произвольным рациональным коэффициентом по
методу многоскоростной фильтрации, а именно - полифазной фильтрации, состоит в
следующем.
1. Определяется число подвыборок по алгоритму Евклида путем вычисления
наибольшего общего делителя двух целых чисел, соответствующих размерам входной и
выходной последовательности (строки/столбца).
67
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
2. Определяется число фаз делением выходного размера последовательности на число
подвыборок.
3. Определяется шаг по фазе делением 1 на число фаз.
4. Вычисляются 4 коэффициента импульсной характеристики фильтра для каждой фазы.
5. Осуществляется свертка 4 последовательных отсчетов входной последовательности с
импульсной
характеристикой,
определяемой
вычисленными
коэффициентами
полифазного фильтра для каждой фазы. Этот процесс может быть распараллелен.
6. Пункт 5) выполняется циклически для всей последовательности.
В качестве практического применения разработанного алгоритма выполним оценку
коэффициентов полифазных фильтров при преобразовании Industry standard в PAL для
фильтра Кэтмулла-Рома. При преобразовании ширины изображения из 768 элементов в 720
мы получаем 48 циклов по 15 фаз, шаг по фазе в пространственной области составляет
Dt = 0,0667 . Коэффициенты для интерполяции по строкам представлены в табл. 1.
Коэффициенты полифазных фильтров Кэтмулла-Рома для преобразования Industry standard в PAL
Таблица 1.
N фазы
tk
q1(k)
q2(k)
q3(k)
q4(k)
1
0,066667
-0,029037
0,989333
0,041778
-0,002074
2
0,133333
-0,050074
0,959111
0,098667
-0,007704
3
0,200000
-0,064000
0,912000
0,168000
-0,016000
4
0,266667
-0,071704
0,850667
0,247111
-0,026074
5
0,333333
-0,074074
0,777778
0,333333
-0,037037
6
0,400000
-0,072000
0,696000
0,424000
-0,048000
7
0,466667
-0,066370
0,608000
0,516444
-0,058074
8
0,533333
-0,058074
0,516444
0,608000
-0,066370
9
0,600000
-0,048000
0,424000
0,696000
-0,072000
10
0,666667
-0,037037
0,333333
0,777778
-0,074074
11
0,733333
-0,026074
0,247111
0,850667
-0,071704
12
0,800000
-0,016000
0,168000
0,912000
-0,064000
13
0,866666
-0,007704
0,098667
0,959111
-0,050074
14
0,933333
-0,002074
0,041778
0,989333
-0,029037
15
0
0
1
0
0
При масштабировании используются 4 последовательных отсчета входной строки,
номер стартовых отсчетов изменяется с шагом 1, при k Î [1,14] и с шагом равным 2 при k=15.
Заключение. Разработан алгоритм полифазной фильтрации для масштабирования
изображений с произвольным рациональным коэффициентом масштабирования.
Получены коэффициенты полифазного фильтра Кэтмулла-Рома и Ланкцоса при N=2.
Показано, что для реализации полифазной фильтрации с произвольным
коэффициентом масштабирования предпочтительно использовать сплайн Кэтмулла-Рома, не
требующий вычисления тригонометрических функций.
Библиографический список
1. Фисенко В.Т., Фисенко Т.Ю., Компьютерная обработка и распознавание изображений: учеб. пособие. СПб: СПбГУ ИТМО, 2008. – 192 с.
2. Федоров Д.А. Метод интерполяции цифровых изображений на основе дискретного вейвлетпреобразования // Научно-технический вестник, 2012, №79.
3. Фёдоров Д.А. Метод масштабирования изображений с целочисленным коэффициентом на основе
вейвлетного преобразования// Оптический журнал 2013, Т. 80. №3. C. 54-57.
4. Мушкаев С.В. Применение процессоров семейства NeuroMatrix для масштабирования
изображений//www.module.ru/upload/images/1354521441resampling.pdf.
5. D.P.Mitchell, A.N. Netravali. Reconstruction Filters in Computer Graphics// Computer Graphics, V. 22, N4,
August 1988, P. 221-228.
68
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
1
Фисенко В.Т., 2Вилесов Л.Д., 1 Можейко В.И., 3Фёдоров Д.А.,
1
Фисенко Т.Ю.
1
2
Филиал ОАО «Корпорция «Комета» - «НПЦ ОЭКН», г. Санкт-Петербург
Санкт-Петербургский Государственный университет аэрокосмического
приборостроения (ГУАП), г. Санкт-Петербург
3
Национальный Исследовательский Университет Информационных
Технологий, Механики и Оптики (НИУ ИТМО), г. Санкт-Петербург
Оценка эффективности дополненного сигматочечного фильтра Калмана в задачах
сопровождения маневрирующей цели
Реализованы модификации сигма-точечного фильтра Калмана. Произведена оценка
их эффективности в задачах сопровождения в случае аддитивного шума при
наличии/отсутствии
манёвра.
Выработаны
рекомендации
по применению
дополненного/недополненного сигма-точечного фильтра Калмана и стратегии
перевыборки сигма-точек.
Ключевые слова: дополненный сигма-точечный фильтр Калмана, сигма-точки, сопровождение,
калмановская фильтрация.
Введение. В задаче сопровождения объекта от точности оценки вектора состояния
зависит эффективность предсказания траектории объекта. В случае маневрирующего
объекта меняется характер его движения. Одним из решений задачи сопровождения является
использование фильтров Калмана. Расширенный фильтр Калмана (РФК) имеет ограничение
при нелинейном характере движения, связанное с тем, что использует линеаризованные
функции процесса и наблюдения системы. Сигма-точечный фильтр Калмана (СТФК),
впервые предложенныйм в [1], использует нелинейные функции процесса и наблюдения
системы напрямую.
Известны различные реализации и аспекты применения СТФК. В [2] исследовано
влияние сглаживания СТФК в задаче предсказания траектории объекта, что необходимо в
случае срыва сопровождения. Применение СТФК обеспечивает преимущество по сравнению
с РФК. На основании обзора литературы [3-9] можно выделить следующие основные
модификации СТФК:
1 СТФК дополненный или недополненный [4,5];
2 перевыбор сигма-точек производится или нет [5];
3 по способам выбора сигма-точек:
· оригинальная симметричная стратегия [1],
· симплекс метод [6],
· сферический симплекс метод [7];
4 по методу сглаживания результатов фильтрации:
· комбинирование прямого и обратного фильтра [8,9],
· по методу RTS [8,9];
5 по стратегиям обновления матриц ковариаций шумов.
69
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Цель данной работы — исследование поведения дополненного фильтра в случае
аддитивного шума и наличии манёвра объекта при сохранении или перевыборке сигматочек.
Рассматриваемые модификации сигма-точечного фильтра Калмана. В данной
работе исследованы четыре модификации СТФК: дополненный/недополненный фильтр, с
перевыборкой сигма-точек и без неё. Впервые СТФК был представлен в дополненном виде в
[1]. Дополненный фильтр может иметь преимущества в случае аддитивного шума [4]. В
недополненном виде фильтр может применяться только в случае аддитивного шума.
Пусть есть процесс c вектором параметров x, который описывается через матрицу
процесса F и матрицу наблюдения H с соответствующими шумами процесса и наблюдения
(w, v):
ìx k = F ( x k -1 ) + w
(1)
í
î y k = H ( xk ) + v
Дополненный СТФК определяется следующими шагами. Сначала расширяются вектор
параметров и ковариационная матрица процесса при помощи вектора шума и матрицы
ковариации шумов Q:
ì
x aug
= [x k ; 0; 0]
k
í aug
îPk , x = [Pk , x , 0, 0; 0, Q, 0; 0, 0, R ]
(2)
Затем в цикле, пока есть измерения y k , производится выборка сигма-точек. Сигма-точки
выбираются таким образом, чтобы сохранять значения математического ожидания и
ковариации:
ì
c k , 0 = x aug
k
ïï
aug
aug
í c k ,i = x k + ( lPk , x ) i ,
ï
aug
aug
ïîc k ,i + n = x k - ( lPk , x ) i
(3).
где i=1..n, а n — размерность xaug, ( lPkaug
, x ) i — i-я строка из квадратного корня матрицы
2
lPkaug
, x , l = a ( n + k) - n .
Масштабирующие коэффициенты задаются:
ì
W0M = l /(l + n)
ï C
2
íW0 = l /(l + n) + (1 - a + b)
ï W M = W C = 1 /( 2(n + l ))
1..2 n
î 1..n
(4)
где a, b, k — параметры выборки.
Выполняется этап предсказания:
ì
ï
c -k +1 = Fc k
ï
2n
ï
aug x
(Wi M c k ,i )
=
í
å
k +1
i =0
ï
2n
ïP aug - = W C (c - x aug - )(c - x aug - ) T
å
i
k ,i
k +1
k ,i
k +1
ïî k +1
i =0
(5)
Выполняется обновление, при необходимости делается перевыборка c k ,i .
70
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
2n
ì
y k = å Wi M (Hc -k +1 )
ï
0
ï
ï
C
T
í Pk , yy = å Wi ( y k ,i - y k )( y k ,i - y k )
ï
ï
C
aug T
ïPk , xx = å Wi (c k ,i - x k +1 )( y k ,i - y k )
î
(6)
x aug
и Pkaug являются входными данными для следующей итерации.
k
Осуществляется калмановская фильтрация:
ì
K = Pk , xy Pk-,1yy
ï aug
aug íx k = x k +1 + K ( y k - y k )
ï P aug = P aug - - KP K T
x ,k
yy
î x ,k
(7)
В случае недополненного фильтра и аддитивного шума измерения расширение (2) не
производится и матрицы Q и R входят слагаемыми в вычисление Pkaug
и Pk , yy
+1
соответственно.
Экспериментальная часть. При применении калмановской фильтрации в задаче
сопровождения мы производим раздельную обработку координат. Поэтому для сравнения
различных модификаций СТФК используем синтезированную одномерную параболу с
аддитивным нормальным шумом. Манёвр выражается в изменении ускорения на
определённом временном интервале. При проведении испытаний задаются следующие
параметры:
é1 1 1 / 2 ù
é1 1 1 / 2 1 0 0 0 ù
é1ù
ê
ú
ê
ú
aug
T
F = ê0 1 1 ú F = ê0 1 1 0 1 0 0ú H = êê0úú
êë0 0 1 úû
êë0 0 1 0 0 1 0úû
êë0úû
é1 ù
ê0 ú
ê ú
ê0 ú
ê ú
aug T
( H ) = ê0ú (8)
ê0 ú
ê ú
ê0 ú
ê1 ú
ë û
Матрицы ковариации шумов:
0 ù
é0,01 0
ê
Q = ê 0 0,01 0 úú; R = [25].
êë 0
0 0,01úû
(9)
Для оценки точности фильтрации используется среднее квадратическое отклонение
(СКО) данных, полученных на выходе фильтра, от тестовой кривой. Оценка СКО
производится по координате, скорости и ускорению в среднем за 100 симуляций. Для случая
монотонной параболы результаты приведены в табл. 1, при наличии манёвра ― в табл. 2.
Часть результатов представлена на рис. 1.
Оценка эффективности СТФК при отсутствии манёвра.
Таблица 1.
Не дополненный СТФК, перевыборка
Не дополненный СТФК, без перевыборки
СКОx
3,25
5,39
СКОv
0,90
6,40
СКОa
0,12
0,44
71
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Оценка эффективности СТФК при отсутствии манёвра.
Таблица 2.
Не дополненный СТФК, перевыборка
Не дополненный СТФК, без перевыборки
СКОx
40,54
4,18
а)
СКОv
23,16
40,21
СКОa
6,4
9,27
б)
Рис. 1. Результат фильтрации траектории недополненными фильтрами в случае а) без манёвра, б) с
манёвром.
Заключение. Реализованы четыре модификации СТФК и выполнена оценка их
эффективности в задаче сопровождения. Исследования показали, что в случае аддитивного
шума недополненный СТФК обеспечивает более точную оценку траектории. При наличии
манёвра использование фильтра без перевыборки обеспечивает более точную оценку
координаты, хотя на монотонных участках он даёт худшие оценки положения, скорости и
ускорения.
Библиографический список
1) J. Julier, K. Uhlmann A New Extension of the Kalman Filter to Nonlinear Systems// Proc. of AeroSense: The
11th Int. Symp. on Aerospace/Defense Sensing, Simulations and Controls, -1997.
2) Фёдоров Д.А. Исследование сигма-точечного фильтра Калмана в задачах сопровождения// Сборник
тезисов докладов III Всероссийского конгресса молодых учёных, выпуск №1. – Спб: НИУ ИТМО, c. 299300, 2014.
3) Gustafsson F. and Hendeby G. Some Relations Between Extended and Unscented Kalman Filters//IEEE
Transactions on Signal Processing, - Vol. 60, - No.2, - pp. 545-555, - 2012
4) Y. Wu, D. Hu Unscented Kalman Filtering for Additive Noise Case: Augmented vs. Non-augmented// American
Control Conference, - 2005.
5) Liu Ye, Yu AnXi, Zhu JuBo, Liang DianNong Unscented Kalman filtering in the additive noise case// Science
China Technological Sciences - Vol.53, - No. 4, - 2010.
6) J. Julier Scaled unscented transform// American Control Conference - Vol. 6, pp.4555 - 4559 - 2002.
7) G. Juan, R. Luis, A. Dzul, R. Lozano Spherical Simplex Sigma-Point Kalman Filters: A comparison in the inertial
navigation of a terrestrial vehicle// American Control Conference pp.3536-3541, - 2008.
8) S. Sarkka Unscented Rauch-Tung-Striebel Smoother //IEEE Transactions Automatic Control. - Vol.:53, – Issue:
3, - pp. 845-849, - 2008.
9) S Razali, K. Watanabe, S. Maeyama, K. Izumi An Unscented Rauch-Tung-Striebel Smoother for a Vehicle
Localization Problem// Journal of Advanced Computational Intelligence and Intelligent Informatics, - Vol. 15, - No.
7, - 2011.
72
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Кузьмин С.А.
Санкт-Петербург, СПб ГУАП
Интегральные показатели точности алгоритмов
обнаружения движущихся объектов
Аннотация – Описаны новые подходы в оценке точности алгоритмов обнаружения
движущихся объектов. C помощью этих подходов два показателя Рпо и Рлт
заменяются на один показатель.
Ключевые слова: обнаружение объектов, обнаружение движения, вероятность правильного
обнаружения, вероятность ложной тревоги, ROC
Задача оценки точности является одной из тем интенсивных исследований в каждой
технической науке. В информационном поиске, обнаружении сигналов, дистанционном
зондировании, компьютерном зрении обычной практикой является использование рабочей
характеристики приемника (ROC) для сравнения алгоритмов.
Один из обычных показателей точности – площадь под кривой (AUC) – показывает
среднее значение Рпо в полном диапазоне значений Рлт. Другой подход – использование
значение критерия, например значение Equal Error Rates (значение Рлт в точке ROC, где 1Рпо=Рлт). В случае низкого количества рабочих точек в измеренной ROC значения
критериев трудно измерить.
Предложенный подход основан на следующих предположениях [1]:
1) для лучшего алгоритма Рпо=1 и Рлт=0;
2) для худшего алгоритма Рпо=0 и Рлт=1;
3) для всех других алгоритмов Рпо находится в диапазоне между 1 и 0, и Рлт находится
в диапазоне между 0 и 1.
Можно написать уравнение прямой линии, которое описывает положения всех
алгоритмов:
Рпо + Рлт = 1
У этой линии совершенства алгоритма есть точка пересечения с кривой ROC. Эта
точка пересечения обозначается точка sum100 (единица равна 100 процентам).
Эти линия и точка имеют некоторые интересные особенности:
1) линия совершенства алгоритма перпендикулярна линии случайного выбора
Рпо = Рлт (случаю, когда отношение сигнал-шум SNR=0);
2) линия совершенства алгоритма связана с точкой, имеющей координаты Рпо=1,
Рлт=0. Видимо, это направление лучшего выбора (смотри предыдущий пункт);
3) обозначим, что точка sum100 имеет координаты Рпо*, Рлт*. Тогда эта точка
показывает то, сколько ложных тревог и правильных обнаружений среди 100
положительных решений.
Следующий шаг после вычисления линии совершенства алгоритма и обнаружения
точки sum100 - построение угла между осью Рлт и точкой sum100. Обозначим этот угол α.
Рисунок 1 демонстрирует ROC кривую, точку пересечения sum100, угол α.
73
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Тангенс α – отношение Рпо к Рлт (отношение вероятности правильных обнаружений к
вероятности ложных тревог). Синус α равен 0 в случае худшего алгоритма и 1 в случае
лучшего алгоритма. Синус α может быть использован как мера точности. Но функция синуса
имеет нелинейный график, а для оценки точности лучше использовать линейную функцию.
Предложенная мера точности - нормализованное значение угла α:
M 1 = a 90 = arctg (Рпо * / Рлт*) 90
Эта мера находится в диапазоне от 0 до 1.
Рпо
точка
Sum100
1
ROC
Рпо треб.
Рпо*
Рпо+Рлт=1
α
0
Рлт треб.
Рлт*
1
Рлт
Рис.1. Расчет меры точности M1 в точке пересечения sum100
Более простой способ оценить точность – вычислить отношение длины отрезка от
точки sum100 до точки (Рпо=0, Рлт=1) к длине линии совершенства (рис. 2):
M 2 = Рпо *2 + (1 - Рлт*) 2
12 + 12 = Рпо *2 + Рпп *2
2
В данной формуле Рпп*=1-Рлт* - вероятность (правильного) пропуска фонового
пикселя/объекта. Однако в силу линейной зависимости Рпо+Рлт=1 получается, что
Рпо*+Рлт*=1 и, следовательно, Рпо*=1-Рлт*. Из-за этого формула упрощается до
M 2 = Рпо *2 + (1 - Рлт*) 2
12 + 12 = Рпо *2 + Рпо *2
2 = Рпо * .
Рпо
1
ROC
Рпо треб.
Рпо*
точка
Sum100
0
Рлт треб.
Рлт*
Рпо+Рлт=1
1
Рлт
Рис.2. Расчет меры точности M2 как отношения длины отрезка после точки sum100 к длине всей линии
Рпо+Рлт=1
74
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Далее представлены результаты экспериментального сравнения трех алгоритмов
обнаружения движения с помощью показателя точности M1.
Первый сравниваемый алгоритм - простая межкадровая разность. Алгоритм имеет ряд
недостатков, но, как правило, используется в качестве одного из объединяемых алгоритмов.
Второй сравниваемый алгоритм - вычитание фона. Алгоритм намного точнее, но все
еще есть некоторые проблемы, например скорость обновления фона, «объекты-призраки». В
этой статье фон оценен с помощью фильтра Калмана, примененном в каждом пикселе в
направлении времени.
Третий сравниваемый алгоритм [2] - это объединение «двойной разности» и
обнаружения контуров. «Двойная разность» была популярна из-за низкой Рлт, но ей также
не хватает Рпо. Объединение «двойной разницы» с вычислением контуров, предложенное в
[2], значительно усовершенствовало его Рпо, но и сделало его более чувствительным к
шуму.
Для исследования были использованы реальные изображения с движущимися
автомобилями. ROC кривые были рассчитаны после измерения вероятности обнаружения
интересных пикселей. Они представлены на рис. 3. Координаты точек пересечения трех
алгоритмов: первый алгоритм Рпо=82.17%, Рлт=17.83%; второй алгоритм Рпо=93.45%,
Рлт=6.55%; третий алгоритм Рпо=92,63%, Рлт=7.37%. Рассчитанные углы α: первый
алгоритм 77.750, второй алгоритм 85.990, третий алгоритм 85.450. Нормализованный угол α
для трех алгоритмов: первый алгоритм M1(1)=0.8638; второй алгоритм M1(2)=0.9554; третий
алгоритм M1(3)=0.9494. Для второго показателя значения получаются меньше: первый
алгоритм M2(1)=0.8217; второй алгоритм M2(2)=0.9345; третий алгоритм M2(3)=0.9263.
Рис.3. ROC кривые для трех алгоритмов и их пересечения с линией совершенства алгоритма. Рпо и Рлт были
измерены в процентах
75
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Нахождение точки пересечения ROC и линии совершенства алгоритма — новый метод
для измерения точности. Преимущество предлагаемых мер точности: одно нормализованное
значение вместо двух (Рпо, Рлт). С одной стороны необычно сравнивать алгоритмы по
величине углов (обычный подход – сравнить Рпо при фиксированных Рлт) или по
относительной длине отрезка, но если рабочая точка находится далеко от требуемых
показателей точности, то это точка алгоритма с низкой точностью сегментации.
Библиографический список
1. Evaluation of Accuracy and Vizualization of Progress for Multiple-step Motion Detection Algorithms / S. A.
Kuzmin // Proceedings of the IEEE Russia. North West Section, Vol. 6, 2014. Pp. 34-36.
2. Cucchiara R., Piccardi M., Prati A., Scarabottolo N., Real-time Detection of Moving Vehicles// Proceedings of
10th International Conference on Image Analysis and Processing(ICIAP 99), Venice, Italy, Sept. 1999. Pp. 618-623.
Integral indicators of accuracy of the moving object detection algorithms
Kuzmin S.A.
Saint-Petersburg, SUAI
Annotation – New approaches for assessing the accuracy of moving object detection
algorithms are proposed. With these approaches two indicators true acceptance rate and false
acceptance rate are replaced by a single indicator.
Keywords: object detection, motion detection, true acceptance rate, false acceptance rate, ROC
76
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Кузьмин С.А.
Санкт-Петербург, СПб ГУАП
Этапы обработки видеоинформации для
достижения высокой точности сегментации
Аннотация – Описаны возможные этапы обработки изображений для
достижения требуемой точности сегментации. Эти этапы являются объединяющим
звеном для многих современных направлений теории компьютерного зрения, так как в
общем виде заданы лишь типы изображений и операций на ними, но конкретная
реализация этапов возможна с помощью многих известных алгоритмов.
Ключевые слова: обнаружение объектов, бустинг, многошаговая сегментация
В рамках направления усиления слабых классификаторов пикселей (бустинга) путем
многошаговой обработки рассматривается задача поиска всех возможных способов
обработки для двух случаев: случая одного алгоритма и случая объединения двух
алгоритмов. В ходе систематического анализа были определены варианты структур
обработки видеоинформации, которые можно использовать для получения бинарного
изображения, максимально близкого к изображению эталонного обнаружения.
Начальные обозначения: кадр изображения I ; бинарный эталон Ed , созданный
экспертом вручную (индекс d будет означать желаемый); полученное в ходе обработки
бинарное изображение Er (индекс r будет означать реальный); пороговая функция (п. ф.)
T ( x, y ) .
В случае использования одного алгоритма сегментации для условий априорной
неопределенности и мультимодальной гистограммы кадра нельзя сразу перейти от I к Ed
применением бинаризации с пороговой функцией T ( x, y ) = const , т.к. при
мультимодальной гистограмме кадра алгоритм сегментации получится смещенным (
Pлт > Рпо ). Надо изменить I (убрать фон и тени). Поэтому последовательность этапов
обработки такова (рис.1):
1) формируется изображение оценки фона Br ;
2) рассчитывается разница Dr =| I - Br | . Если оценка фона была идеальная
Br = Bd , то получим идеальное разностное изображение Dd , которое можно
преобразовать в Ed бинаризацией с пороговой функцией T ( x, y ) = const ;
3) если Br ¹ Bd , то изображения Br или Dr можно корректировать для получения
Ed в результате бинаризации разности кадра и оценки фона;
4) если применить порог бинаризации, не равный идеальному T ¹ Td , то получится
бинарное изображение Er ;
5) следовательно, либо пороговую функцию T ( x, y ) можно корректировать, либо
изображение Er можно корректировать для получения Ed .
Таким образом, в случае одного алгоритма сегментации есть пять типов операций
обработки видеоинформации:
1) операции с входным изображением I ;
2) операции с изображением оценки фона B ;
3) операции с разностным изображением D ;
4) формирование и коррекция пороговой функции T ( x, y ) ;
77
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
5) коррекция бинарного изображения Er .
Рис.1. Варианты структур в случае одного алгоритма сегментации
В случае объединения двух алгоритмов сегментации таких типов операций
(направлений исследований) уже тринадцать (рис.2):
1) операции с входным изображением I ;
2) операции с изображением оценки фона B ;
3) объединение изображений Cr (полутоновое изображение результата первого
алгоритма сегментации) и Dr (полутоновое изображение результата второго алгоритма
сегментации) до бинаризации. В результате получается полутоновое изображение Arx ;
4) коррекция объединенного полутонового изображения Arx до бинаризации. В
результате получается полутоновое изображение Arx' ;
5) операции с полутоновым изображением Dr . В результате получается полутоновое
изображение Dr ' ;
6) операции с полутоновым изображением Cr . В результате получается полутоновое
изображение Cr ' ;
7) объединение скорректированных изображений Dr ' и Cr ' до бинаризации. В
результате получается полутоновое изображение Ary ' ;
8) коррекция объединенного изображения Ary ' . В результате получается полутоновое
изображение Ary ' ' ;
9) формирование и коррекция пороговых функций T ( x, y )
с последующей
бинаризацией изображений Dr и Cr . В результате получаются бинарные изображения Er
и Fr ;
10) объединение бинарных изображений Er и Fr в изображение Erx ;
11) коррекция бинарных изображений Er и Fr . В результате получаются
изображения Er ' и Fr ' ;
12) объединение скорректированных бинарных изображений Er ' и Fr ' . В результате
получается изображение Erx' ;
13) коррекция объединенного бинарного изображения Erx' . В результате получается
изображение Erx ' ' .
78
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Рис.2. Варианты структур в случае двух алгоритмов сегментации
Интерес вызывает этап 3 – объединение полутоновых изображений результатов работы
алгоритмов сегментации до их бинаризации. В статье [1] найдено упоминание одного из
примеров такого направления. В цитируемой работе [2] был реализован алгоритм
79
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
сегментации, использующий перемножение результатов работы двух детекторов изменений
в пространстве (контуры) и времени (межкадровая разница), а затем бинаризацию
полученного изображения.
Практические исследования в [3] в виде последовательности этапов 1, 2, 9, 11, 12, 13
привели к реализации графика рабочих точек, показанного на рис.3. На графике рабочих
точек показаны рабочие характеристики приёмника (ROC) после каждого из этапов
обработки. Соединение рабочих точек образует траекторию движения к требуемым
показателям точности по Рпо и Рлт.
Рис.3. Реализуемый в [3] график рабочих точек. Цифрами указаны характеристики объединяемых
алгоритмов – движущихся областей и движущихся контуров
Библиографический список
1. D. Murray and A. Basu, Motion tracking with an active camera, IEEE Trans. on Pattern Analysis and Machine
Intelligence, Vol. 16, No. 5, May 1994, pp. 449-459.
2. P. D. Picton, Tracking and segmentation of moving objects in a scene, in Proc. 3rd Int. Conf. Image Processing
and its Applicat., Coventry, England, 1989, pp. 389-393.
3. Кузьмин С.А. Способы повышения точности выделения объектов в видеопоследовательностях
//Техническое зрение в системах управления 2012: Сборник трудов научно-технической конференции/ИКИ
РАН. М., 2012. С. 124-131.
The stages of video processing for achieving high accuracy of segmentation
Kuzmin S.A.
Saint-Petersburg, SUAI
Annotation – The possible stages of the image processing for achieving the required
accuracy of segmentation are described. These stages of processing are the unifying element
for many modern trends in the theory of computer vision, since only image types and
operations on them are generally given, but the specific implementation steps possible with the
help of many well-known algorithms.
Keywords: object detection, boosting, muli-step segmentation
80
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Березин В.В. 1, Зинкевич А.В. 2,Фахми Ш.С.1
1
Санкт-Петербургский государственный электротехнический
университет,
2
ХИИК ФГОБУ ВПО СибГУТИ, Хабаровск
Варианты реализаций дискретного вейвлет
преобразования на базе системы на кристалле.
Рассмотрены варианты аппаратной и программной реализации дискретного
вейвлет преобразования на нескольких уровнях для использования в системах на
кристалле.
Дискретное вейвлет преобразование, аппаратно-программная реализация, система на кристалле,
время выполнения, площадь кристалла, уровень реализации.
Современные устройства цифровой обработки данных являются ярким примером
мультимедийных приложений, которые требуют для реализации в портативных устройствах
значительные вычислительные ресурсы и минимальное энергопотребление. Толчком к
уменьшению стоимости конечных устройств стало повышение уровня интеграции ведущего
к системам на кристалле (СнК), которые объединяют интерфейс обработки и хранения
данных на одном кристалле кремния. Одним из важных аспектов проектирования СнК на
системном уровне является разнообразие вариантов реализации, доступных для каждого
узла в спецификации уровня задачи. Каждый узел может быть реализован несколькими
способами в аппаратных и в программных отображениях. При этом, чем больше различных
вариантов реализаций будет рассмотрено, тем точнее будет оценка критериев конечной
реализации задачи. В качестве примера рассмотрим задачу вычисления дискретного вейвлет
преобразования (ДВП) на базе СнК. ДВП может быть осуществлено различными способами
в зависимости от заданных критериев, таких как занимаемая площадь, быстродействие,
требуемый объем памяти и т.д. Все варианты решений можно разделить на три основных
уровня: алгоритм, преобразование и ресурсы.
1. Уровень алгоритма.
Для описания задачи могут использоваться несколько алгоритмов. Например, ДВП
может быть вычислено традиционно, используя свертку, или с применением схемы
лифтинга, что потребует меньшее количество вычислительных ресурсов, но внесет
ограничение на размер входной последовательности (кратной 2x).
2. Уровень преобразования.
Для выбранного ранее алгоритма возможно несколько преобразований, которые могут
быть применены для начального описания задачи. Такие преобразования могут включать,
например, замену операции умножения эквивалентной операцией сдвига или изменение
относительных позиций элементов задержки. Применяя первое преобразование, возможно
уменьшение занимаемой площади кристалла при сохранении того же самого времени
выполнения. Второе преобразование позволяет распределение по различным тактовым
циклам для получения лучшего использования ресурса и, следовательно, уменьшение
занимаемой области в течение того же самого времени выполнения. На рис.1 представлен
алгоритм реализации традиционной схемы вычисления одного уровня ДВП с фильтром (5,3).
При этом блок PEi, вычисляющий Xi и Yi , может быть выполнен либо с использованием
умножителей и сумматоров (1), либо с использованием сдвигателей и сумматоров (2).
Xi = hi×(Pi+qi)
Yi = gi×(Pi+qi)
(1)
81
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Xi = (Pi+qi) << hi
Yi = (Pi+qi) << gi
(2)
Для каждой реализации можно определить примерное количество тактов, за которое
операция может быть выполнена и ориентировочно занимаемое количество логических
ячеек. Если предположить, что занимаемая площадь умножителя amult= 10, сумматора aadd=1
и сдвигателя ashift = 3, а время выполнения каждой операции равно tmult=tadd=tshift=1 такт, то
можно показать, что выполнение по (1) займет: количество умножителей: 3 штуки;
количество сумматоров: 5 штук; занимаемая площадь: a=35. По (2) займет: количество
сдвигателей: 3 штуки; количество сумматоров: 5 штук; занимаемая площадь: a=14. При этом
общее время выполнения tобщ в обоих случаях будет равно.
Рис. 1 - ДВП на уровне преобразования с фильтром (5,3)
3. Уровень ресурсов.
Задача для указанного алгоритма и набора преобразования может быть осуществлена с
использованием различного количества вычислительных модулей. Типичными модулями в
данном примере являются сумматоры и умножители. Например, модуль PEi на рис. 1,
который выполняет сложение и умножение последовательных данных, в случае аппаратной
реализации может производить эти операции для различных коэффициентов hi и gi
последовательно или параллельно. При этом изменение модулей будет изменять значения
показателей конечной реализации (занимаемая площадь и время выполнения).
При реализации задачи на уровне программного обеспечения также могут применяться
различные стратегии синтеза. Так, например, последовательный код выполняется быстрее,
чем код, который использует вызов подпрограмм, но при этом он имеет больший размер.
Таким образом, существует обмен между размером кода и временем выполнения. На рис. 2
показан граф, описывающий вычисление одного уровня двумерного ДВП изображения 4×4
пикселя. Расписание описывает последовательность, в которой узлы должны быть
выполнены таким образом, чтобы в конце одного прохода через граф, число выборок на всех
дугах восстанавливалось к исходному состоянию (т.е. без накопления данных). Задачи D, E,
F, G не являются вычислительными, а характеризуют передачу данных в буфер. Варианты
некоторых возможных расписаний, отличающиеся по размеру кода и времени выполнения
показаны в таблице 1.
Таким образом, каждый узел в описании уровня задачи может быть осуществлен
несколькими способами или аппаратно или программно, что порождает множественные
реализации для каждой задачи. При проектировании на системном уровне имеется
множество таких задач, и общий проект в конечном итоге должен быть оптимизирован.
82
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Однако независимая оптимизация каждой отдельной задачи не всегда дает оптимальное
решение в рамках всей системы. Например, если каждая задача в спецификации реализуется
высокоуровневым аппаратным синтезом, который оптимизирован по скорости (то есть,
генерирует самую быструю реализацию), то занимаемая площадь кристалла может быть
довольно большой. В свою очередь, если задача реализуется только программно, занимаемая
площадь может быть минимальна. Выбор реализации для каждого узла должен быть таким,
чтобы выполнялись критерии при проектировании СнК.
Рис. 2 - Граф потока данных ДВП
Возможные варианты расписаний
Возможное расписание
AABBCC
A(2B)A(2C)
2A2B2C
Примечания
1
2
3
4
5
Размер кода
6c
4с
3c
Размер буфера данных
32b
12b
24b
Таблица 1
Время выполнения
6t
6t+4y
6t+6y
размер кода одного узла = c слов
размер кода для конструкций цикла = 0
время выполнения одного узла = t тактов
дополнительное время выполнение для цикла = y циклов
размер буфера на сообщение = b слов
Библиографический список
1. В.В. Березин, Ш.С. Фахми, А.В. Зинкевич. Метод распределения задач на аппаратные и программные
ресурсы. Вопросы радиоэлектроники. Сер., Техника телевидения. - 2011. - № 2. - С. 43-50.
2. В.В. Березин, А.В. Зинкевич. Метод распределения задач на аппаратные и программные ресурсы на
примере дискретного вейвлет преобразования. Телевидение: передача и обработка изображений. Тез. докл.
Международной конференции. Санкт-Петербург, 2011.
3. В.В. Березин, А.В. Зинкевич. Оптимальное распределение аппаратно-программных ресурсов при
проектировании систем на кристалле. Электронное научное издание «Ученые заметки ТОГУ». - 2011. - № 2.
- С. 21 – 25.
4. В.Немудров, Г.Мартин. Системы-на-кристалле. Проектирование и развитие. М.: Техносфера, 2004.
5. Г.Г. Штарк. Применение вейвлетов для ЦОС. М.: Техносфера, 2007.
Variants of implementations of discrete wavelet transform-based system-on-chip.
Berezin V.V., Fahmi Sh.S.
St. Petersburg State Electrotechnical University “LETI”
Zinkevich A.V.
HIIK FGOBU VPO SIBGUTI, Khabarovsk
The variants of the hardware and software implementation of the discrete wavelet
transformation on several levels for use in systems-on-chip.
Discrete wavelet transform, hardware-software separation, system-on-chip, time of execution, area of chip,
level of implementation.
83
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Березин В.В. 1, Зинкевич А.В. 2, Фахми Ш.С.1
1
Санкт-Петербургский государственный электротехнический
университет,
2
ХИИК ФГОБУ ВПО СибГУТИ, Хабаровск
Постановка задачи о рюкзаке как способ определения
аппаратной и программной составляющей при
реализации устройств в системах на кристалле.
Рассмотрена постановка задачи о рюкзаке для поиска решения оптимального
варианта аппаратной-программной реализации устройств в системах на кристалле.
Задача о рюкзаке, аппаратно-программная реализация, система на кристалле, время
выполнения, площадь кристалла.
Для описания математического подхода к решению аппаратно-программного
разделения представляется полезным взять за основу задачу о ранце (Knapsack Problem). В
качестве целевой функции применительно к системе на кристалле (СнК) выступает
производительность, а в качестве ограничений – площадь кристалла. Если используется
только аппаратная или только программная реализация, то задача вырождается в
тривиальный случай – в итоге получается только единственное значение целевой функции.
Гораздо более интересен смешанный случай, который модифицирует задачу о ранце.
Пусть для каждой i-той задачи имеется два варианта решения – аппаратный с
производительностью (временем выполнения)
и ресурсом
и программный, с
производительностью (временем выполнения)
и ресурсом
каждого i) необходимо выбрать или программyю (
,
. На каждом шаге (для
) или аппаратную реализацию
( , ), таким образом, чтобы максимализировать целевую функцию при ограничении
ресурса. Этому варианту соответствует задача о рюкзаке с мультивыбором (Multiple-choice
Knapsack Problem). Целью решения является получение такого набора задач, реализованных
аппартно и программно, чтобы получить минимальную (заданную) площадь кристалла при
минимальном (заданном) времени выполнения. Целевая функция сводится к следующему:
= ∑ =1 ∑ =1
∙ 0,1 →
= ∑ =1 ∑ =1
∙ 0,1 →
в случае нахождения оптимального решения, и к системе ограничений, в случае задания их
проектировщиком.
⎧
⎪
=1
=1
∙
0,1
≤
⎨
∙ 0,1 ≤
⎪
⎩ =1 =1
где ati – время выполнения задачи на элементарном процессоре;
asi – занимаемая площадь кристалла элементарного процессора;
Т – допустимое время выполнения узла;
S – допустимая площадь кристалла для узла;
х0,1 - наличие или отсутствие выполняемой задачи.
Эта задача известна как блочная задача о рюкзаке. Получение необходимых данных ati
и asi возможно за счет быстрого прототипирования системы на конкретной ПЛИС Для
84
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
применения этой задачи к методике распределения аппаратно-программных ресурсов СнК
под классом предметов понимается вариант решения i-той задачи аппаратный или
программный.
Блочная задача о рюкзаке имеет достаточно простую и наглядную интерпретацию
(выбор вариантов для частей некоторой системы с учетом общего ресурсного ограничения и
максимизацией общей «полезности» выбранных вариантов) и соответствует версии задачи
построения конфигурации системы.
Если в качестве бюджета учитывать не только площадь кристалла, занимаемого для
решаемой задачи, но и, например, размер оперативной памяти, то задача перейдет в
смешанный класс – блочная задача с многомерным рюкзаком.
При увеличении количества задач, а также различных вариантах их аппаратной и
программной реализации будет увеличиваться и количество возможных распределений,
которое можно определить как K=JN, где J – количество различных элементарных
процессоров; N – количество выполняемых задач.
Даже простейшая базовая постановка блочной задачи о рюкзаке является NP-трудной.
Список наиболее популярных методов решения задачи включает следующие:
1. Переборные точные методы (метод ветвей и границ, метод динамического
программирования и их комбинации).
2. Приближенные алгоритмы с гарантированной погрешностью (по целевой функции,
по ограничению (-ям)).
3. Генетические алгоритмы и многокритериальные эволюционные схемы решения
(evolutionary multiobjective optimization).
4. Эвристики/метаэвристики.
Автору неизвестны прецеденты решения о распределении доступных ресурсов в
системах на кристалле на основе решения блочной задаче о рюкзаке. Для анализа качества
результатов подхода используется точный переборный метод
Библиографический список
1. В.В. Березин, Ш.С. Фахми, А.В. Зинкевич. Метод распределения задач на аппаратные и программные
ресурсы. Вопросы радиоэлектроники. Сер., Техника телевидения. - 2011. - № 2. - С. 43-50.
2. В.В. Березин, А.В. Зинкевич. Метод распределения задач на аппаратные и программные ресурсы на
примере дискретного вейвлет преобразования. Телевидение: передача и обработка изображений. Тез. докл.
Международной конференции. Санкт-Петербург, 2011.
3. В.В. Березин, А.В. Зинкевич. Оптимальное распределение аппаратно-программных ресурсов при
проектировании систем на кристалле. Электронное научное издание «Ученые заметки ТОГУ». - 2011. - № 2.
- С. 21 – 25.
4. В.Немудров, Г.Мартин. Системы-на-кристалле. Проектирование и развитие. М.: Техносфера, 2004.
Statement of the knapsack problem as a way to detect the hardware and the software component
in the implementation of devices in SoCs.
Berezin V.V., Fahmi Sh.S.
St. Petersburg State Electrotechnical University “LETI”
Zinkevich A.V.
HIIK FGOBU VPO SIBGUTI, Khabarovsk
Considered staging the knapsack problem to find a solution optimal hardware-software
implementation of devices in SoCs.
Knapsack problem, hardware-software separation, system-on-chip, time of execution, area of chip.
85
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Березин В.В.1, Лабецкий А.В.1, Костикова Е.В.2, Фахми Ш.С.1
1
Санкт-Петербургский государственный электротехнический
университет,
2
Санкт-Петербургский государственный университет морского и речного
флота им. адмирала С.О. Макарова
Транспортные видеоинформационные системы:
Задачи сжатия и распознавания
Предложена обобщенная схема транспортной видеоинформационной системы.
Рассматриваются методы и технологий для решения задач анализа и передачи
видеоинформации при проектировании транспортных видеоинформационных систем
на основе технологии «система на кристалле».
Ключевые слова. Транспортные видеосистемы, сжатие и анализ изображения, системы на
кристалле.
В настоящее время видеоинформационная техника стремительно развивается по двум
основным направлениям. Одно из них составляет вещательное телевидение, второе
получило название прикладного телевидения, под которым понимается использование
телевизионных методов и средств в народном хозяйстве, научных исследованиях,
космической связи, на транспорте и т. д. [1].
Формирование единой информационной среды отраслей, в том числе и транспортной
[2], с целью обеспечения своевременного комплексного видеонаблюдения и управления
становится возможным только при интегрированном и системном подходе в создании
транспортных видеоинформационных систем (ТВИС). А также внедрение высоких
информационных технологий для контроля и управления при решении задач обеспечения
безопасности и обнаружения чрезвычайных ситуации.
К концу 2015 года ОАО «Газпром космические системы» планируется развить
существующую систему спутниковой связи и телевидения в полномасштабную
космическую информационную систему с целью оказания разнообразных спутниковых
услуг и создания современной наземной инфраструктуры. Ключевым элементом наземного
сегмента является телекоммуникационный центр в подмосковном Щелково [3].
Рост сложности антропогенных систем обострил проблему эффективного
взаимодействия человека с машиной, вызвав, тем самым, к жизни феномен негативного
влияния человеческого фактора на работу таких систем, оборачивающегося для
человечества, как правило, серьёзными материальными и людскими потерями. Возникла
острая необходимость создания эффективного «пользовательского интерфейса».
В широком толковании этого понятия пользовательский интерфейс должен
обеспечивать, в конечном счёте, безопасную эксплуатацию систем, в том числе и
транспортных, и сбережение материальных, людских и прочих ресурсов. К одному из
фундаментальных направлений развития пользовательского интерфейса принадлежит
интеллектуальным системам и аппаратная реализация системных функций, ранее
выполнявшихся человеком, чему в немалой степени способствует состояние современной
микроэлектронной базы, характеризуемое высоким уровнем интеграции электронных
компонент на одном кристалле.
86
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Важнейшим атрибутом интеллектуальных транспортных видеосистем является
применение умных IP-камер и устройств обработки видеоинформации, в анализе развития
которых уместно выделить мировоззренческие и системные аспекты [4].
Мировоззренческие получили широкое признание в робототехнике, в управлении
автономными наземными, подводными и воздушными аппаратами, в системах управления
производственными процессами различного назначения, в системах охраны промышленных,
оборонных и социальных объектов. В последнее время лицом к ним повернулась и
транспортная отрасль, свидетельством чего служит востребованность в захвате и доставке
видеоинформации в процессе управления транспортными системами. Предпринимались
попытки применения систем технического зрения в речном, и морском транспорте,
соответственно, для управления движением судов по информации о береговой черте и для
управления процессами швартовки и расхождения судов в открытом плавании. Этого, к
сожалению, не скажешь о железнодорожном и речном транспорте, где необходимость
применения систем технического зрения находится ещё в стадии осмысления, хотя вопросы
безопасности, например, охраны объектов железнодорожной инфраструктуры, управления
многопрофильным транспортным процессом стоят не менее остро, чем на других видах
транспорта.
Системные аспекты построения ТВИС порождены тенденцией приближения средств
обработки видеоинформации к источнику её возникновения, обусловленной
необходимостью принятия оперативного решения, интенсивным развитием средств синтеза
и анализа визуальных данных и появлением новой технологии «система на кристалле».
Обобщенная схема транспортной видеоинформационной системы
Возросший риск различного рода техногенных и экологических чрезвычайных
ситуаций обусловил необходимость решения новых задач исследований и разработок с
последующим внедрением принципиально новых методов и средств для своевременного
получения, обработки и доставки соответствующим органам видеоинформации в процессе
контроля и слежения за ситуацией на транспорте. Для решения вышеупомянутых задач
актуальным становятся развитие двух направлений при проектировании ТВИС (рис. 1): а)
передача больших объемов видеоданных с максимальным сжатием при допустимых
искажениях и, б) распознавание и выделение объектов при анализе изображений с целью
эффективного принятия решения в чрезвычайных ситуациях. При этом оба направления
необходимо реализовывать в реальном масштабе времени.
Рассмотрим методы решения этих задач:
Спектральный метод сжатия изображений. Востребованность в обработке, анализе и
передаче движущихся картин всегда была первоочередной задачей при решении вопросов
визуального контроля и наблюдения за значимыми объектами. В эпоху мультимедиа
появилась возможность оцифровки видеоинформации и её обработки в реальном времени.
В контексте необходимости декорреляции, видеосигнал как многомерная функция
имеет оптимальное разложение по всем своим аргументам. Другими словами, для
устранения временной корреляции нет существенных формальных оснований использовать
средства, отличающиеся от применяемых для пространственной декорреляции [5]. Кроме
того, известно, что для большинства практически значимых классов изображений
оптимальным (асимптотически оптимальным) по критерию минимума требуемого для
передачи количества информации при заданном уровне качества изображения является
трёхмерное дискретное косинусное преобразование (ДКП-3D).
87
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Требования транспортной
отрасли к ТВИС
Задача 1
Максимум сжатия
изображений
при заданной
ошибке
Обработка и
передача
информации
Обучение и
распознавание
Задача 2
Распознавание и
выделение объектов
изображения
Единая транспортная
база видеоданных
Рис. 1. Обобщенная схема ТВИС
С точки зрения вычислительной сложности кодирование на основе ДКП-3D
характеризуется примерно в 10 раз меньшими временными затратами в сравнении с
известным стандартом MPEG-2, это достигается в основном за счет отсутствия компенсации
движения по временной оси, а вместо неё применяется спектральное косинусное
преобразование. При аппаратной реализации подсистем сжатия и восстановления в составе
ТВИС дополнительно можно использовать возможности оптимизации программноаппаратных ресурсов с использованием технологии «систем на кристалле» [6].
Разработанный в институте проблем транспорта совместно с ОАО «НИИТ»
программный видеокодек на основе ДКП-3D характеризуется единым механизмом
декорреляции – трехмерным дискретным косинусным преобразованием.
К числу основных достоинств принятого в пользу ДКП-3D решения следует отнести:
универсальность метода по отношению к большому количеству классов изображений,
открывающая возможность оперативного регулирования «глубины вычислений» по
временной оси для создания ТВИС, адаптируемых к динамике изменения видеосюжета и
возможным изменениям требований ко времени реакции системы.
однородность
вычислений, позволяющая в дальнейшем оптимизировать
вычислительный процесс, аппаратные затраты и технологические аспекты реализации
подсистем сжатия и восстановления в составе ТВИС.
Пространственные метод анализа и распознавания. Другим немаловажным и
перспективным методом для анализа видеоинформации в области создания систем
технического зрения на транспорте является пространственный метод, применение которых
известно из задач распознавания образов и из задач восстановления двумерных изображений
по структурированным опорным точкам. Основные преимущества указанного метода
заключаются в следующем. Во-первых, структура опорных точек естественным образом
подстраивается под данные,– там, где отсутствуют объекты наблюдения опорных точек
меньше. А там, где есть объекты опорные точки – больше. Во-вторых, использование
рекурсивного подхода в процессе сжатия (то есть при поиске опорных точек) и
использованием триангуляции при декодировании, что позволяет распараллеливание
алгоритмов сжатия и передачи [7].
Огромное количество данных и сложный характер обработки видеоинформации делает
необходимым слияние достигнутых успехов в области вычислительной техники,
телевидения и техники связи при решении проблем развития транспортных систем и
технологии [8].
88
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Подсистемы передачи и анализа видеоинформации в составе ТВИС, предназначенной
для использования на транспорте должны отличаться высокой производительностью,
надёжностью и гибкостью. Всем этим требованиям удовлетворяют системы, построенные на
базе промышленных БИС/СБИС, спроектированных с использованием новейших
нанотехнологий со стандартными шинами интерфейсов связи с внешней средой.
Следовательно, для решения сложных и ответственных задач транспорта в реальном
времени, необходимо осуществить синтез видеосистем на основе современной технологии
«система на кристалле» [9] (рис. 2).
Транспортная постановка задачи
проектирования
ТВИС
Системное проектирование
- АО/ПО разбиение;
Библиотека
транспортной
отрасли
- моделирование;
- анализ производительности.
Уровень
системного
проектирования
Библиотека
моделей
производителей
СБИС
Верификация
Контроль функционирования системы
Да
Физический синтез (Топология)
Верификация
Генерация
тестов
Физический
Уровень
проектирования
(на кристалле)
Наноэлектронная реализация
видеосистемы
Рис. 2. Маршрут проектирования ТВИС
на базе технологии «система на кристалле»
Однако, специфика транспортных задач такова, что одновременно требуется
осуществить наблюдение и передача видеоинформации с высокой скоростью. Поэтому,
основные проблемы, стоящие перед разработчиками интеллектуальных ТВИС, – это:
а) использование эффективных методов передачи видеоинформации в реальном
времени;
89
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
б) разработка методов анализа сцены для эффективного принятия решения на основе
распознавания требуемых объектов изображения;
в) учёт ограничения ресурсов, продиктованных требованиями транспортной отрасли.
Влияние этих трёх факторов и следует учитывать при разработке ТВИС на базе технологии
«система на кристалле» (рис. 2).
В заключение можно выделить следующие основные выводы:
1) возможность распараллеливания алгоритмов предложенных методов сжатия и
анализа изображений, что является весьма актуальным и остро востребованным на
транспорте (органам управления важней принимать огромных потоков видеоданные о
чрезвычайных ситуациях в реальном времени);
2) рынок видеонаблюдения развивается безостановочно. Скорость, с которой
увеличивается число мегапикселей в матрицах видеокамер и объемы жестких дисков на
видеорегистраторах, говорит о все более жестких требованиях к транспортным технологиям
безопасности. В условиях подобной «гонки вооружений» ощутимым преимуществом для
производителя оказывается разработка и применение собственных технологий, созданных на
основе принципа «система на кристалле». В первую очередь, это транспортные
видеосистемы на кристалле с матрицами для аналоговых и цифровых камер и сетевых
видеорегистраторов;
3) преимуществами создания библиотек готовых модулей транспортной отрасли
являются возможность автоматизированной разработки различных специализированных
видеосистем наблюдения, контроля и мониторинга с использованием современной
технологии «система на кристалле» и наличие, по открытому лицензионному соглашению,
доступа к компонентам других библиотек радиоэлектронной промышленности РФ;
Список литературы
1. Зубарев Ю.Б., Дворкович В.П., Дворкович А.В. Проблемы и перспективы внедрения информационных
мультимедийных систем в России. Электросвязь. 2004. № 10.
2. Белый О.В. Проблемы построения и развития транспортных систем.- СПб.: «Элмор», 2012.-192 с.
3. http://www.gazprom-spacesystems.ru/ru/about/
4. Cisco Video Surveillance Manager Solutions Reference Guide. Cisco Systems, Inc. All rights reserved2008.
5. Chan Y-L., Siu W-C. Variable temporal-length 3-D discrete cosine transform coding // IEEE Trans. on image
proc. 1997. Vol. IT-6, № 5. P. 758–763.
6. Фахми Ш.С., Березин В.В, Зинкевич А.В. Эффективные способы использования последовательной
памяти в системах на кристалле// Вопросы радиоэлектроники, сер. Техника телевидения, 2013, вып. 1,
С.94-104.
7. Demaret L., Iske A. Adaptive image approximation by linear splines over locally optimal Delaunay
triangulations. IEEE Signal Processing Letters 13(5), 2006– pp. 281–284.
8. Зубарев Ю.Б, Сагдулаев Ю.С., Сагдулаев Т.Ю. Видеоинформационные технологии и систем связи.
Монография. М: Изд. «Спутник+», 2011.-296с.
9. Немудров В., Мартин Г. Системы на кристалле. Проблемы проектирования и развития. М.: Техносфера,
2004. – 216 с.
Transport videoinformation system: Tasks of compression and recognition
1
1
1
2
1
Berezin V.V.,Labetsky А.V., Kostikova E.V. ,Fahmi Sh.S.
St. Petersburg State Electrotechnical University “LETI”
Admiral Makarov State University of Maritime and Inland Shipping
The generalized scheme of the transport videoconferencing system. Discusses methods
and technologies for solving problems of analysis and transmission of video when video system
design of transport systems based on the technology of "system on chip".
Keywords: Transport video, compression and image analysis, system-on-chip.
90
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Березин В.В., Лабецкий А.В., Фахми Ш.С.
Санкт-Петербургский государственный электротехнический
университет «ЛЭТИ»,
Распознавание и определение параметров
объектов изображений
Рассматривается алгоритм распознавания и измерения параметров объектов
изображений для определения координат центра мишени и ошибок промаха и
параллакса при стыковке космических аппаратов.
Ключевые слова: Распознавание образов, измерение параметров объектов.
Развитие технологий твердотельного телевидения позволила повысить измерительные
возможности бортовых космических телевизионных систем и тем самым расширило круг
решаемых ими задач, включив в него задачи точного измерения полного вектора параметров
движения наблюдаемого космического аппарата в процессе сближения и стыковки [1].
Адаптивная телевизионная система, предложенная в [2], должна на разных этапах
сближения космического аппарата (КА), т. е. на разных дальностях, перестраивать чёткость
и кадровую частоту телекамеры так, чтобы частота передачи пикселов в кодер источника
была по возможности постоянной. При этом на большой дальности, когда масштаб
изображения приближающегося КА и его скорость в приборной системе координат весьма
малы, чёткость максимальна (все пикселы матрицы используются раздельно), а кадровая
частота минимальна [2].
При решении задач измерения промаха и параллакса важнейшим из блоков
телевизионной системы является устройство распознавания и измерения соответствующих
параметров стыковочного узла КА.
В работе [2] были исследованы и смоделированы алгоритмы сжатия, которые показали,
что ошибки измерения промаха (e1) и параллакса (e2) имеют соизмеримые значения, и их
раздельный учёт связан с тем, что критические значения дальности и коэффициента сжатия
для этих параметров имеют различные численные значения. При этом измерение промаха
возможно на существенно бóльших дальностях и при бóльших коэффициентах сжатия, чем
измерение параллакса.
Задача распознавания образов заключается в классификации объектов изображений на
основе определенных требований. Объекты, относимые к одному классу образов, обладают
общими свойствами. Требования, определяющие классификацию, могут быть разными, так
как в различных ситуациях возникает необходимость в различных типах классификаций,
например, в нашем случае, необходимо по заданным параметрам объектов определить
имеют ли форму окружности. При этом необходимо распознавать форму, найти центра и
соответствующие значения e1 и e2. Однако, чтобы решить задачу распознавания формы
расположения объектов, нужно в начале выполнить фильтрацию и уменьшение числа
градации яркости изображений.
91
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
К настоящему времени сделаны успешные попытки разработки устройств и машинных
программ для чтения типографских и машинописных букв, классификации
электрокардиограмм, распознавания слов из конечного словаря, произнесенных одним и тем
же диктором, а также выделение в речи ключевого слова, произнесенного разными
дикторами. Можно назвать еще ряд других применений распознавания образов:
идентификация людей по фотографии, по отпечаткам пальцев, по топометрическим данным,
диагностика неисправностей в системах, идентификация технологических параметров,
обнаружение цели и так далее [3].
Простейший подход к распознаванию образов заключается в сопоставлении с
эталонами. В этом случае некоторое множество образов, хранятся в памяти машины.
Исследуемый образ сравнивается с эталоном каждого класса. Классификация основывается
на заранее выбранном критерии близости. Более совершенный подход заключается не в
сравнении исследуемого образа с эталонами, а основывается на сравнении некоторых
специальным образом проведенных замеров объектов исходного изображения (длина и
ширина). Эти выполненные, на этапе анализа, замеры предполагаются инвариантными или
малочувствительными по отношению к элементам одного и того же класса, и далее такие
замеры будем называть признаками.
Описание алгоритма распознавания. Алгоритм распознавания и измерения центра
мишени включает следующие основные этапы (рис. 1):
а)
б)
в)
г)
Рис. 1. Процедура идентификации центра мишени
1) фильтрация и ввод числа градации яркости: эта задача заключается в определении
того, какие главные свойства объектов, которые могут играть роль признаков. Отметим, что
92
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
признаки могут иметь различную природу и значимость для задачи классификации, поэтому
отбор признаков и их упорядочивание основывается на важности этих признаков для
характеристики образов или на влиянии данных признаков на качество распознавания,
следовательно. В результате предварительного анализа и многократного проведения
эксперимента над различными изображениями, для решения задачи определения центра
мишени, получены следующие основные признаки: непрерывность, однородность, ширина и
длина объекта;
2) анализ областей (объектов) по заданным признакам: данная задача распознавания
образов заключается в классификации, т.е. в принятии решения о принадлежности объекта
требуемому классу;
3) нахождение центра тяжести всех объектов и определение координат центра мишени,
e1 и e2.
Наиболее трудоемкой задачей является задача второго этапа и для удобства его
рассмотрения приведем его краткое описание на примере разработанного Win-приложения с
использованием пошагового режима вывода промежуточных результатов анализа.
Анализ объектов исходного изображения выполняется по следующей схеме (рис. 1):
1) Исходное цветное изображение (рис. 1 а) преобразуется в черно-белое изображение
с заданным числом градации яркости (рис. 1 б),
2) формирование списков объектов по заданным признакам;
3) нахождение центры тяжести найденных объектов (рис. 1 в);
4) из полученных списков объектов находятся наиболее отдаленные по вертикали и по
горизонтали, затем вычисляется центр мишени (рис. 1 г).
Рис. 2. Окно приложения программы распознавания и измерения
параметров объектов изображения
Заключение. Моделирование предложенного алгоритма распознавания для
определения параметров объектов по заданным признакам мишени было выполнено в среде
Builder С++ окно приложения которого представлено на рис. 2.
93
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Результаты работы программы над изображениями, сжатыми различными методами и
исследование зависимости степени сжатия от ошибки e1и e2 показывают, что ошибки
измерения параметров объектов изображений имеют прямую зависимость от способа
кодирования и декодирования и лучшие результаты были получены при использовании
методов кодирования изображений без перехода в спектральную область сигнала. В
результате эффективность алгоритма распознавания достигается ценой увеличения
сложности в среднем в 2-3 раза [4].
Библиографический список
1. Цыцулин А. К. Телевидение и космос. – СПб: СПбГЭТУ «ЛЭТИ», 2003.–228 с.
2. Манцветов А.А., Зубакин И.А., Козлов В.В., Фахми Ш.С., Цыцулин А.К. Адаптация космической
телевизионной системы к этапам наблюдения объекта// Вопросы радиоэлектроники, сер. Техника
телевидения, 2012, вып. 1, с.29-43.
3. Ту Дж., Гонсалес Р. Принципы распознавания образов. Пер. с англ. – М.: Мир, 1978 – 414 с.
4. Фахми Ш.С. Кодирование и декодирование видеоинформации // Вопросы радиоэлектроники, сер.
Техника телевидения, 2007, вып. 2, с.43 – 51.
Algorithm of recognition and measurement of parameters of images objects
Berezin V.V., Labetsky А.V.,Fahmi Sh.S.
St. Petersburg State Electrotechnical University “LETI”
The algorithm of recognition and measurement of parameters of objects of maps for
definition of coordinates of centre of a target and errors of a miss and a parallax is
considered{examined} at joining space vehicles.
Keywords: Pattern recognition, measurement of parameters of objects.
94
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Секция 3. Телевизионные системы специального
назначения
Руководитель секции – д.т.н., проф. Б.С. Тимофеев (СПбГУАП)
Зам. руководителя – аспирант. С.В. Очкур (СПбГЭТУ "ЛЭТИ")
Секретарь секции – аспирант А.А. Чиркунова (СПбГЭТУ "ЛЭТИ")
СПбГЭТУ «ЛЭТИ», 2-й корп., пом. 2405
В. И. Челпанов, Н. П. Корнышев, А. В. Кузнецов, С. Б. Торицин
ОАО «НИИПТ «Растр», Великий Новгород, [email protected]
Первые промышленные телевизионные
установки
Рассматриваются первые отечественные промышленные телевизионные
установки, приводятся их технические характеристики и конструктивные
особенности
Безусловно, первые телевизионные системы прикладного назначения, как
отечественные, так и зарубежные, стали появляться практически одновременно с
вещательными телевизионными системами. Однако, промышленная телевизионная
аппаратура, чтобы стать, действительно, промышленной, должна была выпускаться серийно.
В этой связи необходимо отметить, что рождение отечественного промышленного
телевидения напрямую связано с одним из первых предприятий радиоэлектронной
промышленности в Великом Новгороде – НПО «Волна». Строительство предприятия (завод
п/я 11) было начато в 1948г., как первого крупного современного производства средств
радиосвязи. 7 февраля 1952 г. сборочный цех завода выпустил свои первые изделия –
гетеродинные волномеры, собранные из узлов, изготовленных на ленинградском
радиозаводе им. Козицкого. Затем на новгородский завод было передано производство
судовых передатчиков для рыбного флота, налажен выпуск мощных блоков питания для
судовых радиостанций, другой аппаратуры радиосвязи. В июле 1957 г. завод п/я 11 был
передан управлению радиотехнической промышленности Ленсовнархоза. Тесные
производственные контакты и освоение ряда разработок Всесоюзного научноисследовательского института телевидения (ВНИИТ, г. Ленинград) резко увеличило
нагрузку на отдел главного конструктора завода, и в 1958 г. на базе центральной заводской
лаборатории было образовано особое конструкторское бюро (ОКБ).
На ОКБ были возложены задачи модернизации изделий ранее выпускаемых заводом,
оказания помощи основному производству в освоении изделий, передаваемых от ВНИИТ,
разработки новой телевизионной техники, необходимой народному хозяйству страны:
замкнутых системы видеонаблюдения для промышленных предприятий. Позже это
направление телевизионной техники в отличие от аппаратуры вещательного телевидения
получило название «аппаратура промышленного телевидения».
Первыми отечественными промышленными телевизионными установками (ПТУ),
серийно освоенными в 1959г. предприятием п/я 11, стали диспетчерская телевизионная
95
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
установка ДТУ, а также установки ПТУ-0М1, ПТУ-2М, ПТУ-3, ПТУ-4 (рис. 1,2),
разработанные во ВНИИТ (главный конструктор Полоник В. С.).
Рис.1. Приборы диспетчерской телевизионной установки ДТУ: слева ‒ телевизионная камера на суперортиконе
с устройством наведения, в центре ‒ пульт управления, справа ‒ выносное видеоприемное устройство с
выносным пультом управления
Рис.2. Общий вид установки ПТУ-2М на базе видиконной камеры
В ДТУ и ПТУ-3 были использованы суперортиконы, обеспечивающие
чувствительность до 25 лк на объекте, а в ПТУ-0М1, ПТУ-2М, ПТУ-4 были использованы
первые видиконы, обеспечивавшие работу при освещенности на объекте до 250 лк.
Разрешающая способность камер на суперортиконах в центре составляла до 550 т. л., а для
видиконных камер ‒ 450-500 т. л. Диапазон рабочих температур от − 20 до +40 °С. Длина
линии связи от 1 до 1,5 км. В аппаратуре использовался в основном объемный монтаж.
Опытный образец диспетчерской телевизионной установки (ДТУ-18) демонстрировался на
первой советской промышленной выставке в Нью-Йорке в 1958г.
С 60-х годов ХХ века в серийное производство начинают поступать собственные
разработки ОКБ, которое становится основным создателем в стране серийно способной
многоцелевой промышленной телевизионной аппаратуры для оснащения важных для
государства отраслей промышленности: металлургической, горнорудной, химической,
железнодорожного и водного транспорта.
Одними из первых разработок ОКБ стали прикладные телевизионные установки для
атомного ледокола «Ленин», а также для Воронежской и Белоярской атомных станций
(1958-1963гг.).
В конце 50-х гг. на базе ПТУ-2М, ПТУ-4 и ДТУ-18 в ОКБ была проведена разработка
ПТУ-101, ПТУ-102, ПТУ-103 (соответственно, одно-, шести- и двенадцатикамерной ПТУ на
базе суперортиконов), а в начале 60-х ‒ ПТУ-22, 23 и 24 (соответственно, одно-, пяти- и
десятикамерной ПТУ на базе видиконов) для наблюдения за производственными
процессами в различных отраслях народного хозяйства (главный конструктор ОКР Богданов
Г. М.). Перечисленные выше установки принято относить к первому поколению ПТУ
(рис.3).
В дальнейшем ПТУ-22, 23, 24 прошли модернизацию и выпускались в 60-х годах ХХ
века. В модернизированной аппаратуре широко использовался печатный монтаж, набор
96
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
стандартных блоков, в связи с чем, ее можно рассматривать, как переходный этап (так
называемый 1+) к следующему поколению ПТУ.
ПТУ-22, 23, 24 имели следующие технические характеристики. Диапазон рабочих
температур от − 40 до +40 °С (с водоохлаждаемым кожухом ‒ до +150 °С). Разрешающая
способность 450-500 т. л. Впервые были успешно использованы на Ижорском заводе и
рекомендованы к серийному производству.
На базе полученного опыта в ОКБ начинают развиваться новые направления
телевизионной техники: телевизионное оборудование для особо опасных и экстремальных
условий эксплуатации, телевизионная аппаратура для летных тренажеров, телевизионные
системы для наблюдения и охраны, в том числе, для ВМФ и для наземных стартовых
комплексов, рентгенотелевидение, системы телевизионного контроля при сварочных
работах, телевизионная автоматика.
Рис.3. Общий вид установки ПТУ-24
В 1975 году конструкторское бюро было определено головным разработчиком
телевизионных систем и аппаратуры для промышленности и народного хозяйства. В 1976
году был введен Государственный стандарт ГОСТ 22006-76 «Установки телевизионные
прикладного назначения».
В 1982 году на базе конструкторского бюро был создан отраслевой научноисследовательский институт – институт промышленного телевидения «Растр» (НИИПТ
«Растр»), первым директором которого по 2007г. включительно стал к.т.н. Владимир
Петрович Кузьмин. В.П. Кузьмин внес весьма значительный вклад в развитие
отечественного промышленного телевидения, начиная с самого основания ОКБ. С 1962 по
1979г. В.П. Кузьмин работал главным инженером ОКБ, а с 1979г. – его директором, являясь
основным идеологом по перспективным направлениям техники промышленного
телевидения. В.П. Кузьмин был главным конструктором ряда ПТУ и удостаивался медалей
ВДНХ за разработку, в частности, ПТУ «Контроль» (1963г.), ПТУ-28 (1972г.), ПТУ45, ПТУ46 (1979г.).
Принято различать 4 поколения аппаратуры промышленного телевидения. Критерием
здесь является элементная база и конструкторское исполнение. К первому поколению
относят аппаратуру на радиолампах, ко второму – на транзисторах, к третьему – на
97
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
транзисторах и микросхемах общего применения, к четвертому – с использованием
микросхем высокой степени интеграции и микропроцессоров.
В настоящее время в связи с новой элементной базой: ПЗС и КМОП фотоприемников с
высоким разрешением и чувствительностью, LCD – экранов, а также в связи с применением
в телевизионных системах микро-ЭВМ и ПЭВМ со специализированным программным
обеспечением и аппаратной поддержкой можно говорить о постепенном переходе к
следующему, пятому поколении ПТУ.
ПТУ принято считать системами замкнутого (закрытого) типа, в которых передача
видеосигналов осуществляется по кабельным линиям связи для ограниченного числа
потребителей.
Как правило, ПТУ состоят из номенклатурного набора приборов, к которым относятся
телевизионные камеры, устройства наведения, пульты управления, линейные усилители,
усилители-распределители видеосигнала, видеопросмотровые устройства, блоки питания и
т. п. ПТУ часто дополняются устройствами совмещения изображений (квадраторами),
устройствами видеозаписи (видеорегистраторы). В настоящее время функции
видеопросмотровых устройств, квадраторов и видеорегистраторов возлагаются, в том числе,
на ПЭВМ, имеющих соответствующие аппаратные и программные средства.
Набор стандартных блоков позволяет гибко проектировать замкнутые телевизионные
системы для различных задач видеонаблюдения, а также предлагать потребителям готовые
варианты поставок ПТУ. Данный подход полностью реализуется со второго поколения ПТУ,
созданных в конце 60-х годов ХХ века (группы установок: ПТУ-28, ПТУ-29, ПТУ-30, ПТУ31, ОКР «Комплекс ПТУ», главный конструктор ОКР Богданов Г. М.).
ПТУ третьего поколения были созданы в середине 70-х годов (ПТУ серии «Планета»,
главный конструктор ОКР «Планета» Милюков В. Е.), а четвертого поколения (ПТУ серии
«Орбита», главный конструктор ОКР «Орбита» В. И. Челпанов) – в конце 80-х годов ХХ
века и серийно выпускались в НПО «Волна».
Выводы
1. Промышленные телевизионные установки (ПТУ) создавались, как серийно способные
многоцелевые телевизионные системы для оснащения важных для государства отраслей
промышленности: металлургической, горнорудной, химической, транспорта и т.п.
2. Основные направления, области применения, а также принципы построения ПТУ,
заложенные уже в первых разработках аппаратуры, остаются в настоящее время
актуальными и являются базой при проектировании современных телевизионных систем для
промышленного применения.
Литература
1. Андреева Е.В. Телевизионные аппаратно-программные комплексы для криминалистических
исследований / Е.В. Андреева, В.В. Бутусов, Н.П., Корнышев, В.П. Кузьмин, Н.С. Никитин, В.И.
Челпанов//Вопросы радиоэлектроники, сер. «Техника телевидения», Санкт-Петербург. 2008. №2. С.50-57.
2. Челпанов В.И. ОАО «НИИПТ «РАСТР»: Традиции и инновации. Вестник новгородского
государственного университета 2011, №65, С.106-109.
98
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Толочков Дмитрий Викторович
ЗАО «МНИТИ», г. Москва
«Автоматическое определение основных
параметров стереосъемки»
Аннотация. В статье описан способ разработки стереоскопических
телевизионных систем с возможностью естественного восприятия глубины
изображаемого пространства. Способ позволяет определить необходимые основные
параметры стереосъемки на основе экспериментально определенных линейных
параллаксов.
Ключевые слова. Стереоскопическая система, стереопара, базисное расстояние, угол
конвергенции, параллакс, компьютерная 3D графика.
Во время съемки стереоскопического видео или фотоматериала для достижения
необходимого эффекта глубины передаваемой сцены следует правильным образом
выставлять основные параметры стереосъемки. Под основными параметрами стереосъемки
(ОПС) будем понимать фокусное расстояние объективов (f’), базисное расстояние (B) и угол
конвергенции осей визирования (β). Для наглядности на рисунке 1 представлена схема
расположения каналов стереокамеры с системой координат.
Рис. 1
Восприятие глубины сцены, визуальное восприятие расстояний до предметов,
определяется такими функциями зрительного аппарата человека как конвергенция и
аккомодация. Конвергенцией можно управлять с помощью углового параллакса стереопар
(α) (см. рисунок 2), который в свою очередь определяется следующими техническими
параметрами стереоскопической системы: основные параметры стереосъемки (фокусное
расстояние, базисное расстояния, угол конвергенции), размер элемента датчика
изображения, формат датчика изображения, размер элемента стереоскопического монитора,
формат монитора, расстояние от наблюдателя до стереоскопического монитора.
Среди перечисленных величин регулировки во время съемки поддаются лишь ОПС.
Сформулируем задачу, какие значения должны иметь ОПС для того, чтобы
наблюдатель воспринимал глубину изображаемого пространства естественным образом, т.е.
99
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
расстояния до предметов ему казались такими же, как если бы он видел сцену своими
глазами.
В качестве рекомендации в литературе встречается правило «70 минут», т.е. ОПС
выбирается таким образом, чтобы угловой параллакс не превосходил 70 минут [1,2]. Но
данное правило не дает возможности проверить угловые параллаксы на всех дальностях по
всей глубине пространства.
Для возможности моделирования стереоскопической системы на необходимой глубине
пространства был проведен эксперимент по определению значения параллакса в плоскости
экрана стереоскопического монитора в заданном диапазоне дальностей наблюдения.
С помощью специального программного обеспечения (СПО) StereoModel v0.6 и
стереоочков NVIDIA 3D [3] участнику эксперимента демонстрировался специальный
видеоматериал на стереомониторе Acer GD245HQ. Видео материал представлял собой
отрендеренные стереопары виртуальных кубов, расположенные в трехмерном пространстве
посредствам технологии DirectX. Рядом с виртуальным кубом сквозь затворные очки
участник эксперимента может одновременно наблюдать реальный куб, меняя положение
виртуального куба, участник эксперимента может фиксировать момент, когда, по его
мнению, дальность до передней грани кубов совпадает. СПО автоматически измеряет и
выводит на монитор значение параллакса передней грани куба. В результате эксперимента
получается график зависимости линейного параллакса в плоскости экрана
стереоскопического монитора (р) от дальности до объекта наблюдения (ZК).
Рис. 2
Ход эксперимента поясняет рисунок 2, где изображена плоскость стереоскопического
монитора (поз.2), стереопара виртуального куба (поз.1), реальный куб (поз.3), положение
глаз УЭ (поз.4), р – линейный параллакс, α – угловой параллакс, Zм - расстояние между
наблюдателем и плоскостью стереоскопического монитора (Zм = 500 мм), Zк - дальность до
объекта наблюдения.
В эксперименте принимали участие 4 человека. Усредненные результаты зависимости
р(Zк) приведены на рисунке 3.
100
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Рис.3
Полученные результаты были использованы в программе автоматического
определения основных параметров стереосъемки (ПАОПС).
Принцип определения ОПС основан на применении экспериментально полученных
значениях параллаксов, при которых оператор наблюдает виртуальное объемное
изображение с естественной передачей восприятия дальности до предметов. Программа
подбирает, исходя из начальных условий, наиболее подходящие значения ОПС, при которых
стереокамера будет обеспечивать требуемые параллаксы на заданных расстояниях
наблюдения. На рисунке 4 представлен интерфейс ПАОПС.
Рис. 4
Суть алгоритма ПАОПС сводится к подсчету параллаксов для всех значений ОПС с
заданным шагом и определенными начальными условиями. С помощью уравнения (1)
рассчитывается положение изображения точки на оси Х в плоскости приемника излучения
левого канала (см. рис. 1).
(1)
)∗
)∗ )
∗ (cos(
+ 2 − sin(
=
)∗
)∗
− sin(
+ 2 − cos(
С помощью уравнения (2) рассчитывается положение изображения точки на оси Х в
плоскости приемника излучения правого канала (см. рис. 1).
(2)
)∗
)∗ )
∗ (cos(
− 2 + sin(
=
)∗
)∗
+ sin(
− 2 − cos(
Значение линейного параллакса определяется по формуле (3)
101
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
=
−
(3)
Каждый раз при расчете параллакса для определенного расстояния наблюдения
происходит его сравнение с экспериментальным значением. При совпадении с учетом
допуска, такой набор ОПС запоминается в отдельный массив. Далее каждый элемент
массива проверяется на начальные условия в отношении возможности динамического
изменения и удовлетворения всему диапазону дальностей наблюдения. Результаты
фильтрации выводятся в графическом виде. При фиксации всех ОПС, решение выглядит, как
изображено на рисунке 5.
Рис. 5
При разработке стереоскопической системы становится ясно, какие значения должны
принимать ОПС, чтобы наблюдатель естественным образом воспринимал заданную глубину
передаваемого сюжета. Следует отметить, что выполнение данного условия особенно
принципиально в роботизированных системах, где оператор управляет манипуляторами,
ориентируясь по стереоскопической системе технического зрения.
Одина из полученных конфигураций была проверена в программе StereoModel v0.6, в
которой можно моделировать работу виртуальной видеокамеры. Компьютерная модель
воссоздала стереоскопическую камеру с полученными значениями ОПС. В результате,
повторив описанный выше эксперимент, визуально можно было убедиться в том, что
восприятие дальности по стереоскопическому изображению и при наблюдении сцены
естественным образом совпадает.
Список литературы.
1. Н.А. Валюс. Стереоскопия - М.: Издательство академии наук СССР, 1964г.
2. http://3dtv.at
3. http://www.nvidia.ru/
Tolochkov Dmitry
ZAO «MNITI»
Annotation. In this article is described a method for development of stereoscopic
television systems with the feature of natural depth perception of shown imagery. The method
lets you detect the necessary main parameters of stereoscopic capture based on experimentally
found linear parallaxes.
Keywords. Stereoscopic system, stereo-pair, basic distance, angle of convergence, parallax, computer 3d
graphics.
102
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Слюсаренко С.А.
ЗАО «МНИТИ»
Компьютерное моделирование виртуальной
стереокамеры
В статье рассмотрен процесс моделирования работы виртуальной
стереоскопической камеры средствами Direct3D с целью определения оптимальных
параметров стереосъемки. Описаны программные средства, используемые при
разработке программного обеспечения, включая краткое описание шейдеров.
Ключевые слова: стереосъемка, стереокамера, компьютерное моделирование, 3D графика, буфер,
шейдер
При просмотре стереоскопического контента очень важно, чтобы наблюдатель
воспринимал глубину изображаемого пространства естественным образом, т.е. расстояния
до предметов ему казались такими же, как если бы он видел сцену своими глазами. Съемка с
неправильно выбранными параметрами может вызывать у наблюдателя дискомфорт и
усталость. Разработанное программное обеспечение моделирует работу виртуальной
стереокамеры, позволяя произвольно менять основные параметры стереосъемки (фокусное
расстояние объективов, базисное расстояние и угол конвергенции осей визирования).
Главная задача разработанного программного обеспечения состоит в определении
линейного параллакса стереопар, при которых наблюдатель может наблюдать сцену, не
испытывая при этом дискомфорт. Трехмерная сцена, моделируемая программой,
представляет собой набор графических примитивов (кубов), расположенных в разных
местах сцены.
Одной из самых распространенных технологий отображения стереоскопической
информации является Nvidia 3D Vision — технология стереоскопического проецирования,
разработанная компанией Nvidia. В технологии NVIDIA 3D Vision используется затворный
метод разделения изображений для левого и правого глаз. Изображения проецируются
поочередно, а в активных очках смонтированы ЖК-затворы, которые синхронно с
проектором поочередно закрываются, позволяя каждому глазу видеть только своё
изображение. Сигнал синхронизации передаётся на очки посредством инфракрасного
излучения. Для получения 3D изображения необходим монитор или проекторы,
поддерживающий частоту 120 Гц, ПК с графическим процессором NVIDIA GeForce и одна
или несколько пар очков NVIDIA 3D Vision.
Программное обеспечение написано на языке программирования C++
с
использованием интерфейсов прикладного программирования (API) DirectX и NvAPI.
DirectX представляет собой набор классов, функций и структур, обеспечивающих
высокоэффективное выполнение задач, возникающих при разработке мультимедийных
приложений. К таким задачам можно отнести загрузку и отображение трехмерных моделей.
Direct3D один из компонентов DirectX, отвечает за вывод двухмерной и трехмерной графики
на экран. Компания NVIDIA предоставляет комплект средств разработки (SDK),
позволяющий разработчику управлять режимами работы графического процессора (в том
103
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
числе и стереорежимом), а также драйвером видеокарты. SDK носит название NvAPI,
распространяется бесплатно и доступен для скачивания с официального сайта NVIDIA
вместе с англоязычной документацией. NvAPI совместим с операционными системами
Windows Vista/7/8, 32 и 64 бита.
На рис. 1 представлена структурная схема программы. Приложение состоит из
создания окна средствами WinAPI, инициализации Direct3D, функции рендеринга
(визуализации) и функции очистки памяти.
Рис. 1
Вывод графической информации в Direct3D устроен следующим образом:
изображение рисуется не на экране, а в памяти компьютера, в так называемом вторичном
буфере (back buffer). Имеется также первичный буфер, его содержимое пользователь видит
на экране. Как только построение во вторичном буфере завершилось, буферы меняются
местами, вторичный буфер становится первичным (и отображается на экране), а первичный
становится вторичным, и изображение следующего кадра строится уже в нем. Этот подход
называется двойной буферизацией. Для подготовки Direct3D и NvAPI к работе необходимо
выполнить следующие действия:
· инициализировать NvAPI и включить поддержку 3D режима;
· создать устройство Direct3D 10 (device); этот объект производит рисование кадров в
указанный буфер визуализации;
· создать цепочку переключений (swap chain), которая содержит первичный и вторичный
буферы и отвечает за смену кадров;
· связать устройство Direct3D 10 и указатель на блок памяти, в котором хранятся
параметры стерео (stereohandle);
104
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
· создать объект представления данных как вторичного буфера визуализации (render target
view). Представление данных это аналог приведения типов переменных; одну и ту же
область памяти можно рассматривать как массив данных целого типа, либо как массив
данных с плавающей точкой и т.д. Буфер в цепочке переключений представляет собой
обычную текстуру, она также может содержать данные различного рода; представление
данных позволяет связать вторичный буфер с устройством, чтобы оно могло выводить в него
изображения кадров;
· установить область отображения (viewport), с помощью которой можно определить,
какую часть вторичного буфера можно использовать для вывода графики.
Трехмерные объекты в Direct3D выводятся с помощью шейдеров. Шейдер в Direct3D
10 – это программа, написанная на языке HLSL (High Level Shading Language – язык
шейдеров высокого уровня), которая выполняется процессором видеокарты и служит для
получения различных визуальных эффектов. При отображении графики данные проходят
через следующие стадии (рис. 2):
Рис. 2
На стадии компоновки входных данных происходит подготовка данных о примитивах
и передача их для обработки на последующих этапах. Вершинный шейдер производит
обработку вершин, производит геометрические преобразования. Вершинный шейдер
принимает и возвращает данные только одной вершины. Геометрический шейдер
105
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
обрабатывает примитив целиком, на его вход подаются геометрические данные примитива
(три вершины для треугольника, две для отрезка и т.д.). На стадии ввода данных данные о
примитивах передаются из конвейера в оперативную память. На стадии растеризации
происходит отсечение примитивов. Пиксельный шейдер выполняет смешивание текстур
(texture blending), получая на вход данные о примитивах, преобразованных в пикселы, и
устанавливает цвет каждого пиксела индивидуально. В самом конце происходит
объединение выходных данных различного рода с содержимым буфера визуализации (render
target) для создания итогового результата работы конвейера.
В результате разработанное программное обеспечение позволило провести
полноценное компьютерное моделирование работы стереоскопической видеокамеры с
возможностью динамического изменения основных параметров стереосъемки. Полученные
значения линейного параллакса в плоскости монитора были использованы в дальнейшем для
оптимизированного расчета стереоскопической системы с возможностью естественного
восприятия глубины передаваемой сцены.
Библиографический список
1. www.developer.nvidia.com/nvapi
2. www.docs.nvidia.com
3. Попов А., DirectX 10 - это просто. Программируем графику на С++.
Creating a virtual stereoscopic camera model
Slyusarenko Sergey
ZAO “MNITI”
In this paper we will examine the virtual stereoscopic camera model by means of
Direct3D for determination of effective main parameters of stereoshooting. This paper also
describes used software tools including brief summary of shaders.
Keywords: stereoscopic, software, stereocamera, three-dimensional scene, buffer, shader
106
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Чафонова В. Г.
кафедра киновидеоаппаратуры,
Санкт-Петербургский государственный университет кино и телевидения
Метод формирования стереопары с
возможностью автоматической коррекции
рассогласования изображений по параметрам
масштаб и поворот
В статье описывается разработанный авторами алгоритм совмещения
изображений стереопары, позволяющий выполнить автоматический контроль и
коррекцию разномасштабности изображений, а также устранить нежелательный
наклон одного изображения относительно другого при его наличии. Алгоритм основан
на применении детекторов точечных особенностей с целью нахождения сопряженных
ключевых точек левого и правого кадров стереопары.
Ключевые слова: алгоритм, стереопара, совмещение изображений, параллакс, рассогласование
масштабов, коррекция, наклон, сопряженные точки.
Довольно часто встречаются случаи, когда длительный просмотр изображений в
стереоформате вызывает у зрителей неприятные ощущения (дискомфорт, боль в глазах,
головокружение и т.д.). Во многом это связано с тем, что при создании стереоизображений
не были выполнены необходимые требования, предъявляемые к параметрам стереосъемки и
формируемым изображениям стереопары.
К одним из главных условий формирования стереоизображения комфортного для
восприятия относятся требования к величине параллаксов изображаемых объектов
(параллакс – величина взаимного смещения сопряженных точек в изображениях
стереопары). Так, в изображениях стереопары должен отсутствовать вертикальный
параллакс, горизонтальные параллаксы объектов, воспринимаемых в предэкранном и
заэкранном пространствах, не должны превышать своих допустимых значений [3, 4], а
горизонтальный параллакс объектов на изображении, расположенных в плоскости рампы
(или экрана), должен быть равен нулю. При этом важную роль играет качество совмещения
левого и правого кадров, так как при неточном совмещении изображений возникают
нежелательные параллаксы. Нежелательный вертикальный параллакс может возникнуть
также по причине геометрического рассогласования изображений стереопары, например,
если фокусные расстояния объективов камер не согласованы или одна камера наклонена
относительно другой.
В настоящее время существуют различные программы по совмещению и обработке
изображений стереопары, однако коррекция геометрического рассогласования изображений
в большинстве подобных программ чаще всего отсутствует или же осуществляется
«вручную». В данном случае точность, как коррекции, так и совмещения изображений
невелика, поскольку во многом зависит от субъективного восприятия человека,
формирующего стереопару. «Автоматический режим» имеющихся на сегодняшний день
программ также не всегда дает желаемый результат.
107
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
В качестве примера рассмотрим возможность коррекции разномасштабности
изображений, а также наклона одного кадра стереопары относительно другого в программе
StereoPhotoMaker (разработчики Masuji Suto, David Sykes). Для этого совместим
изображения, полученные съемкой камерами с несогласованными фокусными расстояниями
объективов и с наклоном относительно друг к другу (рис. 1). Итоговая стереопара показана
на рис. 2 (а).
а)
б)
Рис. 1. Исходные левый (а) и правый (б) кадры стереопары
а)
б)
в)
Рис. 2. Итоговое анаглифное изображение стереопары, сформированное в автоматическом
режиме программы StereoPhotoMaker (а), его фрагменты (б, в)
На представленном рисунке видно, что в изображении сохранился небольшой
вертикальный параллакс, а размер стереопары уменьшился, вследствие чего некоторые
объекты на изображении не отобразились. Кроме того, изображения стереопары оказались
оба наклонены и совмещены по объекту, расположенному на переднем плане снимаемой
сцены, и при просмотре такого стереоизображения, все объекты будут восприниматься
только в заэкранном пространстве, что ухудшит его зрелищность.
Предлагаемый в статье метод формирования стереопары позволяет совместить кадры
стереопары по любому изображаемому объекту, т.е. осуществить цифровую конвергенцию
изображений стереопары [1], и таким образом получить стереоизображение с любым
пространственным расположением. Также данный метод автоматически и с высокой
точностью выполняет контроль и коррекцию рассогласования изображений по параметрам
масштаб и поворот.
Существуют несколько методов определения величины геометрического
рассогласования изображений. Одни из наиболее распространенных – метод фазовой
корреляции в логарифмических полярных координатах модулей спектров изображений [9], и
корреляционный подход с использованием множества шаблонов [5]. Однако в данном
случае при увеличении числа шаблонов существенно возрастает время, необходимое для
108
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
выполнения коррекции рассогласования изображений, а также объем памяти для хранения
набора шаблонов [7].
Предлагаемый в статье метод основан на выделении объекта в изображении, который
по замыслу должен быть расположен в плоскости рампы или экрана (по этому объекту будут
совмещены кадры стереопары), а также на использовании детекторов точечных
особенностей FAST (Features from Accelerated Segment Test [10]) и SURF (Speeded Up Robust
Features) [8], при помощи которых обнаруживаются соответствующие друг другу ключевые
точки на левом и правом кадрах.
Объекты на стереопаре в зависимости от их расположения по глубине сцены имеют
различные горизонтальные параллаксы, и поэтому для получения точного результата
область поиска ключевых точек ограничена выделенным объектом, находящимся в одной
плоскости дистанций. На основании координат данных точек определяются значения
необходимого угла поворота одного изображения относительно другого с целью коррекции
геометрического рассогласования изображений, а также величина разномасштабности
изображений стереопары.
При помощи пространственного аффинного преобразования [2] и билинейной
интерполяции значений яркости пикселов [6] в соответствии с полученной величиной
коэффициента разномасштабности и вычисленным значением необходимого угла поворота
происходит изменение масштаба и коррекция угла наклона одного кадра стереопары
относительно другого.
На рис. 3 представлено анаглифное изображение, полученное разработанным методом
формирования стереопары из исходных кадров с явно заметным геометрическим
рассогласованием (рис. 1) и совмещенное по выбранному объекту (ваза).
а)
б)
в)
Рис. 3. Итоговое анаглифное изображение стереопары, сформированное разработанным
методом (а), его фрагменты (б, в)
На представленном рисунке видно, насколько точно выполнена коррекция
геометрического рассогласования изображений и совмещение кадров стереопары по
выбранному объекту.
Предлагаемый в статье метод формирования стереопары позволяет автоматизировать
процесс контроля и коррекции геометрического рассогласования изображений по
параметрам масштаб и поворот и совместить изображения стереопары, обеспечив
выделенному объекту нулевой горизонтальный и вертикальный параллаксы.
109
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Библиографический список
1. Газеева И.В., Тихомирова Г.В., Чафонова В.Г. Алгоритмы цифровой конвергенции изображений
стереопары // Мир Техники Кино. № 31, 2014.
2. Гонсалес Р., Вудс Р., Эддинс С. Цифровая обработка изображений в среде MATLAB. – М.: Техносфера,
2006.
3. Комар В.Г., Рожков С.Н., Чекалин Д.А. Необходимость нормирования параметров стереопары и
стереопроекции с целью снижения зрительного дискомфорта в условиях кинозала // Мир Техники Кино.
№ 24, 2012.
4. Мелкумов А.С. Основы стереографии // Мир Техники Кино. № 18, 2010.
5. Прэтт У. Цифровая обработка изображений / Пер. с англ. – М.: Мир, 1982.
6. Цифровая обработка 2D- и 3D-изображений: учебное пособие для студентов вузов, обучающихся по
направлению подготовки 230400 «Информационные системы и технологии» / Н. Н. Красильников. – СанктПетербург: БХВ-Петербург, 2011.
7. Чемерис Д.С., Бурдинский И.Н. Исследование методов определения геометрического рассогласования
двух изображений для решения задачи оптического наведения и стыковки подводного
робота // Проектирование инженерных и научных приложений в среде MATLAB: материалы V
Международной научной конференции. – Харьков: ФЛП Шейнина Е.В., 2011.
8. Bay H., Ess A., Tuytelaars T., Van Gool L. SURF: Speeded Up Robust Features // Computer Vision and Image
Understanding. 2008. Vol. 110. № 3.
9. Reddy B.S., Chatterji. B.N. An fft-based technique for translation, rotation, and scale-invariant image registration
// IEEE Trans. Pattern Analysis and Machine Intelligence, 1996.
10. Rosten, E, Porter, R., Drummond, T. Faster and better: A machine learning approach to corner detection // IEEE
Trans. Pattern Analysis and Machine Intelligence. 2010. Vol. 32. №1.
Method of stereo pair formation with the ability to correct automatically the discrepancies of images
parameters: scale and rotation
Chafonova Viktoriia Germanovna
Saint-Petersburg State University of Film and Television
The article is devoted to algorithm of the 3D pictures assembling, which allows setting
horizontal parallaxes and vertical parallaxes with high precision, to control and to eliminate
the discrepancies in scale and to correct the unwanted rotation of one image relative to the
other image. The algorithm operates automatically and it is based on using features detector to
find corresponding points on the left and right images.
Keywords: algorithm, stereo pair, pictures assembling, parallax, the discrepancies in scale, correction,
rotation, corresponding points.
110
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Птицына А. С.
Университет ИТМО
Система видеонаблюдения за процессом
перегрузки ядерного топлива на АЭС
В статье описывается необходимость создания телевизионной системы для
постоянного контроля за реактором на атомных электростанциях (АЭС). Самым
опасным и трудным процессом для контроля является процесс перегрузки ядерного
топлива. Этот процесс и контролирует данная система.
Ключевые слова: реактор, атомная электростанция, перегрузка топлива
Введение
Мировые энергетические ресурсы ядерного горючего (уран, плутоний и др.)
существенно превышают энергоресурсы природных запасов органического топлива (нефть,
уголь, природный газ и др.). Это открывает широкие перспективы для удовлетворения
быстро растущих потребностей в топливе. Однако стремление к получению большого
количества относительно недорогой и так необходимой энергии сопряжено с значительными
рисками радиоактивного заражения в случае возникновения неуправляемой ядерной
реакции, а также неконтролируемого радиационного излучения. Для предотвращения аварий
при работе с опасными объектами, необходимо следить за всеми процессами на АЭС. Для
этого и разрабатываются телевизионные системы слежения. Самым опасным и сложным для
контроля является момент перегрузки ядерного топлива.
Цель работы
Создание и модернизация телевизионных систем, для повышения эффективности
мониторинга состояний опасных объектов атомных электростанций.
Назначение системы
АЭС - ядерная установка для производства энергии в заданных режимах и условиях
применения, располагающаяся в пределах определённой проектом территории, на которой
для осуществления этой цели используются ядерный реактор(реакторы) и комплекс
необходимых систем, устройств, оборудования и сооружений. Для сведение до минимума
возникновения аварии на АЭС - необходимо постоянно контролировать процесс перегрузки
топлива в реакторе. Именно для этого и разрабатывается специальная система
телевизионная.
Атомные
электростанции
классифицируются
в
соответствии
с
типом
используемых реакторов:
· с реакторами на тепловых нейтронах, в том числе с:
· водо-водяными
· кипящими
· тяжеловодными
· газоохлаждаемыми
· графито-водными
· высокотемпературными газоохлаждаемыми
· тяжеловодными газоохлаждаемыми
111
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
· тяжеловодными водоохлаждаемыми
· кипящими тяжеловодными
· с реакторами на быстрых нейтронах
Разрабатываемая специальная телевизионная система предназначена для
использования только в реакторах типа ВВЭР (Водо- Водяной Энергетический Реактор).
Поэтому при создании телевизионной системы необходимо учитывать защиту камеры не
только от радиации, но и активной водной среды. На рисунке №1 схематично представлен
реактор типа ВВЭР.
Рис. 1 - ректор типа ВВЭР
Система телевизионная специальная предназначена для проведения дистанционного
телевизионного наблюдения при выполнении процесса перегрузки изделий и проведения
физической инвентаризации ядерного топлива в реакторном отделении энергоблока.
Система позволяет решать следующие задачи:
· -Контроль операций по перегрузке ядерного топлива;
· Контроль маркировки и номеров кассет и кластеров;
· Осмотр наружных поверхностей кассет и кластеров;
· Осмотр активной зоны после загрузки топлива
Описание системы
Система включает в себя:
· устройство телевизионное передающее (УТП) контроля состояния
тепловыделяющей сборки в реакторе;
· устройство телевизионное передающее осмотра посадочных мест под установку
тепловыделяющей сборки в реакторе;
· стыковочные и монтажные узлы и устройства, обеспечивающие установку УТП
на телевизионную штангу и их подключение к кабельной линии связи.
· стойка телевизионных систем.
Основный функции специальной телевизионной системы:
· наблюдение за извлечением и установкой перегружаемых изделий;
112
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
·
·
·
контроль маркировки перегружаемых изделий;
осмотр наружных поверхностей перегружаемых изделий;
возможность снятия показаний с устройства контроля уровня установки ТВС в
реакторе;
· наблюдение за работой фиксатора захвата ТВС рабочей штанги;
· осмотр посадочных мест под установку ТВС в реакторе с помощью устройства
для осмотра гнёзд;
· воспроизведение изображения, формируемого используемым в данный момент
времени УТП;
· обеспечение оператору системы возможности управления используемым в
данный момент времени УТП (наведение на требуемый участок объекта
контроля, настройка изображения посредством управления объективом
камеры);
· управления интенсивностью излучения осветителей;
· запись изображений, поступающих от УТП;
· обеспечение обработки, представление и документирование видеоинформации
в процессе контроля.
На рисунке 2 представлена специальная телевизионная система
Расчет необходимых измерений
При выборе типа телевизионной системы необходимо учитывать возникающие
нелинейные и геометрические искажения изображений на экране видеомонитора. Учет
возникающих нелинейных искажений производится в автоматизированном режиме на
экране видеомонитора при помощи линейки измерительной с использованием
испытательной таблицы № 0365-М, представленной на рисунке 3.
Первоначально проводится измерение ширины (высоты) двух смежных наиболее узких
и двух смежных наиболее широких квадратов, расположенных в одном ряду вблизи
центральных линий таблицы.
Рисунок 2 - специальная телевизионная система
113
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Рис.-3 Испытательная таблица № 0365-М
Коэффициенты суммарных нелинейных искажений изображения рассчитываются в
процентах по формулам (1), (2) и (3):
Lmax - Lср
* 100
Lср
K H1 =
(1)
Lmin - Lср
* 100
Lср
KH2 =
(2)
2L
Lcp n
=
(3)
где: Lmax – общая ширина (высота) двух смежных наибольших квадратов, мм;
Lmin – общая ширина (высота) двух смежных наименьших квадратов, мм;
Lcp – средний размер, мм;
L – ширина (высота) прямоугольника мм;
n – число квадратов на ширине (высоте) прямоугольника.
За величину суммарных нелинейных искажений изображения принимают наибольшее
по абсолютной величине значение КH1 или КH2 , полученное по вертикали и горизонтали.
Телевизионная камера считается прошедшей проверку суммарных нелинейных
искажений изображения, если суммарные нелинейные искажения не более ±10%.
При измерениях геометрических искажений учитываются параллельности поверхности
линейки плоскости экрана видеомонитора и параллельности линейки стороне экрана
видеомонитора вдоль которой производится измерение [2].
На рисунке 4 показан пример проведения измерений искажений изображения. С
использованием испытательной таблицы № 0365-М, представленной на рисунке 3.
Коэффициенты суммарных геометрических искажений изображения, в процентах
рассчитываются по формулам (4), (5):
Dl1
* 100
L
T
SL1=
(4)
Dh1
* 100
H
T
SH2=
(5)
114
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Dh1 – величины отклонений вертикальной и горизонтальной сторон
прямоугольника, мм; H T , LT – размеры вертикальной и горизонтальной сторон
прямоугольника, мм.
За величину суммарных геометрических искажений изображения принимают
наибольший из результатов.
где:
Dl1 ,
Рис. 4 – Измерение суммарных геометрических искажений изображения
Телевизионная камера считается прошедшей проверку суммарных геометрических
искажений изображения, если суммарные геометрические искажения не более ±4%.
Следующим немаловажным фактором, оказывающим существенное влияние на выбор
типа телевизионной системы является оценка кратности изображения.
Для проведения проверки необходимо установить перед камерой телевизионную
таблицу ИТ-72 (см. Рис. 5 ) на расстоянии ~300 мм. Телевизионная таблица устанавливается
перпендикулярно оптической оси камеры.
Рис.5- Телевизионная таблица ИТ-72
115
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
В процессе проверки устанавливается минимальное значение угла поля зрения и
производится фокусировка камеры, добиваясь наиболее резкого изображения телевизионной
таблицы. Производится измерение длины х2 черного горизонтального прямоугольника,
расположенного ниже центра телевизионной таблицы. Далее устанавливается максимальное
значение угла поля зрения, производится фокусировка камеры на резкое изображение
телевизионной таблицы и выполняется измерение длины х1 того же прямоугольника.
Кратность оптического масштабирования определить по формуле (6):
Гₒ =
где:
(6),
Го - кратность оптического масштабирования объектива;
х1 - длина прямоугольника, видимая при максимальном значении угла поля зрения
камеры;
х2 - длина прямоугольника, видимая при минимальном значении угла поля зрения
камеры.
Телевизионная камера считается прошедшей проверку кратности оптического
масштабирования,
если
кратность
оптического
масштабирования
Го=5 х±20%.
Библиографический список
1. В.В. Коротаев, А.В. Краснящих Телевизионные измерительные системы /Учебное пособие /СПб 2008
2. ГОСТ 23456-79 Установки телевизионные прикладного назначения. Методы измерений и испытаний.
Videosurveillance system for monitoring of nuclear power plant reactors on nuclear
power stations.
Ptitcyna Anastasiia
ITMO University
Annotation This article describes the need to creation of television systems for monitoring
of nuclear power plant reactors on nuclear power stations. The most dangerous and difficult
process is to control the transfer of nuclear fuel. For monitoring, you can use television
systems.
Keywords: reactor, nuclear power station, the transfer of nuclear fuel
116
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Авдоченко Б.И., Зайцева Е.В, Кирпиченко Ю.Р., Курячий М.И,
Пустынский И.Н.
Томский государственный университет систем управления и
радиоэлектроники
Особенности построения активно-импульсных
телевизионно-вычислительных систем (АИТВС),
работающих в сложных условиях контроля и
наблюдения
Объектом исследований в данной статье являются активно-импульсные
телевизионно-вычислительные системы (АИТВС), работающие в сложных условиях
контроля и наблюдения.
Ключевые слова: активно-импульсные телевизионно-вычислительные системы, предельная
дальность видения, телевизионный датчик, яркость, цифровая обработка.
Особый интерес в плане повышения технических и эксплуатационных характеристик
телевизионных систем представляют системы наблюдения и контроля в сложных условиях
видимости. Широкий круг задач при таких условиях может быть решен с помощью
тепловизионных приборов и АИТВС.
Объектом наших исследований являются АИТВС, работающие в сложных условиях
контроля и наблюдения. Работы в этом направлении ведутся на кафедре телевидения и
управления ТУСУРа. Кафедрой совместно с Институтом оптики атмосферы СО РАН были
разработаны АИ ТВС «Зонд» и «Обзор» [1-3].
Одним из основных требований, предъявляемых к таким системам, является
формирование качественного изображения наблюдаемого пространства при заданной
величине зоны видения по дальности. Предельная дальность видения (ПДВ) является
основной характеристикой подобных систем. Увеличение ПДВ при неблагоприятных
условиях наблюдения (низкие уровни освещенности, низкая прозрачность среды
распространения оптического излучения и др.) можно достичь в АИТВС за счет увеличения
оптической мощности импульсного источника подсвета, либо повышения чувствительности
телевизионного датчика с усилителем яркости.
Потенциальные возможности системы можно увеличить и за счет использования
эффективных алгоритмов цифровой обработки сформированных изображений. Основными
критериями оценки качества работы АИТВС являются
разрешающая способность,
быстродействие и помехоустойчивость при заданной ПДВ, которая определяется характером
решаемых задач и областью применения системы.
Ранее были разработаны и исследованы возможности повышения характеристик
устройства подсвета, телевизионного датчика и устройства цифровой обработки
изображений. Целью данного этапа исследований, выполненного при финансовой
поддержке Минобрнауки России в рамках базовой части государственного задания №
2014/225 по НИР «Исследование и разработка методов и средств повышения качества
изображений в активно-импульсных телевизионно-вычислительных системах при
пониженной прозрачности среды распространения излучения и наличии оптических помех»
117
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
(код проекта 769), являлось прведение экспериментальных проверок и получение оценок
эффективности методов и алгоритмов повышения качества изображений, которые
формируются АИТВС в различных режимах их функционирования.
Для достижения поставленной цели были сформулированы, а в последующем решены
следующие задачи:
- разработаны и обоснованы способы расширения зоны видения и обеспечения равной
яркости изображения по дальности;
- разработаны и экспериментально апробированы аппаратные средства мощных и
быстродействующих оптических импульсных излучателей в инфракрасном и
ультрафиолетовом диапазонах;
- модернизирован экспериментальный макет АИТВС с целью повышения надежности,
чувствительности и помехозащищенности;
- экспериментально произведена оценка эффективности итерационных алгоритмов
повышения качества изображений в АИТВС;
- разработана методика проведения лабораторного и натурного эксперимента на
примере оценки уровня помехоустойчивости систем цифрового телевидения.
По итогам выполненных исследований получены следующие результаты.
1. Проведен анализ известных способов расширения зоны видения АИТВС и
обеспечения равной яркости изображений по дальности. Сформулированы теоретические
предпосылки возможности расширения зоны видения по дальности за счет эффективного
управления импульсными режимами устройства подсвета и ЭОП с учетом оценки
коэффициента пропускания среды распространения оптического излучения в ближних
зонах, где отсутствуют объекты наблюдения.
2. Разработаны и экспериментально исследованы импульсные источники
инфракрасного
и ультрафиолетового излучений с повышенной мощностью и
быстродействием. Разработана и исследована аппаратная реализация импульсного
источника питания с динамическим режимом управления транзисторами, позволяющая
минимизировать время включения и выключения фотокатода ЭОП и уменьшить мощность
автономного источника питания АИТВС.
3. В модернизированном экспериментальном макете АИТВС апробированы новые
технические решения:
- реализовано автоматическое управление чувствительностью ЭОП за счет
использования специального вторичного источника питания;
- в оптической системе АИТВС применен длиннофокусный объектив с узкополосным
инфракрасным фильтром для повышения помехозащищенности системы;
- повышена контрастная чувствительность системы за счет использования
высокочувствительной ПЗС-матрицы;
- уменьшено влияние вносимых засветок на работу системы за счет уменьшения
фронтов импульсов стробирования по фотокатоду ЭОП.
4. Наряду с известным критерием оценки качества изображений в АИТВС по пиковому
отношению сигнал/ шум при заданной разрешающей способности в телевизионных линиях
разработан критерий оценки качества изображений по реальному отношению сигнал/ шум
(РОСШ) при контроле особых значений контрастно-частотных характеристик системы.
Экспериментально оценена эффективность итерационных алгоритмов повышения качества
118
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
изображений в АИТВС. Показано, что максимальный выигрыш по параметру РОСШ у
базового итерационного алгоритма составляет 45 % при девяти итерациях, а у
модифицированного – 35 % при пяти итерациях.
5. Разработаны и апробированы методики экспериментальной оценки
помехоустойчивости систем цифрового телевидения. Проведен лабораторный и натурный
эксперимент, численные данные которого согласуются с результатами теоретических
расчетов.
Реализован и исследован вариант построения разработанной АИТВС [4]. В состав
системы входят: телевизионная камера с повышенной чувствительностью и электроннооптическим преобразователем, устройство подсвета, источник питания, блок управления и
ноутбук со специализированным программным обеспечением. Устройством подсвета
является осветитель на базе полупроводникового лазера или импульсных светодиодов,
который преимущественно работает в импульсном режиме.
Основные технические характеристики системы: дальность видения– 200 м; глубина
зоны видения– 20 м; угол поля зрения – 6–10 градусов; длина волны излучения подсвета –
830 нм; длительность импульса подсвета– 120 нс; частота повторения импульсов подсвета –
50–5000 Гц; длительность строба приемника – 120 нс.
Библиографический список
1. Стробируемая система ночного видения ZOND / В.В. Белов, В.С. Белоусов, Б.Д. Борисов, М.И. Курячий,
Г.Г. Матвиенко, И.Н. Пустынский, В.П. Тарасенко // Наука– производству. – 2003. – № 39. – С. 32–38.
2. Активно-импульсные телевизионные системы «Зонд» и «Обзор» / В.В. Белов, В.С. Белоусов, Б.Д.
Борисов, Дегтярев П.А.,. Кирпиченко Ю. Р., Курячий М. И., Матвиенко Г. Г., Пустынский И. Н., Рудникович
А. С. // Изв. вузов. Приборостроение. – 2005. – № 11. – С. 51–54.
3. Активные ТВ-системы видения с селекцией фонов рассеивания / В.В. Белов, Г.Г. Матвиенко, Р.Ю. Пак и
др. // Датчики и системы. – 2012. – № 3. – С. 25–30.
4. Пат. № 2406100 РФ, МПК G01S 17/06. Активно-импульсная телевизионная система / Ю.Р. Кирпиченко
(РФ), М.И. Курячий (РФ), И.Н. Пустынский (РФ). – № 2008152485/28; заявл. 29.12.2008; опубл. 10.12.2010. –
Бюл. № 34, – 8 с.
Creation features of the active and pulse television computing systems (APTCS) working in
difficult conditions of control and supervision.
Avdochenko B. I., Zaytseva E.V, Kirpichenko Y.R., Kuryachy M.I., Pustynsky I.N.
Tomsk state university of control systems and radio electronics
Object of researches in this article are the active and pulse television computing systems
(APTCS) working in difficult conditions of control and supervision.
Keywords: active and pulse television computing systems, limit range of vision, television sensor, brightness,
digital processing.
119
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Обухова Н.А., Николюк О.А.
Санкт-Петербургский государственный университет аэрокосмического
приборостроения.
Алгоритм сегментации бликов в экспертно консультирующей телевизионной системе
диагностики рака шейки матки.
Предложен алгоритм сегментации бликов на изображениях шейки матки,
полученных телевизионными методами. Метод основан на оценках яркости и
насыщенности цвета, а также значение яркостного вектора-градиента. Алгоритм
реализован и апробирован в экспертно-консультирующей телевизионной системе
диагностики рака шейки матки.
Ключевые слова: предобработка изображений в медицинских системах, выделение бликов на
изображениях, автоматический анализ кольпоскопических изображений.
Компьютерный анализ изображений является одним из основных инструментов
медицинских диагностических систем, позволяющих существенно повысить качество
диагностики. В частности, автоматический анализ кольпоскопических изображений,
полученных телевизионными методами, является важнейшей составляющей экспертноконсультирующей системы диагностики рака шейки матки.
Эффективность автоматического анализа кольпоскопических изображений в
значительной мере определяется
их предобработкой, в которой следует выделить
стандартные процедуры повышения качества изображений (гамма-коррекцию, подавление
шумов, цветокоррекцию, увеличение контраста и т.д.) и специальные процедуры
(совмещение изображений, автоматическую сегментацию зоны интереса, удаление бликов
на изображениях).
К образованию бликов на изображениях приводит наличие жидкости на шейке матки.
При дальнейшем анализе блики обуславливают ошибки как при сегментации, так и при
классификации изображений. Например, области с бликами могут быть ошибочно приняты
за ацетобелые или значительно текстурированные области при анализе изображений,
полученных в белом свете, поэтому перед началом анализа блики должны быть найдены и
удалены (отмечены).
Предложен алгоритм сегментации бликов на изображениях шейки матки, основанный
на оценке яркости, оценке насыщенности цвета и значение яркостного вектора - градиента.
Отражения всегда имеют очень высокую яркость и низкую насыщенность цвета. Это
наблюдение позволяет сегментировать начальные области интереса. Для определения
оценки яркости и оценки насыщенности цвета использована цветовая система RGB. Оценка
яркости и оценка насыщенности ищут следующим образом:
=
=1−
+
+
;
3
min( , , )
,
120
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
где – оценка яркости пиксела; , , – координаты пиксела; – оценка насыщенности
цвета пиксела [1].
Для выделения области кандидата проводится пороговая обработка, адаптивные
пороги p1 и p2 определяют с использованием метода Отсу:
> 1 × max;
< p2 × max,
(1)
где Lmax и Smax – максимальное значение оценки яркости и максимальное значение оценки
насыщенности цвета пикселя в анализируемом изображении.
Все пиксели, оценка яркости и оценка насыщенности которых удовлетворяет
условиям (1), помечают как области кандидаты.
На границе зон изображений, соответствующих бликам, яркостный вектор – градиент
имеет большое значение. На основе этого признака проводят уточнение областей
кандидатов:
где ∇
Отсу.
|∇G| =
∂L
∂x
+
∂L
∂y
> ,
– яркостный вектор-градиент, k - пороговое значение, найденное на основе метода
Ниже представлена структурная схема алгоритма сегментации бликов на изображении
(рис. 1).
Ввод изображения для
обработки
Вычисление значений
оценки яркости цвета ( )
и оценки насыщенности
цвета ( ) для каждого
пиксела
Определение адаптивных
порогов сегментации:
p1,2=f(t). Переменная t
ищется при помощи
метода Отсу
Уточнение области
кандидата по значению
яркостного вектора градиента
Определение
максимального значения
L и S для всего
изображения
Вывод
сегментированного
изображения
Рис. 1. Структурная схема алгоритма выделения бликов
В ходе исследования были проведены моделирование и экспериментальная проверка
данного алгоритма на реальных изображениях, полученных в ходе клинических
исследований, проводимых в клинике Отта. Примеры полученных результатов
представлены на рисунке 2. Слева располагается исходное изображение, справа –
изображение после обработки. На сегментированном изображении области бликов
помечены черным цветом. Апробация алгоритма проводилась на изображениях: до
применения растворов, после применения уксуса и Люголя.
Точность сегментации оценена на основе критерия:
= | эт − м|,
где
- ошибка сегментации, эт и м – площадь бликов на изображении и площадь
сегментированных бликов, выраженные в блоках размером 32*32 элемента. Использование
121
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
в критерии значений площадей, выраженных в блоках, определено принципами дальнейшей
обработки: классификация изображения с целью выделения области патологии реализована
не для пикселей, а для блоков.
Исходное изображение
Сегментированное
изображение
Рис. 2. Результаты обработки изображений.
Экспериментальные данные показывают, что среднее значение ошибки сегментации
составляет не более 3 блоков. (До обработки площадь бликов может достигать 30 блоков,
причем связанных в единую область). Такой уровень ошибки обеспечивает корректную
работу алгоритмов дальнейшего анализа, поэтому предложенный метод может быть
использован для предварительной обработки изображений в телевизионных системах ранней
диагностики онкологических заболеваний шейки матки.
Библиографический список
1. Zimmerman-Moreno G., Greenspan H. Automatic Detection of Specular Reflections in Uterine Cervix Images//
SPIE Medical Imaging Symposium. 2006.
2. Otsu N.A. Threshold Selection Method from Gray-Level Histograms// IEEE Transaction on Systems, Man and
Cybernetics, SMC -9(1), 62-66, 1979.
The algorithm of highlights segmentation in expert television system for cervical cancer
diagnosis.
N. Obukhova, О. Nikoliuk
Saint-Petersburg State University of Aerospace Instruments.
The algorithm of highlights segmentation in the images of the cervix obtained by
television methods is proposed. The method is based on the estimates of the brightness and
color saturation, and on the value of brightness gradient vector. The algorithm is implemented
and tested in the expert television system diagnosis of cervical cancer.
Keywords: image preprocessing in medical systems, the highlights detection and segmentation in images,
automatic analysis of colposcopic images.
122
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Чиркунова А.А.
СПБГЭТУ каф ТВ, ОАО «НИИТ»
Пространственное разрешение оптикоэлектронной аппаратуры для системы
дистанционного зондирования Земли из космоса
Рассмотрены факторы, влияющие на пространственное разрешение оптикоэлектронной системы дистанционного зондирования Земли (ДЗЗ) из космоса.
Приведены графики зависимостей пространственного разрешения от высоты орбиты,
фокусного расстояния, размера элемента фотоприемника, а также от длины волны
фиксируемого излучения.
Ключевые слова: дистанционное зондирование Земли, оптико-электронная аппаратура,
искусственный спутник Земли, пространственное разрешение
Современные системы ДЗЗ отличаются большим разнообразием характеристик и
параметров, таких как высота орбиты, полоса захвата, разрешение по местности, наличие и
количество спектральных диапазонов.
На сегодняшний день, наметилась тенденция построения оптико-электронной
аппаратуры для спутников ДЗЗ высокого и сверхвысокого пространственного
разрешения (рис. 1).
Рис.1
Рассмотрим основные параметры, оказывающие влияние на пространственное
разрешение оптико-электронной аппаратуры системы ДДЗ.
В предельном случае пространственное разрешение зависит в основном только от
параметров используемой оптической системы и высоты орбиты, с которой осуществляется
наблюдение [1]. Имеется предельное разрешение при идеальной оптической системе,
определяемое (1). Данное ограничение определяется дифракцией света на основных краях
оптического элемента (линзы или зеркала). Оно носит название дифракционного предела
объектива и означает, что не имеет смысла выбирать фотоприемник с размером элемента
(пиксела) а меньше размера радиуса кружка рассеяния объектива ао, так как в этом случае
элемент будет использоваться неэффективно.
Предельное пространственное разрешение при идеальной оптической системе (рис.2):
123
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
=
λ
,
(1)
где К-коэффициент пропорциональности, связанный с качеством системы наблюдения и
условиями наблюдения, λ - длина волны, H - высота орбиты, D - апертура (диаметр)
оптической системы.
Кружок рассеяния объектива определяется: а = 1,22
, где λ - длина волны, F -
фокусное расстояние, D - апертура (диаметр) оптической системы.
На практике размер пиксела обычно равен или несколько больше размера кружка
рассеяния объектива.
Разрешение по местности определяется следующим образом:
=
, где H –
высота орбиты, а – размер пиксела,F –фокусное расстояние.
Спутники ДЗЗ размещают на двух типах орбит: низкие (высота от 160 км до 2000 км) и
геостационарные.
14
Пространственное
разрешение,м
12
10
8
D=0,1 м
6
D=0,3 м
4
D=0,5 м
2
0
0
500
1000
1500
Высота орбиты, км
2000
2500
Рис.2
Низкоорбитальными орбиты подвержены максимальным возмущениям со стороны
гравитационного поля Земли и ее верхней атмосферы [2]. Для обеспечения одинаковых
условий наблюдения такие спутники выводят на полярные солнечно-синхронные орбиты.
Эти орбиты имеют наклонение относительно экватора, близкое к 90°, обеспечивают съемку
всей поверхности Земли, включая полярные области. Поворот орбиты относительно Земли
синхронизован с вращением Земли относительно Солнца, так что в течение всего времени
угол между плоскостью орбиты и направлением на Солнце постоянен. Это позволяет
производить съемку приблизительно в один и тот же час местного времени в течение всего
года. Наиболее удобное время для съемки - около 12 ч местного времени [3].
Высокоорбитальными искусственными спутниками Земли считаются спутники,
достигающие высот 35786 км над поверхностью Земли. Орбиты могут как иметь
значительный эксцентриситет, так и быть почти круговыми[2].
Космические снимки, полученные с высоких орбит, позволяют: выявлять глобальные
процессы на поверхности Земли: наиболее протяженные глубинные разломы и зоны
разломов, гигантские кольцевые структуры, выяснять характер сочленения крупных
структурных элементов земной коры, связь поверхностной геологии с глубинным строением
литосферы и прочее.
124
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Спутники, находящиеся на геостационарной орбите как бы висят над одной точкой
поверхности Земли, так как их период обращения вокруг Земли составляет 24 часа, т.е.
сутки. На таких орбитах обычно размещают спутники с метеорологической аппаратурой
(например, спутники серии GOES, METEOSAT, Электро-Л1) [4].
Примем размер элемента фотоприемника равным 6 мкм. На рис 3. Приедены
зависимости пространственного разрешения от высоты орбиты.
Кривые приведены для разных значений фокусного расстояния. Более детальные
снимки получаются при наименьшей высоте орбиты и высоком значении фокусного
расстояния.
Определяющим параметром при расчете оптико-электронного тракта системы ДЗЗ, как
правило, является относительное отверстие / (отношение диаметра объектива D к
фокусному расстоянию F). Чем больше
/ , тем потенциально меньший размер
фотоприемника можно использовать. Однако, существует предел разрешения, определяемый
критерием Релея. На рис.4 приведена зависимость предела разрешения от относительно
отверстия применяемого объектива.
Пространственное
разрешение, м
25
0.5 м
20
1м
15
1.5 м
10
2м
2.5 м
5
3м
0
0
500
1000
1500
Высота орбиты, км
2000
3.5 м
4м
Рис.3
Рис.4
Зависимость простанственногго разрешения от размера элемента фотопрриемника
приведена на рис. 5.
125
Разрешение по
местности , м
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
5
4
3
2
1
0
0,003
0,005
0,007
0,009
0,011
0,013
0,015
Размер элемента фотопримника
Рис.5
Выводы:
Наблюдается тенденция построения систем ДЗЗ высокого и сверхвысокого
пространственного разрешения.
Пути увеличения пространственного разрешения:
- уменьшение элемента фотоприемника;
- увеличение фокусного расстояния.
Библиографический список
1. Бакланов А. И. Фотоприемники ПЗС космических систем наблюдения высокого разрешения // Вопросы
радиоэлектроники. Техника телевидения. № 2, 2012.
2. Гарбук С.В., Гершензон В.Е. Космические системы дистанционного зондировании Земли. – М.: Изд-во А
и Б, 1997 – 296 с
3. Волков С.Н. Использование КА ДЗЗ в системах экологического мониторинга //научная публикация
«Корпорация «ВНИИЭМ» 2007
4. Цыцулин А.К., Умбиталиев А.А. Твердотельная революция в телевидении: Телевизионные системы на
основе приборов с зарядовой связью, систем на кристалле и видеосистем на кристалле / М: Радио и связь,
2006. 312 с.
The spatial resolution of electro-optical equipment for remote sensing of the Earth from space.
Chirkunova A.A.
Saint Petersburg Electrotechnical University “LETI”, Television subdepartmant
The factors affecting the spatial resolution of the optoelectronic system of Earth remote
sensing (ERS) from space. Shows the dependence of the spatial resolution of the orbit, the focal
distance, the size of the photodetector element and the wavelength fixed by radiation.
Keywords: remote sensing, optical-electronic equipment, artificial earth satellite, integration time, a linear
CCD
126
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
А.В. Морозов
СПбГЭТУ «ЛЭТИ», ОАО «НИИТ»
Оценка максимальной дальности обнаружения
удаленного объекта в неблагоприятных
метеоусловиях
Рассмотрены факторы, влияющие на дальность обнаружения объектов
телевизионной системой при неблагоприятной метеорологической обстановке.
Ключевые слова: дальность видимости, рассеяние, контраст, телевизионная система
В настоящее время широкое распространение получили телевизионные методы
наблюдения [1]. Однако серьезной проблемой телевизионных систем является зависимость
дальности обнаружения объектов на полученных изображениях от метеорологической
обстановки. В общем случае, ослабление излучения атмосферой происходит, как из-за
поглощения, так и рассеяния энергии излучения. Поглощение энергии происходит
молекулами газа на длинах волн, равных или кратных резонансным длинам волн
колебательных движений молекул. Т.е. поглощение является селективным, приходящимся
на сравнительно узкие участки спектра – "полосы поглощения" молекул газов, входящих в
состав атмосферы.
Дальность видимости реальных объектов определяет следующая формула [2]:
=
lg
,
(1)
где Sм — метеорологическая дальность видимости (МДВ),км; Ко — контраст объекта при
отсутствии дымки; ε — порог контрастной чувствительности. Учитывая, что за величину
МДВ принимается расстояние, с которого черный объект виден с контрастом 2%, из
формулы (2) при ε = 0,02 и К0 = 1, может быть получен коэффициент α=0,66.
Формула Релея для интенсивности рассеянного света имеет следующий вид [3]:
=
9
ср
λ
−
час +
час
ср
ср
(1 − cos
),
(2)
где I0 - интенсивность падающего на частицу света, θ - угол между направлением падающего
пучка и направлением наблюдения (рассеяния), λ = λ
- длина волны в среде, V – объем
частицы,
=
част
ср
ср
ср
- относительный показатель преломления частицы в среде с показателем
преломления ср , N – число частиц в единице объема, L – яркость источника света.
Особенности релеевского рассеяния:
· интенсивность рассеянного света обратно пропорциональна λ4;
· интенсивность рассеянного света прямо пропорциональна квадрату объема
частицы V2.
127
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Рис. 1, иллюстрирующий зависимость рассеяния прямых солнечных лучей от длины
волны, показывает, что наибольшее рассеяние света происходит в коротковолновой части
видимого диапазона длин волн.
При ведении телевизионного наблюдения например за морской обстановкой рассеяние
света максимально. Это вызвано наличием тумана, который представляет собой скопление
мелких частиц воды. Учитывая частотно зависимое рассеяние и поглощение, получение
наилучшего контраста пригоризонтных объектов требует выбора спектрального
светофильтра.
Рис. 1. Рассеяние прямых солнечных лучей в зависимости от длины волны
Контраст объектов вычисляется исходя из значений коэффициентов отражения объекта
Коби фона Кф:
Ko=
об
об
ф
ф
.
(3)
Дальность видности
объектов, км
На рис 2. представлена зависимость дальности видимости объекта от МДВ для
объектов с различными контрастами.
18000
16000
14000
12000
10000
8000
6000
4000
2000
0
К0=0,2
- - - - К0=0,4
------ К0=0,6
0
5000
10000
15000
20000
Метеорологическая дальность видности, км
Рис. 2. Зависимость дальности видимости объектов съемки от МДВ
Изменение вторичного контраста вдоль оптического пути определяется следующим
соотношением [4]:
=
,
(4)
128
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
где σ - постоянная величина, определяемая метеоусловиями. При МДВ = 20 км, в формуле
(2) и К = 0,02; К0 = 1,0 можно получить из (4) постоянную σ = (1,95х10-4) м-1.
Зависимость вторичного контраста объекта от МДВ при разных Ко иллюстрирует
рис.3.
0,2
0,18
0,16
Контраст
0,14
К0=0,2
0,12
- - - - К0=0,4
0,1
0,08
0,06
0,04
0,02
0
1000
6000
11000
16000
Метеорологическая дальность видности, м
Рис.3. Зависимость вторичного контраста объекта от МДВ
Видно, что при уменьшении МДВ вторичный контраст падает. Это обусловлено
усилением рассеяния света на микрочастицах атмосферы.
Зависимость контраста объектов от дальности видимости представлена на рис.4.
График показывает, что вторичный контраст объектов снижается с увеличением расстояния
до них и на определенном расстоянии вторичный контраст становится ниже порога
контрастной чувствительности.
0,18
0,16
0,14
Контраст
0,12
МДВ=15км
0,1
МДВ=20км
0,08
МДВ=10 км
0,06
МДВ=5км
0,04
0,02
0
1000
6000
11000
16000
дальность видности, м
Рис.4. Зависимость вторичного контраста объекта от дальности видимости
Список литературы
1. Иванов В. А., Левко Г. В., Манцветов А. А., Степовой А. В., Баранов П. С., Морозов А. В., Пучка Е. Ю.,
Письменный Е. В., Сашин Д. И. Телевизионная камера для малогабаритного звездного датчика//Вопросы
радиоэлектроники, сер. «Техника телевидения», Санкт-Петербург. 2014. Вып. 1. С. 43-51.
2. Г.А.Зисман, О.М.Тодес. Курс общей физики. М.: Наука, 1970.
3. Мак-Картни Э. Оптика атмосферы. Рассеяние света молекулами и частицами, 1979, 422с.
4. Д.К. Земляновский. ЛОЦИЯ ВНУТРЕННИХ ВОДНЫХ ПУТЕЙ,2001.
129
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
Г.В. Левко, А.В. Морозов, А.А. Чиркунова
ОАО «НИИТ»
Телевизионная система пригоризонтного
наблюдения
В докладе рассмотрены методы повышения дальности видимости
телевизионной системы в условиях плохих метеоусловий.
Ключевые слова: отношение сигнал – шум, контраст, длина волны, светофильтр, телевизионная
система
Телевизионное наблюдение широко используется в различных областях науки и
техники[1]. Параметры телевизионных систем наблюдения удаленных пригоризонтных
объектов имеют сильную зависимость от конкретных погодных условий[2,3]. Частая смена
метеообстановки, (например наличие тумана в морских условиях) приводит к
необходимости создания телевизионной системы, имеющей механизмы компенсации плохих
условий наблюдения. Для построения автоматического телевизионного обнаружителя
пригоризонтных объектов необходимо экспериментальное исследование механизмов
компенсации рассеяния и затухания света на трассе наблюдения.
Структурная схема экспериментальной телевизионной системы (Рис. 1) включает в
себя телевизионную камеру с объективом, турель с набором спектральных светофильтров и
персональный компьютер с платой “захвата” кадра.
Рис. 1 Экспериментальный стенд: БСФ – блок светофильтров, ОБ – объектив, ТВК – телевизионная камера,
ПО – программное обеспечение, ПК – персональный компьютер PentiumIV
В качестве исследуемого объекта были выбраны
расположенные на расстоянии около 4 км от ТВ-камеры (Рис.2).
промышленные
трубы,
Рис.2. Изображение труб при идеальной погоде
130
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
При съемке последовательно применен набор спектральных светофильтров: ЖС11,
ЖС12, ЖС16, ЖС17, ЖС18, ОС12, ОС13, ОС14, КС11, КС14 с целью исследования
контраста объекта относительно фона. Эксперимент проводился при МДВ ~10 км. ТВкамера на основе КМОП-фотоприемника с размером пиксела 3,5×3,5 мкм2, размер сенсора
3002×2210 элементов, объектив Pentax C7528-M с фокусным расстоянием 75 мм. На Рис. 3
представлены изображения объектов без фильтра и с фильтром КС14.
а) без светофильтра
б) со светофильтром КС14
Рис. 3. Изображения исследуемых объектов
В результате анализа получены зависимости контраста изображения от длины волны
среза светофильтра (Рис.4). Видно, что для данных метеоусловий, с увеличением плотности
светофильтра увеличивается контраст. Максимальное отношение с/ш получаем для
светофильтров ЖС16 или ЖС17. Выигрыш по контрасту от применения спектральных
светофильтров достигает 18%. Выигрыш по дальности видимости при этом составляет 31%.
а) Зависимость контраста изображений от
б) Зависимость отношения С/Ш от длины
длины волны
волны.
Рис. 4. Экспериментальные кривые
Таким образом, при выборе спектрального светофильтра:
· при большой МДВ лучше использовать менее плотные светофильтры (желтый
или оранжевый);
131
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
·
при малой лучше подходят плотные светофильтры, смещающие длину волны
регистрируемого излучения от объекта в «красную» сторону спектра.
В результате структурная схема телевизионного обнаружителя пригоризонтных
объектов может иметь следующий вид (Рис. 5).
Рис. 5. Структура телевизионного обнаружителя: БСФ – блок светофильтров, ТВК – телевизионная
камера, БПР – блок принятия решений.
Блок светофильтров включает в себя турель с набором спектральных светофильтров.
В блок принятия решений с телевизионной камеры поступает набор изображений
одинакового сюжета, снятых с использованием каждого светофильтра, входящего в БСФ.
Изображения обрабатываются в блоке принятия решения либо автоматически, либо
оператор задает искомую цель, по которой ищется максимальное отношение сигнал/шум
среди всех изображений. Таким образом, выявляется и устанавливается оптимальный
светофильтр для ведения наблюдения в данной метеорологической обстановке. При смене
метеоусловий операция подбора светофильтра должна быть повторена.
На дальность обнаружения объекта, помимо метеообстановки, также влияет размер
объекта [1]. На больших расстояниях, когда проекция объекта на матрицу ТВК составляет
единицы пикселов (обычно <5), объект считается точечной целью (рис. 6). Для точечных
целей существует пороговый контраст обнаружения объекта, при котором объект становится
невидимым для телевизионной системы.
Зависимости на рис. 6 построены по формуле (1), и показывают, что контраст объекта
относительно фона экспоненциально падает с увеличением дальности объекта, а в месте
перехода объекта к точечной цели происходит излом кривой, и кривая уменьшается еще
более резко. На графике отмечен пороговый контраст, при котором цель пропадет с
изображения, его значение составляет 0,02 или 2 %.
180
2∙
( )∙
∝ пор
(1)
=
,
ℎ
где K – контраст объекта относительно фона на изображении, H – горизонтальный
размер объекта в пространстве,м, L – расстояние до объекта, м, npix – размер проекции
объекта на матрицу в пикселах, h – количество пикселов матрицы по горизонтали, α –
коэффициент ослабления согласно закону Бугера, м-1, Lпор – метеорологическая дальность
видимости, м.
Выводы:
1) Для достижения предельной дальности в условиях ограниченной метеорологической
дальности видимости необходимо использовать спектральную селекцию, при которой
отсекаемая коротковолновая часть спектра тем шире, чем меньше метеорологическая
дальность видимости.
132
Тезисы 11-ой международной конференции «ТЕЛЕВИДЕНИЕ:ПЕРЕДАЧА И ОБРАБОТКА ИЗОБРАЖЕНИЙ»
2) Выигрыш по контрасту от применения спектральных светофильтров, для указанных
выше условий, достигает 18%. Выигрыш по дальности видимости при этом составляет 31%.
Рис. 6. Изменение контраста объекта на изображении в зависимости от дальности обнаружения
Список литературы
1. В. В. Березин, А. А. Умбиталиев, Ш. С. Фахми, А. К. Цыцулин,Н. Н.Шипилов. Твердотельная
революция в телевидении: Телевизионные системына основе приборов с зарядовой связью, систем на
кристалле и видеосистемна кристалле; под ред. А. А. Умбиталиева и А. К. Цыцулина. М.: Радио и связь,
2006, 312 с.
2. Мак-Картни Э. Оптика атмосферы. Рассеяние света молекулами и частицами, 1979, 422с.
3. В. Е. Зуев. Прозрачность атмосферы для видимых и инфракрасных лучей. М.: Советское радио, 1966,
320 с.
133
1/--страниц
Пожаловаться на содержимое документа