Главная arrow книги arrow Копия Глава 24. Восприятие arrow Распознавание с учетом яркости
Распознавание с учетом яркости

При таком подходе за основу берется подмножество пикселов изображения, которое соответствует распознаваемому объекту, и определяются данные о характеристиках как данные о самих исходных значениях яркости пикселов. Еще один вариант этого метода состоит в том, что вначале может быть выполнена свертка изображения с различными линейными фильтрами, после чего значения пикселов в результирующих изображениях рассматриваются как характеристики. Как было показано в разделе 20.7, такой подход оказался очень успешным при решении таких задач, как распознавание рукописных цифр.

Для создания детекторов лиц, позволяющих распознавать лица с помощью баз данных с изображениями, использовался целый ряд статистических методов, включая методы на основе нейронных сетей с необработанными входными данными, представленными в виде характеристик пикселов; деревья решений с характеристиками, определяемыми с помощью различных фильтров полос и краев; а также наивные байесовские модели с характеристиками небольшого волнения (ряби). Некоторые результаты применения последнего метода показаны на рис. 24.19.

Рис. 24.19. Выходные данные алгоритма поиска лиц (любезно предоставлено Генри Шнейдерманом (Henry Schneiderman) и Такео Канаде (Takeo Kanade))

Одним из недостатков метода, в котором в качестве векторов характеристик используются необработанные данные о пикселах, является большая избыточность, свойственная этому способу представления. Предположим, что рассматриваются два пиксела, расположенные рядом на изображении щеки лица какого-то человека; между ними, скорее всего, будет весьма высокая корреляция, поскольку для них свойственны аналогичное геометрическое расположение, освещенность и т.д. Для сокращения количества размерностей вектора характеристик можно с успехом применять методы уменьшения объема данных, такие как анализ наиболее важных компонентов; использование таких методов обеспечивает распознавание объектов, подобных лицам, с большим быстродействием по сравнению с тем, которое может быть достигнуто с использованием пространства большей размерности.