Pixlogic система логического поиска цифровых изображений
Для человеческого глаза и разума обнаружить зрительное сходство двух и более предметов или изображений — операция нетрудная. Даже, можно сказать, сама собой разумеющаяся.
Для компьютера же эта задача долгое время оставалась непосильной. Но вот ЦРУ наткнулось на алгоритм компании PixLogic…
…Повертев этот алгоритм в руках и так, и этак, ЦРУ извлекло из широких штанин некий, видимо довольно крупный, грант, выложило его на стол перед сотрудниками PixLogic и приставило палец к губам: мол, тсс!
Собственно, в реальности всё выглядело несколько менее поэтично: у ЦРУ есть специальная «ширма» — фирма венчурного капиталовложения In-Q-Tel, которая как раз занимается финансированием рисковых, но перспективных технологических задумок. Именно In-Q-Tel выделило PixLogic грант, о размерах которого ничего, впрочем, не известно.
Что предлагает PixLogic? Из объяснений, представленных на их сайте, следует, что разработанный ими алгоритм способен с огромной скоростью перерабатывать многочисленные изображения, как статичные, так и постоянно меняющиеся (то есть, видео), и находить в них сходство.
То есть выделять сходные, с логической точки зрения, элементы — форму, например.
Ещё одна технология распознавания лиц — из тех, что раз за разом демонстрируют свою немощность?
И да, и нет. Как явствует из пояснению PixLogic, разработанная ими система выделяет логическую информацию о форме, точнее, внешнем облике представленных на цифровом изображении объектов, и хранит её в виде метаданных.
Каждое изображение раскладывается на «объекты» и именно их характеристики переводятся в мета-формат.
В качестве опорных характеристик используются форма, цвет, размер, расположение и ориентация предмета. Всё это представляется в математическом виде.
Когда необходимо произвести сравнение с другими изображениями, любая часть исходной картинки, или она сама целиком могут служить аналогом «ключевого слова» в текстовом поиске — сходство выявляется по выделенным метаданным.
Что же касается объёма, который занимают вышеуказанные метаданные, то тут, по утверждениям PixLogic, всё очень радужно: математическое описание любого изображения — а точнее, объектов, на нём представленных, — занимает всего-навсего 1% от размера графического файла.
Как видим, интерес ЦРУ к этой разработке совершенно закономерен. Любая спецслужба многое бы отдала для того, чтобы заполучить аналогичный алгоритм представления графической информации в виде «математического каркаса», если так можно выразиться.
Хотя ниоткуда не следует, что из этого «каркаса» можно восстановить исходное изображение — технология, очевидно, разрабатывалась не для хранения графических данных, а для их поиска, сопоставления и каталогизации.
Чтобы вычислить лицо в толпе, программе не нужно много времени. Вопрос в том, чтобы вычислить именно того, кого надо.
Спецслужбы заинтересованы, прежде всего, в автоматизации процесса обнаружения лиц, подозреваемых в каких-либо преступлениях (или в намерении совершить таковые). Для человека будет очень большой проблемой перелопатить миллионы фотографий лишь для того, чтобы обнаружить на пяти из них интересующего его персонажа.
Учитывая обширные планы Министерства внутренней безопасности (Department of Homeland Security) по узнаванию всего про всех, силовики острейшим образом нуждаются в технологиях, которые автоматизируют рутинный поиск сходных изображений.
Впрочем, кроме спецслужб PixLogic собирается предлагать свои технологии и организациям, так или иначе занимающимся работой с визуальной информацией, в том числе, фотографическим компаниями и киностудиям, — всем тем, у кого имеется большая библиотека визуальных данных, подлежащих каталогизации.
Кстати, уже выпущен пакет для разработчиков PixLogic SDK. Этот пакет позволит встраивать в различные программные решения средства поиска по изображениям.
🚩 Не показывает цифровая приставка ТВ