Работа с распознаванием образов имеет одну уникальную особенность – процесс развития может принять неожиданный оборот.
Если проанализировать путь нашей компании, на котором точками будут отмечены локализуемые нами объекты, получится интересная траектория.
Первым объектом стали лица, т.к. данные статистики показывали, что это максимально часто встречающийся объект на фотографиях.
Следующим (промежуточным) звеном оказалась мебель. По заказу одной европейской компании мы разработали мини-решение для сайта по поиску похожих предметов интерьера.
Продолжая анализировать изображения с людьми, мы «наткнулись» на еще одну группу «объектов», которые представляют интерес для доминирующей части взрослого населения по всему миру. Причем слова в данном случае, как говорится, излишни Поскольку нам слова тоже без надобности, мы решили использовать технологические наработки и выпустили сервис автоматического детектирования порнографических изображений.
Каким может быть следующий пункт? Интересно, что объектов окружающего мира множество, и не все их изображения оказались распознанными на сегодняшний день. Например, на фестском диске отображена целая система объектов, которые до сих пор остаются большой минойской загадкой:
Может быть, заняться расшифровкой фестского диска ?
Какие объекты станут следующим звеном в цепочке распознавания? Примите участие в нашем опросе
Возможность различать на фотографиях «не лица» обнаружилась в ходе разработок Picollator. Однако на тот момент мы даже не подозревали, насколько актуальной является тема порно. Все известные публичные сервисы пытаются организовать процесс работы с нежелательным контентом и особых успехов пока в этом не достигли. Последняя публикация на Newsweek посвящена киберкопам Facebook, описанию их трудовых будней и тяжелой, но такой необходимой работе . 150 человек каждый день сортируют пользовательский контент в зависимости от собственных предпочтений – мускулистый представитель сильной половины человечества в душе, – не совсем правильно, но красиво – что ж, одобрим фото. А вот здесь уже демонстрация не такая эффектная, – пожалуй, ограничим показ и т.д., и т.п.
Не сомневаюсь, что кто-то даже позавидует такой работе, за которую еще и платят достаточно. А что можно сказать о компании? Для наглядности возьмем данные Facebook:
1) 150 человек из 850 занимаются ручной модерацией изображений, – 17% персонала! Эти специалисты, среди которых есть выпускники Стенфорда, могли бы решать гораздо более интересные задачи;
2) эти люди в день мониторят 11 250 изображений из 400 000, что составляет только 3%!
3) 400 000 – это ежедневный объем фото, отмеченных пользователями как нежелательные для просмотра. А сколько фото осталось «за кадром»?
Такой подход напоминает 18 век, когда использовался исключительно ручной труд, однако затем появились машины и механизмы… ну а далее вы сами знаете.
Мы решили напомнить, что 21 век уже наступил, и выпустили сервис автоматической детекции сомнительного контента piFilter, русская версия которого готовится и будет доступна в ближайшее время.
Вот в чем вопрос. Именно его мы решали в последние месяцы, и теперь можем дать ответ, просто взглянув машинным глазом на фотографию. Основная фишка в том, что текстовые описания, теги и прочие метки здесь ни при чем. Новое решение от Рекогмишн способно на основе анализа содержания изображений определить, относится ли контент к категории «порно».
Надо сказать, что процесс обучения был не из легких (хотя, возможно, кто-то может даже позавидовать авторам разработки ). Есть определенная специфика распознаваемых объектов по сравнению с лицами (какая же трудная тема для описания однако), соответственно система должна найти эти «специфические» объекты на картинке и одновременно не должна перепутать их с другими объектами. Если такие элементы найдены, фото классифицируется как «порно» и блокируется для отображения. Конечно, иногда фильтр смущается (а может устает ) и не может дать точный ответ. Ну здесь уж ничего не поделаешь, человек еще более субъективен в оценках и может забраковать вполне невинное фото.
Фильтр работает в автоматическом режиме, обрабатывает как отдельные картинки, так и сайты с визуальным контентом, может включаться и отключаться.
Теперь вам достаточно лишь определиться с выбором варианта ответа…
Вот мы и сделали новую версию, которая группирует фотографии по степени сходства. В отличие от предыдущей версии теперь похожие фотографии группируются, и эти группы отображаются в результатах поиска. Число картинок в группе указано в скобках.
Не буду давать длинных текстовых описаний, просто покажу практический пример использования новой группировки из серии «Найти неизвестного».
Как-то исторически сложилось, что особенно привлекательным для нашей системы является мистер Буш – Picollator распознает его во всяком обличье и ракурсах (видимо, что-то в нем есть для машинного глаза).
Первоначально загружаем произвольно выбранное фото Буша. В результатах поиска появилась группа фотографий Джорджа (надеюсь, он не обидится за некоторую фамильярность) с »неизвестным». И в этой группе 38 фото.
В текстовом описании к файлу об этой интересной личности нет ни одного слова. И как определить, кто это? Это не просто, а очень просто.
Нажимаем на ссылку Найти похожие (Similar) к данной группе фотографий, и вот он наш незнакомец – Карл Роув:
Как видим, в результатах поиска есть фотографии Карла и с Джорджем, и с другими товарищами. Цепочку выявления связей можно при желании продолжить:)
Итак, личность установлена. Далее можно использовать традиционные методы получения информации…