изображения, контент, модерация, порно, сервис, фото
In Решения on Май 20, 2009 at 10:01 дп
Возможность различать на фотографиях “не лица” обнаружилась в ходе разработок Picollator. Однако на тот момент мы даже не подозревали, насколько актуальной является тема порно. Все известные публичные сервисы пытаются организовать процесс работы с нежелательным контентом и особых успехов пока в этом не достигли. Последняя публикация на Newsweek посвящена киберкопам Facebook, описанию их трудовых будней и тяжелой, но такой необходимой работе
. 150 человек каждый день сортируют пользовательский контент в зависимости от собственных предпочтений – мускулистый представитель сильной половины человечества в душе, – не совсем правильно, но красиво – что ж, одобрим фото. А вот здесь уже демонстрация не такая эффектная, – пожалуй, ограничим показ и т.д., и т.п.
Не сомневаюсь, что кто-то даже позавидует такой работе, за которую еще и платят достаточно. А что можно сказать о компании? Для наглядности возьмем данные Facebook:
1) 150 человек из 850 занимаются ручной модерацией изображений, – 17% персонала! Эти специалисты, среди которых есть выпускники Стенфорда, могли бы решать гораздо более интересные задачи;
2) эти люди в день мониторят 11 250 изображений из 400 000, что составляет только 3%!
3) 400 000 – это ежедневный объем фото, отмеченных пользователями как нежелательные для просмотра. А сколько фото осталось “за кадром”?
Такой подход напоминает 18 век, когда использовался исключительно ручной труд, однако затем появились машины и механизмы… ну а далее вы сами знаете.
Мы решили напомнить, что 21 век уже наступил, и выпустили сервис автоматической детекции сомнительного контента piFilter, русская версия которого готовится и будет доступна в ближайшее время.
детектор, изображения, модерация, порно, фильтр, фото
In Решения on Март 4, 2009 at 10:37 дп
Вот в чем вопрос. Именно его мы решали в последние месяцы, и теперь можем дать ответ, просто взглянув машинным глазом на фотографию. Основная фишка в том, что текстовые описания, теги и прочие метки здесь ни при чем. Новое решение от Рекогмишн способно на основе анализа содержания изображений определить, относится ли контент к категории “порно”.
Надо сказать, что процесс обучения был не из легких (хотя, возможно, кто-то может даже позавидовать авторам разработки
). Есть определенная специфика распознаваемых объектов по сравнению с лицами (какая же трудная тема для описания однако), соответственно система должна найти эти “специфические” объекты на картинке и одновременно не должна перепутать их с другими объектами. Если такие элементы найдены, фото классифицируется как “порно” и блокируется для отображения. Конечно, иногда фильтр смущается (а может устает
) и не может дать точный ответ. Ну здесь уж ничего не поделаешь, человек еще более субъективен в оценках и может забраковать вполне невинное фото.
Фильтр работает в автоматическом режиме, обрабатывает как отдельные картинки, так и сайты с визуальным контентом, может включаться и отключаться.
Теперь вам достаточно лишь определиться с выбором варианта ответа…
Буш, Поисковая система, распознавание, фотографии
In Поисковая система on Январь 15, 2009 at 2:54 пп
Вот мы и сделали новую версию, которая группирует фотографии по степени сходства. В отличие от предыдущей версии теперь похожие фотографии группируются, и эти группы отображаются в результатах поиска. Число картинок в группе указано в скобках.
Не буду давать длинных текстовых описаний, просто покажу практический пример использования новой группировки из серии “Найти неизвестного”.
Как-то исторически сложилось, что особенно привлекательным для нашей системы является мистер Буш – Picollator распознает его во всяком обличье и ракурсах (видимо, что-то в нем есть для машинного глаза).
Первоначально загружаем произвольно выбранное фото Буша. В результатах поиска появилась группа фотографий Джорджа (надеюсь, он не обидится за некоторую фамильярность) с ”неизвестным”. И в этой группе 38 фото.

В текстовом описании к файлу об этой интересной личности нет ни одного слова. И как определить, кто это? Это не просто, а очень просто.

Нажимаем на ссылку Найти похожие (Similar) к данной группе фотографий, и вот он наш незнакомец – Карл Роув:

Как видим, в результатах поиска есть фотографии Карла и с Джорджем, и с другими товарищами. Цепочку выявления связей можно при желании продолжить:)
Итак, личность установлена. Далее можно использовать традиционные методы получения информации…