picollator

Порно, не порно, спорно

In Решения on Май 20, 2009 at 10:01 дп

Возможность различать на фотографиях “не лица” обнаружилась в ходе разработок Picollator.  Однако на тот момент мы даже не подозревали, насколько актуальной является тема порно. Все известные публичные сервисы пытаются организовать процесс работы с нежелательным контентом и особых успехов пока в этом не достигли. Последняя публикация на Newsweek посвящена киберкопам Facebook, описанию их трудовых будней и тяжелой, но такой необходимой работе :) . 150  человек каждый день сортируют пользовательский контент в зависимости от собственных предпочтений – мускулистый представитель сильной половины человечества в душе, – не совсем правильно, но красиво – что ж, одобрим фото.  А вот здесь уже демонстрация не такая эффектная, – пожалуй, ограничим показ и т.д., и т.п.

Не сомневаюсь, что кто-то даже позавидует такой работе, за которую еще и платят достаточно. А что можно сказать о компании? Для наглядности возьмем данные Facebook:

1)  150 человек из 850 занимаются ручной модерацией изображений, – 17% персонала! Эти специалисты, среди которых есть выпускники Стенфорда, могли бы решать гораздо более интересные задачи;

2) эти люди в день мониторят 11 250 изображений из 400 000, что составляет только 3%!

3) 400 000 – это ежедневный объем фото, отмеченных пользователями как нежелательные для просмотра. А сколько фото осталось “за кадром”?

Такой подход напоминает 18 век, когда использовался исключительно ручной труд, однако затем появились машины и механизмы… ну а далее вы сами знаете.

Мы решили напомнить, что 21 век уже наступил, и выпустили сервис автоматической детекции сомнительного контента piFilter, русская версия которого готовится и будет доступна в ближайшее время.

Порно или не порно?

In Решения on Март 4, 2009 at 10:37 дп

Вот в чем вопрос. Именно его мы решали в последние месяцы, и теперь можем дать ответ, просто взглянув машинным глазом на фотографию. Основная фишка в том, что текстовые описания, теги и прочие метки здесь ни при чем. Новое решение от Рекогмишн способно на основе анализа содержания изображений определить, относится ли контент к категории “порно”.

Надо сказать, что процесс обучения был не из легких (хотя, возможно, кто-то может даже позавидовать авторам разработки :) ). Есть определенная специфика распознаваемых объектов по сравнению с лицами (какая же трудная тема для описания однако), соответственно система должна найти эти “специфические” объекты на картинке и одновременно не должна перепутать их с другими объектами. Если такие элементы найдены, фото классифицируется как “порно” и блокируется для отображения. Конечно, иногда фильтр смущается (а может устает :) ) и не может дать точный ответ. Ну здесь уж ничего не поделаешь, человек еще более субъективен в оценках и может забраковать вполне невинное фото.

Фильтр работает в автоматическом режиме, обрабатывает как отдельные картинки, так и сайты с визуальным контентом, может включаться и отключаться.

Теперь вам достаточно лишь определиться с выбором варианта ответа…

Найти неизвестного – миссия выполнима

In Поисковая система on Январь 15, 2009 at 2:54 пп

Вот мы и сделали новую версию, которая группирует фотографии по степени сходства. В отличие от предыдущей версии теперь похожие фотографии группируются, и эти группы отображаются в результатах поиска. Число картинок в группе указано в скобках.

Не буду давать длинных текстовых описаний, просто покажу практический пример использования новой группировки из серии “Найти неизвестного”.

Как-то исторически сложилось, что особенно привлекательным для нашей системы является мистер Буш – Picollator распознает его во всяком обличье и ракурсах (видимо, что-то в нем есть для машинного глаза).

Первоначально загружаем произвольно выбранное фото Буша. В результатах поиска появилась группа фотографий Джорджа (надеюсь, он не обидится за некоторую фамильярность) с  ”неизвестным”.  И в этой группе 38 фото.

bush6

В текстовом описании к файлу об этой интересной личности нет ни одного слова.  И как определить, кто это? Это не просто, а очень просто.

bush41

Нажимаем на ссылку Найти похожие (Similar) к данной группе фотографий, и вот он наш незнакомец – Карл Роув:

bush5

Как видим, в результатах поиска есть фотографии Карла и с Джорджем, и с другими товарищами. Цепочку выявления связей можно при желании  продолжить:)

Итак,  личность установлена. Далее можно использовать традиционные методы получения информации…