Поиск информации в сети стал для нас делом привычным, длительность процесса тоже не удивляет, да и качество результатов мало кто анализирует. Выдала поисковая система что-то, ключевые слова в результатах присутствуют. Если не нашлось, что нужно – ну значит, не шмогла:)
Занимаясь поиском мультимедиа, мы решили попробовать изменить текстовый поиск, используя собственные технологии. Смотрите, что получилось.
Введем имя «Мария» в качестве запроса на поиск в одной из известных систем. Получаем следующие результаты:

Вводим тот же запрос на picollator.ru. Результаты:

Видите разницу?
В первом случае демонстрируются изображения, содержащие в описаниях тег «Мария», в хаотичном порядке (или в беспорядке?). Во втором случае изображения выведены группой, потому как имеется сходство содержания этих картинок. Другими словами, система полагает, что это фотографии одного и того же человека. Отсюда и появление группы.
Мы использовали технологию, которая позволяет сравнивать визуальные объекты со словами, т.е. система создает объединенный индекс мультимедиа и текстовой информации, анализируя семантику изображений.
В следующей версии появится абсолютно новая группировка изображений и сайтов…однако об этом напишу в следующем постинге. Не пропустите:)



