Полезно знать|20 Декабрь 2013 12:08

Как работает распознавание картинок в Google

При поиске по изображениям в Интернете Google ориентируется на названия и подписи, добавляемые пользователями при загрузке файлов на сайты, форумы, профили соцсетей и т.д. Но даже в случае, если графический файл не несет в себе необходимой для поисковика информации, Google все равно находит нужные изображения. Делать это ей позволяет специальная технология, которая «базируется на машинном распознавании и компьютерном самообучении и умеет на основании содержимого файла генерировать поисковые теги, что в совокупности с другими источниками позволяет находить такие обобщенные образы, как автомобили, еда, цветы и т.д.».

В недрах Google данная система поиска называется «Классификация изображения посредством глубоких нейронных сверточных сетей». В ней используются семь скрытых весовых слоев, специальные биграфы и контролируемое обучение, а работает она на основе 60 миллионов оцениваемых критериев и 650 тысяч нейронов.

1371413550_image-recognition-research

Отмечается, что общедоступная поисковая функция по изображениям на данный момент способна распознавать 1100 тегов (визуальных классов). Изначально количество тегов составляло 2000, но почти половина созданных визуальных классов в итоге была принесена в жертву большей эффективности поиска.

Вот несколько примеров классов, которые «понимает» интеллектуальная технология Google: поцелуй, закат, танец, белый медведь. Система распознает как общие понятия, так и конкретные объекты. Тем не менее, запросы вроде «мотор редуктор Калуга» или «Xbox магазины», ей пока не по плечу. В таких случаях технология выводит не совсем релевантные результаты. Впрочем, эти «ошибки» по-человечески обоснованы: они похожи на те, что делает сам пользователь, желая получить все и сразу.