Технология компьютерного зрения Google Lens помогает понять, что видит камера

Технология компьютерного зрения Google Lens позволяет находить контекст того, что видит ваша камера.
Сундар Пичаи стоит перед логотипом Google на Google IO 2021.
Эта история является частью нашего полного обзора Google I/O.

Хотите узнать название цветка или птицы, с которой вы встретились во время прогулки по парку? Вскоре Google Assistant сможет вам подсказать, используя камеру и искусственный интеллект.

Рекомендуемые видео

Google начал 2017 год с рывка Конференция ввода-вывода вокруг искусственного интеллекта и машинного обучения, а одна из технологий компьютерного зрения, которую он выделил, — это Google Lens, которая позволяет Камера делает больше, чем просто захватывает изображение — она дает больший контекст тому, что вы видите.

Подходит к Google Ассистент и Google ФотоТехнология Google Lens может «понять, на что вы смотрите, и помочь вам принять меры», — заявил генеральный директор Google Сундар Пичаи во время своего выступления. Например, если вы наведете камеру на афишу концертного зала, Google Ассистент сможет рассказать вам больше о исполнителя, а также воспроизводить музыку, помогать вам покупать билеты на шоу и добавлять его в свой календарь - и все это в течение одного одно приложение.

Когда камера направлена ​​на незнакомый объект, Google Assistant посредством распознавания изображений может сказать вам, что это такое. Направьте его на вывеску магазина, и использование информации о местоположении может дать вам содержательную информацию о бизнесе. Все это можно сделать посредством «разговорного» голосового взаимодействия пользователя с Ассистентом.

«Вы можете направить на него свой телефон, и мы автоматически сделаем всю тяжелую работу за вас», — сказал Пичаи.

С Google Lens ваш смартфон Камера не просто увидит то, что вы видите, но также поймет, что вы видите, чтобы помочь вам принять меры. #io17pic.twitter.com/viOmWFjqk1

— Гугл (@Google) 17 мая 2017 г.

Если вы используете приложение Google Translate, вы уже видели, как работает эта технология: наведите камеру на текст, и приложение переведет его на язык, который вы понимаете. В Google Assistant Google Lens пойдет еще дальше. В ходе демонстрации Google показал, что Google Ассистент не только переведет иностранный текст, но и отобразит изображения того, что описывает текст, чтобы предоставить дополнительную информацию.

В демо-версии Скотт Хаффман, вице-президент Google по разработке Assistant, продемонстрировал, как Google Lens внутри Google Ассистент может перевести японский текст изображения, а также дать дополнительный контекст того, что означает слово. является.

Технология распознавания изображений не нова, но Google Lens показывает, насколько продвинутым становится машинное обучение. Пичаи сказал, что, как и в случае с речью, Google добился значительных улучшений в области зрения. Технология компьютерного зрения не только помогает распознать, что что-то представляет собой, но даже может помочь восстановить или улучшить изображение. Сфотографировали размытую Эйфелеву башню? Поскольку компьютер распознает объект и знает, как он должен выглядеть, он может автоматически улучшить это изображение на основе того, что уже известно.

«Мы можем понять атрибуты фотографии», — сказал Пичаи. «Наши системы компьютерного зрения теперь даже лучше людей распознают изображения».

Вам больше не нужно будет записывать, что изображено на ваших фотографиях из отпуска. Вице-президент Google Анил Сабхарвал по Google Photos показал, как Google Lens может распознавать объекты на фотографии и предоставлять о них соответствующую информацию.

Чтобы сделать Lens эффективным в своей работе, Google использует сложную вычислительную архитектуру Наборы микросхем Cloud Tensor Processing Unit (TPU) для обучения и вывода данных для своей машины. обучение. Его технология TPU второго поколения может обрабатывать 180 триллионов операций с плавающей запятой в секунду; 64 платы TPU в одном суперкомпьютере могут обрабатывать 11,5 петафлопс. Благодаря такой вычислительной мощности новый TPU может одновременно обрабатывать как обучение, так и вывод, чего раньше не было. возможно в прошлом (предыдущий TPU мог обрабатывать только работу вывода, но не более сложную обучение). Машинное обучение требует времени, но это оборудование поможет ускорить работу.

Google Lens также станет основой следующего обновления Google Photos. Распознавание изображений уже используется в «Фото» для распознавания лиц, мест и предметов, что помогает в организации и поиске. С помощью Google Lens Google Photos могут предоставить вам более подробную информацию об объектах на ваших фотографиях, например название и описание здания; нажав на номер телефона на фотографии, вы позвоните и получите дополнительную информацию о произведении искусства, которое вы видели на фотографии. музей или даже автоматически введите пароль Wi-Fi с фотографии, сделанной на задней панели Wi-Fi. маршрутизатор.

Ненавижу вводить пароли сетей Wi-Fi? Сделайте снимок настроек беспроводной сети, и технология Google Lens через Google Фото автоматически введет их за вас.

Assistant и Photos станут первыми приложениями, использующими Google Lens, но они будут внедрены и в другие приложения. А с объявлением о поддержке Assistant в iOS пользователи iPhone также смогут использовать технологию Google Lens.

Рекомендации редакции

  • Нет, вам действительно не нужен Google Assistant на ваших умных часах.
  • 5 вещей, которые мы хотели бы увидеть на Google I/O 2023 (но, скорее всего, не увидим)
  • Google I/O 2023 состоится 10 мая с очным мероприятием
  • iPhone 14 Pro против. Битва камер Google Pixel 7 Pro невероятно близка
  • Эта новая функция Google Lens выглядит так, как будто она взята прямо из научно-фантастического фильма.

Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.