Зустрічайте нову потужну систему розпізнавання зображень SEER A.I.

Якщо Facebook має неофіційний слоган, еквівалент Google «Don’t Be Evil» або Apple «Think Different», це «Рухайся швидко і Ламати речі». Це означає, принаймні теоретично, що потрібно повторювати спроби новин і не боятися можливості невдача. Однак у 2021 році, коли соціальні медіа зараз звинувачують у безлічі суспільних бід, фразу, можливо, слід змінити на: «Рухайся швидко і виправляй речі».

Зміст

  • Ласкаво просимо до самоконтрольованої революції
  • Інші можливі застосування

Одна з багатьох сфер соціальних мереж, не тільки Facebook, було засуджено за поширення певних зображень в Інтернеті. Це складна проблема за будь-яких умов: щосекунди у Facebook завантажується близько 4000 фотографій. Це дорівнює 14,58 мільйонів зображень на годину, або 350 мільйонів фотографій щодня. Виконання цієї роботи вручну потребує кожного Facebook працівник працюватиме 12-годинну зміну, схвалюючи або ветуючи завантажене зображення кожні дев’ять секунд.

facebook зламаний
Digital Trends Graphic

Навряд чи це станеться найближчим часом. Ось чому роботу з класифікації зображень передано системам штучного інтелекту. Нове дослідження Facebook, опубліковане сьогодні, описує нову великомасштабну модель комп’ютерного зору під назвою SEER (це «самоконтрольований» у безнадійно спотвореній традиції бекронімів, яку люблять технічні люди обійми). Натренований на понад 1 мільярді публічних зображень в Instagram, він може перевершити найсучасніші система розпізнавання зображень із самоконтролем, навіть якщо зображення низької якості, а тому складні читати.

Пов'язані

  • А.І. у 2020 році вдалося досягти кількох важливих віх. Ось підсумок

Це розробка, яка може, як стверджують її творці, «[прокласти] шлях до більш гнучких, точних і адаптованих моделей комп’ютерного зору». Його можна використати краще тримайте «шкідливі зображення або меми подалі від нашої платформи». Це може бути настільки ж корисним для автоматичного створення зображень із описом альтернативного тексту для людей із вадами зору людей, чудову автоматичну класифікацію товарів для продажу на Marketplace або Facebook Shops, а також безліч інших програм, які потребують вдосконалення комп'ютерний зір.

Рекомендовані відео

Ласкаво просимо до самоконтрольованої революції

«Використовуючи самоконтроль, ми можемо тренуватися на будь-якому випадковому зображенні», Прія Гоял, інженер-програміст у Facebook AI Research (FAIR), де компанія здійснює свою діяльність багато інноваційних досліджень розпізнавання образів, розповіли Digital Trends. «[Це] означає, що в міру розвитку шкідливого контенту ми можемо швидко навчити нову модель на змінених даних і, як наслідок, швидше реагувати на ситуації».

Самонагляд, на який посилається Гоял, є брендом машинне навчання що потребує менше участі людини. Напівконтрольоване навчання – це підхід до машинного навчання, який є чимось середнім між контрольованим і неконтрольованим навчанням. У контрольованому навчанні дані навчання повністю позначені. У неконтрольованому навчанні немає позначених навчальних даних. У напівконтрольованому навчанні … ну, ви зрозуміли. Для машинного навчання це те, що для батьківства – стежити за своєю дитиною, поки вона самостійно їздить по парку. Самоконтрольоване навчання використовувалося для трансформаційних ефектів у світі обробки природної мови для всього, від машинного перекладу до відповідей на запитання. Тепер це також застосовується до розпізнавання зображень.

мозку мережі на ілюстрації вен
Chris DeGraw/Digital Trends, Getty Images

«Навчання без нагляду — це дуже широкий термін, який передбачає, що під час навчання взагалі не використовується нагляд», — сказав Гойял. «Самоконтрольоване навчання є підмножиною — або більш конкретним випадком — неконтрольованого навчання, оскільки самоконтроль автоматично отримує контрольні сигнали з навчальних даних».

Що означає самоконтрольоване навчання для Facebook, так це те, що його інженери можуть тренувати моделі на випадкових зображеннях, і робити це швидко, досягаючи хороших результатів у багатьох завданнях.

«Можливість тренуватися на будь-якому випадковому зображенні в Інтернеті дозволяє нам захопити візуальне розмаїття світу», — сказав Гойял. «Контрольоване навчання, з іншого боку, вимагає анотацій даних, що обмежує візуальне розуміння світу, оскільки модель навчена вивчати лише дуже обмежені візуальні анотовані концепції. Крім того, створення анотованих наборів даних обмежує обсяг даних, на яких можна навчати наші системи, отже, контрольовані системи, ймовірно, будуть більш упередженими».

Це означає, що А.І. системи, які можуть краще навчатися на будь-якій інформації, яку вони надають, без неї змушені покладатися на підібрані та позначені набори даних, які навчать їх розпізнавати конкретні об’єкти в a фото. У світі, який рухається так само швидко, як онлайн, це важливо. Це має означати більш розумне розпізнавання зображень, яке діє швидше.

Інші можливі застосування

«Ми можемо використовувати самоконтрольовані моделі для вирішення проблем у областях, які мають дуже обмежені дані або взагалі не мають метаданих, наприклад медична візуалізація", - сказав Гоял. «Маючи можливість тренувати високоякісні моделі, які самостійно контролюються, лише з випадкових, немаркованих і непідготовлених зображень, ми можемо тренувати моделі на будь-якому зображення в Інтернеті, і це дозволяє нам фіксувати різноманітність візуального вмісту та пом’якшувати упередження, які інакше вносять дані кураторство. Оскільки нам не потрібні мітки чи контроль даних для навчання самоконтрольованої моделі, ми можемо швидко створювати та розгортати нові моделі для вирішення проблем».

Як і вся робота FAIR, наразі ця технологія перебуває на стадії дослідження, а не технологія, яка буде розповсюджена у вашій стрічці Facebook протягом наступних кількох тижнів. Це означає, що це не буде негайно розгорнуто для вирішення проблеми шкідливих зображень, які поширюються в Інтернеті. Водночас це означає, що розмови про використання А.І. передчасно виявляти дрібні деталі на завантажених зображеннях.

Подобається це чи ні, але класифікатор образів A.I. інструменти стають розумнішими. Велике питання полягає в тому, чи звикли вони, щоб ламати речі далі, чи почали їх виправляти знову.

Рекомендації редакції

  • А.І. зазвичай нічого не забуває, але нова система Facebook забуває. Ось чому
  • Новий штучний інтелект Facebook виводить розпізнавання зображень на абсолютно новий рівень