Facebook macht seine Bilderkennungs-KI für jedermann zugänglich

Facebook Messenger Virus Malware Windows Chrome Facebookcomp Head
Die KI-Forschungsabteilung von Facebook stellt ihre Bilderkennungssoftware als Open Source bereit, mit dem Ziel, die Technologie so weiterzuentwickeln, dass sie eines Tages auf Live-Videos angewendet werden kann. Facebooks DeepMask, SharpMask, Und MultiPathNet Die Software ist jetzt für jedermann auf GitHub verfügbar.

Facebook Zuvor hat das Unternehmen seine Bilderkennungssysteme in einer Reihe von Forschungsarbeiten dargelegt, die zusammen mit seinen Demos auch der Öffentlichkeit zugänglich gemacht werden. Derzeit arbeiten die Algorithmen des Unternehmens mit seinen Faltungs-Neuronalen Netzwerken MultiPathNet zusammen – einer KI, die enorm gespeist wird Datenmengen, bis es andere Daten selbstständig erkennen kann – so kann Facebook ein Bild anhand jedes einzelnen Pixels verstehen enthält.

Empfohlene Videos

Um die Objekte in einem Bild zu klassifizieren und zu kennzeichnen, koppelt Facebook sein DeepMask-Segmentierungsframework mit seinem SharpMask-Segmentverfeinerungsmodul. Die letzte Stufe im Bildverarbeitungssystem von Facebook nutzt die Deep-Learning-KI MultiPathNet, um jedes Objekt auf dem Foto zu kennzeichnen.

Verwandt

  • OpenAI gibt den Standort seines ersten internationalen Außenpostens bekannt
  • Photoshop AI denkt, „Glück“ sei ein Lächeln mit faulen Zähnen
  • Optische Täuschungen könnten uns beim Aufbau der nächsten Generation der KI helfen

Laut Facebook hat sich die KI-Software für maschinelles Sehen in den letzten Jahren rasant weiterentwickelt und eine Art der Bildklassifizierung ermöglicht, die es vor Kurzem noch nicht einmal gab. Facebook behauptet, dass Open-Sourcing der Software für ihre Weiterentwicklung von entscheidender Bedeutung ist.

Beispielbilder, die mit dem vollständigen Bilderkennungssystem von Facebook gescannt wurden
Beispielbilder, die mit dem vollständigen Bilderkennungssystem von Facebook gescannt wurden

Überall im großen blauen Giganten schießen Deep-Learning-Techniken aus dem Boden. Die KI unterstützt Facebooks (umstritten) Gesichtserkennungsfunktion, verwaltet die Kuratierung seines Newsfeeds und wird sogar darin verwendet digitaler Assistent für Messenger.

Dies ist nicht das erste Mal, dass Facebook seine KI als Open Source zur Verfügung stellt. Tatsächlich ist das Unternehmen so etwas wie ein Vorreiter, wenn es um die Weitergabe seiner Technologie geht. Im Dezember, Facebook hat seinen Stand der Technik vorgelegt Server Das Open Compute Project widmet sich der KI – einer Gruppe bestehend aus Technologiegiganten wie Apple und Microsoft, die die Designs ihrer jeweiligen Computerinfrastrukturen teilen.

Facebook prognostiziert bereits die zukünftigen Anwendungsfälle für die Bilderkennungstechnologie. Das Unternehmen verrät, dass es ihm möglicherweise dabei helfen könnte, auf seinen bestehenden KI-generierten Bildbeschreibungen aufzubauen sehbehindert.

„Derzeit hören sehbehinderte Benutzer, die Fotos auf Facebook durchsuchen, nur den Namen der Person, die das Foto geteilt hat. gefolgt von dem Begriff „Foto“, wenn sie in ihrem Newsfeed auf ein Bild stoßen“, schreibt Piotr Dollar, Wissenschaftler bei Facebook AI Research (FAIR), in a Blogeintrag. „Stattdessen möchten wir ausführlichere Beschreibungen anbieten, wie zum Beispiel ‚Das Foto enthält Strand, Bäume und drei lächelnde Menschen.‘“

Darüber hinaus behauptet Facebook, dass seine nächste Herausforderung darin besteht, seine Bilderkennungstechniken auf Videos anzuwenden, „wo sich Objekte bewegen, interagieren und sich im Laufe der Zeit verändern“ und sogar Facebook Live-Übertragungen. „Echtzeitklassifizierung könnte dabei helfen, relevante und wichtige Live-Videos sichtbar zu machen Facebook„Während die Anwendung verfeinerter Techniken zur Erkennung von Szenen, Objekten und Aktionen über Raum und Zeit hinweg eines Tages eine Erzählung in Echtzeit ermöglichen könnte“, fügt Dollar hinzu.

Empfehlungen der Redaktion

  • Sogar OpenAI hat den Versuch aufgegeben, ChatGPT-Plagiate zu erkennen
  • Die besten KI-Bildgeneratoren zum Erstellen von Kunst aus Text
  • Meta hat DALL-E für Videos gemacht und es ist sowohl gruselig als auch erstaunlich
  • Drei Gründe, warum Facebook/Meta sein Gesichtserkennungssystem abschaltet
  • Die BigSleep A.I. ist wie die Google-Bildersuche nach Bildern, die noch nicht existieren

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.