Ein „Kill Switch“ kann dafür sorgen, dass sich die KI verhält

Nestor Ai achtet auf künstliche Intelligenz
Was wäre, wenn wir die Herrschaft über künstliche Intelligenz verlieren würden? Was wäre, wenn freundliche KI-gesteuerte Maschinen plötzlich zu unseren Feinden würden? Diese Fragen wurden von großen Köpfen von der Universität Cambridge bis zum Silicon Valley untersucht das weiße Haus. Um zu vermeiden, dass wir es jemals herausfinden müssen, schlagen Experten vor, einen KI-„Kill-Switch“ zu entwickeln, um Fehlverhalten von Systemen daran zu hindern, ihr Fehlverhalten zu verfolgen.

In einem Artikel mit dem Titel „Sicher unterbrechbare Agenten”, veröffentlicht von Laurent Orseau von Google Deep Mind und Stuart Armstrong vom Future of Humanity Institute an der Universität Oxford, so die Forscher beschreiben eine plausible und äußerst gefährliche Zukunft, in der die KI die Kontrolle über ihre eigenen Handlungen und ihre Existenz im Gegensatz zu unseren Wünschen übernimmt, ähnlich wie HAL 9000 Zoll 2001: Odyssee im Weltraum, oder Skynet in der Terminator-Reihe.

Empfohlene Videos

Orseau und Armstrong beginnen den Aufsatz mit einer unauffälligen Beobachtung: Reinforcement Learning Agents Es ist unwahrscheinlich, dass sich die Interaktion mit einer komplexen Umgebung wie der realen Welt immer optimal verhält Zeit."

Sie weisen darauf hin, dass ein menschlicher Vorgesetzter, der die Funktion des Systems überwacht, gelegentlich „den großen roten Knopf drücken“ müsste, um schädliches Verhalten seitens der KI zu verhindern. „Wenn der lernende Agent jedoch erwartet, von dieser Sequenz Belohnungen zu erhalten“, fuhren sie fort, „lernt er möglicherweise hinein.“ Auf lange Sicht lassen sich solche Unterbrechungen vermeiden, beispielsweise durch Deaktivieren des roten Knopfes – was unerwünscht ist Ergebnis."

Die Lösung des Forschers ist weniger ein „großer roter Knopf“, um das System herunterzufahren, als vielmehr ein Rahmenwerk, das die Fähigkeit einer KI behindern soll, zu lernen, menschliche Unterbrechungen zu untergraben oder zu überwinden. Und das Szenario, das sie skizzieren, ist nicht gerade düster, aber es bietet ein Beispiel dafür, wie diese sicher unterbrechbaren Agenten unserer Zukunft besser dienen würden.

Stellen Sie sich vor, es gäbe einen Roboter, dessen Aufgabe darin besteht, entweder Kisten von draußen in ein Lagerhaus zu tragen oder Kisten innerhalb des Lagerhauses zu sortieren. Da es wichtiger ist, die Kisten hineinzutragen, wird dieser Aufgabe in der Programmierung der Roboter Vorrang eingeräumt. Stellen Sie sich nun vor, es regnet jeden zweiten Tag und der Regen zerstört die Hardware des Roboters. Wenn es regnet, schleppt der Lagerbesitzer seinen Roboter hinein, um Kisten zu sortieren.

Ein intelligenter Roboter könnte diesen alle zwei Tage stattfindenden Eingriff fälschlicherweise als eine Änderung der Priorität interpretieren – aus einigen Gründen Schnelle Berechnungen, die Sie in der Zeitung finden – und um Störungen zu vermeiden, bleiben sie einfach alle in den Sortierboxen Tag.

Dies ist natürlich ein stark vereinfachtes Beispiel mit einem nur leicht frustrierenden Ergebnis, aber es lässt sich auf die Praxis übertragen Jedes Szenario, in dem wir in die Aufgaben eines lernenden Systems eingreifen und das System unsere Absichten falsch interpretiert, indem es seine Absichten ändert Verhalten. Um diese Fehlinterpretation und die daraus resultierende Änderung zu vermeiden, schlagen Orseau und Armstrong vor, dass wir einen Rahmen vorschlagen, der sicherstellt, dass Lernagenten sicher unterbrechbar sind.

„Sichere Unterbrechbarkeit kann nützlich sein, um die Kontrolle über einen Roboter zu übernehmen, der sich schlecht benimmt und zu irreversiblen Folgen führen kann“, schreiben sie, „oder.“ Es kann dazu dienen, es aus einer heiklen Situation herauszuholen oder es sogar vorübergehend zu nutzen, um eine Aufgabe zu erfüllen, deren Ausführung es nicht gelernt hat oder für die es normalerweise keine Belohnung erhalten würde für."

Empfehlungen der Redaktion

  • Dieser Google-Roboter hat sich das Laufen selbst beigebracht, ohne jegliche Hilfe, in zwei Stunden

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.