KI & Robotics

Interactive AI: Wenn KI-Tools sich unterhalten

Ein Jahr ist es her, dass Open AI mit ChatGPT einen wichtigen Meilenstein in der Entwicklung der generativen KI gesetzt hat. Seit November 2022 ist viel passiert und doch steht der nächste große Evolutionssprung noch bevor: Interactive AI – also KI-Anwendungen, die miteinander kommunizieren. Unser Autor Falk Hedemann gibt einen Überblick.

Schon kurz nach dem Start von ChatGPT wurde den Technologieexperten früh klar, dass sie hier nicht nur einem weiteren Trend beiwohnen, der nach kurzer Zeit wieder abebben wird. Schnell wurde der Vergleich zu einer anderen bedeutenden Technologieeinführung gezogen: Mit ChatGPT hatte die Generative KI ihren iPhone-Moment.

Denkt man diesen Vergleich konsequent weiter, stehen wir erst am Anfang einer bedeutsamen Entwicklung. Das erste iPhone war im Vergleich zu heutigen Smartphone-Modellen eher ein Versprechen auf die Zukunft. Und genau so sollten wir auch die erste Generation der Generativen KI einordnen: Sie sind ein Ausblick auf kommende Entwicklungen und wir können heute bestenfalls erahnen, in welche Richtung sie sich weiterentwickeln werden.

Von einer generellen KI sind wir noch weit entfernt

So beeindruckend uns die heutigen KI-Tools auch Intelligenz vorgaukeln, sie selbst sind es noch nicht. Sie erscheinen uns intelligent, weil sie in gigantischen Datenbergen Muster erkennen und reproduzieren können. Damit haben sie einen großen Entwicklungsschritt gemacht. Doch von einer starken KI sind die heutigen KI-Werkzeuge noch weit entfernt.

Darunter verstehen KI-Forscher eine „Artificial General Intelligence“ (AGI), die nicht nur in der Lage ist, menschliche Kommunikation durch Mustererkennung zu simulieren. Vielmehr kann eine AGI jede Form von intellektuellen Aufgaben verstehen oder erlernen, die ein Mensch ausführen kann. Übersteigen die Fähigkeiten einer KI sogar die menschliche Intelligenz, spricht man von einer Superintelligenz oder Singularität.

Sowohl die AGI als auch die Singularität gelten derzeit als theoretische Konstrukte der technologischen Zukunftsforschung, bei denen unklar ist, ob sie jemals Realität werden. Die aktuelle Generation von KI-Werkzeugen wird dagegen als „schwache KI“ kategorisiert. Sie werden als Modelle charakterisiert, die keine eigene Kreativität besitzen und nicht in der Lage sind, selbstständig neue Fähigkeiten zu erlernen. Ihre Stärke liegt im Erkennen von Mustern in großen Datenmengen (maschinelles Lernen). Schwache KI erledigen klar definierte Aufgaben nach einer festgelegten Methodik und eignen sich besonders für wiederkehrende, komplexe Aufgaben.

KI-Experte erwartet Interactive AI als nächsten Schritt

Auch ChatGPT als Text-KI oder DALL-E 3 als Bild-KI gehören zur Kategorie der schwachen KI. Sie können jeweils ihre programmierten Aufgaben sehr gut erfüllen, aber weder wird ChatGPT plötzlich Bilder erzeugen noch DALL-E 3 Texte.

Da die Entwicklung einer AGI noch nicht in Sicht ist, die Werkzeuge der schwachen KI aber bereits sehr gute Ergebnisse liefern, ist deren Kombination quasi ein logischer Zwischenschritt. OpenAI als Anbieter der beiden genannten Generative-AI-Tools hat damit bereits begonnen. In einem Blogbeitrag erklären die Entwickler, wie das funktioniert:


Diese Art der Kommunikation zwischen KI-Tools nennt der britische KI-Forscher und Unternehmer Mustafa Suleyman „Interactive AI“. Er ist überzeugt, dass wir unsere KI in Zukunft nicht mehr über grafische Oberflächen und durch Eintippen von Text anweisen, sondern mit ihr sprechen werden. Dann werden auch komplexere Aufgaben möglich sein, die von verschiedenen KI-Tools gemeinsam bearbeitet werden. So sieht er zumindest die Zukunft seiner eigenen ChatGPT-Alternative Pi

Was ist mit interaktiver KI möglich?

Bleiben wir zunächst im Bereich der generativen KI. Mit einem ganzen Set von KI-Tools, die miteinander kommunizieren können, um komplexe Aufgaben gemeinsam zu erledigen, könnten wir ein komplettes Content-Asset mit nur einem Prompt erstellen lassen. Die digitalen Assistenten erstellen für uns nicht nur einen Text, sondern auch gleich die passende Illustration, einen Podcast mit der Stimme des Autors oder der Autorin, ein Erklärvideo mit Untertiteln und Social-Media-Posts, die perfekt auf die jeweilige Plattform und die dort erreichbare Zielgruppe zugeschnitten sind. Mindestens fünf verschiedene KI-Tools sind daran beteiligt.

Suleyman, der auch Mitgründer von DeepMind ist, das nach der Übernahme 2014 die KI-Abteilung von Google bildet, skizziert in einem CNBC-Interview eine nahe Zukunft, in der jeder einen persönlichen KI-Assistenten hat. Dieser sei superintelligent und smart, kenne den Nutzer sehr gut und könne seinen Tag organisieren. Er sei viel mehr als nur ein Recherchetool, sondern auch Berater und freundschaftlicher Begleiter.

Dieses Szenario soll laut Suleyman bereits in fünf Jahren Realität sein. Ob es tatsächlich so schnell und so weit geht, wird sich zeigen. Bis dahin sind noch zahlreiche rechtliche und ethische Fragen zu beantworten. Und nicht zuletzt wird es auch um die Akzeptanz der Nutzenden gehen.

Most Popular