Was AI so alles kann – und was nicht

AI (Artificial Intelligence), im deutschsprachigen Raum auch als KI (Künstliche Intelligenz) bekannt, war die längste Zeit hauptsächlich ein Thema für Science-Fiction-Autoren und Hollywood. Ob Isaac Asimov, Philip K. Dick oder Stanley Kubrick – schon viele große Künstler faszinierte der Gedanke, dass Maschinen eines Tages ein Bewusstsein entwickeln könnten. Die mediale Rezeption von künstlicher Intelligenz bildet somit eine Art Gegenstück zu der des Transhumanismus, die vor einiger Zeit in unserem Blog besprochen wurde. Hier nähert sich der Mensch der Maschine an, dort die Maschine dem Menschen.

In der „echten Welt“ wurde das Thema AI hingegen erst in den letzten Jahren wirklich relevant. Den Anfang machten verschiedene Anwendungen in Forschung und Industrie. Um etwa die gigantischen Datenmengen, die in einigen wissenschaftlichen Untersuchungen gesammelt werden – Stichwort „Big Data“ – sinnvoll analysieren zu können, kommen heute häufig sogenannte Machine-Learning-Systeme zum Einsatz. Sie durchforsten Tera- und Petabytes an Informationen und erkennen hierbei selbstständig Muster. Der Mensch muss diese anschließend „nur“ noch korrekt interpretieren. Für die breite Öffentlichkeit rückte AI schließlich mit ersten Berichten über auto-generierte Texte und Deep-Fakes in Zeitung und Fernsehen ins Bewusstsein. Doch während inhaltlich fragwürdige Robo-Literatur und programmierbare Spitzenpolitiker noch für Erheiterung und/oder Erschrecken sorgten, brachten sich bereits erste KI-Applikationen in Stellung, die tatsächlich von einem Massenmarkt genutzt werden können.

Mittlerweile ist die Auswahl an, meist webbasierten, AI-Produkten nur noch schwer zu überblicken. Ihr Nutzen ist dabei häufig gering, ihr Unterhaltungswert hingegen umso größer. Erst im Sommer diesen Jahres entwickelte sich etwa das Posten absurder DALL-E-mini Bildkreationen zum wahren Volksport auf Twitter. Doch es gibt Beispiele, die das Potential erahnen lassen. Drei besonders erwähnenswerte künstliche Intelligenzen sollen deshalb im Folgenden näher vorgestellt werden:

DALL-E 2

Den Anfang macht DALL-E 2, ein Bildgenerator auf Basis ausgeklügelter KI-Technik. Mit den Vorgängerversionen (wie dem bereits erwähnten DALL-E-mini) hatte Entwickler OpenAI bereits erste Erfolge gefeiert und Erfahrungen gesammelt. Doch deren Endprodukte waren selten mehr als absurde Partygags – insbesondere Darstellungen von Menschen erinnerten meist eher an expressionistische Gemälde. Die neueste Generation kann hier schon deutlich mehr. Präzise Eingaben im Textfeld vorausgesetzt, ist die Software in der Lage, erstaunlich echt aussehende Abbildungen von so ziemlich allem zu produzieren, was man sich vorstellen kann. Ein Einrad-fahrender Goldfisch mit Clownshut? Kein Problem! Drei pinke Astronauten spielen Saxofon, gemalt im Stil von Vincent van Gogh? Aber sicher doch…

Dass die Nachfrage nach jederzeit, auf Knopfdruck generierbarer Kunst – wenn man es als solche bezeichnen mag – groß ist, verwundert in Zeiten endloser Social-Media-Feeds, die gefüttert werden wollen, nicht. Entsprechend ist das von Microsoft und Elon Musk unterstützte OpenAI auch nicht das einzige Unternehmen, das die Marktlücke besetzen möchte. Allem voran Tech-Gigant Google verspricht mit den beeindruckenden Ergebnissen seines AI-Bildgenerators „Imagen“, die Technologie zu revolutionieren. Bisher müssen Interessierte hier allerdings noch auf Googles Marketing-Material vertrauen. Selbst ausprobieren, wie bei der Konkurrenz, ist noch nicht möglich.

GPT-3

Während künstliche Intelligenz in Sachen bildender Kunst langsam die Stützräder ablegt, ist sie beim Schreiben schon kurz davor zu fliegen. Kein Wunder, waren doch automatisierte Text-Generatoren eine der ersten Anwendungsmöglichkeiten für AI, deren Sinn sich der Mehrheit erschloss. Wie praktisch, effizient und vor allem wirtschaftlich wäre es etwa für Nachrichtenportale, nur noch die rohen Fakten einzutippen und die Software erzeugt daraus einen verständlichen und angenehm zu lesenden Artikel. Was vor einigen Jahren angesichts noch recht unbeholfener Formulierungen eher unrealistisch schien, wurde spätestens mit GPT-3 eine konkrete Möglichkeit für die nahe Zukunft. Das ebenfalls von OpenAI entwickelte, Machine-Learning-basierte Sprachmodell wurde 2020 der Öffentlichkeit vorgestellt und sorgt seither für Staunen bzw. bei manchen für Schrecken. Denn die per API-Schnittstelle in andere Programme einbindbare Software liefert Ergebnisse, die bisher nur wenige überhaupt für möglich hielten: Auf Grundlage minimalen Inputs spuckt sie sinnvolle, ausführliche und sogar stilistisch brauchbare Texte aus.

Die Anwendungsmöglichkeiten sind hierbei wesentlich vielfältiger als man zunächst glauben möchte, denn GPT-3 eignet sich nicht nur für sachliche Nachrichtenartikel. Auf Wunsch schreibt die KI auch durchaus annehmbare Prosa, Gedichte oder – wie findige Web-Entwickler herausfanden – HTML-Code. Der bereits jetzt gigantische Sprachschatz der Software erweitert sich zudem durch die aktive Nutzung ständig. Während die Vorgängerversion GPT-2 hierzu noch 1,5 Milliarden Parameter überprüfte, sind es bei GPT-3 bereits 175 Milliarden. Ein sprichwörtlicher Quantensprung.

AI Dungeon

Nachdem die beiden vorherigen Beispiele erahnen lassen, welchen Einfluss AI zukünftig auf unsere Arbeitswelt haben könnte (auch auf die von PR-Profis), handelt es sich bei AI Dungeon im Vergleich eher um eine Spielerei. In Sachen Gameplay und Design aufgebaut wie ein sogenanntes Text-Adventure aus den Anfangstagen der Videospiele, kommt das Programm zunächst recht unscheinbar daher. Zu Beginn wählt der Spieler ein Setting und eine grundlegende Prämisse für sein Abenteuer aus. Von hier an beeinflusst er die Handlung – die äußerst schlicht mit weißem Text auf schwarzem Grund präsentiert wird – nur durch seine Eingaben in ein Textfeld. Vorgaben gibt es praktisch keine. Jede Idee, die einem in den Sinn kommt, kann eingetippt werden. Die Spielwelt reagiert dann, so gut sie kann, auf das Geschriebene.

Den technologischen Unterbau hierfür liefert das Sprachmodell GPT-2. Es erlaubt es dem Spiel, erstaunlich sinnvoll mit den Handlungen und Aussagen des Spielercharakters umzugehen und sich diese auch im weiteren Verlauf zu merken. So bleibt die Spielwelt größtenteils konsistent und die Handlung ergibt, wenigstens in groben Zügen, Sinn. Bei zu absurden Eingaben oder wenn Sätze vom Spieler missverständlich formuliert werden, stößt das System jedoch schnell an seine Grenzen. Dann kann es etwa vorkommen, dass bereits verlorene Gegenstände plötzlich wieder da sind oder Charaktere völlig unsinnig auf eine Situation reagieren. Abhilfe soll deshalb zukünftig eine neue Version von AI Dungeon auf Basis von GPT-3 schaffen, die sich aktuell in einer Beta-Phase befindet.

Die Welt der künstlichen Intelligenz ist groß, aufregend und verursacht gelegentlich Unbehagen. Ob AI, Machine-Learning und Co. in den kommenden Jahren tatsächlich Arbeitsplätze bedrohen werden, wie der ein oder andere Tech-Nostradamus behauptet, bleibt abzuwarten. Sicher ist jedoch, dass der Fortschritt in diesem Bereich nicht langsamer wird und das Potential hat, vieles zu verändern. Eines bleibt aber (vorerst) sicher: Egal wie gut malerisches Können und Textverständnis der KI-Anwendungen noch werden, die menschliche Kreativität können sie weder simulieren noch ersetzen. Und das ist auch gut so.

Was AI so alles kann – und was nicht

DALL-E 2

GPT-3

AI Dungeon

Kommentar absenden Antworten abbrechen

Kategorien