
Die jahrhundertealte Debatte Maschine versus Geist hat einen entscheidenden neuen Meilenstein erreicht. Eine heute veröffentlichte bahnbrechende Studie hat quantifiziert, was viele in der Kreativwirtschaft intuitiv gespürt haben: Künstliche Intelligenz (Artificial Intelligence, AI), insbesondere fortgeschrittene Große Sprachmodelle (Large Language Models, LLMs) wie GPT-4, hat offiziell die kreative Leistung des durchschnittlichen Menschen übertroffen. Bevor jedoch die Alarmglocken für das Ende menschlicher Kunstfertigkeit läuten, zeigen die Daten eine entscheidende Nuance — die einfallsreichsten menschlichen Köpfe behalten statistisch signifikant die Nase vor den Algorithmen.
Diese Forschung, die biologische Kognition gegen Siliziumverarbeitung in standardisierten Kreativitätstests antreten lässt, legt nahe, dass KI zwar erfolgreich das "Bodeniveau" kreativer Produktion angehoben hat, aber die von Spitzeninnovatoren gesetzte "Decke" noch nicht durchbrochen wurde. Für Fachleute im Bereich Generative KI (Generative AI) ist diese Unterscheidung nicht bloß akademisch; sie verändert grundlegend, wie wir die Rolle der KI in kreativen Arbeitsabläufen sehen und verschiebt die Erzählung von Ersatz hin zu tiefgreifender Ergänzung.
Kreativität zu quantifizieren war für Kognitionswissenschaftler historisch eine Herausforderung. Um die Fähigkeiten aktueller Modelle gegen menschliche Teilnehmende zu bewerten, nutzten die Forschenden die Torrance Tests of Creative Thinking (TTCT) und die Alternate Uses Task (AUT). Dabei handelt es sich um branchenübliche Assessments, die divergentes Denken messen — also die Fähigkeit, mehrere einzigartige Lösungen für offene Probleme zu generieren (z. B. „Liste alle möglichen Verwendungen für einen Ziegelstein auf“).
Die Studie analysierte Antworten aus einem diversen Pool menschlicher Teilnehmender gegenüber denen, die von GPT-4 generiert wurden. Die Ergebnisse wurden über drei primäre Dimensionen bewertet:
Indem Prompt-Engineering und menschliche Reaktionszeiten streng kontrolliert wurden, lieferte die Studie den bisher genauesten „Apfel-zu-Apfel“-Vergleich im Jahr 2026.
Die auffälligste Erkenntnis des Berichts ist die schiere Dominanz der KI gegenüber dem „durchschnittlichen“ menschlichen Teilnehmenden. In Bezug auf Flüssigkeit übertraf die KI nahezu 90 % der menschlichen Kohorte. Wo ein typischer Mensch in einem vorgegebenen Zeitrahmen vielleicht 10 bis 15 Verwendungen für eine Büroklammer auflisten würde, konnte die KI sofort 50 generieren und deckte dabei ein breiteres Spektrum an Kategorien ab.
Noch überraschender schnitt die KI bei Originalität besser ab als die mediane menschliche Antwort. Das stellt die frühe Kritik infrage, dass LLMs lediglich „stochastische Papageien“ seien, die nur nachahmen könnten. Die Studie deutet darauf hin, dass das umfangreiche Trainingsmaterial des Modells ihm erlaubt, disparate Konzepte effektiver zu verbinden als eine Person mit durchschnittlicher kreativer Ausbildung. Zum Beispiel würde ein durchschnittlicher Teilnehmender vielleicht vorschlagen, einen Ziegelstein als „Türstopper“ oder „Briefbeschwerer“ zu verwenden (häufige Antworten), während die KI ohne weiteres Verwendungen wie „Zermahlen zu rotem Pigment für Farbe“ oder „als thermische Masse für einen Solarheizer“ vorschlug.
Das legt nahe, dass bei Aufgaben, die standardisierte Ideenfindung und Menge erfordern, die KI nicht länger nur ein Werkzeug ist; sie ist dem ungeübten menschlichen Verstand überlegen.
Trotz des statistischen Sieges der KI über die Mehrheit hob die Studie eine „kreative Decke“ hervor, die die Technologie noch nicht durchbrochen hat. Das oberste Perzentil der menschlichen Teilnehmenden — jene, die durchgehend als hochkreative Personen eingestuft wurden — übertraf GPT-4 weiterhin in der Qualität und Tiefe der Originalität.
Die Forschenden stellten fest, dass die KI hervorragend in assoziativer Kreativität ist (X mit Y verbinden), aber Schwierigkeiten bei konzeptueller Kreativität hat, die ein tiefes Kontextverständnis, emotionale Resonanz oder ein Brechen mit etablierter Logik erfordert. Die besten menschlichen Ideen zeichneten sich durch eine Qualität aus, die als „bedeutungsvolle Überraschung“ beschrieben wurde — Ideen, die nicht nur selten waren, sondern eine Logik besaßen, die trotz Neuheit sofort als wertvoll erkannt wurde.
Darüber hinaus zeigten die Flexibilitäts-Werte eine Einschränkung der KI. Zwar konnte sie mehr Ideen generieren, doch die Arten der Ideen folgten oft vorhersehbaren Mustern aus ihren Trainingsdaten. Spitzenkreative Menschen hingegen demonstrierten die Fähigkeit, „Sprünge“ zu machen, die der probabilistischen Natur von LLMs zuwiderliefen.
Um die Diskrepanz zwischen dem durchschnittlichen Menschen, dem erstklassigen menschlichen Kreativen und dem aktuellen Stand der KI zu veranschaulichen, zeigt die folgende Aufschlüsselung die Kernbefunde der Studie.
| Metric | Average Human Participant | AI (GPT-4 Model) | Top 1% Human Creative |
|---|---|---|---|
| Fluency (Volume) | Low to Moderate (10-15 ideas) |
Exceptional (50+ ideas) |
High (30-40 ideas) |
| Originality Score | Low (Relies on common associations) |
High (Connects distant concepts) |
Exceptional (creates novel paradigms) |
| Flexibility | Moderate (Stays within 2-3 categories) |
High (Spans multiple categories) |
Very High (Cross-pollinates disciplines) |
| Contextual Nuance | High (Understanding of social norms) |
Moderate (Can miss subtle cues) |
Exceptional (Deep emotional resonance) |
Die Ergebnisse dieser Studie haben tiefgreifende Implikationen für die Kreativwirtschaft im Jahr 2026 und darüber hinaus. Die Daten legen nahe, dass der Wert „durchschnittlicher“ kreativer Arbeit — einfache Texterstellung, Standard-Bildmaterial, gewöhnliche Brainstormings — weiter sinken wird, da KI diese Aufgaben commodifiziert. Wenn eine KI den Durchschnittsmenschen bei der Generierung standardisierter Ideen übertrifft, wird sich der Markt unausweichlich für diese automatisierten Lösungen bei Basisanforderungen entscheiden.
Der Aufschlag für elitärere menschliche Kreativität dürfte hingegen explosionsartig ansteigen. Da die „besten“ Menschen die „besten“ KIs weiterhin übertreffen, verlagert sich die Rolle des menschlichen Kreativen vom Produzenten großer Mengen hin zum Kurator von Qualität und zur Quelle tiefgreifender Neuheit.
Wichtige Erkenntnisse für Fachleute:
Warum existiert diese Decke? Kognitionswissenschaftler vermuten, dass es mit Intention und lebensgeprägter Erfahrung zusammenhängt. KI operiert innerhalb der Wahrscheinlichkeitsverteilung vorhandenen menschlichen Wissens. Sie kann die Ränder dieser Verteilung erkunden, aber nicht außerhalb von ihr treten, um etwas zu schaffen, das aus einer einzigartigen, subjektiven Welterfahrung abgeleitet ist — weil sie keine solche Erfahrung besitzt.
Die Spitzenkreativen Menschen schöpfen aus Sinneserfahrungen, persönlichem Trauma, Freude und komplexen sozialen Dynamiken, die derzeit nicht codierbar sind. Während KI die Sprache der Emotion simulieren kann, stellten die Forschenden fest, dass menschliche Bewertende oft zwischen der „hohlen“ Neuheit einer KI und der „resonanten“ Neuheit eines menschlichen Dichters oder Denkers unterscheiden konnten.
Die Erzählung, dass „KI Kreativität tötet“, ist nachweislich falsch; stattdessen demokratisiert KI sie. Indem sie den Durchschnitt besiegt, zwingt KI das gesamte Ökosystem, sich anzupassen. Die Schwelle dafür, was als „kreativ“ gilt, hat sich verschoben. Bloße Kompetenz ist jetzt automatisiert.
Für die Leserinnen und Leser von Creati.ai ist diese Studie ein Aufruf zum Handeln. Wir konkurrieren nicht länger darum, durchschnittlich zu sein. Die uns zur Verfügung stehenden Werkzeuge stellen sicher, dass die Basis höher ist als je zuvor. Die Herausforderung besteht nun darin, diese Werkzeuge zu nutzen, um jenes obere Perzentil zu erreichen — den Raum zu besetzen, in dem menschliche Einfallsreichtum, unterstützt durch maschinelle Geschwindigkeit, Vorstellungen erlangen kann, die zuvor für unmöglich gehalten wurden. Die Maschine hat den Boden angehoben; es liegt nun an uns, die Decke zu erhöhen.