ChatGPT: KI liest sechsmal mehr, als sie zitiert

Robert Sasse

Heute, 19:15 Uhr

Eine neue Studie enthüllt eine tiefe Kluft zwischen den Daten, die ChatGPT für eine Antwort verarbeitet, und den Quellen, die sie tatsächlich nennt. Für Verlage bedeutet das: Die meisten Inhalte bleiben unsichtbar.

Die Analyse der KI-Plattform AirOps, veröffentlicht am 24. März 2026, zeigt ein massives Ungleichgewicht. Für jede Antwort ruft ChatGPT im Schnitt sechsmal mehr Webseiten ab, als sie am Ende als Quelle angibt. Ein unsichtbarer Datenfilter sorgt so dafür, dass die allermeisten Inhaltsersteller weder Anerkennung noch Besucherverkehr erhalten.

Während KI-Systeme das Web nach Informationen durchsuchen, müssen Unternehmen die rechtlichen Rahmenbedingungen dieser Technologie im Blick behalten. Dieser kostenlose Leitfaden erklärt verständlich, welche neuen Pflichten die EU-KI-Verordnung für die Nutzung und Dokumentation von KI vorsieht. EU-KI-Verordnung kompakt: Gratis E-Book sichern

Die Studie kommt zu einem kritischen Zeitpunkt. Erst vor einer Woche stellte OpenAI die neuen Modelle GPT-5.4 mini und nano vor, die für hohe Effizienz und komplexe Programmieraufgaben optimiert sind. Doch während die Technik voranschreitet, hinkt die Transparenz offenbar hinterher.

Die 85-Prozent-Ablehnungsrate: Warum Quellen verschwinden

Die Forscher werteten über eine halbe Million abgerufener Seiten aus. Das zentrale Ergebnis ist ernüchternd: Eine klare 85-Prozent-Ablehnungsrate. Von allen Seiten, die die KI „liest“, um eine Antwort zu formulieren, werden nur 15 Prozent dem Nutzer als Zitat präsentiert.

„Das ist ein fundamentaler Wandel gegenüber klassischen Suchmaschinen“, erklärt ein Branchenanalyst. „Bei Google sieht der Nutzer eine Ergebnisliste. Bei generativer KI sind das Abrufen und das Zitieren zwei völlig getrennte Schritte.“ Für Verlage heißt das: Selbst wenn ihre Seite gefunden wird, ist die Chance, dass der Nutzer den Link je sieht, verschwindend gering.

Die Zitierrate schwankt je nach Anfrage. Bei Produktrecherchen liegt sie bei 18,3 Prozent. Sucht der Nutzer jedoch nach Fakten zur Bestätigung, werden nur in 11,3 Prozent der Fälle Quellen genannt. Bei komplexen Fragen synthetisiert ChatGPT offenbar Informationen aus vielen Quellen, ohne direkt auf eine zu verweisen.

Versteckte Suchanfragen: Die KI fragt im Hintergrund nach

Ein weiteres Schlüsselergebnis der Studie sind die sogenannten „Fan-Out“-Anfragen. ChatGPT führt nicht einfach eine Suche pro Nutzerfrage durch. Stattdessen generiert das System häufig mehrere interne Folgefragen, um sein Verständnis zu vertiefen. Bei 89,6 Prozent aller Prompts passiert genau das.

Diese versteckten Suchanfragen schaffen eine eigene Ökonomie. Rund 95 Prozent davon haben kein traditionelles Suchvolumen – es sind hochspezifische Nischenfragen. Dennoch sind sie entscheidend für die Sichtbarkeit: Fast ein Drittel aller zitierten Seiten tauchte ausschließlich in diesen Fan-Out-Ergebnissen auf.

„ChatGPT erschafft seine eigene Suchlandschaft“, so ein Experte. „Die interne Logik der KI bestimmt, welche Unterthemen erkundet werden.“ Für Content-Ersteller wird es damit noch komplexer: Eine Seite muss nicht nur zur ursprünglichen Frage passen, sondern auch zu den automatisierten Nachfragen der KI.

Konzentrierte Macht: Wenige Domains erhalten die meisten Klicks

Die wenigen Zitate, die es gibt, konzentrieren sich stark. Laut Studie teilen sich etwa 30 Domains satte 67 Prozent aller Nennungen innerhalb eines Thema. Es entsteht eine „Winner-takes-all“-Dynamik: Einige autoritative Quellen erhalten den Löwenanteil der Sichtbarkeit, während Millionen anderer Seiten zur Synthese genutzt, aber nicht genannt werden.

Es gibt eine Korrelation zur Google-Rangfolge: Seiten unter den Top 20 bei Google erhalten 55,8 Prozent der ChatGPT-Zitate. Die Nummer eins bei Google hat eine 3,5-mal höhere Chance, zitiert zu werden, als eine Seite außerhalb der Top 20.

Doch ein hohes Ranking ist keine Garantie. ChatGPT bevorzugt umfassende, lange Inhalte. Artikel zwischen 5.000 und 10.000 Zeichen haben eine deutlich höhere Zitierwahrscheinlichkeit. Das Verhalten ist zudem branchenspezifisch: Im Bildungssektor werden Informationen in der Mitte eines Artikels am häufigsten zitiert, bei Finanzthemen sind es kurze, dichte Abschnitte.

Anhaltende Spannungen: Verlage fordern faire Anerkennung

Die Kluft zwischen Abruf und Zitat schürt weiterhin Konflikte zwischen KI-Entwicklern und Medien. Eine separate Studie der McGill University vom 19. März 2026 bezeichnet ChatGPT als eines der schwierigsten Modelle für die Quellenzuordnung. Die Forscher fanden heraus, dass die KI in 92 Prozent der informierten Antworten in bestimmten Kategorien keine einzige Quelle nannte – obwohl sie offensichtlich über die Berichterstattung Bescheid wusste.

Die rasanten Entwicklungen bei KI-Modellen wie GPT-5.4 verschärfen die Anforderungen an die IT-Sicherheit in Unternehmen massiv. Erfahren Sie in diesem Experten-Report, wie Sie sich gegen neue KI-gestützte Bedrohungen wappnen und Ihre Sicherheitsstrategie ohne hohe Investitionen anpassen. Kostenlosen Cyber-Security-Report herunterladen

Dieser Mangel an Anerkennung besteht fort, trotz offizieller Datenpartnerschaften. Eine Analyse von 4 Millionen Zitaten ergab, dass bestätigte Partnerschaften mit Nachrichtenverlagen nur für etwa 3 Prozent aller Nachrichtenzitate verantwortlich waren. Eine formelle Vereinbarung mit OpenAI scheint also nicht automatisch zu mehr Sichtbarkeit zu führen.

OpenAI reagiert derweil auf anderen Ebenen. Am 24. März kündigte die OpenAI Foundation ein Förderprogramm in Höhe von einer Milliarde Euro an, das Lebenswissenschaften unterstützen und die sozioökonomischen Auswirkungen der KI abfedern soll. Gleichzeitig setzt das Unternehmen seine aggressive Akquisitionsstrategie fort und kaufte kürzlich den Python-Tool-Entwickler Astral.

Ausblick: Die Transparenz-Lücke bleibt eine zentrale Herausforderung

Mit der Einführung agentenhafterer Systeme wird die Zitierlücke voraussichtlich ein Dauerbrenner bleiben. Die neuen, effizienteren Modelle wie GPT-5.4 mini lösen die Transparenzprobleme nicht von selbst.

Die nächsten zwölf Monate werden entscheidend sein, wie KI-Unternehmen mit der Quellenangabe umgehen. Verlage fordern angesichts teils stark schwankender Besucherzahlen von ChatGPT immer lauter robustere und konsistentere Verlinkungen.

Die Zukunft der KI-Suche hängt davon ab, ob Plattformen wie ChatGPT die Lücke zwischen ihrem „unsichtbaren Index“ und den sichtbaren Zitaten schließen können, die das offene Web am Leben erhalten. Derzeit liest die KI zwar mehr vom Internet denn je – teilt den Verdienst aber nur mit einem winzigen Bruchteil derjenigen, die ihre Antworten erst möglich machen.

Robert Sasse

Makroökonomie, Vermögensplanung, Ordnungspolitik

Dr. Robert Sasse ist promovierter Wirtschaftswissenschaftler mit umfassender Expertise in der Analyse von Kapitalmärkten und volkswirtschaftlichen...

9025 Artikel

Zum Autorenprofil

Verwandte Artikel

Dongfang Electric Aktie: Expansionskurs bestätigt

King Slide Aktie: Server-Wandel

Alphabet Aktie: Experteneinschätzungen

Dell Aktie: Quanten-Sicherheit

Quantum eMotion Aktie: Rückenwind aus Ottawa

Kooperationspodcast audio-cd.at

ChatGPT: KI liest sechsmal mehr, als sie zitiert

Die 85-Prozent-Ablehnungsrate: Warum Quellen verschwinden

Versteckte Suchanfragen: Die KI fragt im Hintergrund nach

Konzentrierte Macht: Wenige Domains erhalten die meisten Klicks

Anhaltende Spannungen: Verlage fordern faire Anerkennung

Ausblick: Die Transparenz-Lücke bleibt eine zentrale Herausforderung

Robert Sasse

Verwandte Artikel

Dongfang Electric Aktie: Expansionskurs bestätigt

King Slide Aktie: Server-Wandel

Alphabet Aktie: Experteneinschätzungen

Dell Aktie: Quanten-Sicherheit

Quantum eMotion Aktie: Rückenwind aus Ottawa

Kooperationspodcast audio-cd.at

Newsletter der Woche

Der bex-Premium-Newsletter