Die KI-Plattform Claude von Anthropic führt schärfere Nutzungskontrollen ein. Ab sofort werden intensive Anfragen in Stoßzeiten deutlich stärker auf das Wochenkontingent angerechnet. Der Schritt ist eine Reaktion auf einen massiven Nutzerzuwachs und überlastete Server.

Neue „KI-Rationierung“ in Stoßzeiten

Anzeige

Während die Nutzung leistungsstarker KI-Modelle wie Claude im Berufsalltag immer stärker reglementiert wird, rücken auch die rechtlichen Rahmenbedingungen für Unternehmen in den Fokus. Dieser kostenlose Leitfaden zur EU-KI-Verordnung hilft Ihnen, Kennzeichnungspflichten und Risikoklassen richtig einzuordnen. Gratis E-Book zur KI-Verordnung herunterladen

Der Wechsel trifft viele Nutzer unvermittelt. Eine zweiwöchige Promotionsphase mit verdoppelten Limits endete heute, Freitag, den 27. März. Jetzt kehrt das Unternehmen zu einer restriktiveren Politik zurück. Die wöchentlichen Kontingente für Pro- und Max-Abonnenten bleiben zwar gleich. Doch in Stoßzeiten schrumpfen die sogenannten Fünf-Stunden-Sessions nun deutlich schneller.

Diese Stoßzeiten sind werktags von 14:00 bis 20:00 Uhr mitteleuropäischer Zeit definiert. In diesem Fenster erreicht die berufliche Nutzung typischerweise ihren Höhepunkt. Ein Entwickler, der um 17:00 Uhr mit Claude Code arbeitet, stößt damit viel schneller an sein Session-Limit als am Abend oder am Wochenende. Laut Anthropic sind rund sieben Prozent der Nutzer unmittelbar betroffen.

„QuitGPT“-Ansturm überlastet die Infrastruktur

Hintergrund der Drosselung ist ein dramatischer Nutzerzuwachs. Nach umstrittenen Militärverträgen des Konkurrenten OpenAI wechselten Ende Februar 2026 Millionen Nutzer zu Claude – ein Phänomen, das in sozialen Medien als „QuitGPT“-Bewegung bekannt wurde. Mitte März stieg Claude erstmals auf Platz eins der US-App-Charts und überholte ChatGPT bei den täglichen Downloads.

Anzeige

Der rasante technologische Fortschritt und neue KI-Gesetze stellen die IT-Sicherheit von Unternehmen vor völlig neue Herausforderungen. Erfahren Sie in diesem Experten-Report, wie Sie Ihre Infrastruktur effektiv schützen und welche regulatorischen Änderungen Sie 2024 kennen müssen. Kostenlosen Cyber-Security-Leitfaden sichern

Der plötzliche Ansturm lastete die GPU-Cluster des Unternehmens, die für Modelle wie Claude Opus 4.6 benötigt werden, bis an ihre Grenzen aus. Die Kosten für die Inferenz – die Rechenleistung pro Antwort – stiegen schneller, als neue Rechenzentren gebaut werden konnten. Bei einem geschätzten Jahresumsatz von 19 Milliarden Euro priorisiert Anthropic nun die Stabilität des Dienstes.

Frust bei Entwicklern und Codern

Besonders hart trifft die neue Regelung die Entwickler-Community. Das Tool Claude Code, das ganze Codebasen analysieren kann, verbraucht aufgrund seines agentenbasierten Ansatzes besonders viele Tokens. Nutzer berichten, dass komplexe Prompts das Session-Kontingent von Max-Abonnenten (Kosten: 100-200 Euro monatlich) mit einem Schlag aufbrauchen können.

Das Unternehmen reagierte mit transparenteren Nutzungs-Dashboards. Sie zeigen den Verbrauch pro Session und das verbleibende Wochenbudget an. Wer vorzeitig an sein Limit stößt, kann zusätzliche Nutzung zu API-Standardpreisen dazukaufen. Zudem geht Anthropic gegen Drittanbieter-Tools vor, die die Limits umgehen sollen.

Branchentrend: Ende der Flatrate-Ära

Anzeige

Neben technischen Limits gewinnt die rechtssichere Klassifizierung von KI-Systemen für Entwickler und Anbieter massiv an Bedeutung. Was Sie über die seit August 2024 geltenden Dokumentationsanforderungen und Übergangsfristen wissen müssen, erfahren Sie in diesem kompakten Umsetzungsleitfaden. EU-KI-Verordnung: Jetzt kostenlosen Ratgeber downloaden

Anthropic steht mit dieser Strategie nicht allein da. Die gesamte KI-Branche steuert auf eine „Rechenknappheit“ zu, bei der die Nachfrage nach leistungsstarken Modellen die verfügbare Hardware übersteigt. Auch Google hat für seine Gemini-Modelle kürzlich harte tägliche Prompt-Limits eingeführt.

Analysten sehen das Ende der Flatrate-Ära für hochwertige KI-Modelle gekommen. Je „token-hungriger“ und leistungsfähiger die Modelle werden, desto weniger wirtschaftlich sind Pauschalpreise von 20 Euro im Monat. Die Drosselung in Stoßzeiten ist ein Versuch, den Zugang fair zu verteilen, ohne die Preise für die Einstiegstier massiv anzuheben.

Die Spannung zwischen Modellleistung und Nutzungslimits wird Anthropic wohl das ganze Jahr 2026 begleiten. Das Unternehmen setzt auf den Ausbau seiner Rechenzentren, um die Beschränkungen später lockern zu können. Bis dahin lautet die Empfehlung an Nutzer: Schwere Aufgaben in die Abendstunden oder aufs Wochenende verlegen.