Drop #16·11. Juni 2026·4 min Lesezeit

Das Büfett ist bezahlt. Der Wein kostet 22 Euro.

Anthropic, GitHub Copilot, OpenAI - drei Anbieter, derselbe Monat, dieselbe Bewegung. Die KI-Flatrate war immer Kundenakquise. Jetzt kommt die echte Rechnung.

Christopher Thanisch

Christopher Thanisch ist Gründer von Syndikat. Jede Woche schreibt er in seiner Kolumne „Drops“ über die neuesten Entwicklungen und Trends im Bereich KI.

GitHub Copilot hat am 1. Juni auf tokenbasiertes Billing umgestellt. 10 Tage später beschweren sich auf Reddit Entwickler, die von $29 auf $750 Monatskosten gesprungen sind. Anthropic zieht am 23. Juni nach. Google ist längst da. Die Flatrate-Phase der KI ist vorbei.

Drei große Anbieter. Drei Preiserhöhungen. Derselbe Monat.

Was gerade passiert, hat einen konkreten Takt. Bei Anthropic heißt es ab dem 23. Juni "Usage Credits" statt Flatrate. Klingt harmlos. Bedeutet: du zahlst pro Token - also pro Wort, das das Modell verarbeitet oder erzeugt. Für leichte Aufgaben - kurze Antworten, schnelle Suchen - macht das kaum einen Unterschied. Für komplexe Aufgaben mit langen Dokumenten, tiefem Reasoning, stundenlangen Coding-Sessions: der Unterschied kann Faktor 10 oder mehr sein.

Copilot macht das gerade real. GitHub hat Enterprise-Kunden auf ein Token-Modell umgestellt. Wer vorher eine Pauschale zahlte und Entwickler einfach coden ließ, sieht jetzt die Rechnung. Reddit-Threads aus der ersten Juni-Woche zeigen Accounts, die in 10 Tagen mehr ausgegeben haben als im gesamten Vorquartal. Die Nutzung war dieselbe - das Preismodell hatte sich geändert. OpenAI hat GPT-5.5 im April still und leise zum doppelten Preis des Vorgängers eingeführt.

Wenn drei große Anbieter gleichzeitig dasselbe tun, lohnt es sich, das Muster anzusehen.

Die Flatrate war Kundenakquise. Du gibst in der Anfangsphase Marge weg, um Nutzer zu gewinnen, Gewohnheiten zu formen, Lock-in zu erzeugen. Ein SaaS-Gründer nennt es "Land and Expand". Ein Supermarkt nennt es Aktionspreis. Die KI-Anbieter nannten es Flatrate.

Die Subvention hat funktioniert. Copilot hat 1,8 Millionen bezahlte Nutzer. Claude ist in Tausenden von Workflows integriert. ChatGPT ist für viele Teams zum Standardwerkzeug geworden. Die Gewohnheit sitzt. Jetzt kommt die echte Preisstruktur.

Denk an ein All-You-Can-Eat Restaurant. Essen so viel du willst - das stimmt. Aber der Wein kostet 22 Euro das Glas. Wasser 6 Euro. Der Espresso danach 5 Euro. Das Restaurant verdient am Büfett fast nichts. Es verdient an allem drum herum.

KI funktioniert gerade genauso. Die Subscription - ChatGPT Plus, Claude Pro, Copilot Business - ist das Büfett. Die Frontier-Modelle sind die Getränke. GPT-5.5, Claude Fable 5, Gemini Ultra: jeweils nur gegen Usage Credits, nur gegen tokenbasiertes Billing, nur gegen eine Rechnung, die mit deiner tatsächlichen Nutzung wächst.

Und deine tatsächliche Nutzung? Wächst gerade schneller als dein KI-Budget geplant hat.

Laut Bitkom haben inzwischen rund 28% der mittelständischen Unternehmen in Deutschland Copilot-Lizenzen im Einsatz - ab Juni tokenbasiert. Das bedeutet: Finanzabteilungen, die bis jetzt eine fixe Monatspauschale gesehen haben, werden bald variable Rechnungen bekommen, die mit dem Nutzungsverhalten ihrer Teams korrelieren.

Das ist nicht abstrakt. Uber hat intern bekannt gegeben, dass das gesamte KI-Budget für 2026 bereits bis April aufgebraucht war. Kein Nutzungslimit gesetzt, kein Monitoring. Budget weg. Ein OpenAI Enterprise-Vertriebsleiter hat das in einem Interview so beschrieben: "Vor sechs Monaten war die Frage: Was kann KI? Heute ist die Frage: Wir geben zu viel aus."

Token-Governance - das systematische Erfassen und Steuern von KI-Kosten auf Nutzungsebene - fehlt in fast allen Unternehmen. Das Thema ist bisher in der IT hängen geblieben. Es landet bald im C-Level-Meeting.

Die Subventionsphase ist vorbei. Das bedeutet: KI wird teurer. Für alle - aber besonders für die, die intensiv und unkontrolliert nutzen.

Und wenn Zugang zu den leistungsstärksten Modellen dauerhaft eine Frage des Budgets wird - verändert sich dann auch, wer mit der besten Technologie arbeitet, wer die besten Produkte baut, wer am schnellsten lernt?

Ich hab das selbst erlebt. Ich habe Fable 5 in den letzten Wochen intensiv für einen komplexen Coding-Workflow genutzt - lange Sessions, viel Kontext, tiefes Reasoning. Die Qualität war exzellent. Dann kam die Preisänderung. Ich hab auf meine Abrechnung geschaut und kurz innegehalten. Ich nutze KI beruflich täglich - aber auch für mich hat sich in diesem Moment etwas verschoben. Ich fange an, genauer hinzuschauen: Wofür lohnt sich Frontier-Qualität? Wo reicht ein kleineres Modell? Ich weiß die Antwort noch nicht.

Falls du das Thema in deiner eigenen Organisation noch nicht angesprochen hast: Jetzt wäre der Moment. Schick diese Mail an deinen IT-Leiter oder CFO - mit dem kurzen Hinweis: Token-Billing kommt. Budget-Szenario für Q3 wäre gut.