AI News

KI-Inferenz-Startup Modal Labs sammelt Kapital bei einer Bewertung von 2,5 Mrd. $, Verdopplung in 5 Monaten

Modal Labs, eine spezialisierte Cloud-Plattform für KI-Entwickler (AI developers), sichert sich eine neue Finanzierungsrunde, die das Unternehmen mit etwa 2,5 Milliarden $ bewertet. Die Runde wird Berichten zufolge von General Catalyst angeführt, ein Schritt, der den enormen Appetit der Investoren auf Infrastruktur unterstreicht, die in der Lage ist, die boomende generative KI-Wirtschaft (generative AI economy) zu unterstützen.

Diese Kapitalspritze markiert eine dramatische Eskalation im Wachstumskurs von Modal Labs und führt in weniger als fünf Monaten effektiv zu einer Verdopplung seiner Bewertung. Das Startup erreichte zuvor im Oktober 2025 den Einhorn-Status, als es seine Series B bei einer Post-Money-Bewertung von 1,1 Milliarden $ abschloss. Die schnelle Neubewertung unterstreicht eine breitere Verschiebung in der Risikokapital-Landschaft (Venture Capital), in der sich der Fokus vom Training von Basismodellen (Foundation Models) hin zur „Inferenzschicht“ (Inference Layer) verlagert – der Infrastruktur, die erforderlich ist, um diese Modelle in der Produktion auszuführen und zu skalieren.

Der Wechsel zur Inferenz-Infrastruktur

In den letzten zwei Jahren wurde das KI-Narrativ von den massiven Kapitalanforderungen für das Training von Large Language Models (LLMs) dominiert. Da Unternehmen jedoch vom Experimentieren zum Einsatz übergehen, hat sich der Engpass zur Inferenz (Inference) verlagert – der eigentlichen Verarbeitung von Benutzeranfragen durch diese Modelle.

Modal Labs hat sich als kritischer Akteur in diesem Bereich positioniert, indem es eine serverlose GPU-Plattform anbietet, die die Komplexität der Cloud-Infrastruktur abstrahiert. Im Gegensatz zu traditionellen Cloud-Anbietern, die eine komplexe Konfiguration erfordern (oft unter Einbeziehung von Kubernetes und endlosen YAML-Dateien), ermöglicht Modal Entwicklern die Definition von Container-Umgebungen, Hardware-Anforderungen und Skalierungslogik direkt in Python-Code.

Erik Bernhardsson, Mitbegründer und CEO von Modal Labs, hat diese „Infrastructure-from-Code“-Philosophie vorangetrieben. Indem es Ingenieuren ermöglicht wird, High-End-Nvidia H100s oder A100s mit einer einzigen Zeile Python bereitzustellen, hat Modal bei Datenteams und KI-Startups, die schnell iterieren müssen, ohne DevOps-Overhead zu verwalten, erheblich an Bedeutung gewonnen.

Bewertungs- und Wachstumskennzahlen

Der Sprung auf eine Bewertung von 2,5 Milliarden $ wird durch starke fundamentale Daten gestützt. Quellen, die dem Deal nahestehen, deuten darauf hin, dass Modal Labs eine annualisierte Umsatzrunrate (Annualized Revenue Run Rate, ARR) von etwa 50 Millionen $ erreicht hat. Dieses Umsatzwachstum deutet darauf hin, dass das Unternehmen nicht nur einen Hype-Zyklus reitet, sondern eine erhebliche Nutzung seiner Rechenressourcen durch zahlende Kunden verzeichnet.

Die folgende Tabelle skizziert den rasanten Aufstieg der Bewertung von Modal Labs in den letzten Jahren:

Modal Labs Finanzierungshistorie

Runde Datum Bewertung Lead-Investor
Seed Anfang 2022 Nicht offengelegt Amplify Partners
Series A Okt. 2023 Nicht offengelegt Redpoint Ventures
Series B Okt. 2025 1,1 Milliarden $ Lux Capital
Neue Runde Feb. 2026 2,5 Milliarden $ General Catalyst

Warum General Catalyst die Führung übernimmt

Das Engagement von General Catalyst signalisiert eine strategische Wette auf die Wegbereiter der „Anwendungsschicht“ (Application Layer). Das Unternehmen hat seine KI-These aggressiv verfolgt und kürzlich Milliarden für „Schöpfungsstrategien“ (Creation Strategies) und angewandte KI-Unternehmen bereitgestellt. Mit der Unterstützung von Modal investiert General Catalyst in die „Schaufel-Anbieter“, welche die nächste Generation von KI-Anwendungen antreiben werden.

Das Interesse des Unternehmens rührt wahrscheinlich von Modals Differenzierung in einem überfüllten Markt her. Während sich Wettbewerber wie Replicate auf einfaches Modell-Hosting über APIs konzentrieren und RunPod die reine GPU-Vermietung anbietet, findet Modal ein Gleichgewicht, indem es eine programmierbare Laufzeitumgebung bietet. Dies ermöglicht es, nicht nur einfache Modellinferenz zu bewältigen, sondern auch komplexe, rechenintensive Aufgaben wie:

  • Feintuning (Fine-tuning) von Open-Source-Modellen auf benutzerdefinierten Daten.
  • Pipelines zur Erstellung von 3D-Assets (3D asset generation).
  • Proteinfaltungs-Simulationen (Protein folding) für die Biotechnologie.
  • Sandboxed-Codeausführung (Sandboxed code execution) für KI-Agenten.

Der technische Vorsprung: Infrastructure-from-Code

Im Zentrum der Attraktivität von Modal steht seine technische Architektur. Die Plattform besticht durch Kaltstartzeiten im Sub-Sekunden-Bereich (sub-second cold start times), eine kritische Kennzahl für serverlose Inferenz, bei der Benutzer sofortige Antworten erwarten. Modal erreicht dies durch die Optimierung der Container-Laufzeit und des Dateisystems, was es ermöglicht, Tausende von GPUs in Sekunden hochzufahren, um Verkehrsspitzen zu bewältigen, und sie sofort danach wieder auf Null zu skalieren, was Kosten für Entwickler spart.

Diese Elastizität ist entscheidend für die aktuelle Welle generativer KI-Anwendungen (Generative AI), die oft „stoßartige“ (bursty) Verkehrsmuster aufweisen, die mit traditionellen, immer aktiven Server-Clustern teuer zu verwalten sind.

Wettbewerbslandschaft und Zukunftsausblick

Der Deal platziert Modal Labs fest in der oberen Riege der KI-Infrastruktur-Startups (AI infrastructure). Der Sektor erlebt einen intensiven Wettbewerb, wobei auch andere Akteure massive Runden abschließen:

  • Baseten hat sich kürzlich eine Finanzierung bei einer Bewertung von 5 Milliarden $ gesichert.
  • Fireworks AI sammelte Ende 2025 Kapital bei einer Bewertung von 4 Milliarden $ ein.

Während der KI-Markt reift, werden die Gewinner wahrscheinlich durch Entwicklererfahrung und Zuverlässigkeit definiert. Mit 50 Millionen $ ARR und einer neuen Kriegskasse von General Catalyst ist Modal Labs gut positioniert, um sein Engineering-Team zu erweitern, mehr GPU-Kapazität zu sichern und aggressiv Unternehmenskunden anzusprechen, die derzeit Schwierigkeiten haben, ihre KI-Piloten in eine skalierbare Produktion zu überführen.

Die Finanzierung bestätigt die These, dass, während die Modellkriege (OpenAI vs. Anthropic vs. Google) die Schlagzeilen beherrschen, die Infrastrukturunternehmen, die das Ausführen dieser Modelle ermöglichen, massiven, greifbaren Wert generieren.

Ausgewählt