NVIDIA startet GPU-beschleunigte Endpunkte für Moonshot AIs Kimi K2.5 Modell

Jessie A Ellis 04.02.2026 20:11

NVIDIA bietet nun kostenlosen GPU-beschleunigten API-Zugang zu Kimi K2.5, einem multimodalen KI-Modell mit 1T Parametern, 384 Experten und 262K Kontextlänge für Entwickler.

NVIDIA startet GPU-beschleunigte Endpunkte für Moonshot AIs Kimi K2.5 Modell

NVIDIA hat GPU-beschleunigte Endpunkte für Moonshot AIs Kimi K2.5 eingeführt und bietet Entwicklern kostenlosen API-Zugang zu einem der leistungsfähigsten derzeit verfügbaren Open-Source-Multimodal-Modelle. Die am 04.02.2026 angekündigte Integration positioniert das 1 Billion Parameter-Modell für eine schnelle Unternehmenseinführung über NVIDIAs build.nvidia.com-Plattform.

Kimi K2.5 verfügt über beeindruckende technische Spezifikationen, die für Produktionsbereitstellungen wichtig sind. Das Modell verwendet eine Mixture-of-Experts-Architektur mit 384 Experten und aktiviert nur 32,86 Milliarden Parameter pro Token – eine Aktivierungsrate von 3,2 %, die trotz der enormen Parameteranzahl die Inferenzkosten überschaubar hält. Die Kontextlänge erstreckt sich auf 262.000 Token und ermöglicht umfangreiche Dokumentenanalysen und erweiterte Konversationen.

Die Vision-Fähigkeiten verdienen Beachtung. Moonshot hat einen maßgeschneiderten MoonViT3d Vision Tower entwickelt, der Bilder und Videoframes in Embeddings verarbeitet, unterstützt durch ein Vokabular von 164.000 Token mit visionsspezifischen Token. Dies ist keine nachträglich hinzugefügte Multimodalität – sie ist nativ in der Architektur verankert.

Was Entwickler erhalten

Kostenloser Prototyping-Zugang über NVIDIAs Entwicklerprogramm bedeutet, dass Teams gegen Produktions-Workloads testen können, bevor sie Infrastruktur bereitstellen. Der API folgt OpenAI-kompatiblen Mustern, einschließlich Tool-Calling-Unterstützung für agentische Workflows. NVIDIA NIM-Microservices für containerisierte Produktionsinferenz sind in Vorbereitung, obwohl kein spezifischer Zeitplan angegeben wurde.

Für selbst gehostete Bereitstellungen ist die vLLM-Integration jetzt verfügbar. NVIDIA bestätigte auch Fine-Tuning-Unterstützung über das Open-Source-NeMo-Framework, das NeMo AutoModel verwendet, um das Modell direkt von Hugging Face Checkpoints ohne Konvertierungsschritte anzupassen.

Marktkontext

Moonshot AI veröffentlichte Kimi K2.5 am 27.01.2026 und trainierte es mit ungefähr 15 Billionen gemischten visuellen und Text-Token, die auf der früheren K2-Grundlage aufbauen. Das Modell wurde direkt mit Googles Gemini 3 Pro verglichen und erzielte wettbewerbsfähige Benchmarks, darunter einen Score von 78,5 % bei MMMU-Pro-Tests zum visuellen Verständnis und 76,8 % bei SWE-Bench Verified für Coding-Aufgaben.

Ein differenzierendes Merkmal: der „Agent Swarm"-Mechanismus, der bis zu 100 parallele Sub-Agenten koordiniert und die Ausführungszeit Berichten zufolge um das 4,5-fache gegenüber Einzelagenten-Ansätzen reduziert. Für Unternehmen, die komplexe autonome Systeme entwickeln, ist dies eine bedeutende Fähigkeitslücke.

NVIDIAs Unterstützung der Blackwell-Architektur deutet darauf hin, dass das Unternehmen Kimi K2.5 als ernsthaften Konkurrenten bei Enterprise-KI-Bereitstellungen betrachtet. Entwickler können sofort über build.nvidia.com oder direkt über die Kimi API-Plattform von Moonshot auf das Modell zugreifen.

Bildquelle: Shutterstock

nvidia
kimi k2.5
moonshot ai
multimodal ai
gpu computing

NVIDIA startet GPU-beschleunigte Endpunkte für Moonshot AIs Kimi K2.5 Modell

NVIDIA startet GPU-beschleunigte Endpunkte für Moonshot AIs Kimi K2.5 Modell

Was Entwickler erhalten

Marktkontext

Das könnte Ihnen auch gefallen

"Ich hätte Titel nicht entzogen": Plagiatsexperte: Voigt nicht mit Guttenberg vergleichbar

Bitcoin-Entwickler fordern den Rücktritt von Blockstream-CEO Adam Back wegen der Epstein-Papiere.

Bitcoins 365-Tage-Durchschnittsbruch spiegelt vergangene Korrekturphasen wider

Trendnachrichten

"Ich hätte Titel nicht entzogen": Plagiatsexperte: Voigt nicht mit Guttenberg vergleichbar

Bitcoin-Entwickler fordern den Rücktritt von Blockstream-CEO Adam Back wegen der Epstein-Papiere.

Bitcoins 365-Tage-Durchschnittsbruch spiegelt vergangene Korrekturphasen wider

Großpackungen Ramen für Notfallvorsorge und Community-Programme

Foto-Termin mit Jacob Elordi: Margot Robbie kommt ohne BH und stiehlt allen die Show

Kryptopreise