On-Premise KI-Agenten · NVIDIA Elite Partner

KI-Agenten im eigenen Rechenzentrum betreiben.

KI-Agenten on premise sind autonome KI-Systeme, die mehrstufig planen, Werkzeuge aufrufen und Aufgaben ausführen, dabei aber vollständig auf eigener Hardware laufen. Modelle, Kontext und sensible Daten bleiben im Haus. Mit NVIDIA-DGX-Systemen und dem NVIDIA Agent Toolkit bauen Sie diese Agenten DSGVO-konform und ohne Cloud-Roundtrip.

Hardware-Beratung anfragen

Warum eigene Hardware

Agentische Workloads verlangen andere Hardware.

Agenten planen mehrstufig, rufen Werkzeuge auf und halten lange Kontexte. Das verschiebt die Hardware-Anforderung deutlich gegenüber klassischer KI.

bis 15×

mehr Tokens pro Aufgabe als klassische KI

NVIDIA, Vera Rubin NVL72

kohärent

grosser Speicher hält Modell, KV-Cache und viele Agenten-Kontexte lokal

NVIDIA DGX

NVLink

und Unified Memory ersetzen Netzwerk-Hops und senken die Latenz

NVIDIA

always-on

On-Premise-Betrieb ohne Cloud-Roundtrip

DELTA

Die entscheidende Frage: Wie gross ist Ihr Modell, wie viele Agenten laufen parallel, und wie sensibel sind die Daten? Die Antworten führen direkt zur passenden Plattform.

Hardware-Matching

Welche NVIDIA-Plattform passt zu Ihrem Workload?

Von der Entwicklung am Arbeitsplatz bis zur AI Factory. Alle Modellgrössen sind offizielle NVIDIA-Angaben.

Plattform	Lokale Modellgrösse	Speicher	FP4-Leistung	Typischer Einsatz	Status
NVIDIA DGX Spark	bis 200 Mrd. (Inferenz), bis 405 Mrd. gekoppelt	128 GB unified, 273 GB/s	bis 1 PFLOP	Entwickeln, Prototyp, Edge-Agent	Verfügbar
NVIDIA DGX Station	bis 1 Billion Parameter	748 GB kohärent	bis 20 PFLOPS	Produktiver Deskside-Agent	Verfügbar
Vera Rubin NVL72	Trillion-Scale, MoE & Reasoning	20,7 TB HBM4 / Rack	3,6 EFLOPS / Rack	Skalierte Multi-Agent-Inferenz	H2 2026
NVIDIA DGX SuperPOD	Trillion, Training & Inferenz	38 TB schneller Speicher / System	bis 70× Hopper	Agenten-Flotte plus Training	Verfügbar

Modellgrössen und Speicher sind offizielle NVIDIA-Angaben. Vergleichswerte wie 70× Hopper sind NVIDIA-Claims, keine DELTA-Messwerte. Quellen: NVIDIA Produkt- und Newsroom-Seiten.

Unsicher, welche Stufe passt? DELTA gleicht Ihren Workload im Test-Centre Glinde ab →

Produkte

Die NVIDIA-DGX-Systeme von DELTA.

Vier Plattformen, eine durchgaengige CUDA-Basis. Geliefert, integriert und betreut von DELTA.

NVIDIA DGX Spark

GB10 · 128 GB · 1 PFLOP

Ansehen →

NVIDIA DGX Station

GB300 · 748 GB · 20 PFLOPS

Ansehen →

Vera Rubin NVL72

20,7 TB HBM4 · 3,6 EFLOPS

Ansehen →

NVIDIA DGX SuperPOD

Multi-Rack · bis 70× Hopper

Ansehen →

Skalierungspfad

Ein Pfad, vier Stufen.

Dieselbe Software-Basis (NVIDIA AI Enterprise, NIM, NVIDIA Agent Toolkit) läuft auf allen Stufen. Der Wechsel ist ein Hardware-Schritt, kein Software-Bruch.

DGX Spark

Agent entwickeln und lokal testen, ohne Daten aus dem Haus zu geben.

→

DGX Station

Agent produktiv am Arbeitsplatz oder in der Abteilung betreiben.

→

Vera Rubin NVL72

Inferenz für viele Agenten gleichzeitig skalieren.

→

DGX SuperPOD

Agenten-Flotte betreiben und Modelle parallel weiter trainieren.

Datenhoheit

Daten bleiben im Haus.

On premise heisst: Modelle und Agenten laufen auf Ihrer Hardware in Ihrem Rechenzentrum. Sensible Daten verlassen es nicht, es gibt keinen Transfer in eine fremde Cloud.

Lokale Ausführung

Inferenz und Agenten-Kontext bleiben auf der eigenen DGX-Compute. Kein Cloud-Roundtrip, keine US-Datenübermittlung.

Policy- und Privacy-Controls (OpenShell)

Der OpenShell-Runtime setzt Regeln auf Systemebene durch, führt jeden Agenten in einer eigenen Sandbox aus und protokolliert jede Allow- und Deny-Entscheidung. Status: Early Preview.

Zertifizierter Betrieb

DELTA ist nach ISO 27001 zertifiziert und integriert die Systeme direkt in Ihrer Umgebung.

Branchen

Wer agentische KI on-premise einsetzt.

Pharma & Life Sciences

IQVIA betreibt eine agentische Plattform auf Nemotron-Modellen und dem NeMo Agent Toolkit mit über 150 Agenten. On-Premise hält Studien- und Patientendaten im Haus.

IQVIA / NVIDIA

Automotive & Industrie

Die Industrial AI Cloud von Deutsche Telekom und NVIDIA in München ist souverän und EU-datenschutzkonform. EDAG fährt sein Industrial-Metaverse darauf.

Telekom / NVIDIA

Engineering & EDA

Cadence (ChipStack AI) und Siemens (Fuse EDA Agent) bauen Engineering-Agenten auf dem NVIDIA Agent Toolkit.

NVIDIA Newsroom

Forschung & Hochschulen

Frontier-Modelle und autonome Forschungs-Agenten laufen DSGVO-konform im eigenen Rechenzentrum, ohne Cloud-Abhängigkeit.

DELTA

Einige dieser Plattformen laufen heute cloud- oder hybrid. On-Premise ist der Weg, dieselben Workloads im eigenen Rechenzentrum zu betreiben.

Software-Basis

Der NVIDIA-Software-Stack dahinter.

Das NVIDIA Agent Toolkit bündelt die Bausteine für autonome Agenten. Die Details und die Architektur erklären wir auf der Toolkit-Seite.

NVIDIA Agent ToolkitNemoClawOpenShellNemotronCUDA-XNVIDIA AI EnterpriseNIM Microservices

Zum NVIDIA Agent Toolkit im Detail → · NVIDIA AI Enterprise →

Warum DELTA

Beratung, Integration und Test-Centre aus einer Hand.

NVIDIA Elite Partner

Mehrfach ausgezeichneter Star Performer Central Europe, am Markt seit 1985. Sizing, Beschaffung, Integration und Support aus einer Hand.

Test-Centre Glinde

Validieren Sie Ihre Agenten-Workloads auf realer Hardware, bevor Sie investieren. NVIDIA DGX B300 ist im Test-Centre live.

SuperPOD-Erfahrung

DELTA hat mit Arion den ersten europäischen GB200-NVL72-SuperPOD ausgeliefert und mit Mercury einen DGX-H100-SuperPOD in die TOP500 gebracht.

Zertifiziert

ISO 9001, ISO 14001 und ISO 27001 zertifiziert, EcoVadis Gold.

FAQ

Häufige Fragen

Antworten für Entscheider, IT und Beschaffung rund um agentische KI on-premise.

Grundlagen & Datenschutz

Was sind KI-Agenten on premise?+

KI-Agenten on premise sind autonome KI-Systeme, die mehrstufig planen, Werkzeuge aufrufen und Aufgaben ausführen, dabei aber vollständig auf eigener Hardware im eigenen Rechenzentrum laufen. Modell, Kontext und Daten bleiben im Haus. Anders als ein Chatbot, der einzelne Anfragen beantwortet, arbeitet ein Agent eine Aufgabe über längere Zeit selbständig ab.

Lassen sich KI-Agenten DSGVO-konform betreiben?+

Ja. Im On-Premise-Betrieb verlassen sensible Daten das Rechenzentrum nicht, es gibt keinen Transfer in eine fremde Cloud und keine US-Datenübermittlung. Der OpenShell-Runtime ergänzt Policy- und Privacy-Controls und protokolliert jede Agenten-Aktion. DELTA ist nach ISO 27001 zertifiziert.

Bleiben meine Daten im eigenen Rechenzentrum?+

Ja. Inferenz und Agenten-Kontext laufen auf Ihrer eigenen NVIDIA-DGX-Compute. Es gibt keinen Cloud-Roundtrip. Sie behalten die volle Kontrolle über Modelle, Daten und Protokolle.

Hardware & Modelle

Welche Hardware brauche ich für KI-Agenten?+

Das hängt von Modellgrösse, Zahl paralleler Agenten und Datenschutz-Anforderung ab. Zum Entwickeln eine NVIDIA DGX Spark, für den produktiven Arbeitsplatz die NVIDIA DGX Station, für skalierte Inferenz Vera Rubin NVL72 und für den Produktions-Cluster der NVIDIA DGX SuperPOD. Die Workload-Matrix oben ordnet alles zu.

Wie gross darf das Modell lokal sein?+

Eine NVIDIA DGX Station trägt Inferenz bis etwa 1 Billion Parameter, ein NVIDIA DGX Spark bis rund 200 Mrd. (gekoppelt bis 405 Mrd.). Vera Rubin und DGX SuperPOD skalieren in den Trillion-Bereich. Welches Modell auf welche Plattform passt, klären wir im Sizing.

Kann ich Nemotron-Modelle on-premise selbst hosten?+

Ja. Die Nemotron-Modelle stehen unter der NVIDIA Open Model License und laufen lokal auf NVIDIA-DGX-Hardware. Details zur Modellfamilie und zum NVIDIA Agent Toolkit finden Sie auf unserer Toolkit-Seite.

DELTA & Beschaffung

Wer ist NVIDIA Elite Partner für DGX-Hardware in DACH?+

DELTA Computer Products ist NVIDIA Elite Partner und mehrfach ausgezeichneter Star Performer Central Europe, mit eigenem Test-Centre in Glinde und produktiven SuperPOD-Deployments in Europa. Beratung, Integration und Support kommen aus einer Hand.

Kann ich die Hardware vorab testen?+

Ja. Im DELTA Test-Centre in Glinde lassen sich die Systeme auf Ihren konkreten Workloads testen, bevor Sie beschaffen. NVIDIA DGX B300 ist dort live. Beratung anfragen.

Nächster Schritt

Sprechen Sie mit DELTA über Ihre Agenten-Plattform.

Wir klären Use-Case, Modellgrösse und Datenschutz-Anforderungen und empfehlen die passende NVIDIA-Plattform, mit Test-Centre-Validierung vor der Beschaffung.

Hardware-Beratung anfragen +49 40 300672-0

Neueste Beiträge

NVIDIA-AI-Enterprise

NVIDIA Vera Rubin Event

NVIDIA Vera Rubin

NVIDIA DGX Station

NVIDIA DGX GB300 NVL72

Alle Inhalte

Blog durchsuchen

Kontakt

Öffnungszeiten

KI-Agenten im eigenen Rechenzentrum betreiben.

Agentische Workloads verlangen andere Hardware.

Welche NVIDIA-Plattform passt zu Ihrem Workload?

Die NVIDIA-DGX-Systeme von DELTA.

Ein Pfad, vier Stufen.

Daten bleiben im Haus.

Wer agentische KI on-premise einsetzt.

Der NVIDIA-Software-Stack dahinter.

Beratung, Integration und Test-Centre aus einer Hand.

Grundlagen & Datenschutz

Hardware & Modelle

DELTA & Beschaffung

Sprechen Sie mit DELTA über Ihre Agenten-Plattform.

DELTA Computer Products GmbH

Beratung

Support

SOCIAL MEDIA

AUSGEWÄHLTE ZERTIFIKATE

ASSESSMENTS

INFORMATIONEN

DATENSCHUTZ