Wir geben uns nicht mit Standard-Lösungen zufrieden. Während andere nur Cloud-Credits verbrauchen, bauen wir unsere eigene Hochleistungs-Infrastruktur. Wir betreiben einen dedizierten Kubernetes-Cluster auf NVIDIA H100 Hardware und entwickeln darauf unsere eigene KI-Coding-Agent-Infrastruktur.
Du bist der Architekt, der sicherstellt, dass unsere Entwickler mit maximaler Geschwindigkeit und voller Datenhoheit arbeiten können.
## Aufgaben
H100 Core: Du bist Herr über unseren On-Premise Kubernetes-Cluster und optimierst die Anbindung unserer NVIDIA H100 GPUs.
AI Agent Platform: Du baust und skalierst die Infrastruktur für unsere internen KI-Coding-Agents.
GitLab Ecosystem: Du integrierst GitLab Duo und sorgst für die nahtlose Verbindung zwischen unserer Hardware, dem Code-Repository und den KI-Assistenzsystemen.
Inference at Scale: Du nutzt vLLM, um LLMs effizient auf unseren Nodes bereitzustellen.
Automation & GitOps: Du steuerst das gesamte Deployment über ArgoCD und Argo Workflows – Infrastructure as Code ist dein Credo.
Cloud-Sovereignty: Du nutzt Google Cloud und Azure unterstützend für Hybrid-Szenarien, während der Core-Workload auf unserer eigenen Hardware bleibt.
## Qualifikation
K8s & Bare-Metal: Du hast Erfahrung mit Kubernetes, idealerweise in Umgebungen mit direkter Hardware-Verantwortung.
DevSecOps: Du kennst dich mit GitLab aus und hast idealerweise bereits erste Berührungspunkte mit GitLab Duo oder KI-gestützter Softwareentwicklung.
Tech-Stack: Sicherer Umgang mit Argo, Linux und idealerweise vLLM .