Dein Aufgabengebiet
Für unser professionelles und hochmotiviertes Operations-Team in München suchen wir ab sofort dich als erfahrenen, versierten und engagierten Site Reliability Engineer (m/w/d) in Vollzeit. Du hilfst uns dabei, eine moderne, hochverfügbare Infrastruktur aufzubauen, weiterzuentwickeln und zu betreiben.
Dein Aufgabengebiet:
Dein Aufgabengebiet:
- Sicherstellung der Verfügbarkeit, Performance und Skalierbarkeit unserer Systeme in Cloud- und On-Prem-Umgebungen
- Monitoring, Logging und Observability unserer Infrastruktur und Applikationen mit Tools wie Prometheus, Grafana und Elastic Stack
- Automatisierung von Infrastruktur-Provisionierung und Konfiguration mittels Infrastructure as Code (Ansible, Terraform, Helm, GitOps)
- Verwaltung und Optimierung von Kubernetes-Clustern und containerisierten Anwendungen
- Mitgestaltung und Weiterentwicklung einer stabilen, sicheren und agilen Plattform-Infrastruktur
- Enge Zusammenarbeit mit Development, Security und Operations im Sinne der DevOps- und SRE-Prinzipien
- Betrieb und Support unserer produktiven Umgebungen im Rahmen einer 24/7 Bereitschaft (im Rotationssystem)
- Laufende Evaluierung neuer Technologien, Erstellung technischer Konzepte und Unterstützung bei Architekturentscheidungen
- Umsetzung von IT-Sicherheitsstandards sowie Behebung von Audit-Findings