Job Description
Responsibilities
Tanggung Jawab :
Merancang, membangun, dan mengelola CI/CD pipelines untuk aplikasi dan infrastruktur
Mengautomasi provisioning dan konfigurasi bare-metal dan on-premise infrastructure
Mengelola dan mengoperasikan production environment berbasis data center
Menjaga availability, reliability, dan performance sistem produksi
Melakukan troubleshooting lintas layer (application, container, OS, network, hardware)
Mengimplementasikan monitoring, alerting, backup, dan disaster recovery
Memastikan security baseline, compliance, dan audit readiness
Berkolaborasi dengan tim developer untuk meningkatkan deployability dan observability aplikasi
Menyusun dan memelihara technical documentation dan runbooks
Deployment dan maintenance aplikasi menggunakan Docker & Kubernetes
Requirements
Kualifikasi :
Pemahaman kuat tentang Linux system administration (systemd, networking, storage, security)
Pengalaman 2–5 tahun sebagai DevOps / Platform / SRE
Pengalaman mengelola on-premise data center atau bare-metal infrastructure
Pengalaman dengan container technologies (Docker, Kubernetes), termasuk deployment di bare-metal atau self-managed cluster
Pemahaman konsep virtualization dan container orchestration (VMware, KVM, atau sejenisnya)
Familiar dengan cloud platforms (AWS, GCP, Azure) sebagai pelengkap/hybrid environment
Pengalaman menggunakan Git dan workflow kolaboratif (GitOps menjadi nilai tambah)
Pengalaman dengan CI/CD pipelines (Jenkins, GitLab CI, ArgoCD, atau sejenisnya)
Menguasai Terraform atau tools IaC lainnya
Pemahaman dasar networking (DNS, Load Balancer, SSL)
Kemampuan Teknis
Infrastructure & Automation
Infrastructure as Code untuk on-premise dan hybrid (Terraform, Ansible, Packer)
Provisioning dan konfigurasi bare-metal servers (PXE boot, IPMI/iDRAC, RAID, filesystem, kernel tuning)
Capacity planning dan resource optimization (CPU, memory, storage, network)
Container & Platform
Kubernetes di lingkungan non-managed / on-premise
Container networking dan storage (CNI, CSI, persistent storage on bare-metal)
Helm, Kustomize, atau GitOps tools
Monitoring, Logging & Reliability
Monitoring dan alerting (Prometheus, Grafana, Alertmanager)
Centralized logging (ELK / OpenSearch / Fluentd / Loki)
High Availability, failover, dan disaster recovery di lingkungan on-premise
Networking & Security
Networking fundamentals:
DNS, HTTP/HTTPS, SSL/TLS
Load balancer (HAProxy, Nginx, L4/L7 concepts)
VLAN, routing dasar, firewall rules
Security hardening Linux, secrets management, dan access control
Scripting & Tools
Scripting: Bash, Python, atau Go
Web servers dan reverse proxies (Nginx, Apache)
Database fundamentals (PostgreSQL, MySQL; HA setup (menjadi nilai tambah)
Poin Plus Nilai Tambah
Pengalaman mengelola hybrid cloud (on-premise + cloud)
Pengalaman dengan PostgreSQL/MySQL HA, message broker, atau distributed systems
Familiar dengan Service Mesh (Istio, Linkerd) di Kubernetes on-premise
Pengetahuan DevSecOps dan hardening sistem (AppArmor, SELinux, CIS Benchmark)
Sertifikasi terkait (CKA/CKAD, RHCE, atau cloud certification)
Pengalaman berkontribusi pada open-source atau internal platform engineering
Bisa scripting Bash dan salah satu bahasa (Python / Go)
Pengalaman Helm & microservices
Familiar dengan konsep SRE
Pengalaman optimasi cost
Soft Skills
Kemampuan problem-solving yang kuat dan sistematis
Komunikasi teknis yang jelas, terutama lintas tim
Mampu bekerja mandiri maupun dalam tim operasional 24/7
Proaktif, teliti, dan terbiasa bekerja dengan infrastruktur kritikal
Mampu bekerja di bawah tekanan dan menangani incident production