Resumen

Únete a nuestro equipo de Site Reliability Engineering como Observability Engineer, donde implementamos y optimizamos herramientas que permiten un monitoreo automatizado y eficiente, proporcionando la información necesaria para corregir errores y asegurar en todo momento el correcto funcionamiento de nuestros productos en la nube en ambientes productivos.

Tendrás el desafío de garantizar la estabilidad, disponibilidad y desempeño de infraestructuras cloud productivas mediante el diseño e implementación de soluciones de monitoreo y visualización de indicadores de desempeño de las plataformas para garantizar la continuidad de la operación de grandes centros de datos, que soportan las aplicaciones e infraestructura críticas e ininterrumpidas que desplegamos.

Este rol está disponible para trabajo remoto desde las siguientes ubicaciones: México, Chile, Argentina, Colombia, Uruguay y Perú.

Responsabilidades

Diseñar, implementar y optimizar soluciones de monitoreo para infraestructuras cloud.
Definir, analizar e implementar dashboards para visualizar indicadores de desempeño críticos.
Asegurar el correcto funcionamiento de clouds productivos basados en tecnologías open source (como Kubernetes y OpenStack).
Atender las incidencias críticas de la plataforma, escalando a los Ingenieros Senior o al área de desarrollo de productos.

Requisitos Técnicos

Formación:
- Estudios de Ingeniería Informática, Ingeniería de Sistemas, Computación o título afín.
Experiencia:
- Experiencia relacionada de al menos 3 años en cargos relacionados con la gestión, optimización y monitoreo de infraestructuras en la nube, especialmente con tecnologías como Kubernetes y/o OpenStack, y el manejo de incidencias y entornos productivos.
- Experiencia en el diseño y soluciones de monitoreo para infraestructuras cloud, así como gestión del desempeño y coordinación de incidencias críticas con el equipo de desarrollo.
Conocimientos Específicos / Requisitos Técnicos:
- Linux intermedio
  - Comandos básicos, manipulación de archivos, red, etc.
  - Experiencia con Shell scripting (Bash).
  - Automatización (scripting) con Bash y/o Python.
- Git: Nivel básico
  - Conoce el flujo "normal" de add, commit, push.
  - No conoce comandos más complicados como un rebase o un cherry-pick.
  - No sabe solucionar conflictos
- Uso y creación de imágenes de contenedores con Docker (intermedio).
  - Saber crear imágenes con un Dockerfile
  - Conocer el ciclo de vida de contenedores Docker
- Uso y configuración de herramientas de monitoreo (Prometheus, Grafana, Elasticsearch, Kibana).
- Uso y configuración de herramientas de despliegue como GitLab, ArgoCD, etc.
- Conocimiento en monitorear elementos externos como routers, switches, clusters de Kubernetes, VMs.
- Uso y administración de clusters de Kubernetes.

Idioma: Inglés intermedio (Escritura/Lectura)
Deseables

Experiencia Cloud Público (AWS, GCP, Azure) o Privado (Openstack)
Experiencia en metodologías ágiles (Scrum, Kanban, etc.)
Capacidad de adaptar open-source existente.
Certificaciones en Linux, OpenStack y/o Kubernetes
Integración de proyectos de código abierto
Conocimientos básicos en Networking

Soft-skills requeridos
- Autonomía, disciplina y capacidad autoaprendizaje
- Pensamiento analítico conceptual
- Orientación al cliente
- Saber trabajar en equipo

Sobre nosotros

En Whitestack somos líderes en Latinoamérica en el desarrollo de soluciones Telco Cloud, Open Networking e infraestructura digital híper-escalable. Trabajamos con tecnologías de código abierto como OpenStack, Kubernetes, Open Source Mano, Ceph, Prometheus, ONOS y muchas otras y colaboramos activamente con organizaciones globales como ETSI, la Open Infrastructure Foundation, el Telecom Infra Project y el Open Compute Project. Impulsamos la transformación digital en la región mediante estándares de clase mundial, grandes implementaciones para operadores y un fuerte compromiso con la innovación.

Además, somos un Great Place to Work, donde la colaboración y el desarrollo personal son parte esencial de nuestra cultura.

¿Por qué unirte a Whitestack?

🌎 Proyección internacional: Participa en iniciativas globales y viaja para colaborar con equipos en distintos países.
⚖️ Equilibrio real: Diseñamos políticas que se ajustan a tu estilo de vida y te permiten trabajar con autonomía y propósito.
📈 Crecimiento claro: Te ofrecemos una línea de carrera sólida en liderazgo y tecnología.
 Salud primero: Seguro médico privado para ti y tu familia.
📚 Aprendizaje sin límites: Acceso a cursos, libros, materiales y reembolso de certificaciones.
🌐 Idiomas para el mundo: Cursos de idiomas para que tu crecimiento no tenga fronteras.
💻 Tecnología en tus manos: Renovamos tu equipo cada 3 años... ¡y es tuyo al finalizar el período!
🏆 Reconocimiento al esfuerzo: Bonos por rendimiento y éxito en proyectos.
🎉 Tiempo para ti: 15 días de vacaciones mínimo, un día libre por tu cumpleaños y descansos extra antes de Fiestas Patrias, Navidad y Año Nuevo.
🤝 Conexión y diversión: Presupuesto para actividades recreativas e integración.
💡 Cultura de innovación: Tus ideas importan. Promovemos la participación estratégica desde cualquier rol.

Conoce más sobre nuestras prestaciones aquí.

Observability Engineer - Prometheus, Grafana

Trabaja con nosotros!