Observability Engineer - Prometheus, Grafana - AR
Trabaja con nosotros!
Resumen
Únete a nuestro equipo de Site Reliability Engineering como Observability Engineer, donde implementamos y optimizamos herramientas que permiten un monitoreo automatizado y eficiente, proporcionando la información necesaria para corregir errores y asegurar en todo momento el correcto funcionamiento de nuestros productos en la nube en ambientes productivos.
Tendrás el desafío de garantizar la estabilidad, disponibilidad y desempeño de infraestructuras cloud productivas mediante el diseño e implementación de soluciones de monitoreo y visualización de indicadores de desempeño de las plataformas para garantizar la continuidad de la operación de grandes centros de datos, que soportan las aplicaciones e infraestructura críticas e ininterrumpidas que desplegamos.
Este rol está disponible para trabajo remoto desde las siguientes ubicaciones: México, Chile, Argentina, Colombia, Uruguay y Perú.
Responsabilidades
Diseñar, implementar y optimizar soluciones de monitoreo para infraestructuras cloud.
Definir, analizar e implementar dashboards para visualizar indicadores de desempeño críticos.
Asegurar el correcto funcionamiento de clouds productivos basados en tecnologías open source (como Kubernetes y OpenStack).
Atender las incidencias críticas de la plataforma, escalando a los Ingenieros Senior o al área de desarrollo de productos.
Requisitos Técnicos
Formación:
Estudios de Ingeniería Informática, Ingeniería de Sistemas, Computación o título afín.
Experiencia:
Experiencia relacionada de al menos 3 años en cargos relacionados con la gestión, optimización y monitoreo de infraestructuras en la nube, especialmente con tecnologías como Kubernetes y/o OpenStack, y el manejo de incidencias y entornos productivos.
Experiencia en el diseño y soluciones de monitoreo para infraestructuras cloud, así como gestión del desempeño y coordinación de incidencias críticas con el equipo de desarrollo.
Conocimientos Específicos / Requisitos Técnicos:
Monitoreo
Uso y configuración de herramientas de monitoreo (Prometheus, Grafana, Elasticsearch, Kibana).
Python
2-3 años de experiencia en el desarrollo de software con Python
Conocimiento de estructuras de datos, POO, complejidad computacional, patrones de diseño, concurrencia.
Linux
Comandos básicos, manipulación de archivos, red, etc.
Experiencia con Shell scripting (Bash).
Automatización (scripting) con Bash y/o Python.
Admin Kubernetes
Uso y administración de clusters de Kubernetes.
Git
Flujo normal con add, commit, push.
Manejo de ramas y resolución de conflictos.
Idioma: Inglés B2 (Escritura/Lectura)
Deseables
Experiencia Cloud Público (AWS, GCP, Azure) o Privado (Openstack)
Experiencia en metodologías ágiles (Scrum, Kanban, etc.)
Capacidad de adaptar open-source existente.
Certificaciones en Linux, OpenStack y/o Kubernetes
Integración de proyectos de código abierto
Conocimientos básicos en Networking
Soft-skills requeridos
Autonomía, disciplina y capacidad autoaprendizaje
Pensamiento analítico conceptual
Orientación al cliente
Saber trabajar en equipo
Sobre nosotros
En Whitestack somos líderes en Latinoamérica en el desarrollo de soluciones Telco Cloud, Open Networking e infraestructura digital híper-escalable. Trabajamos con tecnologías de código abierto como OpenStack, Kubernetes, Open Source Mano, Ceph, Prometheus, ONOS y muchas otras y colaboramos activamente con organizaciones globales como ETSI, la Open Infrastructure Foundation, el Telecom Infra Project y el Open Compute Project. Impulsamos la transformación digital en la región mediante estándares de clase mundial, grandes implementaciones para operadores y un fuerte compromiso con la innovación.
Además, somos un Great Place to Work, donde la colaboración y el desarrollo personal son parte esencial de nuestra cultura.
¿Por qué unirte a Whitestack?
🌎 Proyección internacional: Participa en iniciativas globales y viaja para colaborar con equipos en distintos países.
⚖️ Equilibrio real: Diseñamos políticas que se ajustan a tu estilo de vida y te permiten trabajar con autonomía y propósito.
📈 Crecimiento claro: Te ofrecemos una línea de carrera sólida en liderazgo y tecnología.
Salud primero: Seguro médico privado para ti y tu familia.
📚 Aprendizaje sin límites: Acceso a cursos, libros, materiales y reembolso de certificaciones.
🌐 Idiomas para el mundo: Cursos de idiomas para que tu crecimiento no tenga fronteras.
💻 Tecnología en tus manos: Renovamos tu equipo cada 3 años... ¡y es tuyo al finalizar el período!
🏆 Reconocimiento al esfuerzo: Bonos por rendimiento y éxito en proyectos.
🎉 Tiempo para ti: 15 días de vacaciones mínimo, un día libre por tu cumpleaños y descansos extra antes de Fiestas Patrias, Navidad y Año Nuevo.
🤝 Conexión y diversión: Presupuesto para actividades recreativas e integración.
💡 Cultura de innovación: Tus ideas importan. Promovemos la participación estratégica desde cualquier rol.
Conoce más sobre nuestras prestaciones aquí.
- Departamento
- Product Development
- Puesto
- Site Reliability Engineer
- Ubicaciones
- Argentina
- Estado remoto
- Completamente remoto
- Tipo de empleo
- Tiempo completo
- Nivel de empleo
- Profesionales
Acerca de Whitestack
Whitestack es una empresa de tecnología con presencia en Latinoamérica, especializada en nubes privadas y virtualización de redes.
Nos destacamos por impulsar soluciones basadas en código abierto, ayudando a operadores de telecomunicaciones, proveedores de aplicaciones y grandes empresas a modernizar su infraestructura.
Además, somos un Great Place to Work, lo que significa que valoramos a nuestro equipo, fomentamos el crecimiento profesional y creamos un ambiente de trabajo colaborativo, diverso e inspirador.