Retail y logística Modernización cloud APIs y backend Observabilidad Caso anonimizado

Modernización de plataforma logística para una empresa de retail

Migramos un monolito a un set de servicios desacoplados con APIs REST, observabilidad end-to-end y CI/CD, reduciendo tiempos de respuesta y aumentando la cadencia de releases.

Retailer LATAM ·

70% Reducción de MTTR De ~3 horas a ~50 minutos en incidentes P1.
12x Cadencia de releases De 1 release cada 2 semanas a múltiples diarios.
0 Downtime durante la migración Strangler fig con tráfico controlado por feature flags.

Problema

Un monolito on-premise de más de 8 años acumulaba deuda técnica, los despliegues tardaban más de 4 horas y los incidentes en hora pico se diagnosticaban a ciegas porque no había observabilidad estructurada.

Intervención

Diseñamos una migración progresiva (strangler fig) a Google Cloud, identificando los dominios candidatos a extraer como servicios. Construimos APIs en Python/FastAPI, agregamos OpenTelemetry para trazas distribuidas y montamos un pipeline de CI/CD en GitHub Actions con despliegues automatizados a GKE. El monolito siguió operando durante toda la migración sin downtime para usuarios.

Resultado

Después de 7 meses, el 60% del tráfico crítico corre en los nuevos servicios. Los despliegues bajaron de horas a minutos, el MTTR de incidentes bajó 70% gracias a las trazas, y el equipo cliente quedó capacitado para evolucionar la plataforma de forma autónoma.

Stack

Python FastAPI Google Cloud Platform GKE PostgreSQL OpenTelemetry GitHub Actions

Contexto

El cliente es un retailer con presencia regional cuya operación logística depende de una plataforma propietaria construida en 2016. La plataforma sostiene la planificación de rutas, la trazabilidad de envíos y la facturación a operadores.

Por qué nos buscaron

El crecimiento del negocio empezó a chocar con los límites del monolito. Cada release pesado tomaba ventanas de mantenimiento, los incidentes en hora pico tardaban en diagnosticarse y el equipo interno no tenía bandwidth para modernizar y operar al mismo tiempo.

Cómo trabajamos

Empezamos con un assessment de 3 semanas para mapear dominios, dependencias y riesgos. Identificamos los candidatos óptimos para extraer (planificación de rutas, autenticación, facturación) y propusimos un plan iterativo con métricas claras.

Trabajamos en squad embebido con dos ingenieros del cliente, lo que aceleró el handover y aseguró que el conocimiento se quedara en casa.

El equipo de Caps no solo entregó la migración, nos enseñó a mantenerla. Hoy operamos la plataforma con la mitad del esfuerzo y el doble de visibilidad.
Director de Tecnología VP Technology · Cliente anónimo

¿Tu reto se parece a este?

Cuéntanos contexto. Si hemos resuelto algo similar, podemos ir directo a la conversación útil.