Explorando las Topologías de Infraestructura en la Nube: Desde el Monolito hasta la Inteligencia Artificial Distribuida

Mauricio ECR
Cloud
05 Apr, 2025

Introducción

El crecimiento exponencial de las soluciones en la nube ha transformado la manera en que diseñamos, desplegamos y mantenemos nuestras aplicaciones. Ya no hablamos solo de servidores y bases de datos, sino de arquitecturas complejas y adaptativas que responden a necesidades específicas de negocio, escalabilidad y resiliencia. En este artículo, exploramos las principales topologías de infraestructura en la nube, categorizadas según su propósito principal. Para cada subcategoría se describe de manera fluida sus componentes clave, casos de uso comunes y ejemplos concretos. Finalizamos con un cuadro resumen que compara escalabilidad, resiliencia y elasticidad entre ellas.

Categoría 1: Aplicaciones Web y Backend

• Monolito en una sola instancia

Una única unidad que contiene toda la lógica de negocio y presentación. Suele usarse cuando se prioriza velocidad de desarrollo y simplicidad.

Componentes: Servidor de aplicaciones, base de datos, DNS, logs.
Caso de uso: Ideal para MVPs o aplicaciones internas simples donde se necesita rapidez de desarrollo.
Ejemplo: App de reservas de un coworking local sin alta demanda.

• Arquitectura 2-tier

Separación básica entre presentación y lógica/datos. Aumenta ligeramente la modularidad y seguridad.

Componentes: Frontend, backend, base de datos, red privada (VPC).
Caso de uso: Aplicaciones CRUD sin requerimientos complejos.
Ejemplo: Sistema de inventario de una tienda de barrio.

• Arquitectura 3-tier

División clara entre presentación, lógica de negocio y almacenamiento. Facilita escalabilidad y mantenimiento.

Componentes: Web UI, capa de negocio/API, base de datos, cache, WAF, balanceador de carga.
Caso de uso: Aplicaciones con múltiples usuarios y procesos críticos.
Ejemplo: Portal de empleados de una empresa con 500+ usuarios.

• Microservicios

División modular del sistema en servicios independientes. Facilita despliegue continuo y escalado específico.

Componentes: API Gateway, servicios desacoplados, base de datos por servicio, orquestador, service mesh.
Caso de uso: Aplicaciones con alta demanda de escalabilidad y despliegue continuo.
Ejemplo: Plataforma de e-commerce como Amazon.

• Serverless (FaaS)

Funcionalidad sin gestión directa de servidores. Excelente para eventos aislados y costos por uso.

Componentes: Funciones (Lambda), API Gateway, triggers, S3/DynamoDB.
Caso de uso: Ejecuciones bajo demanda o respuestas rápidas sin infraestructura constante.
Ejemplo: Formulario web con almacenamiento directo en DynamoDB.

• Contenerizada

Uso de contenedores para portabilidad y consistencia. Ideal para equipos DevOps maduros.

Componentes: Contenedores, orquestador (Kubernetes/ECS), ingress, config maps, monitoreo.
Caso de uso: Apps modernas con despliegues ágiles.
Ejemplo: Backend de servicios para una fintech.

• Edge / CDN-based

Distribución de contenido y funciones lo más cerca posible del usuario. Reduce latencia significativamente.

Componentes: CDN, funciones en el edge, almacenamiento estático, DNS.
Caso de uso: Sitios globales, rápidos y ligeros.
Ejemplo: Página de campaña para Spotify con alto tráfico mundial.

Categoría 2: Procesamiento de Datos

• Batch Processing

Ejecución por lotes en horarios programados. Óptimo para procesos no críticos en tiempo real.

Componentes: Orquestador, Spark/Glue, almacenamiento, data warehouse.
Caso de uso: Procesos intensivos pero no urgentes.
Ejemplo: Generación de reportes contables semanales.

• Streaming Processing

Procesamiento en tiempo real de eventos. Permite reacciones inmediatas.

Componentes: Kafka, Flink, almacenamiento rápido, alertas.
Caso de uso: Monitoreo o reacción instantánea.
Ejemplo: Sistema de detección de fraudes financieros.

• ETL / ELT

Extracción, transformación y carga de datos. Clave para flujos de datos confiables.

Componentes: Extractores, transformadores (dbt), destino (DW), scheduler.
Caso de uso: Consolidación de fuentes de datos.
Ejemplo: Integración entre sistema de ventas y CRM.

• Data Warehouse

Sistema analítico estructurado. Usado para análisis de negocio y reporting.

Componentes: Redshift, Snowflake, BigQuery, herramientas BI.
Caso de uso: Análisis de KPIs, dashboards.
Ejemplo: Reportes de ventas mensuales para dirección comercial.

• Data Lake / Lakehouse

Almacenamiento de grandes volúmenes en múltiples formatos. Flexible y económico.

Componentes: S3, Glue/Athena, catálogos de datos, seguridad.
Caso de uso: Escenarios con datos semi/no estructurados.
Ejemplo: Logs masivos de navegación en web.

• Data Mesh

Modelo distribuido y federado de datos. Favorece la autonomía por dominio.

Componentes: Dominios de datos, APIs, gobernanza, interoperabilidad.
Caso de uso: Independencia de equipos para publicar/consumir datos.
Ejemplo: Multinacional con unidades de negocio autónomas.

Categoría 3: Machine Learning / Inteligencia Artificial

• Entrenamiento simple/local

Ejecutado en entornos personales o educativos. Bajo costo y accesibilidad.

Componentes: Notebooks (Colab, Jupyter), datasets, librerías ML.
Caso de uso: Prototipos y aprendizaje.
Ejemplo: Clasificador de sentimientos en Google Colab.

• Entrenamiento distribuido

Requiere potencia de cómputo alto y paralelización. Usado en proyectos avanzados.

Componentes: Clúster de GPUs, datasets, framework (TensorFlow/PyTorch).
Caso de uso: Modelos de lenguaje o visión a gran escala.
Ejemplo: Modelo LLM para sector salud.

• Inferencia batch

Aplicación del modelo a conjuntos de datos no urgentes. Utilizado en análisis periódicos.

Componentes: Modelo, job programado, input/output, auditoría.
Caso de uso: Predicciones acumuladas.
Ejemplo: Scoring de riesgo semanal para cartera de clientes.

• Inferencia en tiempo real

Predicciones inmediatas vía API. Fundamental para experiencias personalizadas.

Componentes: API, modelo cargado en memoria, balanceador.
Caso de uso: Recomendaciones o respuestas interactivas.
Ejemplo: Recomendador de productos online.

• MLOps Pipelines

Automatización del ciclo de vida ML. Mejora confiabilidad y trazabilidad.

Componentes: CI/CD, versionado de datos/modelos, feature store.
Caso de uso: Iteración y despliegue continuo de modelos.
Ejemplo: Monitoreo y redeploy de modelo de anomalías.

• AutoML

Modelado automatizado con herramientas visuales. Democratiza el uso del ML.

Componentes: Plataforma visual, datasets, API.
Caso de uso: Democratización del ML.
Ejemplo: Clasificador usando Google Vertex AI.

Categoría 4: DevOps y Entornos de Desarrollo

• CI/CD básico

Automatización del flujo de despliegue. Mejora velocidad y calidad.

Componentes: Repositorio, pipelines, build/test/deploy.
Caso de uso: Flujos simples de desarrollo continuo.
Ejemplo: GitHub Actions para app Node.js.

• Entornos efímeros

Instancias temporales por cambios en código. Perfecto para validación rápida.

Componentes: IaC, previsualizaciones por rama o PR.
Caso de uso: Validación visual antes de merge.
Ejemplo: Landing page preview con Vercel.

• Entornos dedicados

Separación de ambientes según etapa de desarrollo. Facilita pruebas seguras.

Componentes: Dev, QA, Staging, Prod, variables.
Caso de uso: Flujo robusto de pruebas.
Ejemplo: Pipeline de pagos con pruebas por entorno.

• Infraestructura como Código (IaC)

Infra reproducible y versionada. Ideal para automatización multicloud.

Componentes: Terraform/Pulumi, módulos, backends de estado.
Caso de uso: Gestión multicloud declarativa.
Ejemplo: Infraestructura de microservicios con Terraform.

• DevSecOps

Seguridad integrada al ciclo de desarrollo. Reduce riesgos desde el origen.

Componentes: SAST, control de secretos, validación de seguridad.
Caso de uso: Garantizar seguridad desde el código.
Ejemplo: Validación de secretos y código con Vault y SonarQube.

Resumen General

A continuación, un resumen de las topologías abordadas, con sus propiedades clave:

Grupo	Subcategoría	Escalabilidad	Resiliencia	Elasticidad	Componentes Principales	Caso de Uso / Ejemplo
Web/Backend	Monolito	Baja	Baja	Nula	Servidor, BD, DNS, logs	App reservas coworking
Web/Backend	2-tier	Media	Media	Baja	Frontend, backend, BD	Inventario de tienda
Web/Backend	3-tier	Alta	Alta	Media	UI, API, BD, cache, WAF	Portal empleados
Web/Backend	Microservicios	Muy Alta	Muy Alta	Alta	API GW, servicios, BD, mesh	E-commerce estilo Amazon
Web/Backend	Serverless	Muy Alta	Alta	Muy Alta	Lambda, S3, triggers	Formulario Lambda
Web/Backend	Contenerizada	Alta	Alta	Alta	K8s/ECS, contenedores	Backend fintech
Web/Backend	Edge/CDN	Alta	Alta	Alta	CDN, edge functions	Landing global Spotify
Datos	Batch	Media	Alta	Baja	Orquestador, Glue, DW	Reportes contables
Datos	Streaming	Alta	Alta	Alta	Kafka, Flink, alertas	Fraudes bancarios
Datos	ETL/ELT	Alta	Media	Media	Extractores, DBT, DW	Datos ventas y CRM
Datos	DW	Alta	Alta	Media	Redshift, BI	KPI dirección comercial
Datos	Lakehouse	Muy Alta	Alta	Alta	S3, Athena, catálogo	Logs web
Datos	Data Mesh	Alta	Alta	Media	APIs, dominios, gov	Datos en multinacional
IA/ML	Entrenamiento local	Baja	Baja	Nula	Notebooks, datasets	Clasificador Colab
IA/ML	Entrenamiento distribuido	Alta	Alta	Media	GPUs, TF/PT, dataset	LLM salud
IA/ML	Inferencia batch	Media	Alta	Baja	Job, modelo, IO	Scoring clientes
IA/ML	Inferencia tiempo real	Alta	Alta	Alta	API, modelo, load balancer	Recomendador productos
IA/ML	MLOps	Alta	Alta	Alta	CI/CD, feature store	Modelo de anomalías
IA/ML	AutoML	Media	Alta	Alta	Vertex AI, API	Vertex AI
DevOps	CI/CD	Media	Media	Media	GitHub, pipelines	GitHub Actions
DevOps	Entornos efímeros	Alta	Media	Alta	IaC, previews	Preview en Vercel
DevOps	Entornos dedicados	Media	Alta	Baja	QA, Staging, Prod	Validación por ambiente
DevOps	IaC	Alta	Alta	Alta	Terraform, módulos	Terraform multicloud
DevOps	DevSecOps	Alta	Alta	Alta	SAST, secretos, Vault	Pipeline seguro + Vault

Este análisis puede servirte como hoja de ruta para diseñar arquitecturas eficientes, seguras y adaptadas al crecimiento de tu organización. Cada topología tiene su momento ideal de uso, y comprenderlas te permite tomar decisiones informadas en tu estrategia de nube.

Conclusión: Hacia una Elección Informada

Elegir la topología de infraestructura adecuada en la nube no es solo una cuestión técnica, sino una decisión estratégica que impacta directamente en la eficiencia, escalabilidad y competitividad de una organización. Como hemos visto, cada enfoque —desde un monolito sencillo hasta una arquitectura de MLOps distribuida— tiene fortalezas y compromisos que deben alinearse con el contexto del negocio, la madurez tecnológica del equipo y los objetivos a corto y largo plazo.

Al evaluar cuál topología adoptar, considera las siguientes preguntas clave:

¿Cuál es la etapa de madurez de tu producto o servicio?
¿Qué tan crítico es el tiempo de respuesta o la resiliencia para tu operación?
¿Tu equipo está preparado para gestionar la complejidad que implica escalar?
¿Qué tanto valor aportaría la automatización y observabilidad en tu flujo de trabajo?

Comenzar con una solución simple y evolucionar progresivamente hacia arquitecturas más sofisticadas es una estrategia válida y, en muchos casos, recomendable. Lo esencial es tener claridad en el propósito y una visión arquitectónica que te permita crecer sin reescribir desde cero cada vez que el negocio escale.

En definitiva, la nube no es solo infraestructura: es una plataforma para innovar con agilidad. Entender sus topologías es el primer paso para diseñar soluciones más robustas, eficientes y orientadas al futuro.