IA - Por las nubes - Cloud empresarial

20/05/2026

Comprimir modelos de IA para crecer sólidamente en Edge

La era de la IA está pasando del entrenamiento a la inferencia. El GTC 2026 de NVIDIA reforzó la idea de que el verdadero valor de la IA se genera cada vez más cuando los modelos funcionan de forma continua en producción, cerca de las fuentes de datos, ofreciendo menor latencia, mejor eficiencia económica y un mayor control sobre los datos.

El mercado global de Edge AI está en pleno crecimiento, con previsiones de pasar de 11.800 millones de dólares en 2025 a 56.800 millones en 2030, con una tasa de crecimiento anual compuesta del 36,9%, impulsado por la necesidad de inferencia en tiempo real en entornos sensibles a la privacidad, de baja latencia, y también por factores geopolíticos.

Para las empresas, este cambio redefine la conversación sobre arquitectura de IA. La pregunta ya no es solo cómo construir LLMs, sino cómo hacerlos más rápidos, más baratos, más seguros y disponibles en cualquier lugar —desde la nube pública o privada hasta el edge—. Aquí es donde la optimización de modelos pasa de ser opcional a convertirse en un activo estratégico.

Tecnologías de optimización de IA

Entre las tecnologías actuales, destacan varios enfoques clave:

Optimizadores de prompts, como Compression Cloud, que evitan modificar el modelo optimizando los prompts para reducir el consumo de tokens.
Cuantización, que reduce la precisión numérica para disminuir el uso de memoria y acelerar la inferencia, normalmente con cierto impacto en la precisión.
Optimizadores de procesador, como OptAI, que mediante cuantización optimizan CPUs y NPUs sustituyendo kernels por runtimes personalizados aplicables a cualquier modelo.
Pruning, que elimina pesos o neuronas menos relevantes para reducir el tamaño del modelo y el cómputo necesario.
Distillation, que transfiere conocimiento de un modelo grande a uno más pequeño.
Adaptación de bajo rango y fine-tuning eficiente en parámetros, que hacen la adaptación más ligera y práctica.
Compresión basada en redes tensor, que va más allá de los enfoques tradicionales reduciendo estructuralmente la complejidad del modelo.
Almacenamiento de alta velocidad, como los nuevos SSD de Kioxia, que eliminan cuellos de botella entre CPU y almacenamiento para un acceso más rápido a tensores.

En este contexto, destaca especialmente CompactifAI de Multiverse Computing, por su enfoque diferencial basado en redes tensor avanzadas para comprimir LLMs, haciéndolos más rápidos, económicos, eficientes energéticamente y portables entre distintos entornos operativos.

Resolviendo los retos del despliegue en el Edge

Lo que hace especialmente relevante este enfoque en el edge es su impacto operativo. Los modelos comprimidos, al ser más pequeños, pueden ejecutarse en hardware menos potente —como drones—, reducen los requisitos de disco y memoria, mejoran los tiempos de respuesta y ayudan a mantener los datos en local.

La “magia” está en reducir significativamente el tamaño de los LLMs sin perder fiabilidad en las respuestas. De lo contrario, los SLMs (modelos pequeños) serían una opción más lógica.

Las organizaciones que consigan desplegar el modelo adecuado, en el lugar adecuado y con el coste adecuado, liderarán la próxima ola de la IA.

En la práctica, esto se traduce en mejores costes de inferencia en el edge, menor consumo energético y mayor viabilidad en entornos limitados, como escenarios de operaciones en condiciones extremas o de recursos restringidos.

Sectores clave beneficiados

Más allá del ámbito de la defensa, este avance impacta en múltiples sectores:

Sector público y soberanía digital, donde la residencia de datos, la gobernanza y el control operativo son críticos. Ejemplo: detección de violencia en tiempo real mediante visión artificial en sistemas CCTV en las ciudades.
Sanidad, donde la privacidad y la necesidad de decisiones en tiempo real se benefician de la inferencia local.
Industria y fabricación, con casos como inspección de calidad, mantenimiento predictivo, seguridad laboral y aplicaciones de IA física (robótica).
Consumo y espacios inteligentes, donde la personalización en tiempo real y el análisis de vídeo requieren procesamiento local rápido. Ejemplo: reducción de colas en caja para mejorar la experiencia del cliente.
Telecomunicaciones y proveedores de servicios, donde la inferencia distribuida como servicio permite monetizar infraestructuras edge desde nodos de comunicaciones para así reducir las latencias.

Los proyectos de Edge AI sólo alcanzan economía de escala cuando consiguen volumen. Para lograrlo, los equipos deben invertir de forma estratégica, aprovechando la compresión de modelos para entregar despliegues a tiempo, dentro de presupuesto y con alta calidad.

Pero este concepto va más allá del edge. Los optimizadores de modelos también son críticos en centros de datos, donde los ciclos de GPU en factorías de IA son un recurso valioso. Cada mejora en eficiencia mediante compresión se multiplica a través de miles de cargas de inferencia, reduciendo costes y maximizando el rendimiento.

07/11/202507/11/2025

Cloud, Edge, IA, Ciber… ¿y de mi negocio qué?

El año 2025 marca un punto de inflexión para la digitalización de las empresas medianas españolas. Cloud, inteligencia artificial y ciberseguridad forman ya el núcleo de la competitividad empresarial, pero ¿cómo abordarlos de forma práctica y aterrizada?

El informe “Global Digital Trust Insights 2025” de PwC señala que solo el 2% de las empresas han alcanzado aplicar la ciberresiliencia en todos sus procesos clave. Aunque casi el 78% aumentará su inversión en ciberseguridad este año. En mi opinión, el reto está en alinear la protección de datos y de entornos cloud con los objetivos marcados por el negocio.

Por su parte, Houlihan Lokey destaca en “From Code to Creation” la revolución que supone la IA en la ingeniería digital. Plataformas low-code, automatización y análisis predictivo permiten desarrollar productos y servicios de manera más ágil, pero también exigen procesos seguros, gobernanza clara y talento digital preparado para aplicar las nuevas tecnologías.

El estudio de Deloitte “AI-powered Cities of the Future” revela cómo la IA aplicada en edge y cloud está transformando entornos urbanos, mejorando la gestión de datos, movilidad, salud y sostenibilidad. Este modelo no deja de ser un perfecto ejemplo de como las empresas medianas que buscan escalabilidad y adaptabilidad sin perder el control sobre sus datos pueden adoptar una estrategia similar a la de los municipios de tamaño medio.

Y es que en España, las empresas de tamaño intermedio deben dejar atrás la fase de pruebas y pilotos para escalar sus proyectos digitales. Para ello, el plan práctico básico debe incluir: migración segura a cloud, despliegue responsable de IA, adopción de plataformas low-code, formación continua de equipos y blindaje de ciberseguridad desde la dirección, involucrando tanto al CISO como a los responsables de negocio.

Vales lo que produces

Por su parte el informe Cotec sobre productividad laboral en España (2025) insiste en que la adopción efectiva de IA puede mejorar entre un 2% y un 3% anual la productividad por hora trabajada, muy lejos del cacareado 30% indicado por estudios internacionales, quizás porque nuestra economía es intensiva en mano de obra de poco valor económico respecto a otros países.

Las claves para obtener mejores resultados: anticipar riesgos, cuantificar el impacto financiero de posibles amenazas, invertir en cloud y protección de datos y activar la colaboración entre áreas, rompiendo los silos tradicionales. Por último, la ciberseguridad debe ser un proceso continuo y transversal, no un elemento aislado del negocio.

Las iniciativas exitosas han conseguido escalar los casos de uso más importantes para sus empresas y España no puede quedarse atrás ante los avances en inteligencia artificial, computación edge y protección digital. La aceleración tecnológica exige visión, estrategia y una ejecución rigurosa.

La receta es clara: plan de migración cloud, despliegue adaptativo de IA en procesos y productos, gestión activa de riesgos y un liderazgo que entienda tanto el contexto regulatorio como las oportunidades de negocio. Solo así las empresas españolas podrán reinventarse y ser competitivas en el nuevo marco global.

Planet 25 Madrid

Tech Business PlaNET25 – Madrid

Nace el Gran escaparate Internacional de la innovación tecnológica aplicada a la empresa, en Madrid. Promovido por el ecosistema de Clústers, HUBs de Innovación y centros de emprendimiento de la Comunidad de Madrid.

La tecnología tiene hoy las respuestas a los retos de competitividad y crecimiento de negocio de las empresas. ¡Ven a conocerlas!

Tech Business PlaNET 25 Madrid, nace con la vocación de ser un espacio de visibilidad para las soluciones tecnológicas más relevantes del momento y, a su vez, el evento que conecta dichas soluciones con las empresas que las buscan. En el evento se darán cita todos los actores del ecosistema tecnológico; empresas creadoras de tecnología, organizaciones públicas y privadas, empresas líderes en tendencias y tecnologías transformadoras nacionales e internacionales, así como sus líderes de opinión.

Más información en https://planet.madrid/

24/10/202424/10/2024

Keynote de AWS Innovate: Construir y Migrar

El evento online AWS Innovate: Build and Migrate ha tratado sobre las posibilidades y beneficios de la migración a la nube. Aquí compartimos las principales conclusiones y casos de éxito presentados durante la keynote de apertura.

Transformación Empresarial e Innovación

Las empresas buscan transformar sus negocios y reinvertir las eficiencias logradas para innovar. AWS destaca cómo la migración a la nube puede generar hasta un 77% de ahorro en costos de licencias al migrar de Windows a Linux o de Oracle a PostgreSQL, y un 43% de reducción en el tiempo de comercialización (time-to-market).

Impacto de la Migración

Con más de un millón de clientes y 1000 migraciones realizadas, AWS ha identificado algunos patrones clave:

Retirar entre el 10% y el 20% de las aplicaciones.
Reducir la actividad operativa con más de 1000 proveedores SaaS en áreas como CRM.

Casos de Éxito

Philips 66: Migró 330,000 archivos en una hora y más de 300 TB de datos en menos de un mes, logrando una reducción del 80% en costos de almacenamiento con NetApp OnTap.

Aflac: Desde su migración en 2020, ha reducido costos, mejorado la resiliencia y creado una plataforma de innovación. Su huella incluye 200 aplicaciones y 138 herramientas retiradas, con 11 datamarts replatformados.

Flywire: Mejoró los tiempos de inicio de los pipelines de desarrollo en un 60%, ahorró un 40% en parches de seguridad manuales y redujo hasta un 70% los costos de cómputo utilizando Fargate y contenedores serverless.

Taco Bell: Escaló su infraestructura serverless para soportar 300,000 pedidos por hora en sus 70,000 restaurantes a raíz del COVID.

Vanguard: Desde 2015, ha aumentado el tiempo de comercialización de microservicios de 3 meses a 24 horas y reducido el costo unitario en un 50% utilizando Fargate y ECS.

Bolttech: Logró una reducción del 75% en el tiempo de documentación de código y un ahorro del 90% en el tiempo de desarrollo de código aplicando inteligencia artificial generativa.

Por Qué Elegir AWS

AWS se destaca por sus 143 estándares y certificaciones de seguridad, 105 zonas de disponibilidad y una nube soberana en construcción en Europa. Con más de 200 servicios y 750 tipos de instancias, AWS ha realizado 134 reducciones de precios desde 2020.

Programa de Aceleración de Migración (MAP)

El MAP de AWS ofrece herramientas, socios globales, servicios de evaluación de migración, hub de migración y servicio de migración de aplicaciones, además de formación, metodología e inversión.

Beneficios de la Migración

Agilidad, velocidad e innovación.
Rendimiento y resiliencia.
Eficiencia y optimización de costos.

Directrices para una Migración Exitosa

Seleccionar cuidadosamente las aplicaciones a migrar.
Aprovechar los programas MAP y EBA de AWS, incorporando socios.
Construir una base para la IA generativa.

AWS intenta hacer ver que la migración a la nube no es solo una tendencia, sino una necesidad estratégica para las empresas que buscan mantenerse competitivas y eficientes en un entorno digital en constante evolución. Para más información sobre estos temas, te invitamos a explorar nuestros artículos en Por las Nubes.

23/10/2024

Foro Tendencias Nube e IA: Innovaciones y Desafíos

El reciente evento organizado por la Asociación ASLAN ha sido un punto de encuentro para el sector que ha mostrado las tendencias emergentes en el ámbito de la computación en la nube. Aquí compartimos las principales conclusiones y posibles interacciones derivadas de las presentaciones de destacados líderes del sector.

HPE: La Transformación de los Datos

HPE destacó la importancia de la abundancia de datos en el edge, subrayando que la transformación digital gira en torno a los datos. Se presentaron casos de uso enfocados en la seguridad, la gobernanza de datos y la operación sencilla, utilizando modelos operativos como CMP (Morpheus), ITOM y FinOps. La plataforma Greenlake y el centro de excelencia global en Madrid fueron puntos clave, resaltando el rápido retorno de AI ops.

«El 80% de las empresas fallarán en la gobernanza de datos y el 60% en la implementación de IA. » [Gartner]

Estos datos subrayan la necesidad de estrategias robustas y bien definidas para evitar estos fracasos.

Lenovo: Edge Computing y Optimización

Lenovo mostró cómo el edge computing mejora los tiempos de respuesta y ahorra ancho de banda, habilitando la IA en sectores como la manufactura, el retail y la gestión de energía. La refrigeración líquida en centros de datos y un ecosistema de socios con diseños validados fueron aspectos destacados.

NetApp: Innovación en la Infraestructura de Datos

NetApp enfatizó la innovación en la infraestructura de datos, promoviendo la unificación del almacenamiento y la nube híbrida para evitar el vendor lock-in. La seguridad por diseño y el uso de IA para la observabilidad y la gestión de costos fueron temas centrales.

Digital Realty / Interxion: Estrategia de Datos y Ubicación

La importancia de tener una estrategia de datos y la ubicación adecuada para alojar nuevas cargas de trabajo de IA fueron puntos cruciales. Los desafíos incluyen la eficiencia de los sistemas, la seguridad y la monetización de la IA.

DE CIX: Reducción de Costos con Redes Privadas

DE CIX destacó cómo una red privada puede reducir significativamente los costos al extraer datos de hyperscalers, adaptándose a las diferentes necesidades de aprendizaje e inferencia.

Cisco: Mejorando las Experiencias Digitales

Cisco, a través de su unidad ThousandEyes, subrayó la importancia de la visibilidad y el control en infraestructuras externas, mejorando las experiencias digitales para usuarios internos y externos.

Crayon: Optimización de Costos y Adopción de la Nube

Crayon se centró en la optimización de costos y la aceleración de la adopción de la nube, destacando un caso de estudio con CODERE que logró una reducción del 27% en el coste de sus consumos en la nube.

Dell Technologies: Liderazgo y Visión en la Transformación Digital

Julio Cesar Gomez Martin de Dell Technologies destacó la incertidumbre que enfrentan muchas organizaciones sobre qué pasos tomar en su transformación digital. Subrayó la importancia de apoyarse en expertos asesores para guiar esta transformación, ya sea con o sin la implementación de IA.

Dell Technologies se posiciona como un líder visionario en este ámbito, ofreciendo soluciones innovadoras como Dell AI Factory y DataLakeHouse en colaboración con Starburst, que facilitan la adopción de tecnologías avanzadas y la gestión eficiente de datos.

Kyndryl: Facilitando la Adopción de AIOps

Hermann Straus de Kyndryl enfatizó la importancia de la gestión del cambio para que las organizaciones adopten AI Ops. Kyndryl se enfoca en crear una conversación más fluida con el cliente, permitiendo analizar juntos los datos y mejorar la toma de decisiones. Esta colaboración estrecha ayuda a las empresas a integrar AIOps de manera efectiva, optimizando sus operaciones y mejorando la eficiencia.

Nutanix: Plataforma en la Nube y Casos de Uso

Nutanix presentó su plataforma en la nube, abordando desafíos como la privacidad y la propiedad intelectual. Los casos de uso incluyeron un ChatGPT privado y un Copilot para la generación de código.

COS: Gestión del Cambio y AIOps

COS enfatizó la necesidad de una gestión del cambio para la adopción de AIOps, facilitando una conversación más fluida con el cliente mediante el análisis conjunto de datos.

AWS: Data Mesh y Gobernanza Federada

AWS presentó el concepto de data mesh, que permite identificar fuentes de datos independientes y aplicar políticas de gobernanza federada, creando un catálogo de datos para exponerlos a los servicios.

Conclusiones

El evento de ASLAN ha dejado claro que la computación en la nube sigue evolucionando rápidamente, con un enfoque creciente en la seguridad, la gobernanza de datos y la eficiencia operativa. Para más información sobre estos temas, te invitamos a explorar nuestros artículos en Por las Nubes.