Comprimir modelos de IA para crecer sólidamente en Edge

La era de la IA está pasando del entrenamiento a la inferencia. El GTC 2026 de NVIDIA reforzó la idea de que el verdadero valor de la IA se genera cada vez más cuando los modelos funcionan de forma continua en producción, cerca de las fuentes de datos, ofreciendo menor latencia, mejor eficiencia económica y un mayor control sobre los datos.

El mercado global de Edge AI está en pleno crecimiento, con previsiones de pasar de 11.800 millones de dólares en 2025 a 56.800 millones en 2030, con una tasa de crecimiento anual compuesta del 36,9%, impulsado por la necesidad de inferencia en tiempo real en entornos sensibles a la privacidad, de baja latencia, y también por factores geopolíticos.

Para las empresas, este cambio redefine la conversación sobre arquitectura de IA. La pregunta ya no es solo cómo construir LLMs, sino cómo hacerlos más rápidos, más baratos, más seguros y disponibles en cualquier lugar —desde la nube pública o privada hasta el edge—. Aquí es donde la optimización de modelos pasa de ser opcional a convertirse en un activo estratégico.

Tecnologías de optimización de IA

Entre las tecnologías actuales, destacan varios enfoques clave:

  • Optimizadores de prompts, como Compression Cloud, que evitan modificar el modelo optimizando los prompts para reducir el consumo de tokens.
  • Cuantización, que reduce la precisión numérica para disminuir el uso de memoria y acelerar la inferencia, normalmente con cierto impacto en la precisión.
  • Optimizadores de procesador, como OptAI, que mediante cuantización optimizan CPUs y NPUs sustituyendo kernels por runtimes personalizados aplicables a cualquier modelo.
  • Pruning, que elimina pesos o neuronas menos relevantes para reducir el tamaño del modelo y el cómputo necesario.
  • Distillation, que transfiere conocimiento de un modelo grande a uno más pequeño.
  • Adaptación de bajo rango y fine-tuning eficiente en parámetros, que hacen la adaptación más ligera y práctica.
  • Compresión basada en redes tensor, que va más allá de los enfoques tradicionales reduciendo estructuralmente la complejidad del modelo.
  • Almacenamiento de alta velocidad, como los nuevos SSD de Kioxia, que eliminan cuellos de botella entre CPU y almacenamiento para un acceso más rápido a tensores.

En este contexto, destaca especialmente CompactifAI de Multiverse Computing, por su enfoque diferencial basado en redes tensor avanzadas para comprimir LLMs, haciéndolos más rápidos, económicos, eficientes energéticamente y portables entre distintos entornos operativos.

Resolviendo los retos del despliegue en el Edge

Lo que hace especialmente relevante este enfoque en el edge es su impacto operativo. Los modelos comprimidos, al ser más pequeños, pueden ejecutarse en hardware menos potente —como drones—, reducen los requisitos de disco y memoria, mejoran los tiempos de respuesta y ayudan a mantener los datos en local.

La “magia” está en reducir significativamente el tamaño de los LLMs sin perder fiabilidad en las respuestas. De lo contrario, los SLMs (modelos pequeños) serían una opción más lógica.

Las organizaciones que consigan desplegar el modelo adecuado, en el lugar adecuado y con el coste adecuado, liderarán la próxima ola de la IA.

En la práctica, esto se traduce en mejores costes de inferencia en el edge, menor consumo energético y mayor viabilidad en entornos limitados, como escenarios de operaciones en condiciones extremas o de recursos restringidos.

Sectores clave beneficiados

Más allá del ámbito de la defensa, este avance impacta en múltiples sectores:

  • Sector público y soberanía digital, donde la residencia de datos, la gobernanza y el control operativo son críticos. Ejemplo: detección de violencia en tiempo real mediante visión artificial en sistemas CCTV en las ciudades.
  • Sanidad, donde la privacidad y la necesidad de decisiones en tiempo real se benefician de la inferencia local.
  • Industria y fabricación, con casos como inspección de calidad, mantenimiento predictivo, seguridad laboral y aplicaciones de IA física (robótica).
  • Consumo y espacios inteligentes, donde la personalización en tiempo real y el análisis de vídeo requieren procesamiento local rápido. Ejemplo: reducción de colas en caja para mejorar la experiencia del cliente.
  • Telecomunicaciones y proveedores de servicios, donde la inferencia distribuida como servicio permite monetizar infraestructuras edge desde nodos de comunicaciones para así reducir las latencias.

Los proyectos de Edge AI sólo alcanzan economía de escala cuando consiguen volumen. Para lograrlo, los equipos deben invertir de forma estratégica, aprovechando la compresión de modelos para entregar despliegues a tiempo, dentro de presupuesto y con alta calidad.

Pero este concepto va más allá del edge. Los optimizadores de modelos también son críticos en centros de datos, donde los ciclos de GPU en factorías de IA son un recurso valioso. Cada mejora en eficiencia mediante compresión se multiplica a través de miles de cargas de inferencia, reduciendo costes y maximizando el rendimiento.

Cómo la guerra condiciona la infraestructura digital

El viejo orden mundial no volverá.

Hasta hace no poco tiempo, la tecnología condicionaba a la política. Todos recordamos el caso de Cambridge Analytica, que obtuvo datos de Facebook para crear perfiles de votantes y personalizar mensajes en redes sociales que influyeron en las elecciones de 2016 en Estados Unidos.

Ahora, las tornas han cambiado y es la política, la que condiciona a la tecnología. El pasado 1 de marzo se produjo el primer ataque militar a un centro de proceso de datos de un proveedor de cloud. El ataque con drones de Irán logró inutilizar dos zonas de la región de Emiratos Árabes de Amazon Web Services (AWS) y ocasionar un apagón en su zona de Bahréin debido a incendios y fallos en los equipos de refrigeración.

CPDs de AWS en Emiratos

Parece más lógico que nunca proceder con cautela, y aplicar una política de mitigación de riesgos donde la descentralización prevalezca como mecanismo de resiliencia para nuestras organizaciones. Este principio puede, y en mi opinión debería empezar a aplicarse en toda y cada una de las capas de nuestras infraestructuras y aplicaciones.

Almacenamiento: resiliencia frente a centralización

Si empezamos con el almacenamiento del dato, es muy recomendable utilizar:

  • alta disponibilidad,
  • replicaciones en caliente entre centros de datos y
  • terceras copias de seguridad aisladas

para recuperar la actividad en caso de desastre o ciberataque. Pero también es importante que tengamos en cuenta las nuevas circunstancias que vivimos a la hora de explotar esos datos.

Así por ejemplo, en lugar de centralizar toda la información en un datalake más vulnerable, sería aconsejable federar los datos de distintas fuentes y ubicaciones para explotarlo desde un Data Lakehouse.   

Una vez asegurado el dato, el siguiente desafío es garantizar la continuidad del cómputo.. No deberíamos centrarnos exclusivamente en el rendimiento económico de los procesadores y la eficiencia energética de los equipos. Ahora en nuestra tabla de evaluación de los servidores habría que añadir factores como la rugerización para resistir vibraciones, impactos, humedades y polvo, así como la posibilidad de soportar altas temperaturas incluso en los CPDs mejor acondicionados.

Y porqué no, pedir que los equipos sean lo suficientemente versátiles como para admitir varias generaciones de procesadores para alargar así la vida útil de los sistemas más allá de los 3 ó 5 años convencionales.

En cuanto a las redes, además de asegurarse el suministro dual de energía, habría que evitar topologías en estrella o bus, para favorecer despliegues en malla que garanticen una mejor calidad de servicio en caso de interrupción del servicio y faciliten la ejecución de aplicaciones distribuidas / grid computing a cambio de aumentar los costes operativos.

El papel de los proveedores de servicios

Por otro lado, a la hora de empaquetar toda esta infraestructura para las pequeñas y medianas empresas, los proveedores de servicios cloud, hosting y housing, deberían plantearse si su negocio será sostenible con este cambio de paradigma.

A mi juicio, si bien algunos servicios de valor añadido podrán mantenerse centralizados, aquellos de misión crítica para la viabilidad de las empresas acabarán replicados o desplazados hacia el edge, es decir alojados y diseñados para mantenerse operativos de forma independiente de los servicios centrales por periodos prolongados de tiempo.

Quizás veamos un resurgir de los Portable Modular Data Center (PMDC), más allá de los servicios móviles a zonal rurales o para picos de demanda, sino como mecanismo de contingencia para dotar de servicios IT/OT a una instalación en caso de emergencia o necesidad productiva.

Sin embargo, ninguna de estas medidas serán efectivas sin una infraestructura segura, y un software que se ejecute sobre la misma, de forma autónoma y fácilmente reemplazable por otras alternativas. De este modo cada capa (dato, cómputo, red, seguridad, software y personas) serán capaces de responder de forma adecuada a ese nuevo orden geopolítico.

El impacto en la Seguridad y el Software

Respecto a la seguridad de las infraestructuras

  • el cifrado de los datos -no hace falta que sea con algoritmos cuánticos, de momento-,
  • la aplicación del principio zero-trust a los accesos,
  • el uso de agentes de IA para automatizar la monitorización y auditoría,
  • el empleo de redes privadas móviles (PMN), Secure Access Service Edge (SASE) y SD-WAN en las comunicaciones,
  • el geo-fencing de los recursos y la prevención de pérdida de datos (DLP), así como
  • la implementación de mecanismos zero-touch para el despliegue de dispositivos en un entorno cada vez distribuido,

reducirán los errores humanos, los vectores de penetración y el robo de información corporativa.

Si bien ser agnóstico en el software sigue siendo difícil pese a las iniciativas de código abierto, ahora más que nunca los departamentos de compras deberían tomar la medida higiénica de diversificar entre varios proveedores y evaluar la cadena de suministro (humana y física) de los fabricantes en caso de guerra.

Más allá del impacto de la IA generativa en las aplicaciones SaaS mediante la desagregación de funcionalidades y la individualización de los requisitos, en este nuevo mundo la dependencia de las comunicaciones se vuelve un riesgo sistémico, al que se unen las dificultades de integración con el resto de aplicaciones y la soberanía del dato como principal activo de las organizaciones.

Quién sabe si las aplicaciones SaaS acabarán derivando en marketplaces de funciones elementales, propias y de terceros, que acaben siendo ensambladas en aplicaciones ad-hoc por agentes IA al más puro estilo Lovable.

Nuevas formas de trabajar

¿Y el factor humano? Si bien resulta tentador pensar que el talento humano pasará a un segundo plano en este nuevo orden mundial, personalmente creo que las personas cualificadas seguirán siendo clave para desatascar situaciones fuera de lo normal o donde los guardarraíles aplicados a la IA le impidan operar satisfactoriamente.

En base a lo anterior, también tendremos que incorporar a las personas dentro de nuestro plan de acción. Por un lado, habrá que revisitar qué funciones son nucleares para nuestro negocio y cuáles son susceptibles de externalizarse, imponiendo servicios locales o regionales a los proveedores con el fin de reducir el riesgo geopolítico.

En lugar de concentrar a todos los trabajadores en unas mismas instalaciones, los cuarteles generales y los centros de competencia deberían diluirse en favor de células productivas de proximidad que pudieran trabajar agrupados por cercanía geográfica o funcional.

Y si queremos reducir aún más el riesgo para las operaciones, deberíamos optar por un modelo totalmente virtualizado de trabajo donde las comunicaciones y el asistente de IA sirvan para aumentar la productividad del empleado y la colaboración dentro de cada célula o squad.

«El futuro pertenecerá a las organizaciones capaces de mantener sus datos y el talento de sus empleados distribuidos sin perder eficiencia.»

En definitiva, el equilibrio entre tecnología, política y geoestrategia en tiempos de guerra se ha vuelto más delicado que nunca. Las organizaciones que aspiren a sobrevivir en este nuevo entorno deberán asumir que la resiliencia ya no es un valor añadido, sino una condición existencial.

Alinear la arquitectura tecnológica con criterios de descentralización, seguridad y sostenibilidad operativa será tan esencial como cultivar el talento capaz de anticipar y reaccionar ante lo inesperado. Solo aquellas empresas que comprendan que la continuidad del negocio depende tanto de la robustez de sus sistemas como de la autonomía de sus equipos humanos estarán realmente preparadas para un futuro cada vez menos predecible.

Aplicaciones de la IA Generativa en la empresa

La gran foto del informe de Wharton–GBK es clara: la IA generativa ha dejado de ser el “gadget de moda” del CIO para convertirse en una capa transversal de productividad, inversión y gobierno en la empresa, con ROI ya visible y un cuello de botella cada vez menos tecnológico y cada vez más humano.

Para el cloud y el edge, esto significa que entramos en una fase de normalización: menos pilotos vistosos, más arquitecturas serias, más presión por integrar y orquestar modelos, datos y agentes cerca de donde se produce el trabajo y el dato.

La IA deja de ser experimento: impacto directo en la infraestructura

Tres años después de ChatGPT, el 82% de los decisores usa IA generativa al menos una vez por semana y el 46% lo hace a diario, con especial intensidad en IT y Compras, mientras que Marketing/Ventas y Operaciones siguen algo por detrás.

Las cargas principales son muy “de oficina”: análisis de datos (73%), resúmenes de documentos/reuniones (70%) y edición/redacción (68%), todas ellas además percibidas como las de mejor rendimiento. Esto consolida un patrón de demanda hacia plataformas cloud capaces de absorber millones de interacciones ligeras, bien integradas con suites de productividad, y hacia un edge más orientado a procesar datos locales y resumir contexto antes de subirlo al modelo.​

«72% de las empresas ya mide formalmente el ROI de la IA generativa»

Del hype al ROI medido: el presupuesto se vuelve selectivo

El informe muestra un giro nítido de la métrica de “uso” a la métrica de “retorno”: un 72% de las empresas ya mide formalmente el ROI de la IA generativa y tres de cada cuatro declaran retornos positivos, sobre todo en eficiencia y productividad.

Aun así, los grandes (Tier 1) reportan más “demasiado pronto para decirlo” por la complejidad de integrar IA en sistemas heredados, mientras que los Tier 2 y 3 ven beneficios antes, lo que favorece arquitecturas cloud más modulares y APIs de IA desacopladas de los monolitos tradicionales.

Esto presiona a los proveedores a ofrecer stacks (AI in a box) de IA “ROI-ready”: observabilidad, medición de productividad, FinOps de inferencia y opciones de despliegue híbrido para ajustar coste y latencia caso a caso.

«muchas organizaciones están construyendo capacidades propias [de IA Generativa]»

Cloud como estándar, edge como acelerador

En la capa de plataforma, los chatbots más usados (ChatGPT, Copilot, Gemini) se alinean con los hyperscalers principales, y la enorme mayoría de suscripciones las paga el empleador, no el usuario. Además, cerca de un tercio del presupuesto tecnológico de IA en IT se destina ya a I+D interna, señal inequívoca de que muchas organizaciones están construyendo capacidades propias, no solo consumiendo servicios genéricos.

Para el mercado cloud/edge, esto se traduce en demanda de runtimes flexibles (modelos fundacionales de terceros, modelos propios y open source) y en la necesidad de acercar modelos y agentes allí donde residen los datos sensibles: on‑prem, en micro‑DCs de proximidad o en dispositivos industriales.

Agentes de IA: el nuevo “cliente” de la infraestructura

Un dato relevante es que un 58% de los líderes afirma que su organización ya está usando agentes de IA , sobre todo para automatizar procesos, coordinar workflows, hacer analítica y reforzar la atención al cliente. Aunque hoy siguen muy supervisados, estos agentes empiezan a orquestar tareas de DevOps (monitorización, remediación automática), finanzas operativas (matching de facturas, fraude) y contratos, lo que exige infraestructuras capaces de ejecutar flujos persistentes, event‑driven y con acceso seguro a múltiples sistemas.

En términos de arquitectura, esto empuja hacia plataformas de eventos, colas y funciones serverless en cloud combinadas con agentes desplegados en el edge para reaccionar en tiempo casi real sobre redes, plantas de producción o tiendas físicas.

Seguridad, riesgo y datos: el argumento fuerte del edge

Las principales barreras no son ya el coste de la tecnología, sino los riesgos de seguridad, la complejidad operacional y la inexactitud de los resultados, con la privacidad de datos de cliente y el cumplimiento regulatorio subiendo posiciones.

Un 64% de las empresas declara políticas de seguridad de datos específicas para IA, un 61% programas de formación y un 62% usa IA para gestionar riesgos, sobre todo en ciberseguridad y riesgo financiero. Para cloud y edge, esto refuerza el caso de arquitecturas donde los datos sensibles no salen del perímetro: inferencia local, anonimización en el edge, controles de acceso y registro de decisiones de agentes que luego se sincronizan con el cloud para auditoría y mejora de modelos.

El cuello de botella humano y su reflejo en la arquitectura

Aunque el 89% de los decisores ve la IA como palanca de mejora de habilidades, un 43% teme pérdida de competencia en la plantilla, y las dificultades para encontrar talento avanzado (49%) y ofrecer formación eficaz (46%) aparecen como frenos clave. Al mismo tiempo, crece el rol del CAIO (presente ya en el 60% de las empresas) y el liderazgo ejecutivo en IA, mientras los presupuestos de formación se estancan y gana peso la opción de contratar perfiles nuevos.

Esto permite que las plataformas cloud y soluciones edge ofrezcan supervisión automática: herramientas que incorporan de serie guardrails, plantillas de casos de uso, flujos guiados y capacidades de gobierno, reduciendo la dependencia de grandes equipos internos para poner en producción casos de uso robustos.

Presupuesto al alza, pero con tijera en el legacy

De cara a los próximos 12 meses, un 88% de los líderes espera aumentar el presupuesto de IA, y un 87% prevé incrementos moderados o significativos a 2–5 años, con TI, Producto/Ingeniería y Finanzas a la cabeza. Una parte creciente de estos fondos ya no es “dinero nuevo”: algunos ejecutivos empiezan a financiar IA recortando en TI legacy, servicios externos y programas de workforce tradicionales, consolidando IA como capítulo estructural de OPEX y CAPEX tecnológico.

Para el ecosistema cloud/edge, esto augura un ciclo de sustitución: menos gasto en sistemas cerrados, más en plataformas de datos modernas, hardware optimizado para inferencia en el edge y servicios gestionados de IA que integren cómputo, datos, seguridad y gobierno en una misma propuesta.

Cloud, Edge, IA, Ciber… ¿y de mi negocio qué?

El año 2025 marca un punto de inflexión para la digitalización de las empresas medianas españolas. Cloud, inteligencia artificial y ciberseguridad forman ya el núcleo de la competitividad empresarial, pero ¿cómo abordarlos de forma práctica y aterrizada?

El informe “Global Digital Trust Insights 2025” de PwC señala que solo el 2% de las empresas han alcanzado aplicar la ciberresiliencia en todos sus procesos clave. Aunque casi el 78% aumentará su inversión en ciberseguridad este año. En mi opinión, el reto está en alinear la protección de datos y de entornos cloud con los objetivos marcados por el negocio.​

Por su parte, Houlihan Lokey destaca en “From Code to Creation” la revolución que supone la IA en la ingeniería digital. Plataformas low-code, automatización y análisis predictivo permiten desarrollar productos y servicios de manera más ágil, pero también exigen procesos seguros, gobernanza clara y talento digital preparado para aplicar las nuevas tecnologías.​

El estudio de Deloitte “AI-powered Cities of the Future” revela cómo la IA aplicada en edge y cloud está transformando entornos urbanos, mejorando la gestión de datos, movilidad, salud y sostenibilidad. Este modelo no deja de ser un perfecto ejemplo de como las empresas medianas que buscan escalabilidad y adaptabilidad sin perder el control sobre sus datos pueden adoptar una estrategia similar a la de los municipios de tamaño medio.

Y es que en España, las empresas de tamaño intermedio deben dejar atrás la fase de pruebas y pilotos para escalar sus proyectos digitales. Para ello, el plan práctico básico debe incluir: migración segura a cloud, despliegue responsable de IA, adopción de plataformas low-code, formación continua de equipos y blindaje de ciberseguridad desde la dirección, involucrando tanto al CISO como a los responsables de negocio.

Por su parte el informe Cotec sobre productividad laboral en España (2025) insiste en que la adopción efectiva de IA puede mejorar entre un 2% y un 3% anual la productividad por hora trabajada, muy lejos del cacareado 30% indicado por estudios internacionales, quizás porque nuestra economía es intensiva en mano de obra de poco valor económico respecto a otros países.​

Las claves para obtener mejores resultados: anticipar riesgos, cuantificar el impacto financiero de posibles amenazas, invertir en cloud y protección de datos y activar la colaboración entre áreas, rompiendo los silos tradicionales. Por último, la ciberseguridad debe ser un proceso continuo y transversal, no un elemento aislado del negocio.

Las iniciativas exitosas han conseguido escalar los casos de uso más importantes para sus empresas y España no puede quedarse atrás ante los avances en inteligencia artificial, computación edge y protección digital. La aceleración tecnológica exige visión, estrategia y una ejecución rigurosa.

La receta es clara: plan de migración cloud, despliegue adaptativo de IA en procesos y productos, gestión activa de riesgos y un liderazgo que entienda tanto el contexto regulatorio como las oportunidades de negocio. Solo así las empresas españolas podrán reinventarse y ser competitivas en el nuevo marco global.

SUSE Edge: La Solución de Innovación Digital al Servicio del Sector del Retail

La Solución de Innovación Digital al Servicio del Sector del Retail

Los sistemas en la industria retail comienzan con la optimización de costes y terminan con la satisfacción del cliente. Operar con márgenes ajustados mientras se busca una innovación que mejore la experiencia del cliente es un reto importante para el sector.

SUSE es líder en soluciones de código abierto para el Edge Computing, con opciones de plataforma para cargas de trabajo en Linux y Kubernetes y soluciones de administración para gestión de ambientes multi-linux y multi-kubernetes, que crecen con el negocio al tiempo que optimizan los costes de desarrollo de aplicaciones y la gestión de operaciones.

Además, SUSE cuenta con un ecosistema de soluciones que permiten a nuestros clientes desplegar y mantener aplicaciones y servicios de un modo ágil y seguro. Estas soluciones habilitan la adopción de aplicaciones modernas como visión artificial, inventario y gestión de la cadena de suministro, detección de robos y muchas más.

Más información en https://more.suse.com/ES-EdgeOps_Webinar_LP.html

SUSE Edge 3.0: The new frontier of innovation

The challenges and complexities of deployment of cloud-native applications and infrastructure at the edge, and how SUSE’s Edge 3.0 platform offers a flexible, scalable, and comprehensive solution, covering deployment footprints, technical capabilities and features, and a look at the road ahead.

SUSExchange Accelerate. Innovation for decision makers.

SUSExchange_Accelerate

Join us for an insightful webinar as we delve into the transformative world of edge computing with a spotlight on SUSE’s cutting-edge technologies – Elemental and Akri. In an era where low latency, high bandwidth, and local processing capabilities are paramount, understanding and harnessing the power of edge computing has become essential for businesses across industries.

Dell Unleash Innovation – Barcelona

Dell_BCN_Unleash_Innovation

Dell Unleash Innovation – Barcelona

Descubre de la mano de los expertos de Dell Technologies y de algunos de nuestros clientes, cómo las ideas pueden convertirse en la próxima gran innovación que impulse a tu organización.

Hablaremos, entre otras cosas, sobre Inteligencia Artificial, Multicloud, aaS, Seguridad, Edge, el Centro de datos moderno, y el Futuro del puesto de trabajo.

VMware Explore 2023

VMwareExplore

VMware Explore offers the sessions, activities and programs that will guide your journey to multi-cloud.

Industrial Innovation and Transformation through 5G, private networks and MEC

Industrial Innovation and Transformation through 5G, private networks and MEC

5G and Wireless Private Networks unlock the power of Multi-access Edge Computing (MEC) for industrial innovation by enabling real-time data processing, remote monitoring and control, enhanced customer experiences, and secure communication—all of which help businesses adapt and thrive in an uncertain economic environment.