Logotipo de Zephyrnet

La promesa de la IA perimetral y los enfoques para una adopción efectiva – KDnuggets

Fecha:

La promesa de la IA perimetral y los enfoques para una adopción eficaz
Imagen por editor
 

El panorama tecnológico actual está experimentando un cambio fundamental hacia la informática de punta, impulsado por rápidos avances en la IA generativa (GenAI) y las cargas de trabajo de IA tradicionales. Históricamente dependientes de la computación en la nube, estas cargas de trabajo de IA ahora se encuentran con los límites de la IA basada en la nube, incluidas las preocupaciones sobre la seguridad de los datos, la soberanía y la conectividad de la red.

Para solucionar estas limitaciones de la IA basada en la nube, las organizaciones buscan adoptar la informática de punta. La capacidad de la computación perimetral para permitir análisis y respuestas en tiempo real en el punto donde se crean y consumen los datos es la razón por la que las organizaciones la consideran fundamental para la innovación en IA y el crecimiento empresarial.

Con su promesa de un procesamiento más rápido con una latencia de cero a mínima, la IA de vanguardia puede transformar drásticamente las aplicaciones emergentes. Si bien las capacidades informáticas de los dispositivos de borde son cada vez mejores, todavía existen limitaciones que pueden dificultar la implementación de modelos de IA altamente precisos. Tecnologías y enfoques como la cuantificación de modelos, el aprendizaje por imitación, la inferencia distribuida y la gestión de datos distribuidos pueden ayudar a eliminar las barreras para implementaciones de IA de borde más eficientes y rentables para que las organizaciones puedan aprovechar su verdadero potencial. 

La inferencia de IA en la nube a menudo se ve afectada por problemas de latencia, lo que provoca retrasos en el movimiento de datos entre dispositivos y entornos de nube. Las organizaciones se están dando cuenta del costo de mover datos entre regiones, a la nube y de ida y vuelta desde la nube hasta el borde. Puede obstaculizar aplicaciones que requieren respuestas extremadamente rápidas y en tiempo real, como transacciones financieras o sistemas de seguridad industrial. Además, cuando las organizaciones deben ejecutar aplicaciones impulsadas por IA en ubicaciones remotas donde la conectividad de red no es confiable, la nube no siempre está a su alcance. 

Las limitaciones de una estrategia de IA “solo en la nube” son cada vez más evidentes, especialmente para las aplicaciones impulsadas por IA de próxima generación que exigen respuestas rápidas y en tiempo real. Problemas como la latencia de la red pueden ralentizar la información y el razonamiento que se pueden entregar a la aplicación en la nube, lo que genera retrasos y mayores costos asociados con la transmisión de datos entre la nube y los entornos de borde. Esto es particularmente problemático para aplicaciones en tiempo real, especialmente en áreas remotas con conectividad de red intermitente. A medida que la IA ocupa un lugar central en la toma de decisiones y el razonamiento, la física del movimiento de datos puede ser extremadamente costosa y tener un impacto negativo en los resultados comerciales. 

Gartner predice que más del 55% de todo el análisis de datos mediante redes neuronales profundas se producirá en el punto de captura en un sistema de borde para 2025, en comparación con menos del 10% en 2021. La computación de borde ayuda a aliviar la latencia, la escalabilidad, la seguridad de los datos, la conectividad y más desafíos, remodelando la forma en que se maneja el procesamiento de datos y, a su vez, acelerando la adopción de la IA. Desarrollar aplicaciones con un enfoque fuera de línea será fundamental para el éxito de las aplicaciones ágiles.

Con una estrategia de vanguardia eficaz, las organizaciones pueden obtener más valor de sus aplicaciones y tomar decisiones comerciales más rápidamente.

A medida que los modelos de IA se vuelven cada vez más sofisticados y las arquitecturas de aplicaciones se vuelven más complejas, el desafío de implementar estos modelos en dispositivos de borde con restricciones computacionales se vuelve más pronunciado. Sin embargo, los avances en la tecnología y las metodologías en evolución están allanando el camino para la integración eficiente de potentes modelos de IA dentro del marco de la informática de punta, que van desde: 

Compresión y cuantificación de modelos

Técnicas como la poda y la cuantificación de modelos son cruciales para reducir el tamaño de los modelos de IA sin comprometer significativamente su precisión. La poda del modelo elimina la información redundante o no crítica del modelo, mientras que la cuantificación reduce la precisión de los números utilizados en los parámetros del modelo, lo que hace que los modelos sean más livianos y rápidos de ejecutar en dispositivos con recursos limitados. La cuantización de modelos es una técnica que implica comprimir grandes modelos de IA para mejorar la portabilidad y reducir el tamaño del modelo, haciéndolos más livianos y adecuados para implementaciones de borde. Utilizando técnicas de ajuste fino, incluida la cuantificación generalizada posterior al entrenamiento (GPTQ), la adaptación de bajo rango (LoRA) y la LoRA cuantificada (QLoRA), la cuantificación del modelo reduce la precisión numérica de los parámetros del modelo, lo que hace que los modelos sean más eficientes y accesibles para dispositivos de borde como tabletas, puertas de enlace perimetrales y teléfonos móviles. 

Marcos de IA específicos del borde

El desarrollo de bibliotecas y marcos de IA diseñados específicamente para la informática de punta puede simplificar el proceso de implementación de cargas de trabajo de IA de punta. Estos marcos están optimizados para las limitaciones computacionales del hardware de vanguardia y admiten la ejecución eficiente del modelo con una sobrecarga de rendimiento mínima.

Bases de datos con gestión de datos distribuida

Con capacidades como búsqueda de vectores y análisis en tiempo real, ayude a cumplir con los requisitos operativos del borde y admita el procesamiento de datos local, manejando varios tipos de datos, como audio, imágenes y datos de sensores. Esto es especialmente importante en aplicaciones en tiempo real, como el software de vehículos autónomos, donde constantemente se recopilan diversos tipos de datos que deben analizarse en tiempo real.

Inferencia distribuida

Colocar modelos o cargas de trabajo en múltiples dispositivos perimetrales con muestras de datos locales sin un intercambio de datos real puede mitigar posibles problemas de cumplimiento y privacidad de datos. Para aplicaciones, como ciudades inteligentes e IoT industrial, que involucran muchos dispositivos de borde y de IoT, es fundamental tener en cuenta la inferencia de distribución. 

Si bien la IA se ha procesado predominantemente en la nube, encontrar un equilibrio con el borde será fundamental para acelerar las iniciativas de IA. La mayoría de las industrias, si no todas, han reconocido la IA y la GenAI como una ventaja competitiva, razón por la cual recopilar, analizar y obtener rápidamente conocimientos en el borde será cada vez más importante. A medida que las organizaciones evolucionen en su uso de la IA, la implementación de cuantificación de modelos, capacidades multimodales, plataformas de datos y otras estrategias de vanguardia ayudarán a impulsar resultados comerciales significativos y en tiempo real.
 
 

raul pradhan es vicepresidente de Producto y Estrategia en Couchbase (NASDAQ: BASE), proveedor de una base de datos moderna líder para aplicaciones empresariales de la que depende el 30% de las empresas Fortune 100. Rahul tiene más de 20 años de experiencia liderando y gestionando equipos de ingeniería y productos centrándose en bases de datos, almacenamiento, redes y tecnologías de seguridad en la nube. Antes de Couchbase, dirigió el equipo de gestión de productos y estrategia empresarial para las divisiones de tecnologías emergentes y almacenamiento de rango medio de Dell EMC para llevar al mercado todos los productos flash NVMe, Cloud y SDS.

punto_img

Información más reciente

punto_img