Noticias

Aceleradores de redes neuronales para Lattice FPGAs

Ambos están destinados a implementar redes neuronales en productos de red de consumo e industriales. No son adecuados para el entrenamiento en red, lo que debe hacerse en otro lugar.

El "acelerador de red neuronal binario (BNN)" admite pesos de 1 bit, tiene una cuantificación de activación de 1 bit y está diseñado para ser utilizado con los FPGA iCE40 UltraPlus de la empresa.

La combinación de acelerador y FPGA está diseñada para aplicaciones siempre activas, como la detección verbal de frases clave, detección de rostros y detección de objetos.

Lattice-BNN-acceleratorLos parámetros predichos de la aplicación BNC + iCE40 UltraPlus son:

  • 1bit red neuronal
  • 1-10mW de consumo activo
  • Huella de 5.5mm2
  • ~ $ 1 bom

El segundo producto, 'acelerador de red neuronal convolucional (CNN)', admite una selección de datos de 1, 8 y 16 bits para pesos y activación, está dirigido a FPGAs ECP5, que generalmente están destinados para uso de video.

Para guardar los recursos de FPGA, diferentes anchos de palabra (1, 8 o 16 bits) se pueden mezclar y combinar en diferentes capas de la red neuronal.

Esta combinación de acelerador y FPGA está diseñada para aplicaciones que incluyen seguimiento de rostros, seguimiento de objetos, detección de señales de velocidad y recuento de objetos.

Lattice-CNN-accelerator

Los parámetros de aplicación CNN + ECP5 predichos son:

  • Red de 1, 8 o 16 bits
  • <1W active consumption
  • Huella de 100 mm2
  • ~ $ 10 bom

Para el desarrollo de software, la firma está presentando un compilador de red neuronal compatible con los sistemas de desarrollo de red Caffe y TensorFlow.

Según el director de marketing de Lattice, Deepak Boppana, el compilador no necesita experiencia previa en RTL, y también analizará y simulará diseños.

El plan es, dijo Boppana, que el compilador se use junto con el entorno de desarrollo Radiant de la firma para la combinación BNN + iCE40 UltraPlus, o su entorno de desarrollo Diamond para CNN + EC5P.

Para los clientes que no están seguros de cómo desarrollar una aplicación basada en redes neuronales, la firma se ha asociado con compañías de servicios de diseño que incluyen Colorado Engineering, Wipro, Softnautincs y VectorBlox.

Las placas de desarrollo de hardware ya están disponibles para iCE40 UltraPlus y ECP5.

Se esperan aplicaciones de agregación de datos y puente de interfaz en aplicaciones de IoT de gran volumen que incluyen altavoces inteligentes, cámaras de vigilancia, robots industriales y drones.

Se están proporcionando diseños de referencia para detección de rostros, detección de frases clave (iCE40 UltraPlus) y para EC5P: recuento de objetos, rastreo de rostros y detección de señales de velocidad.

Los aceleradores son marcadossensAI'.