Implementazione rapida di IA e apprendimento automatico potenti ed efficienti con gli MCU RA8M1 di Renesas

Di Kenton Williston

Contributo di Editori nordamericani di DigiKey

2024-03-20

L'aumento dell'intelligenza artificiale (IA), dell'apprendimento automatico (ML) e di altri carichi di lavoro ad alta intensità di calcolo all'edge della rete per l'Internet delle cose (IoT) sta comportando un carico di elaborazione supplementare per i microcontroller (MCU). La gestione di questi nuovi carichi di lavoro aumenta il consumo energetico, anche se ai progettisti viene chiesto di ridurre al minimo l'energia e di accelerare il time-to-market.

I progettisti hanno bisogno di un'opzione di calcolo che mantenga l'efficienza di un MCU, aggiungendo al tempo stesso funzionalità ad alte prestazioni, studiate appositamente per l'utilizzo a basso consumo. Questa opzione dovrebbe inoltre preservare i modelli di implementazione semplici associati ai tradizionali MCU, aggiungendo al contempo funzionalità sufficienti a supportare le sofisticate applicazioni abilitate da IA e ML, come il controllo vocale e la manutenzione predittiva.

Questo articolo analizza i fattori che determinano la domanda di IA e ML e spiega perché sono necessarie nuove architetture di processore per fornire in modo efficiente queste funzionalità. Presenta quindi la famiglia di MCU RA8M1 di Renesas e mostra come utilizzarla per soddisfare questi requisiti.

I requisiti di IA e ML all'edge

La domanda di IA e ML sta aumentando nelle applicazioni edge IoT, che vanno dall'automazione degli edifici e dai dispositivi industriali agli elettrodomestici. Anche i sistemi embedded relativamente piccoli e a basso consumo sono ora chiamati a svolgere carichi di lavoro come l'individuazione di parole chiave, il controllo di comandi vocali e l'elaborazione di audio e immagini. Le applicazioni target includono hub di sensori, navigazione e controllo di droni, realtà aumentata (AR), realtà virtuale (VR) e apparecchiature di comunicazione.

Per ridurre al minimo il consumo di energia, il sovraccarico e la latenza, garantendo al contempo la privacy, l'elaborazione dei dati sull'edge è spesso preferita all'invio al cloud. Si tratta di una sfida per i progettisti, in quanto i dispositivi edge spesso hanno risorse limitate, soprattutto se alimentati a batteria.

MCU potenziati per l'edge computing

I carichi di lavoro di IA e ML comportano in genere l'esecuzione ripetuta della stessa operazione matematica su grandi insiemi di dati. Questi carichi di lavoro possono essere accelerati utilizzando l'elaborazione a istruzione singola, dati multipli (SIMD), che esegue diverse operazioni matematiche in parallelo, garantendo un throughput notevolmente superiore e una migliore efficienza energetica rispetto all'elaborazione convenzionale.

Poiché i tradizionali MCU non hanno funzionalità SIMD, hanno bisogno di aiuto per l'esecuzione di carichi di lavoro IA e ML. Una soluzione consiste nell'utilizzare un processore di segnali digitali (DSP) o altri acceleratori SIMD accanto all'MCU. Tuttavia, questo approccio multiprocessore complica la progettazione del sistema.

Un'altra opzione consiste in un'unità a microprocessore (MPU) più performante, dotata di capacità SIMD. In questo modo è possibile ottenere le prestazioni necessarie in una configurazione a processore singolo, ma le MPU presentano dei compromessi in termini di consumo energetico e di funzionalità. Ad esempio, non tutte le MPU sono progettate per fornire l'elaborazione deterministica e a bassa latenza richiesta dalle applicazioni orientate agli MCU.

Abilitazione di IA e ML negli MCU

Riconoscendo la necessità di una suite ottimizzata di MCU per supportare i carichi di lavoro IA e ML, Renesas ha introdotto la serie di MCU RA8M1 (Figura 1). La serie è basata su un'architettura ARM® Cortex®-M85 con Helium e TrustZone e può funzionare a 480 MHz con un consumo tipico di 225 µA/MHz.

Figura 1: L'MCU RA8M1 Renesas è basato su un ARM Cortex-M85 e include la tecnologia Helium per accelerare l'elaborazione IA e ML. (Immagine per gentile concessione di Renesas)

Progettato per prestazioni efficienti e basso consumo energetico, l'MCU RA8M1 presenta caratteristiche quali il determinismo, il breve tempo di interrupt e un supporto all'avanguardia per la gestione dell'alimentazione. Il processore raggiunge un'efficienza prestazionale di 6,39 CoreMark/MHz.

Helium è un'estensione vettoriale SIMD M-Profile (MVE) che accelera in modo significativo l'elaborazione dei segnali e l'ML. Aggiunge 150 istruzioni scalari e vettoriali e consente l'elaborazione di registri a 128 bit (Figura 2). È ottimizzato per i microcontroller a basso consumo e con risorse limitate. Ad esempio, Helium riutilizza i registri in unità a virgola mobile (FPU) anziché introdurre nuovi registri SIMD. Ciò contribuisce a ridurre il consumo energetico del processore e la complessità del progetto.

Schema di Helium che riutilizza il banco di registri della FPU per l'elaborazione vettoriale Figura 2: Helium riutilizza il banco di registri della FPU per l'elaborazione vettoriale. (Immagine per gentile concessione di ARM)

Come mostrato nella Figura 3, il core Cortex-M85 di RA8M1 include la tecnologia TrustZone di ARM. TrustZone garantisce l'isolamento dell'hardware per il firmware critico, le risorse e le informazioni private. Il core Cortex-M85 aggiunge anche nuove funzionalità di sicurezza e protezione, come l'estensione PACBTI (Pointer Authentication and Branch Target Identification). Queste caratteristiche di sicurezza sono particolarmente preziose in un contesto di IA in cui un dispositivo può interagire con dati personali.

Immagine di ARM Cortex-M85 TrustZone Figura 3: TrustZone del core Cortex-M85 garantisce l'isolamento hardware di firmware, risorse e informazioni private critiche. (Immagine per gentile concessione di ARM)

Caratteristiche hardware da ricercare in un MCU compatibile con l'IA

Un MCU deve combinare prestazioni efficienti con un robusto set di funzioni per supportare le applicazioni di IA. RA8M1 è ben equipaggiato per il controllo di motori, il controllo a logica programmabile (PLC), la misurazione e altre applicazioni industriali e IoT.

Ad esempio, gli algoritmi di IA richiedono molta memoria. La memoria di sistema di RA8M1 comprende fino a 2 MB di flash e 1 MB di SRAM. La SRAM include 128 kB di memoria strettamente accoppiata (TCM), per il accesso rapido alla memoria per calcoli ad alte prestazioni.

Per garantire un funzionamento affidabile, 384 KB della SRAM utente e gli interi 128 KB della TCM sono configurati come memoria con codice di correzione errori (ECC). Anche le cache delle istruzioni e dei dati da 32 KB sono protette con ECC.

RA8M1 incorpora diverse funzioni di sicurezza oltre a quelle incluse nel core ARM. Queste includono il motore crittografico RSIP (proprietà intellettuale sicura riprogrammabile) per l'elaborazione sicura dei dati, l'archiviazione immutabile per la protezione dei dati critici e i meccanismi di protezione dalle manomissioni.

Per quanto riguarda le interfacce di comunicazione, l'MCU è dotato di Ethernet per la connettività di rete, Controller Area Network Flexible Data Rate (CAN FD) per applicazioni automotive e industriali e USB High-Speed/Full-Speed per la connettività generale. Inoltre, incorpora un'interfaccia per la fotocamera e un'interfaccia periferica seriale (SPI) ottale con decodifica al volo per la memoria esterna.

Le interfacce analogiche comprendono convertitori analogico/digitale (ADC) e digitale/analogico (DAC) a 12 bit, comparatori analogici ad alta velocità e tre circuiti sample-and-hold. Per la comunicazione seriale, RA8M1 supporta diversi protocolli, tra cui un'interfaccia di comunicazione seriale (SCI) con SPI, un ricetrasmettitore asincrono universale (UART) e le modalità I²C (circuito inter-integrato). L'MCU offre anche il circuito inter-integrato migliorato (I3C) per migliorare la velocità di trasferimento dati e l'efficienza.

Gli sviluppatori che necessitano di un accesso completo a queste funzionalità di input/output (I/O) possono utilizzare un contenitore BGA come il modello R7FA8M1AHECBD#UC0 a 224 pin. Chi desideri un processo di progettazione e assemblaggio di schede a circuito stampato più snello può prendere in considerazione l'utilizzo di un contenitore quadruplo piatto a profilo ribassato (LQFP), come il modello R7FA8M1AHECFB#AA0 a 144 pin.

Ambienti di sviluppo per applicazioni IA

I progettisti interessati a sperimentare la serie RA8M1 possono iniziare con la scheda di valutazione EK-RA8M1 R7FA8M (Figura 4). Questa scheda include un'interfaccia Ethernet RJ45 RMII, un'interfaccia USB High-Speed Host e Device e una basetta CAN FD a tre pin. La memoria è costituita da 64 MB di flash SPI ottale.

Figura 4: La scheda di valutazione EK-RA8M1 dispone di un robusto supporto I/O per l'esercizio dell'MCU RA8M1. (Immagine per gentile concessione di Renesas)

RA8M1 è supportato dal Flexible Software Package (FSP) di Renesas, un framework completo progettato per fornire una base software intuitiva, scalabile e di alta qualità per progettare sistemi embedded.

Il pacchetto offre strumenti di sviluppo, tra cui l'ambiente di sviluppo integrato (IDE) e² studio, basato sul popolare IDE Eclipse. Contiene anche due importanti sistemi operativi in tempo reale non soggetti a royalty: Azure RTOS e FreeRTOS.

Il pacchetto comprende driver leggeri e pronti per la produzione che supportano i casi d'uso più comuni nei sistemi embedded. Insieme alla scheda di valutazione, questi driver offrono agli sviluppatori un percorso rapido per sperimentare l'I/O di RA8M1.

Conclusione

RA8M1 offre agli sviluppatori una nuova opzione per l'implementazione di carichi di lavoro IA e ML nelle applicazioni edge IoT che consente di risparmiare energia, migliorare le prestazioni, ridurre la complessità e abbattere il time-to-market.

Esonero della responsabilità: le opinioni, le convinzioni e i punti di vista espressi dai vari autori e/o dai partecipanti al forum su questo sito Web non riflettono necessariamente le opinioni, le convinzioni e i punti di vista di DigiKey o le sue politiche.