L’évolution de l’IA embarquée en 2021 et au-delà

IA, apprentissage automatique, IoT, informatique en périphérie… la liste des mots à la mode dans les communautés du matériel informatique et des logiciels embarqués s’allonge d’années en années. Heureusement ceux-ci se démarquent car ils deviennent de plus en plus courant auprès du grand public. Les progrès de l’informatique embarquée à usage général au cours des 10 dernières années sont impressionnants. A tel point que l’on peut déployer un nœud de blockchain d’un claquement de doigt ! L’informatique à usage général a parcouru un long chemin et a transformé la vie moderne.

Qu’en est-il de l’IA embarquée ? Examinons de plus près les progrès des plates-formes informatiques pour l’IA embarquée. On constate qu’elle a sans aucun doute pris du retard par rapport à l’informatique embarquée à usage général. Dans un passé récent, l’IA embarquée n’était pas vraiment embarquée et dépendait fortement du cloud. Une nouvelle catégorie d’ASIC devrait changer la dynamique de l’IA embarquée. De ce fait, les concepteurs de matériel devraient se préparer à construire des systèmes autour de ces nouveaux composants. Voici ce qui se profile dans le monde de l’IA embarquée et comment les nouveaux systèmes embarqués peuvent tirer parti de ces changements.

Du nuage à la périphérie

Le rêve de l’IA embarquée consiste en un calcul efficace en termes de puissance à la périphérie avec du matériel spécialisé. Les modèles d’IA de ces appareils doivent pouvoir être entraînés, soit au niveau de l’appareil, soit dans le nuage, ce qui nécessiterait ensuite de transmettre le modèle entraîné à la périphérie. Si l’on se penche sur le passé récent et sur l’évolution du paysage de l’IA, on constate un lent transfert des capacités de calcul du cloud vers la périphérie.

Les plateformes informatiques embarquées, plus puissantes et moins chères, y contribuent largement. Un appareil tel qu’un Raspberry Pi ou une carte BeagleBone est suffisamment puissant pour fournir des prédictions numériques ou une classification simple (par exemple, des images, du texte ou du son) au niveau de l’appareil avec des modèles pré-entraînés. Cependant, l’entraînement au niveau de l’appareil avec ces plateformes prend beaucoup de temps. Il est donc préférable de l’effectuer dans le nuage. De nouvelles plateformes matérielles spécifiques à l’IA tentent de combler cette lacune. Elles ont ainsi réussi à accélérer les calculs et à permettre des tâches plus avancées. Un exemple est la détection combinée d’objets, la reconnaissance faciale et la classification d’images à partir de données vidéo. Cette dernière permet des applications dans la sécurité et l’automobile, entre autres.

Le match Google vs NVIDIA

Google et NVIDIA se sont livrés récemment à une sorte de course aux armements. Le but étant de sortir des plates-formes matérielles spécialisées dans les applications d’IA embarquées. Ainsi Google a lancé l’unité de traitement TensorFlow (TPU) dans le cadre de la plateforme matérielle Coral ; cette plateforme se spécialise dans l’exécution de modèles TensorFlow sur l’appareil. Cela la rapproche d’une véritable plateforme d’IA embarquée spécifique à une application.

La plate-forme Jetson de NVIDIA ressemble toujours à une plate-forme informatique générale dans la mesure où elle utilise des GPU. Par contre, le micrologiciel se concentre sur les calculs d’IA pour l’appareil. Actuellement, NVIDIA propose quatre options spécialisées dans l’IA déployables dans des applications embarquées. Ces produits NVIDIA consomment toujours une puissance relativement importante. De plus, ils génèrent une chaleur extrême. En effet, ils reposent sur une architecture GPU héritée, ce qui limite leur utilité dans les petits produits IoT.

Goulots d’étranglement de l’IA embarquée : attention aux circuits intégrés spécialisés dans l’IA

Le goulot d’étranglement de l’IA embarquée n’est pas un goulot d’étranglement de traitement, mais un goulot d’étranglement de taille et de chaleur. La puissance de traitement à usage général existe et les produits GPU/TPU ont été relégués à l’IA embarquée à usage général. Pensez à Amazon Alexa ; vous n’avez pas besoin d’un processeur spécifique à une application pour les tâches d’IA embarquée. En effet, l’appareil doit remplir de nombreuses autres fonctions. En outre, la prise murale l’alimente en permanence et sa conception lui permet une connexion permanente à Internet. L’éventail des tâches à exécuter par cette catégorie de systèmes embarqués couvre un spectre suffisamment large pour que des circuits intégrés spécialisés ne soient pas nécessaires.

Les produits IoT plus récents dans des applications et des fonctions très spécifiques ont besoin de quelque chose de nouveau : un circuit intégré spécialisé dans l’IA. Lorsque nous parlons d’un « circuit intégré spécialisé dans l’IA », nous ne faisons pas référence à un GPU ou à un TPU. Mais plutôt à un circuit intégré doté d’une architecture matérielle. Celle-ci étant spécialisée pour exécuter des types spécifiques de modèles d’IA. Qui à leur tour consomment peu d’énergie et possèdent peu ou pas de périphériques.

Les start-ups de circuits intégrés sans usine s’efforcent de combler cette lacune. Notamment en proposant de nouveaux circuits intégrés intégrables dans d’autres produits. Ou encore des circuits intégrés autonomes offrant des capacités d’IA embarquée hautement spécifiques à une application. On peut imaginer une entreprise lambda prête à lancer un tel produit. Ce dernier ciblerait la 5G-IoT, la robotique, l’industrie 4.0 ou d’autres domaines où l’IA intégrée devrait dominer.

Les nouveaux circuits intégrés spécialisés dans l’IA embarquée

Si vous construisez de nouveaux produits IoT, de la robotique, des produits automobiles ou d’autres systèmes qui ont besoin de capacités d’IA intégrées, surveillez les nouveaux circuits intégrés spécialisés dans l’IA avec certaines des caractéristiques suivantes :

  • Formation sur dispositif : Cet aspect de l’intelligence artificielle embarquée dépend encore de la puissance de calcul du cloud. Mais les meilleurs circuits intégrés spécialisés dans l’intelligence artificielle permettront un apprentissage sur place. Par exemple dans les applications d’apprentissage supervisé.
  • Interfaces à haut débit : De toute évidence, tout circuit intégré spécialisé dans l’IA doit s’interfacer avec d’autres composants sur une carte. De plus, il utilisera une interface à haut débit. I2C et SPI sont les interfaces idéales, mais nous pouvons nous attendre à ce que d’autres interfaces à haut débit soient utilisées pour se connecter aux périphériques de l’ordinateur.
  • Optimisation pour des modèles d’IA spécifiques : Les modèles AI/ML impliquent des calculs matriciels et des étapes d’optimisation redondantes. Et la conception de l’architecture matérielle permettra d’exécuter les algorithmes impliqués dans les différents modèles AI/ML.
  • Faible consommation d’énergie : Il est essentiel d’atteindre des niveaux de consommation inférieurs à MW pour les calculs d’IA. Ceci afin d’assurer la persistance de l’apprentissage, de la classification et de la prédiction sur l’appareil dans les applications d’IA à forte densité de données.

Une architecture optimisée peut aider les concepteurs à surmonter le goulot d’étranglement thermique. Ce qui permet également de réduire la taille globale d’un nouveau produit.

La boucle est bouclée : le retour au centre de données

Au cours des deux prochaines années, on peut s’attendre à une diffusion très large de nouveaux circuits intégrés. Ainsi que des noyaux IP spécialisés. Ce passage de l’informatique à usage général à du matériel spécifique à une application est ce qui conduira vers des applications d’IA embarquées plus avancées. Les équipementiers seront en mesure de produire des dispositifs plus petits. Ces derniers auront une efficacité de calcul supérieure à celle des MCU à usage général.

Nous avons parlé de l’IA embarquée au niveau de la périphérie, mais les circuits intégrés spécialisés dans l’IA peuvent facilement remonter la hiérarchie du réseau jusqu’au niveau du centre de données. Le fait de décharger ces tâches des processeurs polyvalents et de les confier à un ASIC réduira la consommation d’énergie globale au niveau du centre de données.

Le paysage électronique peut changer rapidement, et l’IA embarquée ne fait pas exception. Que vous recherchiez les tout derniers ASICs d’IA embarquée ou tout autre composant pour un nouveau produit, des fournisseurs toujours plus nombreux seront là pour vous aider à trouver les composants dont vous avez besoin.