Développer des caméras intelligentes qui peuvent apprendre


Des caméras qui peuvent apprendre

Un réseau neuronal convolutif (CNN) sur le système de vision SCAMP-5D classe les gestes de la main à 8200 images par . Crédit photo: Université de Bristol, 2020

Les intelligentes pourraient faire un pas de plus grâce à une collaboration de recherche entre les universités de Bristol et de Manchester, qui ont développé des caméras capables d’ et de comprendre ce qu’elles voient.

Les chercheurs en robotique et en intelligence artificielle (IA) savent qu’il existe un problème avec la façon dont les systèmes actuels capturent et traitent le . Actuellement, ils combinent toujours des capteurs tels que des appareils photo numériques, qui ont été conçus pour enregistrer des images, avec des dispositifs informatiques tels que des processeurs graphiques (GPU), qui sont conçus pour accélérer les graphiques pour les jeux vidéo.

Cela signifie que les systèmes d’IA ne perçoivent le monde qu’après avoir enregistré et transmis des informations visuelles entre les capteurs et les processeurs. Mais beaucoup de choses que l’on peut voir sont souvent sans rapport avec la tâche à accomplir, comme le détail des feuilles sur les arbres sur le bord de la route lorsqu’une voiture autonome passe. À l’heure actuelle, cependant, toutes ces informations sont capturées et envoyées par des capteurs dans les moindres détails, encombrant le système de données non pertinentes, consommant de l’énergie et prenant du temps de traitement. Une autre approche est nécessaire pour fournir une vue efficace des machines intelligentes.

Deux articles de la collaboration Bristol-Manchester ont montré comment la détection et l’apprentissage être combinés pour créer de nouvelles caméras pour les systèmes d’IA.

Walterio Mayol-Cuevas, professeur de robotique, de vision par ordinateur et de systèmes mobiles à l’Université de Bristol et chercheur principal (PI), a déclaré: «Afin de créer des systèmes perceptifs efficaces, nous devons repousser les limites au-delà des chemins précédents.

«Nous pouvons être inspirés par la façon dont les systèmes naturels traitent le monde visuel – nous ne percevons pas tout – nos yeux et notre cerveau travaillent ensemble pour comprendre le monde et, dans certains cas, les yeux le traitent eux-mêmes. Brain pour réduire ce n’est pas pertinent. « 

Ceci est démontré par la façon dont l’œil de grenouille a des détecteurs qui détectent les objets ressemblant à des mouches juste au point où les images sont capturées.

Les papiers, un sous la direction du Dr. Laurie Bose et l’autre, dirigée par Yanan Liu à Bristol, ont apporté deux raffinements dans ce sens. En mettant en œuvre des réseaux de neurones à convolution (CNN), une forme d’algorithme d’IA pour permettre la compréhension visuelle, directement au niveau de l’image. Les CNN développés par l’équipe peuvent classer les images des milliers de fois par seconde sans jamais avoir à enregistrer ces images ou à les envoyer dans le pipeline de traitement. Les chercheurs ont examiné des démonstrations sur la façon de classer les nombres manuscrits, les gestes de la main et même comment classer le plancton.

La recherche suggère un avenir avec des caméras intelligentes dédiées à l’IA – des systèmes visuels qui peuvent facilement envoyer des informations de haut niveau au reste du système, telles que: B. le type d’objet ou d’événement qui a lieu devant la caméra. Cette approche rendrait les systèmes beaucoup plus efficaces et sécurisés puisqu’aucune image n’a besoin d’être enregistrée.

Le travail a été rendu possible grâce à l’architecture SCAMP développée par Piotr Dudek, professeur de circuits et systèmes et PI à l’Université de Manchester et son équipe. Le SCAMP est une puce de processeur de caméra que l’équipe appelle le Pixel Processor Array (PPA). Un PPA a un processeur intégré dans chaque pixel qui peut communiquer entre eux pour traiter sous une forme vraiment parallèle. Ceci est idéal pour les CNN et les algorithmes de traitement d’image.

Des caméras qui peuvent apprendre

Système de vision SCAMP-5d Crédit photo: Université de Manchester, 2020

Le professeur Dudek a déclaré: «L’intégration de la capture, du traitement et du stockage au niveau du pixel permet non seulement des systèmes hautes performances et à faible latence, mais promet également un matériel à faible consommation et très efficace.

« Les dispositifs SCAMP peuvent être mis en œuvre avec des empreintes similaires à celles des capteurs de caméra actuels, mais peuvent avoir un processeur universel massivement parallèle au moment où l’image est capturée. »

Dr. Tom Richardson, maître de conférences en mécanique de vol à l’Université de Bristol et membre du projet, a intégré l’architecture SCAMP dans des drones légers.

Il a expliqué: «Ce qui est si excitant à propos de ces caméras, ce n’est pas seulement la capacité émergente d’apprentissage automatique, mais la vitesse à laquelle elles fonctionnent et la facilité avec laquelle elles sont configurées.

« Ils sont absolument parfaits pour les plates-formes de vol rapides et très agiles qui peuvent littéralement apprendre à la volée! »

Une recherche financée par le Conseil de recherche en ingénierie et sciences physiques (EPSRC) a montré l’importance de remettre en question les hypothèses formulées lors de la conception de systèmes d’IA. Et des choses qui sont souvent tenues pour acquises, comme les caméras, peuvent et doivent être améliorées pour obtenir des machines intelligentes plus efficaces.


Les unités de traitement basées sur les photons permettent un apprentissage automatique plus complexe


Fourni par l’Université de Bristol

Citation: Developing Intelligent Cameras That Can Learn (2020, 13 octobre), consulté le 13 octobre 2020 sur https://techxplore.com/news/2020-10-intelligent-cameras.html

Ce document est soumis au droit d’auteur. Sauf pour le commerce équitable à des fins d’étude ou de recherche privée, aucune partie ne peut être reproduite sans autorisation écrite. Le contenu est fourni à titre informatif uniquement.

Laisser un commentaire