Camere inteligente care pot învăța și înțelege ceea ce văd

Camerele inteligente pot fi cu un pas mai aproape datorită unei colaborări de cercetare între universitățile din Bristol și Manchester, care au dezvoltat camere care pot învăța și înțelege ceea ce văd.

Cercetătorii în domeniul roboticii și inteligenței artificiale (AI) știu că există o problemă cu modul în care sistemele actuale simt și procesează lumea. În prezent, acestea încă combină senzori, cum ar fi camerele digitale care au fost create pentru înregistrarea imaginilor, cu dispozitive computerizate, cum ar fi unitățile de procesare grafică (GPU-uri) concepute pentru a accelera grafica pentru jocurile video.

Aceasta înseamnă că sistemele AI percep lumea numai după înregistrarea și transmiterea informațiilor vizuale între senzori și procesoare. Dar multe lucruri care pot fi văzute adesea sunt irelevante pentru sarcina de față, cum ar fi detaliile frunzelor de pe copacii de pe marginea drumului când trece o mașină autonomă. Cu toate acestea, în acest moment toate aceste informații sunt captate de senzori în detaliu precis și trimise blocând sistemul cu date irelevante, consumând energie și luând timp de procesare. Este necesară o abordare diferită pentru a permite viziunea eficientă a utilajelor inteligente.

Două lucrări din colaborarea de la Bristol și Manchester au arătat modul în care detectarea și învățarea pot fi combinate pentru a crea noi camere pentru sistemele de IA.

Rețea neuronală convoluționară

O rețea neuronală convoluțională (CNN) în sistemul de viziune SCAMP-5D care clasifică gesturile mâinilor la 8.200 de cadre pe secundă. Credit: Universitatea din Bristol, 2020

Walterio Mayol-Cuevas, profesor de robotică, viziune computerizată și sisteme de mișcare în Universitatea din Bristol și investigatorul principal (PI), a comentat: „Pentru a crea sisteme de percepție eficiente, trebuie să depășim limitele dincolo de căile pe care le-am urmat până acum.

„Putem împrumuta inspirație din modul în care sistemele naturale procesează lumea vizuală – nu percepem totul – ochii și creierul nostru lucrează împreună pentru a da sens lumii și, în unele cazuri, ochii înșiși procesează pentru a ajuta creierul reduce ceea ce nu este important.

Sistem de viziune SCAMP-5d

Sistem de viziune SCAMP-5d. Credit: Universitatea din Manchester, 2020

Acest lucru este demonstrat de modul în care ochiul de broască are detectoare care observă obiecte similare muștelor, direct în punctul în care sunt simțite imaginile.

Ziare, unul condus de Dr. Laurie Bose și un altul de Yanan Liu la Bristol, au descoperit două perfecțiuni în acest scop. Implementarea Nevale Convolutionary Networks (CNN), o formă de algoritm AI pentru a permite înțelegerea vizuală, direct în planul imaginii. CNN-urile pe care echipa le-a dezvoltat pot clasifica cadre de mii de ori pe secundă fără a fi nevoie să înregistreze aceste imagini sau să le trimită la conducta de procesare. Cercetătorii au luat în considerare demonstrațiile clasificării numerelor scrise de mână, gesturilor mâinilor și chiar clasificării planctonului.

Studiul sugerează un viitor cu camerele inteligente dedicate AI – sisteme vizuale care pot trimite pur și simplu informații de nivel înalt către restul sistemului, cum ar fi tipul de obiect sau eveniment care se întâmplă în fața camerei. Această abordare ar face sistemele mult mai eficiente și mai sigure, deoarece nu este nevoie să înregistrați imagini.

Lucrarea a fost posibilă datorită arhitecturii SCAMP dezvoltată de Piotr Dudek, profesor de circuite și sisteme și PI de la Universitatea din Manchester și echipa sa. SCAMP este un microprocesor-procesor pe care echipa îl descrie ca un Pixel Processor Array (PPA). Un PPA are un procesor încorporat în fiecare pixel, care poate comunica între ele pentru a fi procesat într-o formă cu adevărat paralelă. Acest lucru este ideal pentru CNN și algoritmi de vizualizare.

Arhitectura hardware SCAMP-5d

Arhitectura echipamentelor SCAMP-5d. Acesta include un set de procesoare de 256 x 256 pixeli PPA, fiecare conținând un senzor de lumină, registre de memorie locale și alte componente funcționale. Credit: Universitatea din Manchester, 2020

Profesorul Dudek a spus: „Integrarea senzorului, procesării și memoriei la nivel de pixeli nu numai că permite sisteme performante, cu latență scăzută, dar promite și un dispozitiv cu putere redusă, extrem de eficient.

„Dispozitivele SCAMP pot fi implementate cu urme similare cu senzorii curenți ai camerei, dar cu capacitatea de a avea un procesor paralel de uz general, exact în punctul de captare a imaginii.”

Dr. Tom Richardson, lector principal în mecanica zborului, Universitatea din Bristol și membru al proiectului, a integrat arhitectura SCAMP cu drone ușoare.

El a explicat: „Ceea ce este atât de interesant la aceste camere nu este doar capacitatea de a învăța noua mașină afișată, ci viteza cu care funcționează și configurarea ușoară. Sunt absolut ideale pentru platforme aeriene de mare viteză și destul de agile, care pot învăța literalmente în zbor! “

Cercetarea, finanțată de Consiliul de Cercetare în Inginerie și Științe Fizice (EPSRC), a arătat că este important să se pună la îndoială ipotezele care există atunci când se proiectează sisteme de IA. Și lucrurile care sunt adesea luate ca atare, cum ar fi camerele foto, pot și ar trebui îmbunătățite pentru a atinge obiectivul unor mașini inteligente mai eficiente.

Referințe:

„Implementarea completă a rețelelor convoluționale de mare viteză în matricele procesorului de pixeli” de Laurie Bose, Jianing Chen, Stephen J. Carey, Piotr Dudek și Walterio Mayol-Cuevas prezentate la Conferința europeană de viziune pe computer (ECCV) din 2020

„CNN Concluzie ușoară de mare viteză prin convulsii intercalate într-un grup de procesoare Pixel” de Yanan Liu, Laurie Bose, Jianing Chen, Stephen J. Carey, Piotr Dudek, Walterio Mayol-Cuevas prezentate la Conferința British Vision Conducere (BMVC) 2020

Related articles

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Share article

Latest articles

Mișcări ale electronilor de ceas în interiorul unui atom: viteza obturatorului de o milionime dintr-o miliardime de secundă

Reprezentarea artistică a experimentului. Întârzierea inerentă între emisia celor două tipuri de electroni duce la o elipsă caracteristică în datele analizate. În...

Materialul nou poate proteja mai bine soldații, sportivii și șoferii de șoc, impact și explozii

Soldații, sportivii și șoferii pot face viața mai sigură datorită unui nou proces care ar putea duce la o protecție mai eficientă și reutilizabilă...

A fost găsit cel mai vechi loc de înmormântare uman din Africa – un copil a fost îngropat în urmă cu 78.000 de ani

Vedere generală a zonei peșterii Panga ya Saidi. Observați săparea șanțului unde a fost deschisă înmormântarea. Credit: Muhammad Javad Shoaee Descoperirea celui mai...

Se preconizează că speciile non-native vor crește cu 36% în întreaga lume până în 2050

Gâscă egipteană (Alopochen aegyptiaca) originară din Africa și stabilită acum în Europa Centrală și de Vest. Credit: profesorul Tim Blackburn, UCL Se preconizează că...

Visele noastre pot fi ciudate

Această ilustrație reflectă supra-ipoteza creierului, care susține că calitatea redusă și halucinantă a viselor nu este o greșeală, ci o trăsătură particulară, deoarece ajută...

Newsletter

Subscribe to stay updated.