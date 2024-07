Sviluppato ManiWAV, un dispositivo che registra dimostrazioni umane dal vivo con feedback audio-visivo, permettendo ai robot di apprendere abilità di manipolazione

I ricercatori di Stanford hanno creato un sistema innovativo per addestrare i robot mediante l’uso dell’audio, migliorando così la loro capacità di svolgere compiti complessi. ManiWAV è un dispositivo progettato per registrare dimostrazioni umane in tempo reale, fornendo feedback sia visivo che sonoro. Grazie a questa interfaccia intuitiva, i robot possono apprendere abilità di manipolazione osservando solo queste dimostrazioni. Il team di ricerca ha dichiarato che il sistema è riuscito a completare con successo quattro compiti complessi, che richiedevano la capacità di percepire eventi di contatto e caratteristiche degli oggetti, anche in condizioni difficili. I dettagli della ricerca condotta dal team presso il Robotics and Embodied AI Lab dell’Università di Stanford sono disponibili su arXiv.

L’esecuzione efficace del contatto è fondamentale per la manipolazione robotica, tuttavia la maggior parte dei sistemi basati sulla visione fatica a sfruttare appieno le informazioni di contatto. La ricerca introduce un sistema robotico che apprende il contatto tramite l’audio, una modalità spesso trascurata. I segnali audio forniscono dettagli preziosi sugli eventi di contatto, le modalità, i materiali delle superfici e gli stati degli oggetti. A differenza dei sensori tattili costosi e fragili, i sensori audio sono economici, robusti e facilmente integrabili nei sistemi esistenti. Secondo i ricercatori, ciò consente la raccolta di dati su larga scala e l’apprendimento delle politiche utilizzando dispositivi a basso costo come i manipolatori portatili. Sfruttando il feedback audio, il sistema può migliorare notevolmente le attività di manipolazione robotica.

L’iter di ricerca sui robot

Data la potenzialità dei dati audio, i ricercatori propongono ManiWAV, un sistema versatile per l’apprendimento robotico che utilizza il feedback audio per compiti di manipolazione complessi. L’hardware include un dispositivo portatile con un design “orecchio nella mano” per la raccolta dei dati in situ. Questo dispositivo fornisce feedback sia visivo che sonoro. La configurazione cattura audio di contatto di alta qualità con un microfono piezoelettrico. Sul fronte algoritmico, affrontano le differenze di dominio audio con una strategia di aumento dei dati e una rete di apprendimento sensomotorio end-to-end. Il team ha dimostrato l’efficacia di ManiWAV attraverso quattro compiti: pulire una lavagna, girare un bagel, versare da una tazza e legare fili con Velcro.

Il team ha eseguito ciascun compito centinaia di volte, valutando i tassi di successo dell’addestramento con audio rispetto a quello con la sola visione. I ricercatori hanno scoperto che l’uso di un microfono di contatto migliora significativamente la sensibilità del robot a diversi materiali superficiali. Nei test, la politica basata solo sulla visione aveva un tasso di successo del 20%, e l’uso di un microfono ambientale ha prodotto risultati simili, non riuscendo a rilevare differenze sottili. Al contrario, il microfono di contatto ha guidato il robot in modo affidabile a prendere il nastro corretto. Inoltre, l’aumento del rumore durante l’addestramento si è rivelato più efficace della riduzione del rumore durante il test. I ricercatori affermano che gli algoritmi di cancellazione del rumore degradano il segnale, creando una differenza tra addestramento e test, mentre l’aumento del rumore conserva la distribuzione delle frequenze originali.

