Algoritmo innovativo per ottimizzare l’apprendimento dell’AI | Llm informatica | Llm ai | Llm ai significato | Turtles AI

Algoritmo innovativo per ottimizzare l’apprendimento dell’AI
Un nuovo algoritmo del MIT migliora l’efficienza dell’AI nell’affrontare compiti complessi, riducendo tempi e risorse necessarie per l’addestramento
Editorial Team25 novembre 2024

 


Un gruppo di ricercatori del MIT ha sviluppato un algoritmo innovativo che migliora l’efficienza nell’addestramento di agenti di AI per compiti complessi, riducendo significativamente i tempi e i costi di addestramento. Questo metodo è particolarmente promettente per applicazioni in vari settori come la robotica, la medicina e la gestione del traffico urbano. Il loro approccio consente di massimizzare le prestazioni di AI limitando la quantità di dati necessari per l’addestramento.

Punti chiave: 

  •  I modelli di apprendimento rinforzato spesso falliscono in ambienti variabili.  
  •  Un nuovo algoritmo migliora l’efficienza di addestramento degli agenti AI in contesti complessi.  
  •  La tecnica seleziona strategicamente i compiti da utilizzare per l’addestramento, migliorando le prestazioni globali.  
  •  Test simulati hanno dimostrato che l’algoritmo è fino a 50 volte più efficiente rispetto ai metodi tradizionali.  

 

Il controllo del traffico, la gestione della mobilità urbana e l’automazione dei processi decisionali complessi richiedono sistemi di AI in grado di operare in ambienti variabili e dinamici. Tuttavia, addestrare modelli di AI a gestire questi compiti non è mai semplice, soprattutto quando si tratta di adattarsi a variabili impreviste, come incroci con limiti di velocità diversi o traffico imprevedibile. I ricercatori del Massachusetts Institute of Technology (MIT) hanno sviluppato un metodo che promette di risolvere alcune delle sfide legate a questi compiti complessi, migliorando significativamente l’efficienza nell’addestramento degli agenti AI.

Tradizionalmente, esistono due principali modalità di addestramento per le AI che operano in contesti complessi come quello del traffico urbano. Da un lato, si può addestrare un modello indipendente per ogni singolo compito, come ogni incrocio della città, utilizzando esclusivamente i dati relativi a ciascun caso. Tuttavia, questa strategia richiede enormi risorse in termini di tempo e calcolo. Dall’altro lato, esiste l’approccio di addestrare un unico modello globale che consideri tutti i compiti in contemporanea, ma questa soluzione rischia di generare performance scadenti, poiché non sempre il modello globale è capace di adattarsi adeguatamente a tutte le variazioni individuali.

L’intuizione dei ricercatori del MIT è stata quella di combinare questi due approcci, sfruttando un metodo che seleziona in modo strategico un sottoinsieme di compiti su cui concentrarsi per l’addestramento. Piuttosto che addestrare un modello per ogni singolo incrocio o per tutti gli incroci insieme, l’algoritmo si concentra su un numero limitato di compiti che, se trattati separatamente, offrono il massimo beneficio per l’intero sistema.

Per ottimizzare questa selezione, è stato creato l’algoritmo Model-Based Transfer Learning (MBTL), che si basa su un concetto chiamato "apprendimento a trasferimento". Questo approccio consente di applicare un modello già addestrato su un compito a un compito simile, senza la necessità di riaddestrare completamente l’algoritmo. L’algoritmo MBTL, infatti, opera in due fasi: inizialmente, seleziona i compiti che potrebbero portare al maggiore miglioramento delle prestazioni complessive; successivamente, applica questi compiti a tutti gli altri, migliorando la capacità di generalizzazione del modello.

Il risultato di questo approccio è che l’algoritmo si addestra solo su un numero ridotto di compiti, evitando di dover utilizzare una quantità eccessiva di dati. Questo si traduce in un significativo risparmio di risorse, permettendo agli agenti di AI di risolvere compiti complessi in modo più rapido ed efficace.

I test condotti su attività simulate, come il controllo dei semafori, la gestione dei limiti di velocità e altre operazioni di gestione del traffico, hanno dimostrato che l’approccio MBTL è da cinque a cinquanta volte più efficiente rispetto ai metodi tradizionali. In pratica, ciò significa che l’algoritmo può ottenere gli stessi risultati con una frazione dei dati e dei calcoli necessari, riducendo considerevolmente i costi e i tempi di addestramento.

Ad esempio, se un metodo tradizionale richiede l’addestramento su 100 attività diverse, l’algoritmo MBTL potrebbe ottenere le stesse performance utilizzando solo due di esse. Questo permette di risparmiare tempo e risorse, consentendo agli sviluppatori di concentrarsi sugli aspetti più rilevanti e critici del processo.

Gli sviluppatori del MIT intendono estendere il loro approccio per affrontare problemi più complessi, come quelli legati ad ambienti di attività ad alta dimensione, dove la varietà dei compiti è ancora più ampia. Inoltre, sono interessati a testare l’applicazione di MBTL in contesti reali, come nella gestione dei sistemi di mobilità urbana, per ottimizzare la circolazione e migliorare l’efficienza nei trasporti.

Questo lavoro, finanziato dalla National Science Foundation, dal Kwanjeong Educational Foundation e da Amazon Robotics, offre spunti interessanti per l’evoluzione dei sistemi di AI applicati alla vita quotidiana. Con questo nuovo approccio, il futuro delle tecnologie decisionali potrebbe vedere un significativo balzo in avanti, soprattutto in settori dove la rapidità e l’affidabilità sono fondamentali.

L’approccio sviluppato al MIT potrebbe rappresentare una svolta nell’efficienza dell’addestramento per compiti complessi, offrendo nuove opportunità per l’adozione di sistemi AI in scenari pratici e dinamici.