META AI presenta DinoV2 | Chat gpt Gratis Italiano | Nlp e llm | Chat gpt Login Free | Turtles AI
META AI presenta DinoV2
DukeRem18 aprile 2023
#Meta #AI, azienda leader nella ricerca sull’AI, ha annunciato il rilascio di #DINOv2, un nuovo metodo per l’addestramento di modelli di #visione computerizzata ad alte prestazioni che utilizza l’apprendimento auto-supervisionato (#SSL). Questo approccio innovativo consente al modello di apprendere da qualsiasi raccolta di immagini senza bisogno di #dati etichettati, offrendo un modo potente e flessibile di addestrare i modelli di intelligenza artificiale.
DINOv2 fornisce caratteristiche dalle prestazioni elevate che possono essere utilizzate direttamente come input per semplici classificatori lineari, rendendolo adatto all’uso come spina dorsale per molti diversi compiti di computer vision. Il modello non richiede una messa a punto fine, il che significa che rimane generale e può essere utilizzato simultaneamente per molti compiti diversi.
Secondo Meta AI, il metodo DINOv2 può apprendere caratteristiche, come la stima della profondità, che l’attuale approccio standard non è in grado di apprendere. L’azienda ha reso pubblico il modello e ha condiviso una demo interattiva, che consente agli utenti di vedere le capacità del modello.
In un comunicato, Meta AI afferma che DINOv2 sarà utile in un’ampia gamma di applicazioni. L’azienda ha già collaborato con il World Resources Institute per utilizzare l’intelligenza artificiale per mappare le foreste, albero per albero, in aree grandi come continenti. Il modello auto-supervisionato è stato addestrato su dati provenienti da foreste del Nord America, ma si è rivelato in grado di generalizzare bene e di fornire mappe accurate in altre località del mondo.
Il rilascio di DINOv2 arriva in un momento in cui le prestazioni dei modelli di incorporazione congiunta che addestrano le caratteristiche attraverso l’incremento dei dati si stanno stabilizzando. Le prestazioni di valutazione su ImageNet sono aumentate solo dell’1% dal 2021 e non molto dal 2019. La comunità si è concentrata maggiormente sullo sviluppo di alternative, come la modellazione di immagini mascherate, limitando i progressi in questo campo. Inoltre, la classe di modelli DINO, tra gli altri metodi SSL, era difficile da addestrare al di fuori dell’ambito classico di ImageNet, limitandone l’adozione per la ricerca.
Per passare da DINO a DINOv2 è stato necessario superare diverse sfide, tra cui la creazione di un set di dati di addestramento ampio e curato, il miglioramento dell’algoritmo di addestramento e dell’implementazione e la progettazione di una pipeline di distillazione funzionale. Meta AI ha costruito una pipeline per selezionare i dati utili ispirati al LASER e ha creato un set di dati di pre-addestramento per un totale di 142 milioni di immagini su 1,2 miliardi di immagini di partenza.
Con un numero maggiore di dati di addestramento, i modelli più grandi ottengono risultati migliori di quelli più piccoli, ma il loro addestramento pone due sfide principali. In primo luogo, l’aumento delle dimensioni del modello rende l’addestramento più impegnativo a causa della potenziale instabilità. In secondo luogo, modelli più grandi richiedono implementazioni più efficienti. Il codice di addestramento di DINOv2 integra le più recenti implementazioni di addestramento a precisione mista e distribuito proposte nell’innovativo PyTorch 2, consentendo cicli di iterazione più rapidi ed efficienti.
