Ai2 lancia OLMo 2: nuovi modelli linguistici open source a sfida di Llama | Chat gpt in italiano gratis | Llm meaning | Chatopenai.com italiano | Turtles AI

Ai2 lancia OLMo 2: nuovi modelli linguistici open source a sfida di Llama
Con 7B e 13B parametri, i modelli OLMo 2 offrono prestazioni competitive e risorse completamente accessibili alla comunità scientifica
Isabella V27 novembre 2024

 


Ai2 ha presentato la seconda generazione dei suoi modelli linguistici, OLMo 2, che si propongono come concorrenti di modelli già affermati come Llama di Meta. Completamente open source, OLMo 2 è costruito su un set di dati accessibile e offre prestazioni competitive a livello globale.  

Punti chiave:

  •  OLMo 2 è sviluppato interamente con risorse open source.
  •  I modelli OLMo 2, con 7B e 13B parametri, sono tra i più avanzati nel panorama open.
  •  L’addestramento ha utilizzato 5 trilioni di token, inclusi dati da fonti di alta qualità.
  •  Ai2 punta su innovazione e trasparenza, ma non mancano preoccupazioni per possibili abusi.

Ai2, l’organizzazione di ricerca sull’AI fondata dal defunto Paul Allen, ha rilasciato la seconda versione della sua famiglia di modelli linguistici open source, denominata OLMo 2, una proposta che sfida modelli affermati come Llama di Meta. Questi nuovi modelli si distinguono per essere completamente aperti, un aspetto che va ben oltre il concetto di open source tradizionale. Mentre i modelli come Llama sono accessibili, ma non pienamente riproducibili senza accesso a tutte le risorse originali, OLMo 2 soddisfa i criteri definiti dall’Open Source Initiative, che stabilisce che un progetto debba essere non solo accessibile ma anche pienamente documentato e riproducibile. Ai2 ha messo a disposizione del pubblico tutti gli strumenti necessari per riprodurre da zero questi modelli, incluse le ricette di addestramento, i dati utilizzati e i checkpoint intermedi. Con OLMo 2, l’obiettivo è quello di promuovere l’innovazione e favorire l’accesso equo a tecnologie avanzate, mettendo a disposizione delle comunità di ricerca e sviluppo risorse potenti e trasparenti. La nuova famiglia di modelli è composta da due versioni: OLMo 7B, con 7 miliardi di parametri, e OLMo 13B, con 13 miliardi di parametri. I parametri, in questo contesto, rappresentano l’entità delle capacità di calcolo del modello, con quelli più grandi che, in generale, garantiscono prestazioni migliori nelle attività complesse di elaborazione del linguaggio. Questi modelli, infatti, sono in grado di gestire compiti complessi come rispondere a domande, scrivere codice, riassumere testi e svolgere operazioni di analisi linguistica.  

Per quanto riguarda il processo di addestramento, Ai2 ha utilizzato un imponente set di dati composto da ben 5 trilioni di token, equivalenti a centinaia di milioni di parole. Questi dati sono stati estratti da fonti di alta qualità, incluse pagine web selezionate per il loro valore informativo, articoli accademici, forum di discussione Q&A e risorse specifiche come quaderni di esercizi matematici. Il risultato, secondo quanto affermato da Ai2, è una serie di modelli altamente competitivi rispetto ad altri modelli di linguaggio open source, inclusa la versione Llama 3.1 di Meta. Anzi, Ai2 sostiene che OLMo 2 7B ha superato le performance di Llama 3.1 8B in alcuni test specifici, consolidando così la posizione di OLMo come uno dei migliori modelli linguistici open source disponibili.  

Tuttavia, l’approccio open source solleva inevitabilmente questioni legate alla sicurezza e all’abuso di tali tecnologie. Sebbene Ai2 riconosca la possibilità che i modelli possano essere utilizzati in modo improprio, la sua posizione è che i benefici derivanti dalla trasparenza, dalla verificabilità e dalla riduzione della concentrazione di potere siano superiori ai rischi. Questo approccio, infatti, permette di rafforzare la fiducia nelle tecnologie emergenti, promuovendo un ambiente in cui il progresso è stimolato dall’accesso libero e universale. Dirk Groeneveld, ingegnere di Ai2, ha ribadito che solo attraverso l’accesso completo a questi modelli e alle relative risorse si possono raggiungere traguardi significativi in termini di etica e responsabilità nel campo dell’intelligenza artificiale. In tal modo, Ai2 spera di contribuire alla creazione di un ecosistema più equo e aperto, dove le barriere all’ingresso siano abbattute e la ricerca possa avanzare a beneficio di tutti.  

OLMo 2 rappresenta quindi un importante passo avanti nell’evoluzione dei modelli linguistici open source, non solo per la qualità delle sue prestazioni, ma anche per l’impegno a favorire un ambiente di ricerca più inclusivo e accessibile.