LLM Nazionali per Salvare le Lingue | What is llm | Llm Evaluation Datasets | Llm Machine Learning Tutorial | Turtles AI
AI SU MISURA : MODELLI LINGUISTICI PATRIOTTICI IN CRESCITA
L’Intelligenza Artificiale generativa porta numerosi effetti negativi, tra cui l’appiattimento linguistico. Gli strumenti come ChatGPT e Gemini spesso producono testi con schemi riconoscibili e traduzioni che perdono le sfumature culturali, risultando impersonali e poco interessanti.
Per contrastare questo fenomeno, diversi paesi stanno sviluppando propri modelli di AI linguistica ( LLM ), adattati alle peculiarità linguistiche e culturali nazionali.
Recentemente, è stato lanciato "Italia", un modello creato da iGenius e Cineca, addestrato su un vasto corpus di parole italiane. Pur avendo meno parametri rispetto a GPT-3 e GPT-4, l’importanza risiede nella capacità inferenzialee nella qualità dei dati di addestramento.
"Italia" è disponibile open source per ricerca e imprese e può essere utilizzato tramite interfaccia web o API. Editoriale Nazionale ha contribuito al suo training fornendo archivi storici di articoli.
In Europa, la startup francese Mistral AI ha sviluppato il modello "MIstral", che si distingue per essere open-weight, permettendo a chiunque di modificarlo, ed in questo momento è uno dei più potenti in Europa.
A livello globale, la Cina è molto attiva con oltre 40 LLM approvati per uso pubblico, mentre negli Emirati Arabi Uniti è stato creato "Falcon", un modello focalizzato sulla lingua araba e capace di elaborare testo, immagini e audio.
Anche le università sono coinvolte nello sviluppo di LLM. Ad esempio, Fabrizio Silvestri dell’Università La Sapienza di Roma ha sviluppato "Dante", che è basato su modelli transformer di Google e utilizza innovazioni recenti come la quantizzazione dei pesi. Il modello è statoaddestrato in italiano con l’aiuto del modello "Mistral".
Questi sviluppi mostrano un trend verso la creazione di LLM nazionali, mirati a preservare le caratteristiche linguistiche e culturali di ciascun paese.