I mattoni fondamentali degli LLM: reti neurali (Lezione 2) | Llm Generative ai | Llm Informatica | Large Language Models Wikipedia | Turtles AI
In questa seconda #lezione, parleremo delle fondamenta degli #LLM (Large Language Models): le reti neurali. Le #reti #neurali sono #modelli #computazionali ispirati al modo in cui il cervello umano elabora le informazioni. Sono costituite da #nodi #interconnessi, chiamati #neuroni, che lavorano insieme per elaborare l’input e produrre l’output. Una rete neurale è come un team di detective che lavora insieme per risolvere un mistero. Ogni detective ha un compito diverso, come cercare indizi o interrogare testimoni, e condividono le informazioni per capire cosa è successo. Allo stesso modo, diversi "neuroni" lavorano insieme nelle reti neurali per analizzare i dati e fare previsioni. Comunicano tra loro per risolvere problemi, come capire che tipo di animale è in una foto o quale parola qualcuno sta dicendo. Il tipo più comune di rete neurale utilizzato negli LLM è l’architettura #transformer. I transformers sono stati introdotti nel 2017 e da allora hanno rivoluzionato la NLP (Natural Language Processing, già definita nella prima lezione). Sono particolarmente bravi nell’elaborare sequenze di dati, come le frasi del linguaggio umano. Infatti, i transformers scompongono i dati di input in pezzi e li elaborano per produrre informazioni utili, come prevedere la prossima parola in una frase con una certa probabilità. I transformers sono costituiti da strati, ognuno contenente molti neuroni. Questi strati lavorano insieme per elaborare e generare testo. È come una grossa squadra di lavoro, in cui ognuno ha un compito da svolgere e insieme possono creare qualcosa di veramente interessante, come creare una storia o una conversazione. Durante l’addestramento (training), la rete neurale impara a comprendere e generare il linguaggio umano, regolando le connessioni tra i suoi neuroni sulla base di un enorme dataset di testo (da qui l’aggettivo "large" per gli LLM). Quando una rete neurale viene addestrata per capire e parlare come una persona, guarda molti esempi di linguaggio umano. È come esercitarsi molto per migliorare la propria capacità di parlare una nuova lingua, ma la rete neurale si esercita con molti esempi contemporaneamente.