Google presenta Gemini 2.5 Deep Think, il nuovo modello AI a ragionamento parallelo | Chatgpt login | Large language models paper | Llm nlp | Turtles AI

Google presenta Gemini 2.5 Deep Think, il nuovo modello AI a ragionamento parallelo
Accessibile agli utenti Ultra, il sistema multi-agente eccelle nei test di codifica e logica, esplorando più soluzioni simultaneamente per fornire risposte complesse e dettagliate








Editorial Team2 agosto 2025

 

 Gemini 2.5 Deep Think è ora disponibile per abbonati Google AI Ultra ($250/mese). Si tratta di un modello multi‑agente in grado di esplorare più soluzioni in parallelo, con prestazioni eccellenti in codifica, matematica e ragionamento complesso. Google rilascia anche una sua variante usata per conquistare l’oro alle Olimpiadi internazionali di matematica a un piccolo gruppo di ricercatori.

Punti chiave:

  • Accesso riservato agli abbonati Ultra a partire dall’1 agosto 2025
  • Sistema multi‑agente che esegue ragionamenti concorrenti per selezionare la risposta ottimale
  • Rendimento benchmark superiore su LiveCodeBench V6 (87,6%) e Humanity’s Last Exam (34,8%)
  • Variante “metodo IMO” distribuita a ricercatori e matematici, con tempi di elaborazione che richiedono ore

Google DeepMind ha introdotto Gemini 2.5 Deep Think, definito come il suo modello di AI più sofisticato fino a oggi, capace di ragionare su domande complesse attraverso un sistema multi‑agente che genera simultaneamente più ipotesi e le confronta per decidere la soluzione migliore. Presentato durante il Google I/O di maggio 2025 come parte della famiglia Gemini 2.5, Deep Think è ora accessibile tramite l’app Gemini per gli abbonati al piano AI Ultra da venerdì 1 agosto 2025, al costo di circa 249,99 $/mese.

Il modello estende il tempo di “pensiero” disponibile durante l’inferenza, implementando tecniche di reinforcement learning studiate per favorire ragionamenti articolati, multi-step e strategie iterative di problem-solving. Dopo un periodo di sperimentazione con tester selezionati, Google segnala miglioramenti significativi nelle prestazioni rispetto alla versione annunciata a maggio, in particolare su benchmarking nei campi del codice, della scienza, della conoscenza e del ragionamento generale.

Sul benchmark di programmazione LiveCodeBench V6, Gemini 2.5 Deep Think ha ottenuto l’87,6 %, superando Grok 4 e il modello di OpenAI o3 (79 % e 72 %). Su Humanity’s Last Exam (HLE), che valuta competenze in matematica, scienze e discipline umanistiche, ha raggiunto il 34,8 % senza strumenti, rispetto al 25,4 % di Grok 4 e al 20,3 % di o3. ( OpenAI).

Parallelamente, Google ha scelto di selezionare una versione avanzata del modello (quella usata nelle prove dell’International Mathematical Olympiad), che ha ottenuto un punteggio di livello oro, per un gruppo ristretto di matematici e accademici. A differenza della variante Ultra, questa versione impiega ore per elaborare le risposte, anziché secondi o minuti, ma promette di supportare ricerche scientifiche e sviluppo di congetture complesse.

L’utilizzo del modello avviene all’interno della app Gemini, dove l’abbonato Ultra può selezionare la modalità Deep Think tra i modelli disponibili (es. passando da Gemini 2.5 Pro a Deep Think) e beneficiare dell’integrazione automatica di strumenti come esecuzione del codice e Ricerca Google. Le risposte possono essere molto più estese di quelle generate dai modelli tradizionali. Google mette in evidenza inoltre che Deep Think è particolarmente capace su compiti che richiedono pianificazione strategica, creatività e sviluppo iterativo, come progettazione web, formulazione di ipotesi matematiche o esplorazione di letteratura scientifica complessa.

Secondo Google, Deep Think rappresenta un netto passo avanti rispetto all’annuncio iniziale, grazie al contributo dei feedback forniti da tester iniziali e all’avanzamento delle tecniche di reinforcement learning. L’implementazione è stata accompagnata anche da valutazioni di sicurezza: rispetto alla versione Pro, Deep Think mostra miglioramenti in termini di tono, oggettività e filtraggio di contenuti non appropriati, pur presentando una tendenza maggiore a rifiutare richieste benignhe.

Nei prossimi giorni Google intende attivare l’accesso via API a Deep Think (con e senza strumenti integrati) per sviluppatori selezionati e aziende, al fine di valutarne applicazioni in contesti aziendali e di ricerca.

 Gemini 2.5 Deep Think amplia l’offerta AI Ultra con un modello multi‑agente pensato per prestazioni elevate su problemi altamente complessi e ambiti specialistici.

Sarà interessante osservare come evolveranno le modalità d’uso e l’accessibilità di questo sistema avanzato nel contesto della ricerca e dell’innovazione tecnologica.