Google Lens si arricchisce di nuove funzionalità per l’interazione visiva | Festina Lente - Notizie, recensioni e approfondimenti sull’intelligenza artificiale | Turtles AI

Google Lens si arricchisce di nuove funzionalità per l’interazione visiva
L’app ora consente di porre domande in tempo reale su oggetti presenti nei video e offre informazioni utili sul commercio elettronico
Isabella V4 ottobre 2024

 

 Google ha introdotto nuove funzionalità nella sua app Lens, consentendo agli utenti di porre domande sugli oggetti catturati in video in tempo quasi reale. Questa evoluzione sfrutta la tecnologia AI di Google per offrire risposte pertinenti e informazioni utili. 

Punti chiave:

  • Interazione video: Gli utenti possono registrare video e porre domande sugli oggetti, ricevendo risposte tramite l’AI.
  • Modello Gemini: Lens utilizza un modello AI personalizzato per analizzare il video e fornire risposte contestuali.
  • Funzionalità di e-commerce: Lens riconosce i prodotti e mostra informazioni dettagliate come prezzi e recensioni.
  • Opzioni pubblicitarie: La piattaforma include annunci di shopping per massimizzare il potenziale commerciale.

Google ha avviato un aggiornamento significativo per la sua app di ricerca visiva Lens, ora in grado di fornire risposte quasi in tempo reale a domande relative all’ambiente circostante. Gli utenti di smartphone Android e iOS, che parlano inglese e hanno installato l’app Google, possono iniziare a registrare video attraverso Lens, ponendo domande sugli oggetti di interesse nel video stesso. Lou Wang, direttore della gestione dei prodotti per Lens, ha spiegato che questa nuova funzionalità si basa su un modello Gemini "personalizzato", concepito per interpretare i video e le domande correlate. Gemini rappresenta una famiglia di modelli di AI sviluppati da Google, utilizzati in vari prodotti dell’azienda. Wang ha illustrato un esempio pratico: se un utente desidera conoscere di più su un particolare pesce, Lens fornirà una panoramica che spiega il comportamento del pesce e ulteriori informazioni utili. 

Per accedere a questa nuova funzionalità, gli utenti devono registrarsi al programma Search Labs di Google e attivare le opzioni sperimentali "AI Overviews and more". Una volta nell’app Google, gli utenti possono attivare la modalità di acquisizione video tenendo premuto il pulsante di scatto del proprio smartphone. Durante la registrazione, ponendo una domanda, Lens attingerà alle risorse di AI Overviews, che sfruttano l’intelligenza artificiale per sintetizzare informazioni dal web. Wang ha chiarito che Lens è in grado di identificare i fotogrammi più "interessanti" e pertinenti del video, utilizzandoli come base per formulare una risposta.

Questa iniziativa da parte di Google arriva in un momento in cui anche altre aziende tecnologiche stanno esplorando simili funzionalità. Meta ha recentemente presentato una caratteristica per i suoi occhiali AR che permette agli utenti di porre domande in tempo reale su ciò che li circonda. Anche OpenAI ha accennato a una futura funzionalità del suo strumento Advanced Voice Mode, destinata a comprendere e analizzare i video in tempo reale. Tuttavia, Google sembra aver anticipato i concorrenti, pur essendo il suo approccio asincrono, non permettendo un’interazione in tempo reale. La conferenza stampa non ha fornito dimostrazioni live, e storicamente Google ha talvolta fatto promesse eccessive riguardo le capacità della sua AI.

Oltre all’analisi video, Lens ha ampliato le sue funzioni, consentendo ricerche simultanee utilizzando immagini e testo. Gli utenti di lingua inglese, anche senza iscrizione a Labs, possono scattare foto e porre domande vocalmente. Inoltre, Lens ha introdotto nuove funzionalità per il commercio elettronico. Da oggi, quando Lens identifica un prodotto, fornisce dettagli come prezzo, disponibilità, marchio e recensioni. Questa funzionalità è attualmente limitata a determinate categorie e paesi, riguardando settori come elettronica, giocattoli e bellezza. Wang ha fornito un esempio: se un utente nota uno zaino che gli piace, può utilizzare Lens per identificarlo e ottenere immediatamente informazioni relative. 

Va notato che c’è un aspetto pubblicitario in questa funzione. La pagina dei risultati per i prodotti identificati da Lens includerà annunci di shopping pertinenti, data la rilevanza delle ricerche di shopping, che ammontano a circa 4 miliardi al mese secondo Google. Per un gigante tecnologico la cui attività principale si basa sulla pubblicità, si tratta di un’opportunità commerciale difficile da ignorare.

Le nuove funzionalità di Lens segnano un passo avanti nell’evoluzione della ricerca visiva e dell’interazione con l’AI.