Previsione della sinergia di coppie di farmaci utilizzando i LLM | Chatgpt Italiano | Rete Neurale Esempio | Mercato Intelligenza Artificiale Italia | Turtles AI

Previsione della sinergia di coppie di farmaci utilizzando i LLM
DukeRem28 aprile 2023
  Un nuovo studio ha dimostrato che i modelli linguistici pre-addestrati di grandi dimensioni (#LLM) hanno il potenziale per rivoluzionare l’apprendimento a pochi colpi in vari campi, anche con dati di addestramento minimi. Tuttavia, finora non è stata valutata appieno la loro capacità di generalizzare a compiti inediti in campi più complessi, come la #biologia. Ma un team di ricercatori ha ora proposto un approccio di apprendimento a pochi colpi che utilizza gli LLM per prevedere la #sinergia di coppie di farmaci in #tessuti rari con dati strutturati e caratteristiche limitate. I ricercatori hanno sviluppato un modello chiamato #CancerGPT, che utilizza gli LLM per estrarre la conoscenza pregressa dai corpora di testo e offrire un promettente approccio alternativo per l’inferenza biologica. I loro esperimenti hanno coinvolto sette tessuti rari di diversi tipi di cancro e hanno dimostrato che il modello di predizione basato su LLM ha raggiunto un’accuratezza significativa con pochissimi o zero campioni. In particolare, CancerGPT, che ha circa 124 milioni di parametri, è stato addirittura paragonabile al modello GPT-3, più grande e ottimizzato, che ha circa 175 miliardi di parametri. La ricerca del team è la prima ad affrontare la previsione della sinergia tra farmaci in tessuti rari con dati limitati. È anche la prima a utilizzare un modello di previsione basato su LLM per compiti di previsione di reazioni biologiche. Per mettere a punto CancerGPT, il team ha adattato GPT-2 al contesto della previsione della sinergia tra farmaci. Il modello è stato chiamato CancerGPT e ha utilizzato la stessa struttura del GPT-2 modificato. Il team ha innanzitutto messo a punto CancerGPT per apprendere le informazioni relazionali tra le coppie di farmaci provenienti da tessuti comuni. Questo approccio si basava sul presupposto che alcune coppie di farmaci presentano sinergie indipendentemente dal contesto cellulare. Pertanto, le informazioni relazionali tra coppie di farmaci in tessuti comuni possono essere utilizzate per prevedere la sinergia in nuove linee cellulari in tessuti diversi. Inoltre, il team ha incorporato informazioni sulla sensibilità di ogni singolo farmaco alla linea cellulare in questione, utilizzando il punteggio di inibizione relativa come misura della sensibilità. In questo modo è stato possibile ottenere una comprensione più dettagliata e sfumata del rapporto tra farmaci e linee cellulari. L’équipe ha utilizzato un ampio database di sinergie farmacologiche pubblicamente accessibile dal portale DrugComb, che è un portale di dati ad accesso libero in cui vengono accumulati, standardizzati e armonizzati i risultati degli studi di screening delle combinazioni di farmaci per un’ampia varietà di linee cellulari tumorali. Il database contiene sia righe di sensibilità ai farmaci sia righe di sinergia tra farmaci. I ricercatori si sono concentrati sulle linee cellulari provenienti da tessuti rari, definiti come tessuti con meno di 4.000 campioni, tra cui pancreas, endometrio, fegato, tessuti molli, stomaco, tratto urinario e ossa. Hanno testato i loro modelli con ciascuno dei tessuti rari. Per valutare l’accuratezza della classificazione, il team ha utilizzato AUROC e AUPRC. Hanno confrontato il modello di previsione basato su LLM con altri due modelli tabulari che utilizzano lo stesso insieme di input: XGBoost e TabTransformer. XGBoost è uno degli algoritmi di gradient-boosting per dati strutturati o tabellari, mentre TabTransformer è un modello di apprendimento supervisionato basato sull’autoattenzione per dati tabellari. Il team ha messo a punto tutti i modelli per ogni k shot in ogni tessuto raro e li ha testati con AUPRC e AUROC. I risultati del team suggeriscono che CancerGPT, che utilizza gli LLM, è un approccio alternativo promettente per prevedere la sinergia di coppie di farmaci in tessuti rari con dati limitati. La ricerca del team apre nuove strade a studi futuri per esplorare il potenziale degli LLM in altri compiti di inferenza biologica.