Cosa può insegnarci AlphaGo su come le persone imparano

Ovviamente stiamo cercando modi per applicare MuZero ai problemi del mondo reale e ci sono alcuni risultati iniziali incoraggianti. Per fare un esempio concreto, il traffico su Internet è dominato dai video e un grosso problema aperto è come comprimere quei video nel modo più efficiente possibile. Puoi pensare a questo come a un problema di apprendimento per rinforzo perché ci sono questi programmi molto complicati che comprimono il video, ma quello che vedi dopo è sconosciuto. Ma quando inserisci qualcosa come MuZero, i nostri risultati iniziali sembrano molto promettenti in termini di risparmio di quantità significative di dati, forse qualcosa come il 5 percento dei bit utilizzati per la compressione di un video.

A lungo termine, dove pensi che l’apprendimento per rinforzo avrà il maggiore impatto?

Penso a un sistema che possa aiutarti come utente a raggiungere i tuoi obiettivi nel modo più efficace possibile. Un sistema davvero potente che vede tutte le cose che vedi, che ha tutti gli stessi sensi che hai tu, che è in grado di aiutarti a raggiungere i tuoi obiettivi nella tua vita. Penso che sia davvero importante. Un altro trasformatore, che guarda a lungo termine, è qualcosa che potrebbe fornire una soluzione sanitaria personalizzata. Ci sono questioni di privacy ed etiche che devono essere affrontate, ma avranno un enorme valore trasformativo; cambierà il volto della medicina e la qualità della vita delle persone.

C’è qualcosa che pensi che le macchine impareranno a fare nella tua vita?

Non voglio stabilire una scala temporale, ma direi che tutto ciò che un essere umano può ottenere, alla fine penso che possa farlo una macchina. Il cervello è un processo computazionale, non credo che ci sia alcuna magia in corso lì.

Possiamo arrivare al punto in cui possiamo comprendere e implementare algoritmi efficaci e potenti come il cervello umano? Beh, non so quale sia la tempistica. Ma penso che il viaggio sia emozionante. E dovremmo mirare a raggiungere questo obiettivo. Il primo passo per intraprendere questo viaggio è cercare di capire cosa significa anche raggiungere l’intelligenza? Quale problema stiamo cercando di risolvere risolvendo l’intelligenza?

Oltre agli usi pratici, sei sicuro di poter passare dalla padronanza di giochi come gli scacchi e Atari alla vera intelligenza? Cosa ti fa pensare che l’apprendimento per rinforzo porterà a macchine con comprensione del buon senso?

C’è un’ipotesi, la chiamiamo l’ipotesi della ricompensa è sufficiente, che dice che il processo essenziale dell’intelligenza potrebbe essere semplice come un sistema che cerca di massimizzare la sua ricompensa, e quel processo di cercare di raggiungere un obiettivo e cercare di massimizzare la ricompensa è sufficiente per dare origine a tutti gli attributi dell’intelligenza che vediamo nell’intelligenza naturale. È un’ipotesi, non sappiamo se sia vera, ma in un certo senso dà una direzione alla ricerca.

Se prendiamo specificamente il buon senso, l’ipotesi della ricompensa è sufficiente dice bene, se il buon senso è utile a un sistema, significa che dovrebbe effettivamente aiutarlo a raggiungere meglio i suoi obiettivi.

Sembra che tu pensi che la tua area di competenza – l’apprendimento per rinforzo – sia in un certo senso fondamentale per la comprensione, o “soluzione”, dell’intelligenza. È giusto?

Lo vedo davvero molto essenziale. Penso che la grande domanda sia: è vero? Perché sicuramente è in contrasto con il modo in cui molte persone vedono l’intelligenza artificiale, ovvero che c’è questa collezione incredibilmente complessa di meccanismi coinvolti nell’intelligenza, e ognuno di loro ha il suo tipo di problema che sta risolvendo o il suo modo speciale di funziona, o forse non c’è nemmeno una chiara definizione del problema per qualcosa come il buon senso. Questa teoria dice, no, in realtà potrebbe esserci questo modo molto chiaro e semplice di pensare a tutta l’intelligenza, ovvero che è un sistema di ottimizzazione degli obiettivi e che se troviamo il modo per ottimizzare gli obiettivi davvero, davvero bene, allora tutte queste altre cose emergeranno da quel processo.

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *