L\'ALGORITMO E L\'ORACOLO- ALESSANDRO VESPIGNANI PDF

Title L\'ALGORITMO E L\'ORACOLO- ALESSANDRO VESPIGNANI
Author Federica Chiapparelli
Course Scienze della comunicazione
Institution Università degli Studi Suor Orsola Benincasa
Pages 8
File Size 108 KB
File Type PDF
Total Downloads 706
Total Views 774

Summary

L'ALGORITMO E L'ORACOLO- ALESSANDRO VESPIGNANIIntroduzione: Alessandro Vespignani è uno dei più importani scienziai della predizione del mondo, egli non si aida ai segni della natura, bensì a quelli matemaici della daiicazione. E a fornirgli quesi dai siamo proprio noi. A parire dai pagameni che ese...


Description

L'ALGORITMO E L'ORACOLO- ALESSANDRO VESPIGNANI Introduzione: Alessandro Vespignani è uno dei più importanti scienziati della predizione del mondo, egli non si affida ai segni della natura, bensì a quelli matematici della datificazione. E a fornirgli questi dati siamo proprio noi. A partire dai pagamenti che eseguiamo con il bancomat, i quali ci dicono cosa possiamo permetterci e cosa ci piace, oppure il GPS sullo smartphone che registra tutti i nostri movimenti, o ancora l’algoritmo di Facebook che impara i nostri gusti in fatto di cinema e musica, moda e cibo, fino a sapere che cosa abbiamo intenzione di votare alle prossime elezioni. Tutti questi dati che seminiamo sono il pozzo da cui attingere per simulare e anticipare il futuro. L’accumulazione dei dati non è scienza, quello che le trasforma in potere produttivo sono: gli algoritmi. Definiamo algoritmi una serie di istruzioni precise ed espressioni matematiche che usiamo per trovare tendenze. Molti di questi algoritmi sono basati su modelli di apprendimento automatico, il cosiddetto machine learning, e sfruttano la statistica: cercano nei dati similarità e ripetizioni, anticipando così i potenziali comportamenti futuri. La storia classica ci insegna che le capacità divinatorie sono sinonimo di potere; es. l’oracolo di Delfi. Oggi lo stesso dono è in mano a chi dispone di dati e algoritmi. Sono gli indovini digitali del nostro presente. 1. La scienza delle previsioni Provare a fare previsioni per il mondo reale è un compito difficile. Eppure, nonostante questo, i tentativi di ingabbiare il futuro all’interno di regole matematiche e scientifiche è un esercizio vecchio che parte dai Babilonesi. Quest’ultimi cominciarono a capire che i fenomeni astronomici avevano moti periodici, e presero subito a tabulare questi periodi con calcoli matematici per eseguire delle predizioni. In questo caso possiamo usare l’evoluzione temporale osservata nel passato per prevedere cosa succederà nel futuro assumendo che la dinamica del sistema si ripete nello stesso modo. La scienza delle predizioni è però dotata di un’arma più potente: la teoria. Non dobbiamo più osservare il sistema per molti anni e costruire un modello empirico. Abbiamo invece un modello meccanicistico che usa una costruzione algoritmica, ovvero un insieme di istruzioni e calcoli matematici, per prevedere il futuro. Misurando le condizioni iniziali, posizione e velocità, massa, carica elettrica, è possibile scrivere le equazioni che descrivono in maniera deterministica il futuro dei sistemi fisici. Ed è in questo periodo che nasce la moderna teoria delle predizione meteorologiche. Gli sviluppi scientifici e tecnologici hanno portato ad aumentare la capacità di previsioni meteorologiche negli ultimi 50 anni, da 3 a 10 giorni. Tuttavia sappiamo che esiste un problema fondamentale legato al fatto che una minuscola perturbazione dello stato dell’atmosfera può portare a un cambiamento drammatico nel futuro. Ma possiamo comunque usare questa consapevolezza dell’intrinseca precarietà previsionale a nostro favore, introducendo il concetto di «previsioni probabilistiche». In questo modo, invece di considerare una sola condizione iniziale e la risultante previsione, si fanno variare le condizioni iniziali e si genera un insieme di soluzioni previsionali, che campionano le possibili evoluzioni 1

future. Questo insieme di previsioni è poi combinato statisticamente per fornire una stima della probabilità dell’evento meteorologico. Pensare in probabilità arricchisce dunque il tipo di analisi che possiamo fare del futuro. Alla fine degli anni 90 si avviò una rivoluzione che fece esplodere il campo d’azione delle previsioni; le predizioni si sono insinuate anche nella nostra vita privata. Gli algoritmi sono in grado di sapere cosa ci piace, di cosa abbiamo bisogno, chi sono i nostri amici, le nostre inclinazioni politiche e religiose. Insomma hanno trasformato l’uomo in un atomo predicibile. 2. Uno sciame di uomini Mandelbrot fu un matematico. La sua qualità scientifica era di non arrendersi davanti alla complessità, ma bensì matematizzare la complessità del mondo circostante. Questo lo ha fatto diventare uno dei padri della scienza dei sistemi complessi. Ovvero di quella scienza che si occupa di capire come un grande numero di elementi in interazione generino i comportamenti collettivi dell’intero sistema, e di come il sistema interagisca con il suo ambiente. Pensiamo all’acqua, composta da miliardi di molecole, che al variare della temperatura può assumere stati diversi. Pochi gradi sotto lo zero e diventa ghiaccio, mentre superati i 100 grandi si trasforma in vapore. Tuttavia, se ci focalizziamo solo su due molecole d’acqua in isolamento non saremo mai in grado di capire cosa sta succedendo. Questi cambi di stato della materia, possono essere infatti compresi solo guardando al sistema nel suo insieme, analizzando le interazioni di una grande quantità di elementi microscopici. Allo stesso modo possiamo applicare questo approccio scientifico alla vita quotidiana. Reynolds spiega il modo in cui è riuscito ad applicare questo approccio al comportamento degli stormi. Egli identifica ogni volatile con un simbolo grafico che si muove nello spazio seguendo 3 semplici regole. La prima detta «di separazione», lo vede impegnato a cercare di non sbattere contro i compagni di viaggio. La seconda «di allineamento» lo spinge a mantenere l’andatura media dei vicini. Infine la terza che riguarda la «coesione», fa sì che non si allontani troppo dagli altri. La combinazione di queste tre semplici regole riproduce le caratteristiche del movimento di gruppo spesso osservato negli sciami animali. Ed è un comportamento imprevisto in quanto non c’è bisogno che gli individui che lo compongono comunichino per coordinare le loro azioni. Helbing definì un modello in grado di simulare il movimento dei pedoni, dove gli uomini vengono descritti come particelle soggette ad alcune semplici regole locali, sulla falsariga dei modelli di comportamento degli sciami animali. La prima regola è che ogni essere umano ha una destinazione particolare e una particolare velocità di marcia preferita. La seconda che ognuno tende a mantenere la propria direzione e velocità a meno che non sia costretto a rallentare o deviare per evitare una collisione. Helbing scoprì inoltre che gli individui erano in grado di definire delle corsie di marcia, nei centri commerciali ad esempio; una corsia di gente che va in una direzione, e un’altra per quella che va nella direzione opposta. Sembra che la folla sia dotata di un’intelligenza collettiva capace di trovare una soluzione ottimale dei percorsi senza finire addosso alle persone. Anche in questo caso ci troviamo in presenza di un comportamento collettivo che emerge spontaneamente senza coordinazione tra gli individui. 2

Gli individui tendenzialmente sono portati a creare comunità con individui della stessa cultura, razza, classe o opinioni. Schelling dimostra attraverso un modello matematico il problema della segregazione urbana. In questo modello illustra due tipi di individui; inizialmente Schelling immaginò un semplice sistema in cui gli individui erano disposti linearmente e in maniera disordinata, uno accanto all’altro, come se fossero seduti ad un lungo tavolo. Ogni individuo però vuole avere almeno una data percentuale di persone dello stesso tipo nelle sue vicinanze. Per questo motivo ognuno di essi controlla i quattro posti alla sua destra e alla sua sinistra, e se la percentuale di individui simili è al di sotto della soglia si sentirà scontento e cercherà di spostarsi muovendosi nel primo posto in cui questa condizione si avveri. Questo vale in sequenza per ogni individuo fino a che tutti gli individui non sono contenti; ma ogni individuo non è a conoscenza delle mosse degli altri perciò non c’è processo di coordinazione tra gli individui. Le connessioni tra gli individui non sono determinate unicamente da processi casuali. Questo è stato dimostrato da Watts e Strogatz con il loro modello di rete che battezzarono con il nome di Small-World; attraverso la rete Small World è possibile identificare un abbondante numero di relazioni triangolari, ovvero «gli amici dei miei amici sono i miei amici». Barabàsj e Albert proposero invece un modello dinamico di rete dove veniva introdotto un aspetto cognitivo nella scelta delle connessioni tra gli individui. Un meccanismo di scelta basato sulla nostra tendenza a preferire connessioni con chi è già altamente connesso. Questo principio prende il nome di «attaccamento preferenziale». Nella rete con attaccamento preferenziale si vede la presenza di nodi con un grande numero di connessioni (hub). 3. Dati, algoritmi e predizioni Smartphone e computer ci permettono di svolgere gran parte delle nostre attività quotidiane, dall’acquisto di libri e vestiti, alla prenotazione del ristorante o del prossimo viaggio. Non ci rendiamo conto fino in fondo, però, che allo stesso tempo gran parte di queste transazioni lascia un segno. Una traccia della nostra vita è presente nei server. Questo fenomeno prende il nome di datificazione; oggi ogni informazione sulla nostra vita è diventata un dato digitale che può essere conservato e sopratutto analizzato dagli scienziati in tempo reale. Questi dati prendono il nome di digital data streams, ovvero flussi di dati digitali. Partendo proprio dalla constatazione che questi nuovi dati permettono un monitoraggio continuo dello stato d’animo della società, due matematici hanno pensato di creare una sorta di termometro della felicità sociale. Viene chiamato Hedonometer, una macchina psicofisica che misura l’umore collettivo negli Stati Uniti analizzando oltre 50 milioni di messaggi Twitter al giorno. Viene mostrato in tempo reale l’effetto di eventi politici ed economici, ma anche feste nazionali e disastri meteorologici. Per compiere queste analisi abbiamo a disposizione un numero di dati estesi in termini di volume, velocità e varietà, definiti big data. Una storia che dimostra come la scienza studia il comportamento umano è quella di Andrew Pole. Pole era stato appena assunto dalla catena di negozi Target quando due colleghi dell’ufficio gli domandarono come fosse possibile capire se una donna è incinta, anche se questa non vuole dircelo. Pole iniziò a lavorarci e scoprì che a seconda del mese di gravidanza le donne acquistavano un certo tipo di prodotti. Queste abitudini uguali per tutti hanno consentito a Pole di prevedere approssimativamente la data del parto, consentendo a Target di inviare pubblicità estremamente mirate e in accordo con specifiche fasi della gravidanza. 3

Sono proprio questi dati che permettono agli algoritmi di predire i nostri bisogni. L’uso dei big data per uso previsionale non si è fermato al marketing. Grazie agli scienziati di Google è stato possibile prevedere l’influenza stagionale attraverso un nuovo servizio, il Google Flu Trends. Questo si avvaleva delle milioni ricerche fatti dagli utenti su Google per quanto riguarda l’influenza, per ottenere l’andamento dell’epidemia. Tanti dati e potenti algoritmi possono fare meglio di qualunque impianto teorico. Questo prevedeva l’abbandono del metodo scientifico classico, quello che cerca di comprendere i meccanismi che causano ciò che osserviamo nel mondo reale. L’intelligenza artificiale è il perno attorno a cui ruota il nostro mondo. L’intelligenza artificiale è un concetto ampio che si riferisce all’uso del computer per imitare le funzioni cognitive degli esseri umani in campi che vanno dalla visione artificiale e la robotica ai videogiochi e i veicoli autonomi (come droni e auto senza guidatore). Per comprendere meglio cosa è successo ci dobbiamo concentrare su un campo specifico dell’intelligenza artificiale: il machine learning, il cui obiettivo è consentire ai computer di apprendere autonomamente. Le tecniche definire per eseguire l’apprendimento automatico si dividono in 3 classi principali; «l’apprendimento supervisionato», in cui l’algoritmo confronta i suoi risultati con i risultati corretti durante la fase di apprendimento, «apprendimento non supervisionato», l’algoritmo cerca semplicemente schemi e associazioni in un insieme di dati senza confrontarli con un insieme di risultati, «apprendimento con rinforzo», l’algoritmo impara per tentativi ed errori, così facendo trova lo schema che minimizza il numero di errori. Non esiste un singolo algoritmo che funzioni meglio di qualunque altro per tutti i problemi che vogliamo risolvere. Esiste però una classe di algoritmi il cui successo sembra inarrestabile. Sono i neural network, nei quali l’algoritmo simula un insieme di neuroni che, stimolati da un dato in entrata, producono un dato in uscita. Il salto di qualità per i neural network avviene quando iniziano ad essere usate reti neurali più grandi, e che includono anche un numero molto più grande di livelli, il deep learning. Ogni livello seleziona una caratteristica specifica da apprendere, offrendo alla macchina una maggiore capacità di trovare e amplificare anche i segnali più piccoli. Questo tipo di apprendimento (machine learning) lo possiamo trovare anche nel campo delle predizioni. In questo caso è stato utile a Vespignani ed i suoi colleghi per creare un modello per la previsione dell’evoluzione dell’epidemia Zika in America Latina. Zika è un virus che si trasmette da individuo a individuo principalmente attraverso un certo tipo di zanzare. Il machine learning, riuscì in questo caso a generare delle mappe della presenza delle zanzare Aedes per l’intero mondo. Tuttavia nell’ammirazione di ciò che aveva fatto l’algoritmo, vi era un certo disagio, in quanto l’algoritmo non poteva spiegare come ci fosse arrivato a produrre quelle mappe. Infatti il team che aveva prodotto quei risultati aveva poi eseguito un’enorme lavoro per spiegare i risultati in modo interpretativo. A questo problema è stato dato il nome di black box, riferendosi al fatto che molti algoritmi prendono un dato in entrata e ne producono uno in uscita, passando attraverso un processo di apprendimento che è una scatola nera non interpretabile dall’esterno. L’unico modo per assicurarci delle loro predizioni è provarle attraverso degli esperimenti e a quel punto confermare le sue rivelazioni.

4

4. Prevedere quante copie venderà questo libro Durante il febbraio del 2012 Vespignani con il suo gruppo di ricerca, iniziò a fare previsioni su uno dei talent show più famosi negli Stati Uniti: American Idol (equivalente di X-Factor). Usando i dati provenienti da Twitter iniziarono a fare previsioni su chi potesse essere l’eventuale vincitore del programma. I risultati furono pubblicati tre giorni prima che venne trasmesso l’ultimo episodio. E ci azzeccarono. Questo fu importante per capire che si stavano aprendo le porte di un nuovo mondo algoritmicamente prevedibile e algoritmicamente previsto. E le predizioni non si fermano al mondo esterno, ma arrivano anche ad anticipare i nostri gusti musicali, che ci vengono suggeriti dal sistema predittivo di Spotify. E la stessa dinamica viene utilizzata da Amazon per quanto riguarda gli acquisti, e Netflix sulla visione dei film. Anche nel mondo del calcio parliamo di predizioni; come quando negli anni 70 si scommetteva al Totocalcio, un concorso a premi che aveva l’obiettivo di prevedere gli esiti delle partite di pallone. Chi indovinava tutte e 13 le partite vinceva un montepremi non irrilevante. In un incontro tra Vespignani e Luís Amaral, professore d’Ingegneria, quest’ultimo iniziò a parlare di calcio e di come forse era possibile usare la scienza delle reti per fare previsioni anche in questo campo. Luís sviluppò un algoritmo che punta i riflettori sulle interazioni tra i vari giocatori e ricostruisce il network di chi passa la palla a chi, quanto sono accurati questi passaggi e quanta probabilità hanno di trasformarsi in una rete nella porta avversaria, a prescindere dal fatto che il tiro vado a segno. Quando Luís e il suo team hanno utilizzato i loro algoritmi per valutare le squadre dell’Euro Cup nel 2008, la metodologia ha mostrato che la Spagna era la squadra più forte e Xavier il miglior giocatore. La storia gli ha dato poi ragione. Negli anni poi l’intelligenza artificiale è diventata una specie di vero e proprio «allenatore virtuale»; l’attività fisica dei giocatori viene registrata grazie a dispositivi GPS. E così è possibile evitare gli infortuni muscolari durante gli allenamenti, avvisando l’allenatore prima che sia troppo tardi ed evitando perdite milionarie a ogni partita mancata. È addirittura possibile prevedere le vendite di un libro, il tutto attraverso tre regole che delineano il futuro di un libro; Se il volume è un saggio bisogna abbandonare ogni aspettativa eccessiva e mettere in conto di vendere in media la metà rispetto a un romanzo. La competizione è molto forte nel periodo natalizio, quando si comprano molti più libri, ma è necessario vendere dieci volte di più che a febbraio o marzo per assicurarsi il titolo di bestseller. Un libro di narrativa raggiunge il picco di vendite nelle prime sei settimane d’uscita, mentre gli autori di saggi hanno 15 settimane per sperare nel successo. Poi bisogna tener conto di tre parametri fondamentai; fitness, ovvero la capacità di un libro di rispondere ai gusti di un pubblico ampio, il fattore immediatezza che misura il momento in cui le vendite raggiungono il picco, infine il terzo parametro è la longevità che rivela il tasso di perdita d’interesse nei confronti di un volume con il passare degli anni. Combinando questi fattori possiamo ottenere un quadro del futuro del libro. Il trucco sta nel considerare come esso viene percepito dalla società.

5. Le trappole dell’intelligenza artificiale 5

In una cosa esseri umani e algoritmi sono molto simili: entrambi hanno pregiudizi. Un esempio lampante è offerto dai software per il riconoscimento facciale. Joy Buolamwini, lavorando proprio sugli algoritmi di riconoscimento facciale si accorse che quando si sedeva di fronte alla telecamera, il computer non riconosceva il suo volto, mentre riconosceva il suo collega. L’unica differenza tra lei e il suo collega stava nel colore della pelle: lei era afroamericana, mentre il collega e era bianco. Al cuore del riconoscimento facciale ci sono degli algoritmi di apprendimento automatico che identificano le persone imparando a riconoscere una serie di indicatori biometrici del viso; se alleniamo le macchine con informazioni di cattiva qualità, non possiamo ottenere che pessimi risultati. Ed è per questo motivo che si genera un processo di discriminazione basato su pregiudizi verso specifiche comunità o gruppi sociali. Un’altro esempio ci viene offerto da un software utilizzato dai giudici in Florida per predire futuri criminali. Un team investigativo notò che questo era prevenuto contro i neri, in quanto per gli individui di colore l’algoritmo prediceva un numero sproporzionato di falsi positivi, individui classificati ad alto rischio che però successivamente non commettevano alcun reato. Anche Google Flu Trends si rivelò un fallimento, in quanto esso prevedeva più del doppio della percentuale di visite mediche per influenza rispetto ai dati provenienti dal sistema di sorveglianza del CDC. Per questa ragione nel 2015 il sistema GFT è stato chiuso e Google ha interrotto la ricerca a supporto e sviluppo dei sistemi di predizione dell’influenza stagionale. Si rivelò come uno dei fallimenti più clamorosi dell’intelligenza artificiale e delle predizioni basate su big data. 6. I mondi artificiali I primi passi verso lo sviluppo di un modello che possa simulare la dinamica di un’epidemia è stato merito del professore Ira Longini. Egli collaborò con Leonid Rvachev che proponeva un’idea semplice per prevedere la diffusione dell’influenza in Russia, grazie a equazioni che descrivevano gli spostamenti delle persone: le epidemie, sosteneva Rvachev, si verificano perché gli individui che sono stati esposti al patogeno, lo trasportano inconsapevolmente. Seguendone i movimenti era possibile prevedere il contagio. Come la storia di Rvachev e Longini insegna, il campo era ancora ai suoi arbori nel 1985, e si è dovuto aspettare fino al 2008 per uno studio guidato da Halloran in grado di produrre diversi modelli realistici simulati al computer, ed esaminare dunque le conseguenze delle strategie di intervento contro una pan...


Similar Free PDFs