Propaganda e manipolazione nelle elezioni politiche: il ruolo dei social network e degli algoritmi basati sulla intelligenza artificiale

Roberto Bellotti si occupa dell’influenza dei social network sull’informazione e la propaganda politica. Dopo aver richiamato alcuni esperimenti sociali - condotti all’oscuro degli elettori – e le caratteristiche di strumenti nuovi che utilizzano piattaforme di social network, big data e complessi algoritmi, Bellotti sostiene che un’accurata profilazione economica, sociale, culturale e di orientamento politico permette di diffondere notizie, spesso false, a gruppi selezionati in modo preciso ed invasivo, esercitando un’influenza superiore a quella che percepiamo.

Servendosi di concetti non matematici, Gaal Dornick ha definito la psicostoria come quella branca della matematica che studia le reazioni di un agglomerato umano a determinati stimoli sociali ed economici […]. Un ulteriore assunto è che la comunità esaminata deve essere, essa stessa, all’oscuro dell’analisi psicostorica, affinché le sue reazioni siano assolutamente istintive

Isaac Asimov, Ciclo delle Fondazioni.

 

Cosa sono i Big Data. Le riflessioni che seguono prendono le mosse dal recente caso che ha visto Facebook e la società di consulenza britannica Cambridge Analytica accusate di aver utilizzato in modo improprio i dati personali ed altre informazioni rilevanti, desunte dalle attività svolte dai cittadini attraverso la piattaforma Facebook, per acquisire un vantaggio competitivo nelle campagne elettorali statunitensi.

La possibilità di influenzare il voto politico, attraverso la diffusione di informazioni mirate e personalizzate riguardanti la politica e l’economia, ma anche l’etica e i più in generale i costumi, è stata resa possibile dallo sviluppo esponenziale delle tecnologie digitali, dalla possibilità di memorizzare grandi quantità di dati riguardanti i comportamenti e le abitudini dei cittadini, comprese le idee politiche, e di analizzarli attraverso algoritmi basati sull’apprendimento automatico (machine learning), capaci di individuare con grande accuratezza le caratteristiche e le informazioni salienti presenti nei dati al fine di pervenire alla definizione di insiemi omogenei (cluster) e predire, sulla base dei dati già raccolti ed analizzati, tendenze e comportamenti futuri.

La potenza messa in campo dalle grandi multinazionali che operano nel settore della Information and Communication Technology ha come punto di partenza e miniera da cui estrarre ricchezza (data mining) proprio i dati, che per le caratteristiche che li contraddistinguono vengono definiti “Big Data”. Tra le tante definizioni utili a definire il punto di partenza di questa analisi ne riportiamo una di natura tecnica, che definisce Big Data un insieme di dati caratterizzato dalle cosiddette 3 V: volume, velocità e varietà.

La prima caratteristica individua la dimensione dei file che contengono i dati o, equivalentemente i dati stessi: un file contenente la registrazione degli acquisti effettuati in un anno dalla popolazione italiana può senz’altro essere considerato un file di grandi dimensioni, caratterizzato dalla prima delle tre V.

La seconda V definisce la natura dinamica dei dati raccolti, ovvero la necessità, affinché i dati abbiano “Valore”, che il file sia continuamente arricchito di nuovi dati. E’ intuitivo cogliere la differenza di Valore tra un file che contiene i dati di acquisto della popolazione italiana raccolti nel 2016 ed un altro che viene continuamente aggiornato sino al 2018 e oltre.

La terza V riguarda la natura delle fonti che producono i dati. Se oltre alla raccolta dei dati attraverso gli scontrini fiscali fosse possibile acquisire anche informazioni sullo stato d’animo degli acquirenti, ad esempio attraverso l’analisi dell’espressione facciale raccolta attraverso telecamere dislocate nei luoghi ove l’acquirente effettua le spese, il Valore dei dati aumenterebbe ulteriormente.

Le tecnologie informatiche necessarie per memorizzare ed elaborare i Big Data, secondo la definizione delle 3 V, sono attualmente in possesso di poche e grandi aziende altamente specializzate.

Una seconda definizione, che sposta l’attenzione sugli utilizzi dei Big Data è la seguente (J. Dutcher 2014): “Historically, most decisions — political, military, business, and personal — have been made by brains [that] have unpredictable logic and operate on subjective experiential evidence. “Big data” represents a cultural shift in which more and more decisions are made by algorithms with transparent logic, operating on documented immutable evidence. I think ‘big’ refers more to the pervasive nature of this change than to any particular amount of data”. E’ infine interessante notare che il termine Big Data, ormai di uso e comprensione comune, è stato introdotto molto recentemente nei vocabolari di lingua inglese: nel 2013 nell’Oxford English Dictionary e nel 2014 nel Merriam-Webster’s Collegiate.

I dati, quindi, vengono prodotti in massima parte attraverso le azioni che i cittadini compiono con i dispositivi, di qualunque tipo, connessi a internet: è significativo il ritmo di crescita di tali dispositivi. Nel 2003 vi erano al mondo 500 milioni di dispositivi connessi a internet, nel 2020 saranno 50 miliardi; nell’arco di meno di venti anni il numero di dispositivi/abitante è cresciuto di un fattore circa 8.000. Analogamente la quantità di dati prodotta cresce del 40% all’anno.

Reti complesse ed elezioni politiche. Le reti complesse sono strumenti matematici che permettono di studiare in modo approfondito le relazioni tra un gran numero di entità interagenti tra loro. Una rete complessa è definita dalle entità (ad esempio gli elettori) e dal tipo di “relazioni” tra le entità che si intendono studiare, ad esempio se condividono i “tweet” provenienti dalle stesse fonti, o se si scambiano “like” su documenti e notizie Facebook, sottolineandone se possibile la natura. Lo studio di una rete complessa consente di evidenziare il cosiddetto “comportamento emergente”, ovvero una o più proprietà complessive e macroscopiche ben definite, difficilmente predicibili a partire dal comportamento delle entità che compongono la rete, prese singolarmente. Molti sistemi fisici vengono descritti e studiati efficacemente per mezzo delle reti complesse: le reti dei trasporti (stradale, ferroviario, aereo), le reti di distribuzione delle fonti energetiche, i mercati finanziari e molte altre tra cui, le reti delle relazioni sociali.

Appare quindi evidente come siano proprio queste ultime alla base della progettazione ed attuazione di strategie finalizzate ad orientare il voto politico.

Per riassumere il significato e l’importanza dei big data e delle reti complesse, appare emblematico il messaggio comparso sulla pagina LinkedIn del data scientist Rayid Ghani, che attraverso la Società Edgeflip ha contribuito alla progettazione della campagna elettorale di Barack Obama nel 2012: “Siamo in cerca di data scientist esperti che vogliano fare la differenza. La campagna di Obama vedrà un ampliamento del team dedicato alla risoluzione di problemi di data mining su vasta scala e a forte impatto. Si presentano diverse opportunità di inserimento professionale a tutti i livelli di esperienza. Cerchiamo esperti di statistica, di apprendimento automatico, di text analytics e di analisi predittiva per lavorare su grandi volumi di dati e contribuire ad orientare la strategia elettorale”

La mobilitazione politica attraverso Facebook. Plasmando le notizie che gli elettori leggono attraverso i social network, è possibile manipolare il sistema politico? Per rispondere a questa domanda Facebook ha condotto, in collaborazione con ricercatori della University of California – ad insaputa degli elettori – un esperimento chiamato “megafono dell’elettore” (R. Bond et al., “61-million-experiment in Social Influence and Political Mobilization”, Nature, 2012): il quesito iniziale può essere meglio specificato:

  1. a) è possibile aumentare l’affluenza alle urne attraverso gli online social network?;
  2. b) possono, gli online social network, generare un “contagio sociale”?;
  3. c) se si, quanto “vale” questo effetto, tenendo presente che nei sistemi elettorali con i collegi uninominali un effetto, per quanto piccolo, può essere decisivo?

L’esperimento è consistito nel presentare due differenti messaggi agli elettori statunitensi che si sono collegati a Facebook il 2 Novembre 2010, giorno in cui si sono celebrate le elezioni di “medio termine” negli Stati Uniti d’America. In sintesi, la popolazione di elettori, in modo disgiunto, ha visualizzato un banner con l’indicazione di quante persone avevano votato sino a quel momento ovvero la stessa informazione con l’aggiunta del voto degli amici Facebook che avevano già votato. Infine, come gruppo di controllo, altri utenti Facebook non hanno visualizzato alcun banner “elettorale”. L’analisi dei dati raccolti, attraverso metodi di statistica multivariata e reti complesse ha evidenziato che il comportamento degli elettori è stato influenzato dai banner elettorali e in particolare l’affluenza alle urne del gruppo a cui è comparso il banner con il volto degli amici è stata maggiore. Questo effetto è stato tanto più marcato quanto più “stretti” erano gli amici i cui voti sono comparsi nel banner. . In sostanza, si è misurato in maniera scientificamente valida l’effetto dei legami sociali, dedotti attraverso le relazioni tra gli elettori tramite i social network, misurando quello che gli autori chiamano “contagio sociale”, rispetto alle elezioni politiche. E’ significativo chiedersi se la capacità di Facebook (o di altre piattoforme simili) di aumentare l’affluenza alle urne, possa essere utilizzata per spingere al voto prevalentemente gli elettori di una sola parte politica, posto che gli orientamenti politici di un generico utente Facebook sono, in linea di massima, chiaramente deducibili dalla notizie che pubblica e dai relativi commenti. Forse alcuni dei lettori avranno notato che l’esperimento appena descritto è stato condotto da Facebook anche in Italia in occasione delle votazioni politiche del 4 marzo 2018.

La “propaganda computazionale”. Se il contagio sociale si propaga attraverso i social network, non stupice che uno strumento di ampia diffusione, come Twitter, sia stato utilizzato massicciamente per diffondere notizie polarizzate politicamente, al fine di modificare la percezione della realtà dei cittadini e, in ultima analisi, influenzare il voto.

Lo studio “Polarization, Partisanship and Junk News Consumption over Social Media in the US” svolto dall’Oxford Internet Institute (oii.ox.ac.uk), nell’ambito del progetto “Computational Propaganda” ha esaminato, tramite l’analisi delle reti complesse, la struttura e i meccanismi di diffusione di notizie provenienti da circa 50.000 mila account Twitter “automatici”, riconducibili alla Russian Internet Research Agency, che hanno raggiunto circa 126 milioni di cittadini statunitensi nel periodo precedente alle elezioni presidenziali del 2016. Lo studio ha censito circa 100 siti di “junk news” ed ha identificato, tramite le relazioni di “following” e “follower” le comunità di utenti che condividevano le stesse notizie.

Nello studio, che presenta molte difficoltà di ordine tecnico e metodologico, sono stati analizzati circa 22 milioni di “tweets”, raccolti nel periodo 1-11 novembre 2016 (le elezioni si sono svolte l’8 novembre 2016) da siti etichettati come di “propaganda”, e oltre 13.000 account Twitter di membri del partito democratico e repubblicano con incarichi di governo e di loro “follower” filtrati in modo da includere solo gli utenti tra loro altamente connessi. L’insieme di account è stato suddiviso in dieci comunità, che includono utenti che condividono essenzialmente notizie locali, nazionali, di orientamento democratico o repubblicano, di movimenti progressisti, di supporto a Trump e di altre tipologie. L’analisi ha messo in evidenza che attraverso Twitter il gruppo “Trump supporters” ha diffuso una quantità di junk news maggiore di quella di tutti gli altri gruppi messi insieme. Il medesimo studio ha mostrato che su Facebook le pagine gestite dai gruppi di estrema destra hanno diffuso una quantità di junk news maggiore di quella di tutti gli altri gruppi messi insieme.

Conclusioni. “If we want to truly understand—and improve—our society, wellbeing and the world around us, it will be important to use these methods to identify which real world behaviours are amenable to online interventions”. L’obiettivo dichiarato della ricerca effettuata dal gruppo di data scientist di Facebook e della University of California era quello di migliorare la società ed il benessere identificando quali comportamenti nella vita reale dei cittadini possono essere modificati attraverso l’intervento delle piattaforme di social network. Gli esempi riportati lasciano comprendere che, in realtà, la potenza delle nuove tecnologie informatiche e in particolare la capacità di raccogliere, memorizzare ed analizzare Big Data fornisce un vantaggio importante in termini di capacità di indirizzare i consensi elettorali da parte di chi è in grado di disporne.

Schede e storico autori