Sentiment analysis e big data sostituiscono i sondaggi politici
La sentiment analysis e i big data possono essere utilizzati per costruire modelli di analisi predittiva e sostituire o verificare le informazioni provenienti dai classici sondaggi politici ed elettorali.
Sono molteplici le modalità di costruzione di un modello predittivo dei risultati elettorali basato sui big data. Un esempio ci viene fornito da RavenPack, una piattaforma di analisi di big data specializzata su proiezioni e analisi rispetto alle elezioni.
L’approccio big data per le elezioni utilizza la sentiment analysis su una serie di informazioni pubbliche quali le notizie ma anche le informazioni disponibili sul candidato e sulla sua presenza pubblica. Questo tipo di analisi include anche gli schemi storici del voto e la misurazione dell’attenzione dei media ricevuta da ciascun candidato.
Nel caso di RavenPack, il modello, costruito dal suo team di Data Science, ha correttamente previsto il candidato vincitore in quattro delle ultime cinque elezioni presidenziali degli Stati Uniti, con una livello di affidabilità superiore al 75%.
Il coefficiente di attenzione dei media
Uno degli elementi valutati è il coefficiente di attenzione dei media che si basa sulla quota relativa dell’esposizione dei media per i diversi candidati. Già in passato, utilizzando anche strumenti semplici come Google Trends, si è scoperto come siano molte le correlazioni con il risultato finale che è possibile ottenere.
Il punteggio della sentiment analysis del candidato
Un’indicatore fondamentale è quello relativo al punteggio (score) derivante dalla sentiment analyisis effettuata su ogni candidato. Questo punteggio viene calcolato non solo sulle notizie ma anche su eventi, posizioni politiche dei candidati e informazioni relative alla loro vita privata. Non si parla di intelligence su dati privati ma di analisi di dati disponibili tramite fonti aperte (Open Source Analysis). Questo aspetto è particolarmente importante soprattutto per comprendere il comportamento degli elettori indecisi che scelgono il candidato o il partito in base a informazioni di tipo “emotivo”.
Punteggio del sentiment storico
Un altro parametro, importante per fornire una baseline per la valutazione si basa sull’analisi e sull’aggregazione del sentiment derivato da eventi di notizie socio-economiche dal recente passato. Questo parametro è fondamentale per determinare il livello di soddisfazione degli elettori rispetto al passato.
La costruzione del modello dei risultati previsti
Il modello di previsione può basarsi su logiche di vario tipo. Una di esse è quella che si basa sul principio secondo il quale un risultato elettorale futuro non sarà del tutto dissimile al risultato elettorale precedente, pesando un margine di variabilità che dipende dall’esposizione e dal sentiment nei confronti di candidati e partiti.
Un modello di previsione può essere costruito basandosi anche su simulazioni, migliaia di simulazioni, che usano scenari diversi di analisi per valutare i risultati ottenibili e poi analizzarli tramite curve di distribuzione che evidenziano tendenze e probabilità.
Leggi altri articoli nella sezione Algoritmi, Big Data e Data Science pubblicati su Affari Politici.
Commenti