Algoritmi, Big Data e Data ScienceCina

La censura del Gran Firewall Cinese: 4 punti critici

0

censura del Gran Firewall Cinese punti critici

Uno studio sul funzionamento della censura digitale in Cina e in particolare sul Gran Firewall Cinese.

Lo studio analizza come il Great Firewall of China (GFW) impedisce ai cittadini cinesi di accedere a contenuti online ritenuti discutibili dal governo cinese e illustra come l’elenco di parole censurate cambi nel tempo.

Lo studio si chiama “Chinese Wall or Swiss Cheese? Keyword filtering in the Great Firewall of China” e i suoi autori sono “Raymond Rambert”, Zachary Weinberg (University of Massachusetts), Diogo Barradas (Universidade de Lisboa) e Nicolas Christin (Carnegie Mellon University).

Abbiamo indicato tra virgolette il nome Raymond Rambert in quanto si tratta di uno pseudonimo per mascherare la vera identità dell’autore. Qualcuno ricorderà che Raymond Rambert è uno dei personaggi del romanzo di Albert Camus “La peste”. Nel romanzo Rambert è un giornalista parigino che cerca in ogni modo di scappare dalla città dove infuria la peste per tornare dalla donna amata: alla fine abbandona l’idea di fuga per aiutare Rieux, il medico che lotta contro la malattia.

Lo studio analizza il modo con cui il Gran Firewall Cinese impedisce ai cittadini cinesi di accedere a contenuti online ritenuti discutibili dal governo cinese e illustra come l’elenco di parole vietate cambi nel tempo. Rispetto al 2014 risulta infatti che oltre l’85% delle parole chiave proibite è cambiato e le nuove parole chiave censurate si riferiscono ad eventi e controversie recenti. Risulta inoltre che l’elenco delle parole chiave censurate dal Great Firewall of China non venga mantenuto in sincronia con le blocklist utilizzate dai client di chat cinesi.

Lo studio riporta che ora esistono due sottoliste di parole chiave censurate: una lista più breve che viene censurata incondizionatamente e un elenco più lungo che viene censurato solo quando anche la parola “ricerca” appare nella richiesta. Solo 78 delle 451 parole chiave raccolte da Xia Chu nel 2014 (Complete GFW Rulebook for Wikipedia Plus Comprehensive List for Websites, IPs, IMDB and AppStore) appaiono ancora costantemente censurate.

Le parole chiave che sono rimaste nell’elenco fanno riferimento ad
argomenti perennemente sensibili in Cina, come il software per evitare la censura, le Manifestazioni in piazza Tienanmen e le fonti di propaganda straniera. Le parole chiave rimosse si riferiscono ad argomenti il cui livello di sensibilità  è diminuito con il tempo mentre le nuove parole chiave si riferiscono ad argomenti sensibili recenti (ad esempio COVID-19).

tienanmen strage

©ap/lapresse
archivio storico
politica
Pechino 5-06-1989
Massacro di piazza Tienanmen
nella foto: Wang Weilin, lo studente che fermò i carri armati in piazza Tienanmen e venne poi ucciso insieme ad altri manifestanti
A Chinese protestor blocks a line of tanks heading east on Beijing’s Cangan Blvd. June 5, 1989 in front of the Beijing Hotel. The man, calling for an end to the violence and bloodshed against pro-democracy demonstrators, was pulled away by bystanders, and the tanks continued on their way. (AP Photo/Jeff Widener)

Nel complesso risulta che solo l’8% delle parole chiave censurate dai client di chat sono censurate anche dall’ispezione dei pacchetti fatta dal firewall e questo  suggerisce che le chat e gli elenchi di blocco dei pacchetti vengano mantenuti
indipendentemente e non sincronizzate.

Lo studio non ha osservato alcuna censura del traffico all’interno della
Cina continentale e nessuna censura del traffico tra Hong Kong e gli host
fuori dalla Cina continentale.

Un’aspetto molto interessante dello studio riguarda l’esistenza di un “periodo di punizione” (penalty box), come era stato già riportato da altri studi. Il periodo di punizione funziona in questo modo: durante un periodo di 90 secondi dopo un flusso TCP che è stato interrotto dalla censura, tutte le richieste inviate dallo stesso client allo stesso server avranno anche una probabilità del 50-75% di essere bloccate anche se non contengono parole chiave censurate.

Lo studio ha infine identificato il grande firewall cinese come un complesso solido, ma pieno di buchi. Alcuni di questi buchi possono derivare da errori o difficoltà di comunicazione tra i diversi gruppi responsabili degli aspetti gestionali del GFW.
Altri possono essere dovuti all’aver effettuato compromessi tra la complessità di implementazione e l’utilità per il censore.

I 4 punti critici della censura fatta tramite il gran firewall cinese

Sono emersi 4 punti critici:

1 – La censura delle parole chiave dipende dal tempo.

Alcuni argomenti sembrano essere banditi in modo permanente, ma l’elenco di parole chiave censurate dalla Cina è continuamente rivisto, con riferimenti a fatti di cronaca e controversie recenti. Questo significa che l’elenco delle parole censurate può anche essere visto come uno specchio delle preoccupazioni politiche del regime cinese e per questo è estremamente importante per i ricercatori montirore continuativamente i termini sensibili noti e scoprire quali vengono aggiunti.

2 – La censura delle parole chiave dipende dal contesto.

Il Gran Firewall Cinese tiene conto del contesto: la posizione all’interno di una richiesta HTTP è importante e alcune parole chiave vengono censurate solo in presenza della parola “ricerca”.

Questo potrebbe essere un modo per limitare la quantità di risorse di elaborazione richieste per l’ispezione dei pacchetti di dati. Questo può inoltre significare che la censura delle parole chiave venga utilizzata come complemento alla censura basata sul blocco di DNS e IP di interi siti.

3 – La censura delle parole chiave dipende dal percorso.

I ricercatori sono rimasti sorpresi dall’aver verificato che non c’è censura del traffico all’interno della Cina continentale. Questo contraddice
risultati di ricerche precedenti e potrebbe significare che le operazioni del Gran Firewall Cinese siano diventate più centralizzate nel tempo.

Sembra infatti che il traffico in entrata in Cina venga censurato più severamente del traffico in uscita dalla Cina e questo pone dubbi sul fatto che gli esperimenti svolti tramite client al di fuori della Cina riescano a replicare accuratamente l’esperienza degli utenti internet cinesi.
Lo studio ha riscontrato livelli diversi di censura a seconda della fonte
e della destinazione delle interrogazioni, tuttavia senza correlazione con la geografia interna alla Cina. Secondo questi risultati le variazioni nella censura dipenderebbero dalle rotte seguite dal traffico, non dall’effettiva ubicazione dell’host straniero.

4 – La censura delle parole chiave dipende dal protocollo.

Il Gran Firewall Cinese ignora alcune parole chiave inviate su telnet e su IRC anche se reagisce a richieste HTTP. Questo potrebbe significare che i censori pensano
non valga la pena censurare questi protocolli meno utilizzati.
Potrebbe anche significare che l’elenco delle parole chiave censurate sia diverso
o che lo studio non abbia scoperto i contesti a livello di protocollo in cui
queste parole chiave sarebbero censurate.
Gli esperimenti effettuati hanno infine anche rivelato che il Gran Firewall Cinese censura il traffico inviato tramite IPv6, ma non è stato possibile testarlo esaustivamente a causa della disponibilità limitata di hosting compatibili con il protocollo v6.

Lo studio integrale è disponibile sul sito della Carnegie Mellon University.


Altri articoli che potrebbero interessarti:

Tattiche e Tecniche di Disinformazione cinesi sui social media

La guerra dei dati: USA, Cina, Russia e UE

Investire con i consigli sui social media

Articolo precedente

Articoli che possono interessarti

Commenti

I commenti sono chiusi.