Le tecniche di machine learning possono prevedere la viralità dei meme sui social media? Cosa rende virali i meme diffusi tramite i social media?
Una ricerca pubblicata pochi giorni fa su Applied Network Science ha utilizzato tecniche di machine learning (apprendimento automatico) per esaminare e prevedere il successo di un meme.
Siamo inondati da meme ma pochi di questi diventano effettivamente virali e non è oggettivamente chiaro quali siano le caratteristiche che lo fanno diventare virale.
I meme viaggiano tipicamente sotto forma di immagini e citazioni, possono esprimere umorismo, critica sociale o politica e attirare l’attenzione su temi culturali.
La ricerca effettuata da Kate Barnes, Tiernon Riesenmy, Minh Duc Trinh, Eli Lleshi, Nóra Balogh e Roland Molontay si è basata sull’analisi dei contenuti di ciò che rende un meme virale utilizzando tecniche avanzate di machine learning.
Sono stati raccolti 129.326 meme di immagini con testo pubblicate su Reddit dall’inizio dell’epidemia di coronavirus globale e sono stati classificati tramite una variabile target, che è dank se un meme è nel 5% superiore del numero di upvote diviso per il numero di iscritti a un subreddit, e non dank (0) in caso contrario.
Dopo le fasi di pulizia dei dati e l’analisi esplicativa, la ricerca ha utilizzato l’analisi del testo e il riconoscimento ottico dei caratteri per indagare sulla relazione tra attributi testuali e popolarità.
Questo è il cloud word ricavato dalle parole raccolte all’interno dei meme e indica che alcuni argomenti sono stati particolarmente prevalenti a partire da fine marzo 2020.
L’analisi ha evidenziato che, nella maggior parte dei casi, le parole più ricorrenti sono altrettanto prevalenti nei meme virali del 5% superiore come nei meme non virali, ad eccezione dei sinonimi della categoria COVID-19 che apparivano più frequentemente nei dank meme.
Sorprendentemente, non è ovvio se gli attributi relativi all’immagine o testuali abbiano una capacità di prevedere maggiormente il successo del meme.
Nella ricerca sono stati anche analizzati attributi di immagine come il colore del contenuto, la tonalità, la saturazione, ecc. Oltre a questo sono stati analizzati gli attributi delle immagini usati per descrivere il significato semantico presente nelle immagini.
Sono stati utilizzati tre modelli di apprendimento supervisionato per prevedere se i meme rientrassero nelle categorie dank o meno: aumento del gradiente, random forest e convolutional neural network.
Leggi la ricerca completa “Dank or not? Analyzing and predicting the popularity of memes on Reddit”.
Altri articoli che potrebbero interessarti:
Commenti