sabato 6 maggio 2017

Cinguettatori in comune su Twitter


Una piccola indagine statistica su me sul mio social-coso preferito, niente di speciale, solo un gioco. Ma c'è anche una cosa che mi stupisce, vediamo se indovinate.

A differenza di Facebook su Twitter non devi diventare amico di qualcuno per vedere i suoi cinguettii, sempre che il twittatore non abbia classificato la sua pagina come privata, cosa che fanno pochissimi.
In un momento di --come dire-- ho passato in rassegna i ~200 cinguettatori che seguo e ho rilevato per ognuno il numero di conoscenze comuni. Ci sono un paio che risultano seguiti da tanti:

45 Barack Obama
55 Spinoza

ma sono atipici; gli altri numeri sono molto più piccoli, ecco:


Ho gusti particolari, risultano per esempio diversi atipici che si affollano a zero follows senza avere cose in comune con i normali. Poi la distribuzione si regolarizza (compatibilmente con il campione piccolo).

Qualcuno è amico personale nel mondo reale; qualcuno non posta da tempo, forse ha abbandonato e trovato di meglio da fare, chissà.
Lo so che la distribuzione non è normale (gaussiana) e media e deviazione standard vanno prese con molta cautela (la seconda anzi non ha senso) ma non sono uno statisticistico, nèh!

La cosa che mi stupisce è che una volta raccolti i dati elaborarli e visualizzarli è immediato. È stato sufficiente uno script (programmino) Python di 24 righe, questo:


import numpy as np
import matplotlib.pyplot as plt
plt.style.use('seaborn-white')

data = np.array([
0, 10, 5, 4, 8, 0, 18, 3, 3, 3, 3, 4, 0, 7, 2, 2, 0, 2, 5, 6, 1, 10, 7, 4,
45, 0, 3, 0, 1, 0, 55, 0, 0, 29, 1, 19, 12, 1, 8, 0, 10, 18, 10, 6,
3, 6, 15, 7, 20, 5, 1, 7, 3, 20, 1, 10, 1, 1, 2, 10, 2, 10, 0, 1, 0,
3, 3, 4, 33, 2, 5, 19, 9, 20, 3, 1, 1, 2, 8, 4, 10, 1,
3, 4, 4, 3, 18, 6, 0, 4, 33, 4, 6, 5, 12, 6, 37, 3, 10, 19, 3,
10, 7, 5, 1, 1, 6, 7, 1, 7, 8, 14, 5, 0, 5, 1, 11, 0, 0, 18,
3, 15, 14, 3, 8, 12, 8, 5, 6, 6, 1, 3, 7, 11, 2, 3, 2, 0,
0, 16, 0, 8, 5, 7, 1, 10, 0, 2, 13, 6, 1, 8, 11, 10, 10, 8, 7,
9, 3, 0, 16, 4, 14, 23, 1, 29, 13, 0, 0, 23, 20, 31, 4, 6, 14, 12, 7, 16,
9, 4, 2, 3, 0, 24, 1, 1, 1, 15, 6, 9, 2, 22, 3, 23, 12, 14, 14, 29,
3, 32, 17, 14, 30, 31])

print(len(data))                    # 204
print(data.mean(), data.std())      # 8.15 9.00

plt.hist(data, bins=51, normed=True, alpha=1,
         histtype='stepfilled', color='red',
         edgecolor='none');
plt.savefig("hist.png")


Quando ero giovane sarebbe stata un'operazione lunga (molto) e noiosa (altrettanto).

Nessun commento:

Posta un commento