Una piccola indagine statistica su me sul mio social-coso preferito, niente di speciale, solo un gioco. Ma c'è anche una cosa che mi stupisce, vediamo se indovinate.
A differenza di Facebook su Twitter non devi diventare amico di qualcuno per vedere i suoi cinguettii, sempre che il twittatore non abbia classificato la sua pagina come privata, cosa che fanno pochissimi.
In un momento di --come dire-- ho passato in rassegna i ~200 cinguettatori che seguo e ho rilevato per ognuno il numero di conoscenze comuni. Ci sono un paio che risultano seguiti da tanti:
45 Barack Obama
55 Spinoza
ma sono atipici; gli altri numeri sono molto più piccoli, ecco:
Ho gusti particolari, risultano per esempio diversi atipici che si affollano a zero follows senza avere cose in comune con i normali. Poi la distribuzione si regolarizza (compatibilmente con il campione piccolo).
Qualcuno è amico personale nel mondo reale; qualcuno non posta da tempo, forse ha abbandonato e trovato di meglio da fare, chissà.
Lo so che la distribuzione non è normale (gaussiana) e media e deviazione standard vanno prese con molta cautela (la seconda anzi non ha senso) ma non sono uno statisticistico, nèh!
La cosa che mi stupisce è che una volta raccolti i dati elaborarli e visualizzarli è immediato. È stato sufficiente uno script (programmino) Python di 24 righe, questo:
import numpy as np import matplotlib.pyplot as plt plt.style.use('seaborn-white') data = np.array([ 0, 10, 5, 4, 8, 0, 18, 3, 3, 3, 3, 4, 0, 7, 2, 2, 0, 2, 5, 6, 1, 10, 7, 4, 45, 0, 3, 0, 1, 0, 55, 0, 0, 29, 1, 19, 12, 1, 8, 0, 10, 18, 10, 6, 3, 6, 15, 7, 20, 5, 1, 7, 3, 20, 1, 10, 1, 1, 2, 10, 2, 10, 0, 1, 0, 3, 3, 4, 33, 2, 5, 19, 9, 20, 3, 1, 1, 2, 8, 4, 10, 1, 3, 4, 4, 3, 18, 6, 0, 4, 33, 4, 6, 5, 12, 6, 37, 3, 10, 19, 3, 10, 7, 5, 1, 1, 6, 7, 1, 7, 8, 14, 5, 0, 5, 1, 11, 0, 0, 18, 3, 15, 14, 3, 8, 12, 8, 5, 6, 6, 1, 3, 7, 11, 2, 3, 2, 0, 0, 16, 0, 8, 5, 7, 1, 10, 0, 2, 13, 6, 1, 8, 11, 10, 10, 8, 7, 9, 3, 0, 16, 4, 14, 23, 1, 29, 13, 0, 0, 23, 20, 31, 4, 6, 14, 12, 7, 16, 9, 4, 2, 3, 0, 24, 1, 1, 1, 15, 6, 9, 2, 22, 3, 23, 12, 14, 14, 29, 3, 32, 17, 14, 30, 31]) print(len(data)) # 204 print(data.mean(), data.std()) # 8.15 9.00 plt.hist(data, bins=51, normed=True, alpha=1, histtype='stepfilled', color='red', edgecolor='none'); plt.savefig("hist.png")
Quando ero giovane sarebbe stata un'operazione lunga (molto) e noiosa (altrettanto).
Nessun commento:
Posta un commento