Indice di popolarità
Fa un po' ridere (e un po' piangere per la banalità), ma in questa uggiosa domenica di Febbraio è il meglio che posso inventare.
Prefazione
Semplice semplice, perché non tirar fuori un numero che possa rappresentare il voto per un pacchetto, cioè un programma specifico? Le votazioni si fanno su tutto o quasi, e, se non si vogliono stabilire troppi parametri per dare un numero ad un programma, scegliamo allora il voto della massa. Che cos'è? È quello che si ottiene facendo una media dei gusti degli utenti che utilizzano quel programma rispetto all'insieme dei programmi installati sulle loro macchine. Tutto sarà anonimo, automatizzato, semplice più che mai: il risultato sarà un numero da 1 a 100, quello che chiamo l'Indice Di Popolarità™ (d'ora innanzi IDP™)
Azione
attachment:andamento.png BR I dati provengono dall'[http://popcon.ubuntu.com Ubuntu popularity contest] d'ora innanzi chiamato popcon, progetto che si occupa di elaborare in loco i dati relativi all'accesso settimanale dei pacchetti installati, e una volta inviati ad un server centrale di analizzare i campioni ricevuti. Anche se non propriamente (o non ancora) molto affidabili i campioni (ad oggi ~9400) si riferiscono (o almeno il sottoscritto spera che non siano dati forgiati ad-hoc da qualche zuzzurellone) a dati di utenti concreti che hanno installato, aggiornato, utilizzato pacchetti. Questi dati di default vengono inviati al server popcon.ubuntu.com una volta a settimana (tramite un crontab settato la domenica mattina). Nelle ultime due settimane i campioni stanno lievitando con incrementi ragguardevoli. Stiamo a vedere se è una questione di passaparola*.BR Voto BR I dati ci sono, pochi o tanti che siano (e ammesso che non siano di fantasia): il dato che più mi interessa tra quelli figuranti nelle statistiche del popcon è il cosiddetto voto.BRBR Voto: definizioneBR dal [http://popcon.ubuntu.com sito del popcon] {{{voto: numero di persone che usano il pacchetto regolarmente }}} dalla FAQ ([file:///usr/share/doc/popularity-contest/FAQ /usr/share/doc/popularity-contest/FAQ])
Un computer vota per un pacchetto se, secondo i dati raccolti nel rapporto (inviato dal computer verso il server che raccoglie le statistiche), un programma facente parte o strettamente dipendente dal pacchetto è stato usato in un lasso di tempo inferiore ai 30 giorni. Il computo viene effettuato lato server.
Graduatorie BR Ora che sappiamo cosa rappresenta in concreto un voto, dobbiamo anche sapere che le statistiche sono stilate in due tipi principali di graduatorie:
globale
di categoria
La globale ovviamente comprende l'insieme di *tutti* i pacchetti coperti dai dati statistici, non propriamente tutti i pacchetti reperibili per Ubuntu, ma circa.BR Quella di categoria comprende, invece, solo i pacchetti che fanno parte di una particolare sezione, che cioé hanno cioè un preciso utilizzo. Le categorie attualmente utilizzate su Ubuntu sono: admin, kde, python, comm, libdevel, science, devel, libs, doc, mail e molte altre. Vista la particolarità della graduatoria di categoria, è facilmente intuibile che di per sè sarà più competitiva (il pacchetto verrà equiparato a suoi 'simili'), ma al contempo, non terrà conto della globalità del software disponibile sulla distribuzione.BR Questa generica considerazione mi ha portato a considerarle entrambe nel ricavare l'IDP. BR Se è così allora l'IDP può essere rappresentato dalla media semplice (aritmetica) delle due graduatorie:BR
(1) ( voto Globale + voto di Categoria ) diviso 2.
BR Ma da cosa scaturiscono in pratica voto Globale e voto di Categoria? Prendiamo il Globale, la sua graduatoria consiste in una lista ordinata per voto decrescente e posizione assoluta crescente (voto + alto, n°1 in graduatoria, via via fino a voto + basso, ultima posizione in graduatoria). Nella graduatoria isoliamo i dati essenziali: sono posizione, numero dei pacchetti totale (che coincide con l'ultima posizione in graduatoria). BR Il voto globale, espresso in forma percentuale può essere dato da: BR
(2) ( totale - posizione ) diviso totale per 100.
BR Nella stessa misura si trova il voto di Categoria applicando il dato totale ed il dato posizione relativi alla categoria di appartenenza del pacchetto, in esame. BR========================================BR Ricapitolando BR
L'IDP si calcola come (1) (voto Globale + voto di Categoria) / 2
Il voto Globale sarà dato da (2) (totale G - posizione G) / totale G * 100
Il voto di Categoria similmente sarà dato da (2) (totale C - posizione C) / totale C * 100
BRBR Formula BR Sostituendo e semplificando si avrà:
IDP = (vG + cG) / 2 = [(tG - pG) / tG * 100 + (tC - pC) / tC * 100] / 2 = {[(tG - pG) / tG + (tC - pC) / tC]*100} / 2 =
= [(tG - pG) / tG + (tC - pC) / tC] * 100 / 2 = [(tG - pG) / tG + (tC - pC) / tC] * 50 BR
=== ===