mercoledì 1 novembre 2017

Le Statistiche del Lotto


Le Statistiche del Lotto
©.Il Fisico
.
.1 - Teoria della colonna dei ritardi
.
Per rappresentare l’ultimo ritardo dei 90 numeri di una ruota si utilizza spesso la cosiddetta "colonna dei ritardi". Essa viene costruita nel seguente modo : in una prima riga, in basso, si scrivono i 5 numeri usciti nell’ultima estrazione ; in una seconda riga sovrastante si scrivono i numeri usciti nell’estrazione precedente ; nella terza riga immediatamente superiore si riportano i numeri usciti nella terzultima estrazione precedente e cosi via si precede verso l’alto avendo cura, ogni volta che si scrive l’estrazione sovrastante di cancellare i numeri già registrati nella righe inferiori ; la procedura va avanti finché tutti i 90 numeri risultano presenti una sola volta, collocati in una delle righe della colonna. Nell’esempio parziale sottostante le righe sono numerate con un indice n che va da 1 fino ad un massimo norelativo all’ultimo dei 90 numeri (chiaramente il più ritardatario).
n=no......67..(Ultimo ritardatario)
..........
..........
n=n42..4....(sono rimasti ancora due numeri)
..........
..........
n=4713011189(quartultima estrazione)
n=324..19..32(terzultima estrazione)
n=24517..6552(penultima estrazione)
n=11221379014(ultima estrazione)
L’aggiornamento della colonna è semplice : a) si spostano i numeri di ciascuna riga a quella successiva ; b) si introducono i numeri della nuova estrazione nella riga n=1rimasta vuota ; c) si cancella ognuno dei cinque numeri nuovi estratti nelle righe superiori (si formano così nuovi 5vuoti).
La colonna dei ritardi è un potente strumento (ovviamente non l’unico) utilizzabile per la costruzione di statistiche utili per le previsioni ; pertanto ogni giocatore dovrebbe sempre avere sottomano l’insieme delle dieci colonne dei ritardi di ciascuna ruota (detto "il tabellone dei ritardi" e in gergo "TURT" - Tabellone dell’Ultimo RiTardo). Esistono dei programmi molto semplici per computer che consentono al giocatore di poter visionare e aggiornare il TURT ad ogni estrazione. Loctronics può fornire a chi ne fa richiesta il relativo dischetto.
Data l’importanza del TURT (per la costruzione di molte statistiche che esamineremo in note successive), approfondiamo in questa nota il significato della colonna dei ritardi. La prima osservazione da fare è che l’indice n, che numera le estrazioni pregresse a cominciare dall’ultima, coincide con il ritardo RT del numero. Pertanto si deve porreRT=n. In verità , non si sa bene per quale motivo molti usano scrivere RT=0 per n=1 (diminuendo di una unità tutti i ritardi). Anche se la cosa non ha importanza pratica (ma può ingenerare confusione) è bene convincersi che ciò è errato. Allo scopo si deve ricordare che il Lotto è un gioco di tipo "bernoulliano" cioè di prove ripetute (ovvero di estrazioni !) aventi tutte la stessa probabilità p di successo, mentre quella di insuccesso è indicata con q, dato da q=1-p( nel nostro caso, riferendoci al semplice estratto, si hap=1/18 e q=17/18). In un qualsiasi esperimento bernoulliano si comincia con una prima prova, seguita da una seconda, da una terza e così via fino all’infinito, considerando tutte le prove come un tutt’uno, e ci si chiede quale sia la probabilità pn che un numero sia estratto alla n-esima prova.
A titolo esemplificativo prendiamo il numero 12 (che appare in basso a sinistra nell’esempio dato) e immaginiamo di vederlo spostare ad ogni estrazione nella riga immediatamente superiore ; allora la teoria di Bernoulli di dice che la probabilità pn che il numero cada (esca) alla n-esima estrazione è pn=p.q(n-1). In pratica si può immaginare lo schema :
prova1 2 3 4 ...... n ...
probabilitàp1 p2 p3 p4 ....... p...
(ovvero)p p.q p.q2 p.q3.... p.q(n-1)
E’ facile verificare (vedere Appendice) che la somma P di tutti i pn (con nda 1 a infinito) è uguale all’unità , ovvero la serie pn è unadistribuzione di probabilità ( il fatto che la somma è uguale all’unità ci dice che l’evento deve prima o poi avverarsi per un n qualsiasi). Ora, quando noi effettuiamo il primo colpo (estrazione), cioè vogliamo applicare p1, il nostro numero giace già nella colonna dei ritardi dall’ultima estrazione precedente, per cui esso si trova al primo ritardo della nostra prova cioè al ritardo RT=1 (tant’è vero che può risultare immediatamente ri-estratto ).
Nel discutere del primo valore del ritardo si è di fatto considerato anche il significato della riga n : essa ci consente di dire immediatamente la probabilità pn di caduta (di estrazione) di un numero alla n-esima prova. In altre parole la serie pn è una distribuzione di "probabilità di caduta" o di successo. E’ facile rendersi conto che pn decresce continuamente al crescere di n ; ogni termine è minore del precedente per il fattore q ; quindi il valore maggiore si ha per n=1 p1=p) . Si osservi anche, che per n grande la probabilità diventa piccolissima ma non è mai uguale a zero ; da ciò una sicura conclusione : non esiste un limite teoricomassimo per l’uscita di un numero perché n va fino all’infinito (torneremo sull’argomento dal punto di vista pratico in una nota successiva).
E’ possibile, in alternativa, costruire una seconda serie numerica basata su q (cioè sulla probabilità di insuccesso). Se indichiamo con qn il termine generico di questa serie, esso ci dovrà dare la probabilità che un numero sia ancora "in piedi" (cioè non sia stato ancora estratto) prima di effettuare il colpo e quindi lo si trovi registrato nel tabellone al ritardoRT=n. Perché ciò accada devono essere andati a vuoto gli (n-1) colpi precedenti ; pertanto è necessario moltiplicare (n-1) volte il fattore qottenendo:q= q(n-1)
Si noti che per n=1 si ha q1= 1 (qualunque numero diverso da zero elevato a zero è uguale ad 1) ; infatti, per tornare all’esempio precedente il numero 12 è già li che aspetta di essere sottoposto alla prima prova.
La serie qn non è però una distribuzione di probabilità. Infatti è facile fare la somma Q di tutti i termini   (vedere Appendice) ottenendo:
Q = 1 + q + q2 +.. = 1/(1-q) = 1/p
cioè l’inverso della probabilità . Nel nostro caso, essendo 1/p=18 si haQ=18 e non sfuggirà al lettore che 18 è un quinto di 90. Ciò significa che se moltiplichiamo la serie Q per 5, considerando i cinque numeri iniziali insieme, si ottiene 90, cioè il totale dei numeri in gioco. In altre parole, la serie qn non è una distribuzione di probabilità ma rappresenta una distribuzione statistica : essa ci dice (moltiplicata per 5) quanti dei 90numeri sono (teoricamente) presenti nella riga al ritardo RT=n. Cioè la statistica Q è una "statistica di presenza". Come tale essa ha grandi applicazioni nello studio del Lotto come vedremo nelle note successive.
(Il fisico)

APPENDICE
Proprietà della serie geometrica
Il termine generico n della serie geometrica è dato da Xn conn intero che va da zero a infinito, mentre per X assumiamo che sia un numero positivo minore di 1. In tal caso in Analisi si dimostra che la somma G della serie è data da :
G = 1 +X +X2 +X3 ..+Xn .. = 1/(1-X)
Per calcolare la somma P del testo si pone in evidenza p e si ottiene :
P = p + p.q + p.q2 ..+ p.q(n-1) +.. = p .( 1 +q+ q2.. q(n-1) +..) =  p.(1/(1-q)) = p.(1/p )= 1
avendo identificato q con la X della serie G e ricordando che essendo q= 1- p è pure p=1-q.Per calcolare la somma Q del testo basta osservare che essa coincide proprio con la serie geometrica.


Nessun commento:

Posta un commento