mercoledì 1 novembre 2017

Le Statistiche del Lotto
©.Il Fisico
.

.3- Le statistiche integrali di "presenza" DT, WT E BT
.
Nella nota precedente è stata esaminata la statistica di presenza
1) XT = N.q(R-1) R=1 ; 2 ; 3...
con q=17/18 (si ricordi q=1-p essendo p= 1/18 la probabilità di estrazione di un numero). Di fatto essa ci dice quanti di N numeri iniziali sono ancora in piedi (non sono cioè ancora stati estratti) dopo R-1 estrazioni per cui sono ancora presenti al ritardo R (dove possono cadere).
E’ stato altresì visto come la 1) può dare immediatamente luogo a tre statistiche teoriche di presenza LTNT e PTdove N è rispettivamente 5; 50 e 10. Queste statistiche si sono rivelate utili per calcolare alcune aspettabilità parziali (ALAN e AP che sono tra le più semplici fra quelle impiegate nel programma GDS33, su questo sito).
In questa nota estendiamo le applicazioni della 1) supponendo di essere al ritardo R e di sommare tutti i termini dall’ R-esimo termine (compreso) in poi. Il valore risultante SXT ci dirà quanti numeri saranno presenti dal ritardo R (compreso) fino all’infinito. Facendo uso della proprietà della serie geometrica (vedere Appendice nella prima nota di questa serie) si dimostra facilmente che è:
2) SXT = N.q(R-1)/p ( da R a infinito)
Come si vede la 2) è identica alla 1) salvo per il fattore 1/p.Anche la 2) dà origine a varie statistiche, che per la loro origine possono essere dette integrali. La prima si ottiene applicando la 2) alla descrizione della colonna dei ritardi (cfr. il primo articolo), ponendo N=5 e p=1/18. Indicando tale statistica con DT si ha:
3) DT = 90. q(R-1) (da R=1 ; 2 ; 3.. a infinito)
Come si vede per R=1 si ottiene 90 : il totale dei 90 numeri. Se poniamo DT=1 e invertiamo la formula si ottiene facilmente R=1+ log(90)/log(1/q)= 79,72 =80 che è definito ritardo normale del singolo numero (ciò perché aR=80 ci aspettiamo di trovare l’ultimo dei 90 numeri); analogamente se ripetessimo i calcoli per DT=2; DT=3 ecc. troveremmo la sequenza ideale di presenza.
La seconda statistica, indicata con WT, si ottiene prendendo in considerazione non l’intera colonna dei ritardi ma solo una delle 5 sotto-colonne che la costituiscono. In tal caso è evidentemente N=1 mentre p rimane inalterato. Pertanto si ha:
4) WT = 18. q(R-1) (da R=1 ; 2 ; 3... a infinito)
che per R=1 dà WT=18=90/5. In effetti ci attendiamo che i 90 numeri si ripartiscano in modo uguale fra le 5 posizioni (sottocolonne).
La terza statistica, denominata BT, ha un’origine alquanto diversa. Prefissiamo uno qualsiasi dei 90 numeri, che d’ora per maggiore chiarezza, denomineremo "lottroni" (dal momento che la parola numero ha un significato più generale). Scegliamo ad esempio il lottrone 7 e andiamo a vedere quali ritardi esso ha sulle 10 ruote. Per avere la statistica teorica si deve dividere la 3) per 90: tanti essendo i lottroni di una ruota, e quindi moltiplicare per 10, tante essendo le ruote diverse:
5) BT = 10. q(R-1) (da R=1 ; 2 ; 3... a infinito)
In altre parole questa statistica ci dice su quante ruote il lottrone prefissato è presente dal ritardo R compreso in poi. Ovviamente si hanno 90 statistiche BT diverse.
Come già rilevato per i casi presentati nella nota precedente, anche le statistiche reali presentate in questa nota, e denominate rispettivamente DRWR e BR, sono immediatamente deducibili dalle colonne dei ritardi. Per DRbasta contare quanti lottroni sono ancora presenti in una colonna dei ritardi da R compreso in poi. Per WR si deve prima prefissare la posizione (o sottocolonna) di una ruota e contare come sopra. Ovviamente si hanno 5 possibilità diverse per ciascuna ruota. Per BR si deve selezionare prima uno dei 90 lottroni e quindi, fissato R, contare in quante ruote il ritardo del lottrone è superiore o uguale a R. Ovviamente si hanno 90 statistiche diverse, una per ogni lottrone.
Anche per queste statistiche si possono ottenere le corrispondenti aspettabilità parziali (Apz) ADAW e AB con la nota formula:
6) AX = XR / (XR + XT)
dove X sta per DBil valore ottenuto dell’aspettabilità parziale va attribuito solo ai lottroni al ritardo R (perché come sono distribuiti i lottroni con ritardo superiore non ha alcuna importanza: conta solo il loro numero).
Anche queste 3 Apz sono tra quelle più semplici utilizzate nel calcolo delle previsioni fatte col metodo GDS33 che appare dopo ogni estrazione su questo sito.
Chiudiamo con una curiosità relativa alle Apz derivate da queste statistiche integrali. Limitandoci a fissare l’attenzione su AD, supponiamo che una ruota abbia per gli ultimi quattro ritardatari i ritardi 74; 91 ; 93 e 100 (chiaramente vi è un addensamento in coda). Allora DRassume i valori 4; 3; 2 e 1 rispettivamente per R=74; 91; 93 e 100. Si ottiene allora facilmente la seguente tabella utilizzando la 3) per calcolare DT e la 6) per calcolare AD:

RDRDTAD
10010,3140,761
9320,4680,810
9130,5250,851
7441,3870,743
Come si vede il valore massimo dell’Apz non si osserva per il massimo lottrone ritardatario ma per uno dei successivi: poiché vi è un accumulo di lottroni ai grandi ritardi, è come se quelli che sono in coda in modo troppo ravvicinato, avessero difficoltà a procedere perché le posizioni successive sono occupate da altri lottroni ritardatari.

Il fisico


Le Statistiche del Lotto
©.Il Fisico
.

.2 - Le statistiche di presenza LT, NT e PT
.


Nella nota precedente è stato visto che la serie geometrica con il termine generale dato da q= N.q(n-1) (dove n=1 ; 2 ; 3... e intero positivo) è di grande interesse per il gioco del Lotto. Infatti se si assume per la probabilità di non-successo (per l’estrazione di un numero su una ruota) il valore q=17/18 (essendo p=1/18 la probabilità di successo) e se N rappresenta il gruppo di numeri preso in esame, e se, infine, n viene identificato con il ritardo R, la serie rappresenta una statistica teorica di presenza, nel senso che ogni termine ci dice quanti degli N numeri iniziali (presenti per R=1) non sono ancora stati estratti dopo (R-1) estrazioni e possono quindi cadere alla R-esima estrazione.
In termini generali, lasciando indeterminato N tale statistica teorica XT si può
scrivere :
(1) XT = N.q(R-1)R=1 ; 2 ; 3...
ed essere applicata a vari casi di interesse pratico, specificando il particolare valore iniziale del processo che ci interessa studiare. Nelle applicazioni che presenteremo in questa e in note successive, la lettera X del simbolo sarà sostituita da un’altra lettera convenzionale mentre la letteraT rimarrà sempre presente per indicare che si tratta di una statistica teorica, basata sulla teoria della probabilità.
La prima applicazione, molto nota, è proprio quella già descritta nella nota precedente con N=5 ; in tal caso la statistica, che si usa indicare con LT, esprime, come avevamo visto, la colonna dei ritardi di una ruota e ci dice quanti dei 5 numeri estratti ad una certa data ci attendiamo che siano ancora in piedi (cioè presenti) al ritardo R.
Una seconda facile applicazione si ottiene considerandoglobalmente le 10 ruote assumendo quindi per N il valore 50 (eventuali numeri comuni a due o più ruote vanno considerati indipendenti fra loro). In questo caso la statistica è convenzionalmente indicata con NT e ci dice quanti dei 50 numeri estratti ad una certa data saranno teoricamente ancora in piedi al ritardo sull’insieme delle 10 colonne dei ritardi.
Una terza applicazione, meno nota delle precedenti, fu ideata alcuni anno or sono da Gino Pinna (cfr.Lotto Gazzetta , febbraio 1995 ) ponendo N=10 ; in questo caso la statistica, indicata con PT, si riferisce ancora alle dieci ruote ma ipotizza che si sia selezionata preventivamente una tra le cinque posizioni di estrazione dei numeri su una ruota (primo estratto, secondo estratto ecc. ). Se si sceglie ad esempio la prima posizione, PT ci dice quanti dei 10 numeri in prima posizione ad una certa data sono ancora in piedi, secondo la teoria, al ritardo R.
Non sfuggirà al lettore che nella formula 1) N è un semplice fattore moltiplicativo. L’andamento temporale ( al crescere cioè del ritardo) è fissato esclusivamente dal fattore q(R-1). Questo è l’elemento di una progressione geometrica ed è equivalente ad una funzione esponenziale decrescente (essendo q<1 al="" b="" crescere="" di="" diminuisce="" fattore="" il="" in="" nbsp="" progressivamente="" sostanza="" suddetto="">R
 ma pur diventando infinitesimo non diventa mai del tutto uguale a zero (ciò che rappresenterebbe la certezza assoluta dell’estrazione).
A cosa serve conoscere queste statistiche ?. Ovviamente a fare previsioni utilizzando allo scopo una procedura in tre tempi. In primo luogo è necessario costruire, utilizzando i risultati delle estrazioni precedenti, una statistica "reale" (quella che effettivamente si osserva in pratica) ; in secondo luogo questa statistica reale va messa a confronto con la corrispondente statistica teorica allo scopo di mettere in evidenza le deviazioni (dette anche fluttuazioni) più significative esistenti fra il caso pratico che stiamo studiando e la teoria. Come ultimo passo, dall’analisi delle deviazioni riscontrate si potrà tentare di dedurre previsioni di gioco.
La determinazione delle statistiche reali, che vengono indicate col simbolo che si ottiene sostituendo la lettera Tcon una R (reale), è facilissima. Così LR si ottiene semplicemente contando nella colonna dei ritardi di una ruota quanti dei 5 numeri iniziali sono ancora in piedi al ritardo (i numeri che hanno lo stesso ritardo su una ruota sono detti sincroni ). Per quanto riguarda NR sarà sufficiente sommare le LR delle 10 ruote per ogni valore costante di (i numeri che hanno lo stesso ritardo su ruote diverse sono detti isocroni ). Infine per quanto riguarda PRbasterà vedere quanti dei 10 numeri iniziali estratti, ad es. in prima posizione sulle 10 ruote, sono ancora in piedi al ritardo R ( e analogamente per i numeri in seconda posizione e così via ; i numeri che hanno la stessa posizione, allo stesso ritardo, sono detti isotopi ).
Per quanto riguarda il passaggio logico fra il rilevamento dell’esistenza di deviazioni fra teoria e pratica e la deduzione di previsioni vi è sicuramente una certa arbitrarietà. Recentemente tuttavia, è stata introdotta una metodologia razionale per misurare in termini quantitativi, e quindi non ambigui, le deviazioni fra una statistica reale e la corrispondente statistica teorica.    Questa metodologia (cfr. Tosco da Montalbano e Leontino Gorgia "IL LOTTO : Nuove e avanzate metodologie previsionali" - Gino Pinna Editore, 1994) consente di esprimere attraverso un numero compreso fra 0 e 1, detto "aspettabilità" parziale (Apz) la deviazione fra una qualsiasi statistica reale e la corrispondente statistica teorica. Se il valore di Apz risulta circa 0.5 non vi è praticamente deviazione fra caso pratico e teoria ; se il valore risulta maggiore di 0,5 il caso pratico mostra un eccesso rispetto al caso teorico ; in tal caso si dice che i numeri interessati (che partecipano alla fluttuazione) mostrano una "alta aspettabilità" ; il viceversa è detto se il valore dell’Apz risulta inferiore a 0,5.
Il valore di una Apz non è una probabilità : questa rimane costante ad ogni estrazione. Tuttavia il valore di una certa Apz, misurando la deviazione fra una statistica reale e la corrispondente statistica teorica, può essere assunto come il grado di fiducia che si può investire nella prossima uscita di certi numeri (partecipanti ad una fluttuazione)esclusivamente per ragioni di riequilibrio statistico. In effetti, come ben sanno coloro che seguono le statistiche reali, le fluttuazioni nascono in un punto qualsiasi di una statistica, si sviluppano, raggiungono un massimo e poi si estinguono, per poi rinascere eventualmente in un ’ altra zona.
Poiché vi possono essere tante statistiche ( e ne abbiamo già dato tre esempi) vi saranno tante Apz quante sono le statistiche che si possono utilizzare. Il simbolo specifico di una Apz è dato da una A seguita dalla lettera maiuscola che caratterizza la statistica. Nel caso delle statistiche di presenza sopra descritte la formula da applicare, denominando con XR la generica statistica reale, è data da :
AX = XR/(XR+XT)
per cui sono definibili immediatamente tre Apz : ALAN eAP.
Diamo un esempio concreto di calcolo per AL che il lettore può verificare con un semplice calcolatore scolastico. Supponiamo che nella ruota di Bari, al ritardo R=46 siano ancora presenti tre numeri (17 ; 43 e 25 ) dei cinque iniziali ; quindi LR=3. Contemporaneamente dalla 1), ponendo q=17/18 ; N=5 e R-1=45 si ottiene LT= 0,382. Sostituendo nella 2) si ottiene AL=0.887. Questa è l’aspettabilità AL dei tre numeri citati, al ritardo R.
Il lettore può anche verificare che se i numeri residui fossero stati due l’aspettabilità sarebbe risultata inferiore (0,840) e ancora minore se ne fosse rimasto in piedi uno solo (0,724) ; in tutti i casi il valore di AL risulta sempre superiore a 0,5 perché il valore teorico LT è minore di uno. Ciò fatto il lettore può altresì verificare, per LR=3, che diminuendo R, anche il valore di AL diminuisce progressivamente finché per R= 10 esso è circa 0.5 (infatti per R=10 LR=2,99 cioè circa 3).
Infine il lettore dovrebbe verificare che se i tre numeri sono già presenti al ritardo R=4 risulta LT= 4,212 e AL= 0,416 . In questo caso si può dire che la ulteriore caduta di uno dei tre numeri (essendone già caduti due dei 5 iniziali) è poco "aspettabile" in quanto il dato teorico LT è addirittura superiore a quattro. In realtà la probabilità di caduta di uno dei tre numeri è sempre la stessa ma la ulteriore caduta di uno di loro aumenterebbe in negativo la fluttuazione e darebbe per R=5 (alla successiva estrazione) appena il valore AL= 0,335 ai due numeri residui.


Le Statistiche del Lotto


Le Statistiche del Lotto
©.Il Fisico
.
.1 - Teoria della colonna dei ritardi
.
Per rappresentare l’ultimo ritardo dei 90 numeri di una ruota si utilizza spesso la cosiddetta "colonna dei ritardi". Essa viene costruita nel seguente modo : in una prima riga, in basso, si scrivono i 5 numeri usciti nell’ultima estrazione ; in una seconda riga sovrastante si scrivono i numeri usciti nell’estrazione precedente ; nella terza riga immediatamente superiore si riportano i numeri usciti nella terzultima estrazione precedente e cosi via si precede verso l’alto avendo cura, ogni volta che si scrive l’estrazione sovrastante di cancellare i numeri già registrati nella righe inferiori ; la procedura va avanti finché tutti i 90 numeri risultano presenti una sola volta, collocati in una delle righe della colonna. Nell’esempio parziale sottostante le righe sono numerate con un indice n che va da 1 fino ad un massimo norelativo all’ultimo dei 90 numeri (chiaramente il più ritardatario).
n=no......67..(Ultimo ritardatario)
..........
..........
n=n42..4....(sono rimasti ancora due numeri)
..........
..........
n=4713011189(quartultima estrazione)
n=324..19..32(terzultima estrazione)
n=24517..6552(penultima estrazione)
n=11221379014(ultima estrazione)
L’aggiornamento della colonna è semplice : a) si spostano i numeri di ciascuna riga a quella successiva ; b) si introducono i numeri della nuova estrazione nella riga n=1rimasta vuota ; c) si cancella ognuno dei cinque numeri nuovi estratti nelle righe superiori (si formano così nuovi 5vuoti).
La colonna dei ritardi è un potente strumento (ovviamente non l’unico) utilizzabile per la costruzione di statistiche utili per le previsioni ; pertanto ogni giocatore dovrebbe sempre avere sottomano l’insieme delle dieci colonne dei ritardi di ciascuna ruota (detto "il tabellone dei ritardi" e in gergo "TURT" - Tabellone dell’Ultimo RiTardo). Esistono dei programmi molto semplici per computer che consentono al giocatore di poter visionare e aggiornare il TURT ad ogni estrazione. Loctronics può fornire a chi ne fa richiesta il relativo dischetto.
Data l’importanza del TURT (per la costruzione di molte statistiche che esamineremo in note successive), approfondiamo in questa nota il significato della colonna dei ritardi. La prima osservazione da fare è che l’indice n, che numera le estrazioni pregresse a cominciare dall’ultima, coincide con il ritardo RT del numero. Pertanto si deve porreRT=n. In verità , non si sa bene per quale motivo molti usano scrivere RT=0 per n=1 (diminuendo di una unità tutti i ritardi). Anche se la cosa non ha importanza pratica (ma può ingenerare confusione) è bene convincersi che ciò è errato. Allo scopo si deve ricordare che il Lotto è un gioco di tipo "bernoulliano" cioè di prove ripetute (ovvero di estrazioni !) aventi tutte la stessa probabilità p di successo, mentre quella di insuccesso è indicata con q, dato da q=1-p( nel nostro caso, riferendoci al semplice estratto, si hap=1/18 e q=17/18). In un qualsiasi esperimento bernoulliano si comincia con una prima prova, seguita da una seconda, da una terza e così via fino all’infinito, considerando tutte le prove come un tutt’uno, e ci si chiede quale sia la probabilità pn che un numero sia estratto alla n-esima prova.
A titolo esemplificativo prendiamo il numero 12 (che appare in basso a sinistra nell’esempio dato) e immaginiamo di vederlo spostare ad ogni estrazione nella riga immediatamente superiore ; allora la teoria di Bernoulli di dice che la probabilità pn che il numero cada (esca) alla n-esima estrazione è pn=p.q(n-1). In pratica si può immaginare lo schema :
prova1 2 3 4 ...... n ...
probabilitàp1 p2 p3 p4 ....... p...
(ovvero)p p.q p.q2 p.q3.... p.q(n-1)
E’ facile verificare (vedere Appendice) che la somma P di tutti i pn (con nda 1 a infinito) è uguale all’unità , ovvero la serie pn è unadistribuzione di probabilità ( il fatto che la somma è uguale all’unità ci dice che l’evento deve prima o poi avverarsi per un n qualsiasi). Ora, quando noi effettuiamo il primo colpo (estrazione), cioè vogliamo applicare p1, il nostro numero giace già nella colonna dei ritardi dall’ultima estrazione precedente, per cui esso si trova al primo ritardo della nostra prova cioè al ritardo RT=1 (tant’è vero che può risultare immediatamente ri-estratto ).
Nel discutere del primo valore del ritardo si è di fatto considerato anche il significato della riga n : essa ci consente di dire immediatamente la probabilità pn di caduta (di estrazione) di un numero alla n-esima prova. In altre parole la serie pn è una distribuzione di "probabilità di caduta" o di successo. E’ facile rendersi conto che pn decresce continuamente al crescere di n ; ogni termine è minore del precedente per il fattore q ; quindi il valore maggiore si ha per n=1 p1=p) . Si osservi anche, che per n grande la probabilità diventa piccolissima ma non è mai uguale a zero ; da ciò una sicura conclusione : non esiste un limite teoricomassimo per l’uscita di un numero perché n va fino all’infinito (torneremo sull’argomento dal punto di vista pratico in una nota successiva).
E’ possibile, in alternativa, costruire una seconda serie numerica basata su q (cioè sulla probabilità di insuccesso). Se indichiamo con qn il termine generico di questa serie, esso ci dovrà dare la probabilità che un numero sia ancora "in piedi" (cioè non sia stato ancora estratto) prima di effettuare il colpo e quindi lo si trovi registrato nel tabellone al ritardoRT=n. Perché ciò accada devono essere andati a vuoto gli (n-1) colpi precedenti ; pertanto è necessario moltiplicare (n-1) volte il fattore qottenendo:q= q(n-1)
Si noti che per n=1 si ha q1= 1 (qualunque numero diverso da zero elevato a zero è uguale ad 1) ; infatti, per tornare all’esempio precedente il numero 12 è già li che aspetta di essere sottoposto alla prima prova.
La serie qn non è però una distribuzione di probabilità. Infatti è facile fare la somma Q di tutti i termini   (vedere Appendice) ottenendo:
Q = 1 + q + q2 +.. = 1/(1-q) = 1/p
cioè l’inverso della probabilità . Nel nostro caso, essendo 1/p=18 si haQ=18 e non sfuggirà al lettore che 18 è un quinto di 90. Ciò significa che se moltiplichiamo la serie Q per 5, considerando i cinque numeri iniziali insieme, si ottiene 90, cioè il totale dei numeri in gioco. In altre parole, la serie qn non è una distribuzione di probabilità ma rappresenta una distribuzione statistica : essa ci dice (moltiplicata per 5) quanti dei 90numeri sono (teoricamente) presenti nella riga al ritardo RT=n. Cioè la statistica Q è una "statistica di presenza". Come tale essa ha grandi applicazioni nello studio del Lotto come vedremo nelle note successive.
(Il fisico)

APPENDICE
Proprietà della serie geometrica
Il termine generico n della serie geometrica è dato da Xn conn intero che va da zero a infinito, mentre per X assumiamo che sia un numero positivo minore di 1. In tal caso in Analisi si dimostra che la somma G della serie è data da :
G = 1 +X +X2 +X3 ..+Xn .. = 1/(1-X)
Per calcolare la somma P del testo si pone in evidenza p e si ottiene :
P = p + p.q + p.q2 ..+ p.q(n-1) +.. = p .( 1 +q+ q2.. q(n-1) +..) =  p.(1/(1-q)) = p.(1/p )= 1
avendo identificato q con la X della serie G e ricordando che essendo q= 1- p è pure p=1-q.Per calcolare la somma Q del testo basta osservare che essa coincide proprio con la serie geometrica.