inora, nelle note precedenti, abbiamo sempre parlato di statistiche di "presenza". Con questo termine si vuol significare che tutte le statistiche illustrate (LT, NT, PT, DT, BT, WT, VT e HT) hanno fatto tutte riferimento, sia pure in modo diverso, esclusivamente alle colonne dell'ultimo ritardo nelle quali sono presenti, ai vari ritardi R, i 90 lottroni (così denominiamo i numeri del Lotto) di ciascuna ruota. Ciò che è accaduto prima della formazione di tali colonne non ha alcuna importanza.
E' possibile costruire un altro gruppo di statistiche dette di "caduta", concettualmente molto diverse da quelle di presenza. In questa nota introduciamo l'argomento presentando la prima di esse, detta CT, alla quale faremo corrispondere una statistica reale, detta CR e, dal loro confronto, effettuato con regole analoghe ma diverse da quelle finora usate, una aspettabilità parziale (o Apz), detta AC.
Allo scopo è necessario riprendere la distribuzione di probabilità della serie geometrica, già descritta in Appendice della Nota 1 (Teoria della colonna dei ritardi):
1)..... P = p + p.q + p.q2 ..+ p.q(n-1) +..
|
Questa serie, la cui somma degli infiniti termini è pari all'unità, assume nel caso che sia p=1/18 e q=1-p= 17/18 un significato assai preciso nel gioco del Lotto; infatti, in tale ipotesi, il termine generale pn corrispondente all'indice n
2).....pn = p.q(n-1) = (1/18).(17/18)(n-1)
|
rappresenta esattamente la probabilità che un prefissato lottrone venga estratto alla n-esima estrazione (in una serie di estrazioni successive, come sono appunto considerate quelle di ciascuna ruota del Lotto).
E' facile verificare che ogni termine diminuisce progressivamente al crescere di n; per i lettori che hanno meno confidenza con la matematica, può essere utile meditare sui seguenti valori, scelti a titolo di esempio:
estrazione n | valore di pn |
1 | 0,055.600.0 |
2 | 0,052.500.0 |
3 | 0,049.600.0 |
10 | 0,033.200.0 |
20 | 0,018.800.0 |
50 | 0,007.580.0 |
100 | 0,000.193.7 |
150 | 0,000.011.1 |
200 | 0,000.000.6 |
Come si vede la probabilità, massima in fase iniziale, diminuisce fortemente al crescere di n (in modo detto esponenziale) ma non diventa mai zero (!). En passant,questa è la ragione per la quale un lottrone può tardare moltissimo ad uscire, e causare notevoli perdite al giocatore.
Ritornando alla statistica 1), osserviamo in primo luogo che al posto di n possiamo scrivere il ritardo R, purché si assegni il valore R=1 al lottrone sul quale si immagina di cominciare la serie di prove di estrazioni successive ( cfr. quanto detto nella Nota 1). Ciò premesso, supponiamo di considerare un insieme di N (da non confondersi con n) estrazioni consecutive pregresse (precedenti quella ultima su cui stiamo lavorando), e di aver registrato ogni volta con quali ritardi R sono caduti i 5 lottroni estratti ad ogni estrazione. Essendo 5*N le cadute totali da registrare, in base alla 1) esse si distribuiranno secondo una curva statistica data da:
3).....CT(R) = 5.N. p.q(R-1)
|
Per avere un dato numerico supponiamo di considerare le ultime 100 estrazioni pregresse (N=100) e il ritardo R=10; si ottiene CT(10) = 16,61. Questo numero ci dice che, secondo la teoria, nelle ultime 100 estrazioni dovrebbero essere caduti al ritardo R=10 (della ruota considerata) 16,61 lottroni. Un simile dato si può ovviamente avere per ogni valore di R; pertanto l'insieme dei valori CT(R) rappresenta una statistica teorica, detta di caduta: essa infatti riguarda le estrazioni avvenute nelle Nprove precedenti e non l'ultima colonna dei ritardi sulla quale andiamo a fare le previsioni.
Ovviamente in pratica è possibile, per ciascuna ruota, andare a vedere come sono andate effettivamente le cose nelle N estrazioni precedenti. Allo scopo si deve immaginare di disporre, per ciascuna delle N prove precedenti, della colonna dei ritardi e di registrare da qualche parte per quali valori di R sono caduti i 5 lottroni ogni volta estratti. Sommando su tutto gli R e su tutte le N prove, si ottiene la statistica reale CR(R), la quale non solo differirà da quella reale ma sarà anche diversa da ruota a ruota (concettualmente la procedura è semplice; in pratica si può fare rapidamente solo con un computer e un apposito programma).
Può una statistica del genere essere utile per le previsioni? Certamente; nello stesso modo in cui sono utili le altre statistiche. Supponiamo ad esempio che nella ruota di BA al ritardo R=10 sia risultato (nelle 100 prove pregresse) CR(10)=11 mentre per la ruota di CA sia risultato CR(10)=22; intuitivamente ci attendiamo che se, alla prossima estrazione (la 101-esima) cadrà un lottrone al ritardo R la ruota di Ba sia più "aspettabile" della ruota di CA (la probabilità sarà però la stessa).
Come già detto nelle note precedenti l'aspettabilità è soltanto la misura della deviazione di una statistica reale rispetto alla corrispondente statistica teorica. La misura è anche "normalizzata" nel senso che è contenuta fra 0 e 1; il valore 0,5 rappresenta la piena corrispondenza fra le due statistiche (nessuna deviazione) mentre valori superiori indicano che se l'evento atteso accadrà, esso ci riavvicinerà all'equilibrio statistico. La formula da adottare per le Apz legate alle statistiche di caduta è del tipo:
e come si vede a numeratore compare ora la statistica teorica, mentre per le statistiche di presenza compariva la statistica reale. Per verificare che questa è la formula giusta calcoliamo i valori che risultano dai due esempi precedenti: per la ruota di BA si ottiene AC= 16,61/(16,61+11) = 0,60 mentre per la ruota di CA si ha AC= 16,61/(16,61+22)= 0,43. Come era da attendersi, nel caso che CR sia minore di CT si ha effettivamente una aspettabilità maggiore di 0,5 e viceversa nel caso contrario.
A quali lottroni vanno attribuiti tale valori di AC? Chiaramente ai lottroni che dopo la centesima estrazione pregressa si trovano (in vista della 101-esima estrazione: la prossima ) al ritardo R =10 nelle ruote considerate. E' chiaro che ciascuno dei 90 lottroni, secondo il valore R a cui si trova, riceverà un valore diverso di AC.
Per chiudere l'argomento si noti che se CR=0 si ottiene AC=1 anche se i valori di CT sono molto piccoli; in casi del genere il valore di AC potrebbe entrare in saturazione nel senso che potrebbe non dare una particolareggiata graduatoria delle differenze di aspettabilità di molti dei 90 lottroni. Ma ciò significa solo che è stato troppo piccoli il valore del parametro N cioè del numero delle prove pregresse. D'altronde è chiaro che un solo valore di N non può coprire bene tutto l'arco dei possibili ritardi.
Vi sono due modi per superare questo inconveniente; il primo è ovviamente quello di variare N al crescere di R; l'altro, anche se parziale ma molto più semplice, consiste nel raggruppare progressivamente le colonne dei ritardi delle 10 ruote. Ad esempio fino ad un certo valore R1 di R le colonne sono considerate isolate; fra R1 e un successivo valore R2 le colonne sono raggruppate in 5 gruppi di due colonne ciascuno; fra R2 e un successivo valore R5 le colonne sono raggruppate in due gruppi di 5 colonne ciascuno; infine al di sopra di R5 le 10 colonne sono considerate tutte insieme. Ovviamente la statistica teorica data dalla 3) va moltiplicata per 2 al di sopra diR1; per 5 al di sopra di R2 e per 10 al di sopra di R5. Naturalmente anche per avere le statistiche reali si dovranno sommare i lottroni presenti al ritardo R nelle colonne raggruppate; in questo modo si evitano molti casi con RC=0. Questa procedura è stata attuata nel programma che GDS33 che utilizza fra le varie Apz anche AC.
(Il fisico)
Nessun commento:
Posta un commento