Ştiri:

Vă rugăm să citiţi Regulamentul de utilizare a forumului Scientia în secţiunea intitulată "Regulamentul de utilizare a forumului. CITEŞTE-L!".

Main Menu

Sa folosim statistica

Creat de virgil 48, Februarie 07, 2012, 11:18:40 AM

« precedentul - următorul »

0 Membri şi 1 Vizitator vizualizează acest subiect.

prodcomb

Citat din: virgil 48 din Decembrie 27, 2012, 09:07:53 AM
Acesta este sirul care reprezinta a 2-a coloana de numere extrase la loto 6 din 49,
pentru aceleasi trageri ca si prima coloana, de la # 180:
24,35, 5,17, 4,11,38,24,18,12,49,16,35,37,49,13,24,15,19,32,
33,14,46,30,37,37,30,16,46,49,18,22,12,36,13, 1, 4,35,24,30,
15,30,42,12,37,32, 5,38,47,39, 2,14,23, 3, 1,37,22,32,20,18,
22, 5,29,40,39,14,37,24,24,39,11,15, 9,24,42,19,40,34,16,28,
41,16, 8,42,15,18,29,13,21,32,39,28,43,19,38, 7,45,41,11, 3
   Rezerva: 12,26,38,22,20.
Urmeaza sa determinam distributia acestuia si distanta fata de D B, in aceleasi
conditii.


Se pot face analize cu şirurile de numere de pe cele 6 coloane, dar se pot face mult mai multe analize luând la întâmplare câte un număr din fiecare tragere; şi asta pentru că cele 6 numere ale unei trageri sunt disticte. Am mai spus şi repet că ordinea de extragere a celor 6 numere din 49 care compun o tragere nu are nici o importanţă şi nici o relevanţă.
Se vor obţine distribuţii mai mult sau mai puţin apropiate de distribuţia binomială.
Nu pot să mai iau parte la calcule deoarece scormonesc în alte zone.
Un autor renumit, pentru studiul evenimentelor repetate (şi nu numai), este Bachelier. Cărţile şi articolele lui despre teoria probabilităţilor sunt deosebit de interesante.

virgil 48

 Nu este nevoie sa iei parte la centralizari sau calcule elementare. O clarificare
utila din partea ta ar fi raspunsul la problema aparuta la # 163, # 164, pe
care mi-ai spus ca am abordat-o gresit.
Tu ce numar de control pentru variantele jucate ai folosi, in locul celui de
100 000 000, considerandu-l suficient in medie, pentru aprecierea frecventei
aparitiei premiilor de cat I. la 6 din 49? Sa nu-mi spui ca teoria probabilitatilor
nu are raspuns la aceasta intrebare.

prodcomb

Răspunsul se află la #182.
Am să revin cu detalii.

virgil 48

Citat din: virgil 48 din Decembrie 15, 2012, 10:59:43 AM
Centralizand numerele din sirul celor 100, am obtinut o distributie usor diferita
fata de cea oferita de prodcomb:
0 -   6  ( 19, 24, 31, 34, 35, 40 )                                                                    6
1 - 14  ( 3, 4, 5, 6, 8, 18, 26, 27, 29, 30, 36, 41, 44, 45 )                              13
2 - 11  ( 1, 2, 11, 12, 22, 23, 28, 32, 39, 46,48 )                                           14
3 -   8  (14, 15, 16, 17, 21, 37, 38, 49 )                                                          9
4 -   8  ( 7, 10, 13, 20, 33, 42, 43, 47 )                                                           5
5 -   2  ( 25, 9 )                                                                                             2
Pe coloana din dreapta sunt cifrele intregi, pe care le consider " de control". Abaterea
sirului nu mi se pare inacceptabila, dar diferentele se pot cumula, pentru a constitui un
criteriu de apreciere a apropierii unui sir de distributia binomiala, deci de insusirea
de a fi aleator. Dar aceasta apropiere nu poate fi singurul criteriu, fiindca
am sa dau de exemplu un sir alcatuit exact dupa distributia de control, care nu
va crede nimeni ca este aleator.
Deoarece am anuntat ca aceasta centralizare corespunzatoare coloanei I este gresita,
impreuna cu distributia obtinuta, le reiau mai jos:
  0   -   6         (19, 24, 31, 34, 35, 40)
  1   -  14        (3, 4, 5, 6, 8, 18, 26, 27, 29, 30, 36, 41, 44, 45)
  2   -  11        (1, 2, 11, 12, 22, 23, 28, 32, 39, 46, 48)
  3   -  10        (14, 15, 16, 17, 21, 37, 38, 42, 43, 49)
  4   -    6        (7, 10, 13, 20, 33, 47)
  5   -    2        (9, 25)
  6   -    0
  7   -    0
Dupa cum am mai scris si la #202, aceasta se afla la distanta de 6,867 (unitati) de
distributia binomiala. Urmeaza sa vedem cum se plaseaza coloana II-a.

virgil 48

 Pentru sirul de pe coloana II-a, postat la # 209, centralizarea si distributia se
prezinta in felul urmator:

0   -   8   (6, 10, 25, 26, 27, 31, 44, 48)
1   -  14  (2, 7, 8, 9, 17, 20, 21, 23, 33, 34, 36, 43, 45, 47)
2   -   7   (1, 3, 4, 28, 29, 40, 41)
3   -  14  (5, 11, 12, 13, 14,16, 19, 22, 35, 38, 39, 42, 46, 49)
4   -   3   (15, 18, 32)
5   -   1   (30)
6   -   1   (37)
7   -   1   (24)
Verificare:  8+14+7+14+3+1+1+1= 49 ; 0x8+1x14+2x7+3x14+4x3+5x1+6x1+7x1= 100
Distanta fata de distributia binomiala de calcul, este urmatoarea:
l 8 - 6,223 l + l 14 - 12,986 l + l 7 - 13,392 l + l 14 - 9,114 l + l 3 - 4,604 l + l 1 - 1,842 l +
+ l 1 - 0,604 l + l 1 - 0,171 l = 17,741
Observam ca sirul de pe aceasta coloana este departat bine de D B, si intr-o maniera care
justifica suspiciunea. Sa urmarim si celelalte coloane inainte de a ne face o parere.

prodcomb

După cum am mai spus, calculul trebuie făcut şi pentru grupele vide, măcar pentru cele care au date în reprezentarea cu trei cifre exacte; grupa de apariţie "10" ar fi ultima.

virgil 48

 Nu tin prea mult sa ma apropii de valorile exacte. Consider ca aproximarea cu
7 grupe de aparitie, este satisfacatoare pentru eventualii jucatori la loto care
urmaresc acest topic. Daca intentionezi sa intreprinzi vreo cercetare, pe calculator
poti fi mult mai precis.

prodcomb

De acord, diferenţele nu sunt mari:
pentru primul şir 6,867 faţă de 6,909
pentru şirul doi 17,741 faţă de 17,779.
Dar pot apare surprize.
Vom vedea.

virgil 48

 Acesta este sirul de pe coloana a III-a, din aceleasi 100 variante extrase la
6 din 49 mentionate la # 180:

8,34,40,32,48,47,29,2,41,24,20,19,21,34,8,17,46,25,12,30,
38,26,4,39,34,31,11,18,36,20,47,9,28,24,12,45,40,38,43,10,
19,28,45,2,9,20,16,23,23,33,9,42,41,26,46,17,4,34,35,43,
18,46,16,13,23,20,11,36,13,33,2,43,14,44,34,1,42,3,9,40,
45,33,34,9,4,31,31,39,4,19,23,38,37,22,30,8,37,22,26,14.
Rezerva:     26,36,31,45,12

Vom vedea cum se comporta si acesta fata de distributia binomiala.

prodcomb

Înainte de a merge mai departe, pun următoarea întrebare:
sortarea primului şir în grupe de apariţie am comparat-o cu distribuţia binomială pentru 1 din 49; sortările şirurilor 2, 3, 4, 5, şi 6 le comparăm tot cu distribuţia binomială pentru 1 din 49, sau le comparăm cu distribuţiile binomiale pentru 1 din 48, 1 din 47, 1 din 46, 1 din 45, 1 din 44? 

prodcomb

Citat din: virgil 48 din Ianuarie 02, 2013, 09:48:43 AM
Pentru sirul de pe coloana II-a, postat la # 209, centralizarea si distributia se
prezinta in felul urmator:

0   -   8   (6, 10, 25, 26, 27, 31, 44, 48)
1   -  14  (2, 7, 8, 9, 17, 20, 21, 23, 33, 34, 36, 43, 45, 47)
2   -   7   (1, 3, 4, 28, 29, 40, 41)
3   -  14  (5, 11, 12, 13, 14,16, 19, 22, 35, 38, 39, 42, 46, 49)
4   -   3   (15, 18, 32)
5   -   1   (30)
6   -   1   (37)
7   -   1   (24)
Verificare:  8+14+7+14+3+1+1+1= 49 ; 0x8+1x14+2x7+3x14+4x3+5x1+6x1+7x1= 100
Distanta fata de distributia binomiala de calcul, este urmatoarea:
l 8 - 6,223 l + l 14 - 12,986 l + l 7 - 13,392 l + l 14 - 9,114 l + l 3 - 4,604 l + l 1 - 1,842 l +
+ l 1 - 0,604 l + l 1 - 0,171 l = 17,741
Observam ca sirul de pe aceasta coloana este departat bine de D B, si intr-o maniera care
justifica suspiciunea. Sa urmarim si celelalte coloane inainte de a ne face o parere.

Distribuţia corectă este 8-14-8-11-6-0-1-1; ciudat că se verifică la distribuţia greşită cele două reguli.
Dar 30 nu apare de 5 ori în şirul 2!
Atenţie la neatenţie!

prodcomb

Rezultatul sortărilor este:
grupa  0 19,24,31,34,35,40,
grupa  1  3, 4, 5, 6, 8,18,26,27,29,30,36,41,44,45,
grupa  2  1, 2,11,12,22,23,28,32,39,46,48,
grupa  3  7,14,15,16,17,21,37,38,42,49,
grupa  4 10,13,20,33,43,47,
grupa  5  9,25,
grupa  6
grupa  7
grupa  8
grupa  9
grupa 10

grupa  0  6,10,25,26,27,31,44,48,
grupa  1  2, 7, 8, 9,17,20,21,23,33,34,36,43,45,47,
grupa  2  1, 3, 4,28,29,40,41,46,
grupa  3  5,11,12,13,14,19,22,35,38,42,49,
grupa  4 15,16,18,30,32,39,
grupa  5
grupa  6 37,
grupa  7 24,
grupa  8
grupa  9
grupa 10

grupa  0  5, 6, 7,15,27,49,
grupa  1  1, 3,10,21,25,29,32,35,44,48,
grupa  2 11,12,13,14,16,17,18,22,24,28,30,36,37,39,41,42,47,
grupa  3  2, 8,19,26,31,33,38,40,43,45,46,
grupa  4  4,20,23,
grupa  5  9,
grupa  6 34,
grupa  7
grupa  8
grupa  9
grupa 10

grupa  0  1,23,26,34,46,
grupa  1  3, 4, 9,13,18,22,25,31,32,35,43,49,
grupa  2  5, 7,10,11,16,19,24,27,28,30,33,39,42,45,48,
grupa  3  2, 6,12,15,17,20,21,40,41,44,47,
grupa  4  8,14,29,37,38,
grupa  5 36,
grupa  6
grupa  7
grupa  8
grupa  9
grupa 10

grupa  0  1,10,11,27,37,39,
grupa  1 14,16,19,20,22,23,30,34,38,40,41,42,44,45,49,
grupa  2  2, 6, 7, 9,13,24,31,35,46,47,48,
grupa  3  3, 4,12,15,17,25,26,32,33,36,43,
grupa  4  8,18,21,
grupa  5 29,
grupa  6 28,
grupa  7  5,
grupa  8
grupa  9
grupa 10

grupa  0 11,18,20,29,31,33,42,43,
grupa  1  1, 9,10,12,15,17,24,30,36,38,40,45,47,48,
grupa  2  5, 6, 8,13,14,21,25,41,44,46,
grupa  3  2, 4,19,22,23,39,
grupa  4  7,16,26,27,28,32,34,35,
grupa  5  3,37,
grupa  6 49,
grupa  7
grupa  8
grupa  9
grupa 10

6-14-11-10- 6- 2- 0- 0- 0- 0- 0-
8-14- 8-11- 6- 0- 1- 1- 0- 0- 0-
6-10-17-11- 3- 1- 1- 0- 0- 0- 0-
5-12-15-11- 5- 1- 0- 0- 0- 0- 0-
6-15-11-11- 3- 1- 1- 1- 0- 0- 0-
8-14-10- 6- 8- 2- 1- 0- 0- 0- 0-

virgil 48

#222
 Prodcomb, cu calculatorul lui, vrea sa-mi rapeasca placerea de a gresi singur.
Cele 6 randuri de la urma, inseamna ca el a facut  sortarile(centralizarile) si a
determinat distributiile celor 6 coloane, pe care am sa le reiau pe verticala.
Este vorba de 100 extrageri de la 6 din 49, cum am explicat in postarile anterioare:
 
  BILE TRASE                          COLOANA     I           II           III          IV         V           VI
      ----------------------------------------------------------------------------------------------------------
 Nici o data                     0                        6            8            6           5           6           8
 O data                           1                       14          14          10         12         15          14
 De 2 ori                         2                       11           8           17         15         11          10
 De 3 ori                         3                       10          11          11         11         11           6
 De 4 ori                         4                        6            6            3           5          3            8
 De 5 ori                         5                        2            0            1           1          1            2
 De 6 ori                         6                        0            1            1           0          1            1
 De 7 ori                         7                        0            1            0           0          1            0

 Pentru # 219: Nu vad dece sa nu mentinem aceeasi analiza ca si pentru coloana I.  Mi se
pare justificat.

prodcomb

#223
Sortările pentru seria de 100 extrageri le-am făcut pentru început cu EXCEL; după aceea am făcut un progrămel în QBASIC cu care am făcut sortări pentru mai multe serii de 100 extrageri. În total am investigat 1.004 extrageri, între 177 (12.01.1997) şi 1180 (30.12.2012); în total 905 serii a câte 100 "trageri".
În grupa de apariţie 8 au apărut numere în 227 cazuri (din 905), iar în grupa de apariţie 9 au apărut numere în 27 cazuri (din 905); în grupa de apariţie 10 nu au apărut numere în niciunul din cazurile analizate.
Este adevărat, calculatorul nu greşeşte şi poate să facă multe.

PS
anexez un fişier trunchiat, pentru că originalul nu încape

prodcomb

Citat din: virgil 48 din Decembrie 07, 2012, 09:36:50 AM
Fiindca in raspunsul precedent am scris ca numarul de variante jucate saptamanal este
mic, fara sa explic in comparatie cu ce, vin cu urmatoarele precizari:
Consultand revista Loto Prono constatam ca in prezent se joaca la 6 din 49 in medie
800 000 (?) de variante saptamanal. Acestea nu sunt distincte.
Citat din: prodcomb din Noiembrie 24, 2012, 02:27:12 PM
Numărul variantelor distincte rămase după 100.000.000 extrageri 6 din 49 este mai mic decât numărul combinărilor de 49 luate câte 6: 13.972.852,8 respectiv 13.983.816.
Prodcomb a vrut sa spuna ca dupa 100 000 000 variante jucate, tot mai raman
cateva mii de variante distincte nejucate, deci nu avem certitudine 100%.
Am aflat ca dupa ce jucatorii cumpara 100 000 000 de variante, exista in medie o
probabilitate de cca. 99% ca unul dintre ei sa castige un premiu la cat. I. Calculul facut
de el se refera tot la variante nedistincte.
Cu ritmul saptamanal acceptat de 800 000 de variante pe saptamana, sa vedem in cate
saptamani realizam probabilitatea de 99% pentru aparitia unui mare premiu:
   100 000 000 : 800 000 = 125 de saptamani
Asta inseamna ca un mare premiu "natural" ar trebui sa apara o data la doi ani si ceva.
O data ce stim ca in acest rastimp apar 8 - 10 mari premii, putem calcula cu usurinta
cate sunt potential "telecomandate".
Daca considera cineva ca acest calcul simplu este eronat, voi face corectii.

Dacă vrem să calculăm probabilitatea de apariţie a premiului I în cazul în care pentru fiecare tragere se joacă 800.000 variante DISTINCTE (se pot estima cele distincte cu formula prezentată de mine), procedăm astfel:
probabilitatea de apariţie a premiului I la o "tragere" este 800.000/13.983.816
cu ajutorul distribuţie binomiale aflăm care aste probabilitatea de apariţie în 2, 3, 4, ... "trageri";
o să aflăm că valoarea maximă este pentru 17 "trageri";
dacă se depăşeşte această valoare, probabilitatea pentru un premiu I scade şi creşte probabilitatea pentru apariţia a două premii II (34 "trageri").
În realitate numărul variantelor jucate este mai mic (şi implicit al celor distincte).
Numărul variantelor jucate de fiecare dată se găseşte în paginile Loteriei şi în revista ei.