od gofry » 23. 1. 2007 10:12
Pavel J píše:Hugo píše:0.75 * 2^4 + 0.24 * 2^5 + 0.01 * 2^9 = 24.8
Proč to není
(0.75*0.76*0.99) * 2^4 + (0.25*0.24*0.99) * 2^5 + (0.25*0.76*0.01) * 2^9
? Myslím tím, proč např. v prvním sčítanci (ten odpovídá tomu, že první atribut je specifikovaný a ostatní dva nejsou) nemám součin pravděpodobností
P(první atribut specifikován) * P(druhý atribut nespecifikován) * P(třetí atribut nespecifikován)
ale mám tam jen
P(první atribut specifikován) ?
Ty by si vlastne mal chcieť počítať
Kód: Vybrat vše
P(non[B&C])*(počet stránok, ktoré musím prehľadať, ak nemám zadané ani B ani C)
P(non[B&C]) znamená pravdepodobnosť, že atribúty B a C nie sú špecifikované. Nepliesť si to s nejakým logickým výrazom.
Ale zrejme
Čiže pravdepodobnosť, že atribúty B a C nebudú špecifikované sa rovná pravdepodobnosti, že atribút A špecifikovaný bude.
A zároveň
Kód: Vybrat vše
(počet stránok, ktoré musím prehľadať, ak nemám zadané ani B ani C) = (2^db)*(2^dc)
Platí tiež, že (tento krok už v skriptách nie je)
Vo finále teda
Kód: Vybrat vše
P(non[B&C])*(počet stránok, ktoré musím prehľadať, ak nemám zadané ani B ani C) = P(A)*2^(d-da).
d - počet bitov signatúry záznamu
da, db a dc - počet bitov signatúr jednotlivých atribútov
Podobne počítaš v ostatných prípadoch, tj.
špecifikované: B
nešpecifikované: A, C
špecifikované: C
nešpecifikované: A, B
Výsledný vzorec by teda mohol vyzerať takto:
Q - množina dotazov so špecifikovaným jedným atribútom.
To ale zjavne vyzerá príliš jednoducho, preto sa pán Pokorný rozhodol, že to do skrípt trošku zašifruje.
[quote="Pavel J"][quote="Hugo"]0.75 * 2^4 + 0.24 * 2^5 + 0.01 * 2^9 = 24.8[/quote]
Proč to není
(0.75*0.76*0.99) * 2^4 + (0.25*0.24*0.99) * 2^5 + (0.25*0.76*0.01) * 2^9
? Myslím tím, proč např. v prvním sčítanci (ten odpovídá tomu, že první atribut je specifikovaný a ostatní dva nejsou) nemám součin pravděpodobností
P(první atribut specifikován) * P(druhý atribut nespecifikován) * P(třetí atribut nespecifikován)
ale mám tam jen
P(první atribut specifikován) ?[/quote]
Ty by si vlastne mal chcieť počítať [code]P(non[B&C])*(počet stránok, ktoré musím prehľadať, ak nemám zadané ani B ani C)[/code]
P(non[B&C]) znamená pravdepodobnosť, že atribúty B a C nie sú špecifikované. Nepliesť si to s nejakým logickým výrazom.
Ale zrejme [code]P(non[B&C]) = P(A)[/code] Čiže pravdepodobnosť, že atribúty B a C nebudú špecifikované sa rovná pravdepodobnosti, že atribút A špecifikovaný bude.
A zároveň [code](počet stránok, ktoré musím prehľadať, ak nemám zadané ani B ani C) = (2^db)*(2^dc)[/code]
Platí tiež, že (tento krok už v skriptách nie je)[code](2^db)*(2^dc) = 2^(d-da)[/code]
Vo finále teda [code]P(non[B&C])*(počet stránok, ktoré musím prehľadať, ak nemám zadané ani B ani C) = P(A)*2^(d-da).[/code]
d - počet bitov signatúry záznamu
da, db a dc - počet bitov signatúr jednotlivých atribútov
Podobne počítaš v ostatných prípadoch, tj.
špecifikované: B
nešpecifikované: A, C
špecifikované: C
nešpecifikované: A, B
Výsledný vzorec by teda mohol vyzerať takto:
[img]http://aa.kolejhvezda.net/cenaDotazu.png[/img]
Q - množina dotazov so špecifikovaným jedným atribútom.
To ale zjavne vyzerá príliš jednoducho, preto sa pán Pokorný rozhodol, že to do skrípt trošku zašifruje.