Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 14

Họ và Tên: Nguyễn Thái Vinh

Mssv: 18130286

Bài làm môn Data Mining

Bài tập Chương 3 (01)

Bài 1: MinSup= 30%, MinConf= 70%

a) * Thuật toán Apriori:

B1: Duyệt D:

C1: {u}:4, {v}:4, {w}:4, {x}:6, {y}:6, {z}:5


=> L1: {u}:4, {v}:4, {w}:4, {x}:6, {y}:6, {z}:5
=> L: {u}:4, {v}:4, {w}:4, {x}:6, {y}:6, {z}:5

B2: Phát sinh C2: {u,v}, {u,w}, {u,x}, {u,y}, {u,z}, {v,w}, {v,x}, {v,y}, {v,z}, {w,x},
{w,y}, {w,z}, {x,y}, {x,z}, {y,z}

Duyệt D:

=> C2: {u,v}:1, {u,w}:2, {u,x}:1, {u,y}:3, {u,z}:2, {v,w}:2, {v,x}:3, {v,y}:2, {v,z}:2,
{w,x}:3, {w,y}:3, {w,z}:1, {x,y}:3, {x,z}:4, {y,z}:2

=> L2: {u,y}:3, {v,x}:3, {w,x}:3, {w,y}:3, {x,y}:3, {x,z}:4

=> L: {u}:4, {v}:4, {w}:4, {x}:6, {y}:6, {z}:5, {u,y}:3, {v,x}:3, {w,x}:3, {w,y}:3,
{x,y}:3, {x,z}:4

B3: Phát sinh C3: {w,x,y}

*Không phát sinh {x,y,z} vì {y,z} không phổ biến – ÁP DỤNG TÍNH CHẤT APRIORI

Duyệt D:

=> C3: {w,x,y}:2


=> L3: rỗng

=> L: {u}:4, {v}:4, {w}:4, {x}:6, {y}:6, {z}:5, {u,y}:3, {v,x}:3, {w,x}:3, {w,y}:3, {x,y}:3,
{x,z}:4

* Thuật toán FP-Growth

B1: Duyệt D:

=> L1: {x}:6, {y}:6, {z}:5, {u}:4, {v}:4, {w}:4


B2: Xây dựng FP-Tree và Node Link

B3: Khai thác tập phổ biến từ FP-Tree

* Conditional pattern base với hậu tố w ta có

root->x1->y1->z1->u1->v1
root->x1->yz
root->x1->v1
root->y1->u1

=> Conditional Fp-Tree của w: =>{x,w}:3, {y,w}:3

- Conditional hậu tố yw ta có: root->x2

=> Conditional Fp-Tree của yw null

* Conditional pattern base với hậu tố v ta có

root->x1->y1->z1->u1
root->x1->z1
root->x1
root->y1

=> Conditional Fp-Tree của v: => {x;v}:3

* Conditional pattern base với hậu tố u ta có

root-> x1->y1->z1

root->z1

root->y2

=> Conditional Fp-Tree của u: => {y,u}: 3

- Conditional pattern base với hậu tố yu ta có Conditional Fp-tree của yu null

* Conditional pattern base với hậu tố là z ta có

root->x2->y2

root->x2

=> Conditional Fp-Tree của z: => {x,z}:4

* Conditional pattern base với hậu tố là y ta có

root->x3
=> Conditional Fp-Tree của y: =>{x;y}:3

* Conditional pattern base với hậu tố là x ta có Conditional Fp-Tree của x null

B4: Tập phổ biến tìm được bằng thuật toán Fp-Growth

L= {x}:6,{y}:6,{z}:5,{u}:4,{v}:4,{w}:4,{x,w}:3, {y,w}:3, {x;v}:3, {y,u}: 3, {x,z}:4,


{x;y}:3

b) Phát sinh luật kết hợp mạnh. MinConf = 70%

( em xét tập phổ biến của thuật toán Apriori)

- Xét Itemset phổ biến {u,y}, tập luật kết hợp ta có thể có:

R1: u=>y, conf(u=>y) = |{u,y}|/{u} = ¾ = 75% - Luật mạnh

R2: y=>u, conf(y=>u) = |{u,y}|/{y} = 3/6 = 50% - Không phải luật mạnh

-Tương tự ta xét {v,x}, {w,x}, {w,y}, {x,y}, {x,z}

R3: conf(v=>x) = ¾ = 75% - Luật mạnh


R4: conf(x=>v) = 3/6 = 50% - Không phải luật mạnh
R5: conf(w=>x) = ¾ = 75% - Luật mạnh
R6: conf(x=>w) = 3/6 = 50% - Không phải luật mạnh
R7: conf(w=>y) = ¾ = 75% - Luật mạnh
R8: conf(y=>w) = 3/6 = 50% - Không phải luật mạnh
R9: conf(x=>y) = 3/6 = 50% - Không phải luật mạnh
R10: conf(y=>x) = 3/6 = 50% - Không phải luật mạnh
R11: conf(x=>z) = 4/6 = 66.7%% - Không phải luật mạnh
R12: conf(z=>x) = 4/5 = 80% % - Luật mạnh

Vậy tập luật kết hợp mạnh gồm: {u}=>{y}, {v}=>{x}, {w}=>{x}, {w}=>{y}, {z}=>{x}

c) Đúng với kết quả thực hiện trên Weka và Orange

Ảnh kết quả trên Orange: Tập Itemset phổ biến và tập luật kết hợp mạnh
Em có gửi file data và .ows

Bài 2: MinSup= 30%, MinConf= 90%

a) * Thuật toán Apriori:

B1: Duyệt D:

C1: {a}:5, {b}:7, {c}:5, {d}:9, {e}:6


=> L1: {a}:5, {b}:7, {c}:5, {d}:9, {e}:6
=> L: {a}:5, {b}:7, {c}:5, {d}:9, {e}:6

B2: Phát sinh C2: {a,b}, {a,c}, {a,d}, {a,e}, {b,c}, {b,d}, {b,e}, {c,d}, {c,e}, {d,e}

Duyệt D:

=> C2: {a,b}:3, {a,c}:2, {a,d}:4, {a,e}:4, {b,c}:3, {b,d}:6, {b,e}:4, {c,d}:4, {c,e}:2,
{d,e}:6

=> L2: {a,b}:3, {a,d}:4, {a,e}:4, {b,c}:3, {b,d}:6, {b,e}:4, {c,d}:4, {d,e}:6

=> L: {a}:5, {b}:7, {c}:5, {d}:9, {e}:6, {a,b}:3, {a,d}:4, {a,e}:4, {b,c}:3, {b,d}:6,
{b,e}:4, {c,d}:4, {d,e}:6

B3: Phát sinh C3: {a,b,d}, {a,b,e}, {a,d,e}, {b,c,d}, {b,d,e}

*Không phát sinh {b,c,e} vì {c,e} Không phổ biến – ÁP DỤNG TÍNH CHẤT APRIORI

Duyệt D:

=> C3: {a,b,d}:2, {a,b,e}:2, {a,d,e}:4, {b,c,d}:2, {b,d,e}:4


=> L3: {a,d,e}:4, {b,d,e}:4
=> L: {a}:4, {b}:7, {c}:4, {d}:6, {e}:6, {a,b}:3, {a,d}:4, {a,e}:4, {b,c}:3, {b,d}:6,
{b,e}:4, {c,d}:4, {d,e}:6, {a,d,e}:4, {b,d,e}:4

B4: Phát sinh C4: Không có

=> L3: rỗng


=> L: {a}:5, {b}:7, {c}:5, {d}:9, {e}:6, {a,b}:3, {a,d}:4, {a,e}:4, {b,c}:3, {b,d}:6, {b,e}:4,
{c,d}:4, {d,e}:6, {a,d,e}:4, {b,d,e}:4

* Thuật toán FP-Growth

B1: Duyệt D:

=> L1: {d}:9, {b}:7, {e}:6, {a}:5, {c}:5

B2: Xây dựng FP-Tree và Node Link

B3: Khai thác tập phổ biến từ Fp-Tree

* Conditional pattern base với hậu tố là c ta có

root->d1->b1->e1

root->d1->b1

root->d1->e1->a1

root->d1

root->b1->a1
=> Conditional Fp-Tree của c: => {b,c}:3,{{d,c}:4

- Conditional pattern base với hậu tố là bc ta có Conditional Fp-Tree null

* Conditional pattern base với hậu tố là a ta có

root->d2->b2->e2

root->d2->e2

root->b1

=> Conditonal Fp-Tree của a:


=>{e,a}:4,{b,a}:3,{d,a}:4

- Conditional pattern base với hậu tố là ea ta có

root->d2->b2

root->d2

=> Conditional Fp-Tree của ea: => {d,e,a}:4

* Conditional pattern base với hậu tố là e ta có

root->d4->b4
root->d2

=>Conditional Fp-Tree của e: =>{d,e}:6,{b,e}:4,{d,b,e}:4

* Conditional pattern base với hậu tố là b ta có

root->d6

root

=> Coditional Fp-Tree của b: =>{d,b}:6

* Conditional pattern base với hậu tố là d ta có Fp-Tree của d null

B4: Tập luật phổ biến tìm được bằng thuật toán Fp-Growth

L={d}:9,{b}:7,{e}:6,{a}:5,{c}:5,{b,c}:3,{d,c}:4,{e,a}:4,{b,a}:3,{d,a}:4,{d,e}:6,
{b,e}:4, {d,b}:6, {d,b,e}:4, {d,e,a}:4

b) Phát sinh luật kết hợp mạnh

- Xét Itemset phổ biến {a,b}, tập luật kết hợp ta có thể có:

R1: a=>b, conf(a=>b) = |{a,b}|/{a} = 3/5 = 0.6 - Không phải luật mạnh

R2: b=>a, conf(b=>a) = |{b,a}|/{b} = 3/7 = 0.429 - Không phải luật mạnh

-Tương tự ta xét {a,d}, {a,e}, {b,c}, {b,d}, {b,e}, {c,d}, {d,e}, {a,d,e}, {b,d,e}

R3: conf(a=>d) = 0.8 - Không phải luật mạnh


R4: conf(d=>a) = 0.444 - Không phải luật mạnh
R5: conf(a=>e) = 0.8 - Không phải luật mạnh
R6: conf(e=>a) = 0.667 - Không phải luật mạnh
R7: conf(b=>c) = 0.429 - Không phải luật mạnh
R8: conf(c=>b) = 0.6 - Không phải luật mạnh
R9: conf(b=>d) = 0.857 - Không phải luật mạnh
R10: conf(d=>b) = 0.667 - Không phải luật mạnh
R11: conf(b=>e) = 0.571 - Không phải luật mạnh
R12: conf(e=>b) = 0.667 - Không phải luật mạnh
R13: conf(c=>d) = 0.8 - Không phải luật mạnh
R14: conf(d=>c) = 0.444 - Không phải luật mạnh
R15: conf(d=>e) = 0.667 - Không phải luật mạnh
R16: conf(e=>d) = 1 - Luật mạnh
R17: conf(a=>{d,e}) = 0.8 - Không phải luật mạnh
R18: conf(d =>{a,e}) = 0.444 - Không phải luật mạnh
R19: conf(e=>{a,d}) = 0.667 - Không phải luật mạnh
R20: conf(b=>{d,e}) = 0.571 - Không phải luật mạnh
R21: conf(d=>{b,e}) = 0.444 - Không phải luật mạnh
R22: conf(e=>{d,b}) = 0.67 - Không phải luật mạnh
R23: conf({a,d}=>e) = 1 - Luật mạnh
R24: conf({a,e}=>d) = 1 - Luật mạnh
R25: conf({b,d}=>e) = 0.667 - Không phải luật mạnh
R26: conf({b,e}=>d) = 1 - Luật mạnh
R27: conf({d,e}=>a) = 0.667 - Không phải luật mạnh
R28: conf({d,e}=>b) = 0.667 - Không phải luật mạnh

Vậy tập luật kết hợp mạnh gồm: {e}=>{d}, {a,d}=>{e}, {a,e}=>{d}, {b,e}=>{d}

c) Đúng với kết quả thực hiện trên Weka và Orange

Ảnh kết quả trên Orange: Tập Itemset phổ biến và tập luật kết hợp mạnh

Em có gửi file data và .ows

Bài 3: MinSup= 50%, MinConf= 80%


a) * Thuật toán Apriori:
0. Duyệt D:
C1: {a}:8, {b}:9, {c}:3, {d}:4, {e}:3, {f}:6, {g}:6, {h}:6, {i}:2
=> L1: {a}:8, {b}:9, {f}:6, {g}:6, {h}:6
=> L: {a}:8, {b}:9, {f}:6, {g}:6, {h}:6

1. Phát sinh C2: {a,b}, {a,f}, {a,g}, {a,h}, {b,f}, {b,g}, {b,h}, {f,g}, {f,h}, {g,h}

Duyệt D:

=> C2: {a,b}:7, {a,c}:2, {a,g}:4, {a,f}:4, {a,g}:4, {a,h}:6, {b,f}:6, {b,g}:5, {b,h}:5,
{f,g}:3, {f,h}:2, {g,h}:3

=> L2: {a,b}:7, {a,h}:6, {b,f}:6, {b,g}:5, {b,h}:5


=> L: {a}:8, {b}:9, {f}:6, {g}:6, {h}:6, {a,b}:7, {a,h}:6, {b,f}:6, {b,g}:5, {b,h}:5

2. Phát sinh C3: {a,b,h}

*Không phát sinh {b,f,g} vì {f,g} không phổ biến – ÁP DỤNG TÍNH CHẤT APRIORI
Không phát sinh {b,f,h} vì {f,h} không phổ biến – ÁP DỤNG TÍNH CHẤT APRIORI
Không phát sinh {b,g,h} vì {g,h} không phổ biến – ÁP DỤNG TÍNH CHẤT APRIORI
Duyệt D:

=> C3: {a,b,h}:5


=> L3: {a,b,h}: 5

3. Phát sinh C4: Không có

=> L4: rỗng

=> L: {a}:8, {b}:9, {f}:6, {g}:6, {h}:6, {a,b}:7, {a,h}:6, {b,f}:6, {b,g}:5, {b,h}:5, {a,b,h}:5

* Thuật toán FP-Growth

B1: Duyệt D:

=> L1: {b}:9, {a}:8, {f}:6, {g}:6, {h}:6

B2: Xây dựng FP-Tree và Node Link


B3: Khai thác tập phổ biến từ Fp-Tree

* Conditional pattern base với hậu tố là h ta có

root->b2->a2->g2

root->b2->a2->f2

root->b1->a1

root->a1->g1

=> Conditional FP-Tree của h: =>{b,h}:5,{a,h}:6

- Conditional pattern base với hậu tố là ah ta có

root->b5

root
=> Conditional Fp-Trê của ah: =>{b,a,h}:5

*Conditional pattern base với hậu tố là g ta có

root->b2->a2

root->b1->a1->f1

root->b2->f2

root->a1

=>Conditional Fp-Tree của g: =>{b,g}:5

*Conditional pattern base với hậu tố là f ta có

root->b4->a4

root->b2

=>Conditional Fp-Tree của f: =>{b,f}:6

*Conditional partern base với hậu tố là a ta có

root->b7

root
=>Conditional Fp-Tree của a: =>{b,a}:7

*Conditional pattern base với hậu tố là b ta có Conditional Fp-Tree của b null

B4: Tập luật kết hợp tìm được bằng thuật toán FP-Growth

L={b}:9, {a}:8, {f}:6, {g}:6, {h}:6, {b,h}:5,{a,h}:6, {b,g}:5, {b,f}:6, {b,a}:7, {b,a,h}:5

b) Phát sinh luật kết hợp mạnh

- Xét Itemset phổ biến {a,b}, tập luật kết hợp ta có thể có:

R1: a=>b, conf(a=>b) = |{a,b}|/{a} = 7/8 = 0.875 - Luật mạnh

R2: b=>a, conf(b=>a) = |{b,a}|/{b} = 7/9 = 0.778 - Không phải luật mạnh

-Tương tự ta xét {a,h}, {b,f}, {b,g}, {b,h}, {a,b,h}

R3: conf(a=>h) = 0.75 - Không phải luật mạnh


R4: conf(h=>a) = 1 - Luật mạnh
R5: conf(b=>f) = 0.667 - Không phải luật mạnh
R6: conf(f=>b) = 1 - Luật mạnh
R7: conf(b=>g) = 0.556 - Không phải luật mạnh
R8: conf(g=>b) = 0.833 - Luật mạnh
R9: conf(b=>h) = 0.556 - Không phải luật mạnh
R10: conf(h=>b) = 0.833 - Luật mạnh
R11: conf(a=>{b,h})= 0.625 - Không phải luật mạnh
R12: conf(b=>{a,h}) = 0.556 - Không phải luật mạnh
R13: conf(h=>{a,b})= 0.833 - Luật mạnh
R14: conf({a,h}=>b) = 0.833 - Luật mạnh
R15: conf({a,b}=>h)= 0.714 - Không phải luật mạnh
R16: conf({b,h}=>a) = 1 - Luật mạnh

Vậy tập luật kết hợp mạnh gồm: {a}=>{b}, {h}=>{a}, {f}=>{b}, {g}=>{b}, {h}=>{b},
{h}=>{a,b}, {a,h}=>b, {b,h}=>a

c) Đúng với kết quả thực hiện trên Weka và Orange

Ảnh kết quả trên Orange: Tập Itemset phổ biến và tập luật kết hợp mạnh
Em có gửi file data và .ows

You might also like