BÀ B ÀI À À ÀI 3
BÀI TẬP 1
BÀI TẬP Thời gian : 25’
Tid Items 100 M1, M2, M5 Cho CSDL giao dịch bên M2, M4 g thuật thuật toán Apriori 200 1. Sử dụng M2, M3 để tìm cá các tậ tập ph phổ biến iến với với 300 400 M1, M2, M4 minsupp = 22 % M1, M3 2. Liệ Liệtt kê các tập phổ biế biếnn tối tối 500 600 M2, M3 đạii và tậ đạ tậpp bao bao ph phổổ bi biến ến.. 700 M1, M3 3. Tìm tấ tấtt cả các luậ luậtt kết kết hợp 800 M1, M2, M3, thỏa mãn minsupp=22% và M5 a. Minconf = 50 % 900 M1, M2, M3 b. Minconf = 70%
2
1
THUẬT TOÁN APRIORI minsupp = 22% = 2/9
CSDL D Tid 100 200 300 400 500 600 700 800 900
Items M1, M2, M5 M2, M4 M2, M3 M1, M2, M4 M1, M3 M2, M3 M1, M3 M1, M2, M3, M5 M1, M2, M3
Tid M1 M2 M3 M4 M5 100 1 1 0 0 1 200 0 1 0 1 0 300 0 1 1 0 0 400 1 1 0 1 0 500 1 0 1 0 0 600 0 1 1 0 0 700 1 0 1 0 0 800 1 1 1 0 1 900 1 1 1 0 0 3
THUẬT TOÁN APRIORI minsupp= 2/9 = 22%
C 1 1st scan
Itemset supp {M1} {M2} {M3} {M4} {M5}
6 7 6 2 2
L1 Itemset supp {M1} {M2} {M3} {M4} {M5}
6 7 6 2 2
4
2
THUẬT TOÁN APRIORI minsupp= 2/9 = 22% Itemset supp L 2
Itemset {M1, M2} C 2 C 2 {M1, M3} {M1, M4} 2nd scan {M1, M5} {M2, M3} {M2, M4} {M2, M5} {M3, M4} {M3, M5} {M4, M5}
{M1, M2} {M1, M3} {M1, M4} {M1, M5} {M2, M3} {M2, M4} {M2, M5} {M3, M4} {M3, M5} {M4, M5}
4 4 1 2 4 2 2 0 1 0
Itemset supp {M1, M2} {M1, M3} {M1, M5} {M2, M3} {M2, M4} {M2, M5}
4 4 2 4 2 2
5
THUẬT TOÁN APRIORI C 3
Itemset {M1, M2, M3} {M1, M2, M5}
minsupp= 2/9 = 22% C 3
3 r d s c a n
-> T ậ p phổ biế n L = L1 ∪ ∪ L 2 ∪ ∪ L 3 (liệ t kê chi tiế t 13 tậ p)
Itemset
supp
{M1, M2, M3} {M1, M2, M5}
2 2
C 4 = {}
L 3
Itemset
supp
{M1, M2, M3} {M1, M2, M5}
2 2 6
3
Tập phổ biến tối đại + bao phổ biến
Các tập phổ biến tối đại :
{M1, M2, M3}, {M1, M2, M5} – Các tập ph ổ biến
∈
L3
{M2, M4}
Các tập bao phổ biến :
{M1, M2, M3}, {M1, M2, M5}, {M2, M4} – Các tập phổ biến tối đại
{M1, M2}, {M1, M3}, {M2, M3}, {M1}, {M2}, {M3} 7
TÌM LUẬT KẾT HỢ P {M1, M2, M3} - TẬP PHỐ BIẾN ∈ L3
Các tập con khác rỗng của tập phổ biến : {M1, M2}, {M1, M3}, {M2, M3}, {M1}, {M2}, {M3}
Các luật có thể :
M1 ∧ M2 ⇒ M3
conf = 2/4 = 50%
M1 ∧ M3 ⇒ M2
conf = 2/4 = 50%
M2 ∧ M3 ⇒ M1
conf = 2/4 = 50 %
M1 ⇒ M2 ∧ M3
conf = 2/6 = 33%
M2 ⇒ M1 ∧ M3
conf = 2/7 = 29%
M3 ⇒ M1 ∧ M2
conf = 2/6 = 33%
Min conf = 50 %
Min conf = 70 % 8
4
TÌM LUẬT KẾT HỢ P {M1, M2, M5} - TẬP PHỐ BIẾN ∈ L3
Các tập con khác r ỗng của tập phổ biến : {M1, M2}, {M1, M5}, {M2, M5}, {M1}, {M2}, {M5}
Các luật có thể :
M1 ∧ M2 ⇒ M5
conf = 2/4 = 50%
M1 ∧ M5 ⇒ M2
conf = 2/2 = 100%
M2 ∧ M5 ⇒ M1
conf = 2/2 = 100 %
M1 ⇒ M2 ∧ M5
conf = 2/6 = 33%
M2 ⇒ M1 ∧ M5
conf = 2/7 = 29%
M5 ⇒ M1 ∧ M2
conf = 2/2 = 100%
Min conf = 70 % 9
TÌM LUẬT KẾT HỢ P
Tươ ng tự vớ i các tập phố biến ∈ L2 :
{M1, M2}, {M1, M3}, {M1, M5}, {M2, M3}, {M2, M4}, {M2, M5} Các luật có thể :
M1 ⇒ M2
conf = 4/6 = 66.7%
M2 ⇒ M1
conf = 4/7 = 57%
M1 ⇒ M3
conf = 4/6 = 66.7%
M3 ⇒ M1
conf = 4/6 = 66.7%
M1 ⇒ M5
conf = 2/6 = 33.3%
M5 ⇒ M1
conf = 2/2 = 100%
Min conf = 70 %
….. 10
5
TÌM LUẬT KẾT HỢ P
Các luật kết hợ p thỏa mãn minsupp=22% và minconf=70% :
M1 ∧ M5 ⇒ M2
M2 ∧ M5 ⇒ M1
M5 ⇒ M1 ∧ M2
M5 ⇒ M1
M4 ⇒ M2
M5 ⇒ M2 11
TÌM LUẬT KẾT HỢ P
Các luật kết hợ p thỏa mãn minsupp=22% và minconf=50% :
M1 ∧ M5 ⇒ M2
M2 ∧ M5 ⇒ M1
M5 ⇒ M1 ∧ M2
M5 ⇒ M1
M4 ⇒ M2
M5 ⇒ M2
M1 ∧ M2 ⇒ M3
M1 ∧ M3 ⇒ M2
M2 ∧ M3 ⇒ M1
M1 ∧ M2 ⇒ M5
M1 ⇒ M2
M2 ⇒ M1
M1 ⇒ M3
M3 ⇒ M1
M2 ⇒ M3
M3 ⇒ M2
12
6