Download as pdf
Download as pdf
You are on page 1of 24
Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang Gom cum (clusterin: Phan tich bing gom cum ™ Phan tich bing gom cum Ki gi ? ‘Déi tugng twong tu va khong tuong tu Cac loai dir ligu trong phan tich bing gom cum Cae phwong phap gom cum chinh Cae phuong phap phan cAp Cae phwong phap phan hoach Tom tit I)Phan tich bing gom cum lA gi? Gom cum nhin tir gdc 46 ty nhién 1a mét vige hét sire binh thuéng ma ching ta van lam va thye hign hang ngay vi dy nhu phan logi hgc sinh kha, gidi trong lop, phan logi at dai, phan loai tai san, phan loai sach trong thu vign.. = Gom cum: Gom cae déi tugng dé ligu © Tuomg ty véi mot doi tong kha trong cing eum co Khéng tong ty véi cde déi tugng trong céc cum khée (Tie la thye hign gom céc déi turgng cé ciing tinh chat hay e6 ede tinh chét gan gidng nhau thinh nhém) Vi dy: Phan logi hoc sinh trong mot I6p theo diém sé thinh 5 nhém gidi, khd, trung binh kh, trung binh, yéu. Nhing hoc sinh cé diém tir 8-10 phan vao nhém gidi, tit 7-8 phan yao nhém khé, 6-7 phan vao nhém trung binh kha, 5-6 nhém TB, 5 tré xuéng vao nhém yéu. ° Myc tigu cia gom cum: Mve tigu chinh ciia phwong phap phan cum dit ligu 18 nhém cde di tugng tuong ty nhau trong tp dit ligu vao céc cum sao cho cdc déi tugng thuge cling mét Iép 1 tuong déng con cae déi tugng thude cae cum khée nhau sé khong tuong dong. @ Ung dung cia gom cum: o. Kinh doanh: phat hién ra nhém khach hang. Vi dy Trong tiép thi my phim 6 thé phan nhém khéch hang ua chuéng my phim Han Qué, nhém khich hang ua chung Mj pham phép... ©. Sinh hge: phan logi dng, th ¢ vil, phan logi gen. © Dia li: nhan ra cdc ving dat giéng nhau dya vio CSDL quan sat trén trai dat, phan nhém nha,... Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang ° Bao hiém: nhjin dang cde nhém c6ng ty c6 chinh sch bio hiém mé 16 véi chi phi dén bi trung binh cao © Hoach dinh thinh phé: nhdn dang cdc nhém nha cita theo logi nha, gid tri va vi tridia ly. © MGt céng cy déc lap dé xem xét phan bé dit ligu © Lam bude tin xir ly cho cde thudt toan khée @ > Thé nao la gom cum tot — Mét phuong phép tét sé tao ra cde cum cé chat lugng cao véi: © Tuong ty cao cho trong lép (intra-class) © Tuong ty thép gitta cdc lép (inter-class) © Tire la nhing déi trong cing mét nhom c6 sy giéng nhau hode gn giéng nhau cing nhiéu thi chat lugng gom cum sé cing cao — Chat lugng cita két qué gom cum phy thuéc vao: © D6 do tuong ty sir dung © Cai dat d6 do tuong ty ™@ Cac yéu cu cia gom cum trong khai pha dé ligu. "= Scalability: Co thé thay déi kich c@. = Kha ning lam vige cde loai thude tinh khée nhau. = Kham phé ra céc cum 6 hinh dang bat ki = Kha nang lim viée véi dit ligu c6 chia nhiéu ( outliers) H Twong ty va bat twong tu gira hai déi twang (1) — Khéng cé dinh nghia duy nhat vé su twong ty va bat tuong ty gitta cde déi tugng dit ligu — Dinh nghia vé twong ty va bat tugng ty gitta cdc déi tuong tiy thude vao © Logi dir ligu khao sat © Loai tuong ty can thiét — Tuong ty /Bat tuong ty gitta déi tugng thudng duge biéu dién qua d6 do khong cach d(x,y) — Ly tong, mgi d6 do khong céch phai la mét va phai théa céc diéu kign sau: 1. d(x,y)20 2. d(x,y) =0iff x= y 3. d(x,y)=d(y,x) 4, d(x,z)Sd(x,y)+d(y,2) Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang T1)Loai dé ligu trong phan tich cym © Cie bién khoang ti 1é Bién nhj phan Cac bién dinh danh, thir tu, tilé Cae bién c6 kiéu hén hop Cae kiéu dit ligu phite tap Cac bién tri khoang (1) Dinh nghia: Bién tri khoang 1a thang do tuyén tinh, thé. Vi du: trong lugng, chiéu cao, chiéu ngang, chiéu doe, tudi, nhiét d6 thoi tiét, HM M@t nhém ede d6 do khoang céch phd bién cho bién ti Ig theo khoang la khoing KD xj, xj2, ..., xjp) ld cac déi tugng dit ligu p-chiéu va q ™ Néu q=1, dé do khoang cach la Manhattan AGA Alxj,- > pl lei, ltt Lay, -¥ jy | H Néu q=2, d6 do khoang cdch la khoang cdch Euclidean dii, P i) xh xP Bin nhj phan chi c6 hai trang thai 18 0 hay | Bing contingency table cho dit ligu nhj phan: Subject j 1 a 6b atb Subjecti © d-et+d sum| ate bid p Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang M Hé sé Jaccard coefficient (tuwong ty khong bat bién, néu bién nhi phan 1a bat d6i ximg): — Bién nhj phan 46i xtmng va bat déi xing © Mét bign nhi phan 1 déi ximg néu dong théi cdc trang thai ciia né 6 tam quan trong nhu nhau va mang cing mét trong sé. Do dé, khéng 6 sy wu tién khi két qua dua ra phai duge ma hod 1a 0 hoge 1. Vi dy thude tinh gigi tinh c6 2 trang thai la male va female. Tinh tuong ty gitta cdc bién nhi phan déi ximg duge goi la tinh tuong ty bat bién, trong dé két qua khéng thay déi khi 1 hoac tit cd céc bién nhi phan duge ma hod khdc nhau. V6i cdc tinh giéng nhau bat bién, mot hé sé duge biét dén nhiéu nhat dé xae dinh sy khac nhau gitta j la hé sé dds sanh don gian, duge dinh nghia nhw sau: bre WD ererd = M6t bién nhi phan 1a khéng déi ximg néu cdc két qua cia cdc trang théi khong cé tim quan trong nhu nhau. Chang han két qua 4m tinh va duong tinh khi kham bénh. Theo thoi quen, ching ta sé ma hod két qua quan trong nhat, thuéng 1a két qua it xdy ra bang | (HIV duong tinh) va bang 0 cho két qua khéc (HIV 4m tinh). Tinh tuong ty gitta cdc bién nay duge goi li trong ty khéng bat bién. Véi sy tuong ty khéng bit bién, hé sé duge biét dén nhiéu nhat 1a hé s6 Jaccard trong dé sé phép so sénh pha dinh coi nhu khéng quan trong va do 46 duge bé qua khi tinh todn. di, j= atbte Vi dy: Bang hé so bénh nhan Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang Name(tén) | Gender(gidi | Fever(ho) | Cough(sét) | Test-1 | Test-2 | Test-3 | Test-4 tinh) Jack M Y N P N N N Mary F Y N P N P N Jim M Y P N N N N C6 8 thude tinh Name, Gender, Fever, Cough, Test-1, Test-2, Test-3, Test-4 trong dé: 0 Gender la thuge tinh nhj phan adi xing Cée thuge tinh cOn Iai Ld nbj phan bat déi ximg Ta gin cée tri Y va P bang | va tri N duge gan bang 0. Tinh khodng céch gitta cée bénh nhn dya vao cdc bat déi ximg ding hé sé Jacard ta c6 bang gid tri nhu sau: name Cough Test-1 Test-2 Test-3 Test-4 Jack 1 0 1 0 0 0 Marry 1 0 1 0 Il 0 Jim 1 1 0 0 0 0 + Tinh d(Jack,Marry): * Bang dit ligu dang nhj phan: Bai tap chuyén dé Datamining_nhém 2 Marry sum 1 0 Jack 1 2 0 2 0 1 3 4 sum [3 3 6 b=0, c=1, d=3 o+1 D(Jack,Marry): 2+ + Tinh:d(Jack,Jim): Bang dtr ligu nb phan: Jim T 0 sum Jack FF i i 3 0 T 3 q sum [2 q 6 GVHD: Nguyén Huong Giang Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang + Tinh dgim,marry): Bang dit ligu nj phin: mary 1 0 sum Jim 7 T T 2 0 2 2 4 sum (3 3 6 tir bang: @=1, b=, e=: aGjim,marry)=> 122-075 Nhu vay, theo tinh toan trén Jim va Marry c6 kha nang mic bénh giéng nhau nhiéu nhat vi dGim, marry)=0.75 1a ln nhat. Cée bién dinh danh ( nominal variables) Dinh nghia: Bién dinh danh 1a mé& réng cia bién nhj phan vi nhiéu hon hai trang thai. Vi du: thuge tinh mau sie: do, vang, xanh, luc. Cé hai phuong php dé tinh todn su tuong ty gitta hai déi tuong: * Phuong phap 1: Déi sinh don gin véi m 1a sé lan déi sang, p 1a tong s6 cdc bién ai, =? Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang * Phuong phap 2: Ding mét sé lugng Ién cdc bién nhi phan. 1 Tao bién nhj phan méi cho timg trang thai dinh danh, Cée bién thir ty :c6 thé 1a lién tue hay rai rac Thir ty eita cde tri 1a quan trong, vi dy hang. Cé thé xit ly nhu ti 1é khodng nhw sau: - Thay thé xi¢ boi hang cua ching - dnh xa pham vi cia timg bién vao doan [0,1] bang cach thay thé 45i trgng i trong bién tht £b4i ry € (LwM,} - Tinh sy khée nhau ding ede phuong phap cho bién ti 1g theo khodng Cae bién thang do tilé Dinh nghia: La cdc bién cé d6 do duong trén thang phi tuyén, xAp xi thang do ma. Vi du: Ac™ hay Acar Cae phuong php tinh d6 tuong ty: Xirly ching nhu céc bién thang do khoing 4p dung cdc bién déi logarithmic Xirly ching nhu dit ligu thir ty lign tue Xi ly ching theo hang nhw thang do khoang. Cac bién c6 kiéu hon hop M6t co sé di ligu c6 thé chita déng théi ca séu loai bién. Khi dé cé thé ding céng thite duge gan trong dé két hgp ede higu qua: Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang » ahd” dli,j)= =0 néu xyhode xj missing hoe xie=Xje=0 trudng hop khdc 6/ Dong gp cia bién f vao khodng cach d(i,j): - Néu fla bién nhj phan hay dinh dan: di =0 néu xig=Xip cdc truéng hgp khdc di =1 - Néu fla dya trén khoang céch: ding khoang céch duge chudn hoa. = Néu fla thir tu thang do ti s6 tinh cdc hang rip va xit ly zpnhu thang do khoang ryol Cae bién tile © D6 do duong trén thang phi tuyén, xp xi thang do ma o Vidu AcBt hay Ae Bt © Cac phuong phap: xit ly ching nhu cdc bién thang do khoang khéng phai la Iya chon tét / p dung bién dai logarithmic yif = log(xif) xit ly ching nhu di ligu thit ty lign tye va xir ly chting theo hang nhw thang do khoing Cae bién cé kiéu hén hop . © CSDLCé thé chita ca sdu logi bién © Cé thé dig céng thite duge gan trong dé két hgp cdc higu qua: ai, j)= SU) pe OW. . Oy) = 0 if vr brixy is missing, or xy = xy = 0; otherwise §? = 1 Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang Déng gép cila bién f vao khoang cach d(i,j): - Néu fA bién nhj phan hay dinh danh: dL? =0 néu xg=Kip cdc truéng hgp khée di) = = Néu fl dya trén khoang cach: ding khoang céch durge chudn hod. = Néu fla thir ty thang do ti s6 tinh cdc hang rip va xit ly zpnhu thang do khoang ry ol Cae kiéu dir ligu phire tap ‘Tat cd cde déi tung duge xem xét a trong KPDL 1a khéng quan h¢ => Loai dit ligu phite tap ‘Vi dy vé logi dit ligu nhu vay 1a dit ligu khong gian, dor ligu da phuong tign, dit ligu di truyén, dit ligu vin ban, di ligu chudi théi gian, dit ligu van ban va dit ligu duge thu gom tir World-Wide Web Cae d6 do tong ty va bat tuong ty thuong hoan toan khée nhau img véi cdc logi dit ligu tren III. Cac phyong phap gom cum (clustering) chinh yéu ™ C&c phwong phap phan cap = Cac phuong php dya trén phn hoach IIL.1 Phuong phap phan cp ( Hierachical methods): Phan c4p: Tao phan cap cum chtr khéng phai phan hoach cae déi tugng. Khac voi phan hoach, phan cap khéng can sé cum k 6 dau vao va ding ma tran khoang céch Lam tigu chudn gom cum. Trong phuong phdp phan cp cé thé ding diéu kién dimg. Vi du: sé cum. Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang Ciiy e&e eym Phan cp cum thudng duge biéu dién dudi dang cay cia cae cum. Trong a6: = Céc la cita cay biéu dién timg déi tuong = Cée nit trong biéu dién cae cum ‘6 hai phwong phap tao cay phan cay Phwong phap phan cAp tir trén xuéng: Bat dau tir cum lén nhat chia tat ca cac déi tugng. Chia cum phan biét nhat thanh cae cum nhé hon va tiép dién cho dén khi cé n cum thoa man diéu kién dimg. ab a © ap @ <> @ an chia- divisk \ \ \ \ Phan chia- divisive \ Step4 Step3 Step2 Step 1 Step 0 Phuong phap tir duréi len: Cée buée thye hign: B1: Tao n nhém, mdi nhém gém mét déi tuong va lap ma tran khoang céch cdp n. B2:Tim 2 nhém u,v cé khoang cach nhé nhat (duv) B3: Gop nhém u véi mhém y. Ky higu nhém méi 1a (uv), Lap ma trin khoang cach méi bang cach: + Logi cdc hang va et tong (mg véi cde nhém u,v Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang +Thém mot hang vi mt c6t dé Iu khodng céch cha nhém uv véi cde nhém con Iai B4: Lap lai cde buée 2 va bude 3 cho dén khi chon duge k nhém thich hgp nhat cho bai toan hode chi cé mét nhém duy nhat. Phuong phap nay dura t6i bai toan nhé hon : Tim khoang céch gitta hai nhom > Cf phuong phip tinh khoang ciich gira hai nhém 1A: 1. Phuong phap két néi don: Trong phwong phap két néi don diéu kign 6 day 1a Khodng céch gitta hai cum Ja khoang cach ngén nhat tir m6t thanh vién cia nhém. t6i thanh vign cia nhém khac. d(C1,C2) = min(drs), vir thude C1; s thuge C2 (#) Vi du: Cho 5 déi tugng. Véi khoang cach gitta cde déi trong duge cho nhw sau: (1,2) =2, d(1,3)=6, d(1,4)=10, d(1,5)=9, d(2,3)=5, d(2,4)=9, d(2,5)=8, , d(3,. ma tr§n khoang cach cia 5 déi twong 18 D nhu sau: Gy 5 (45 026109 20598 65045 109403 98530 lap ma trfn khoang céch git 5 nhém nay i BI: Ta xdy dymg 5 nhém va D=DI B2: Khoang cach gitta 2 nhém | va 2 nhé nbat la 2 E khoang céch méi la DI Ta sé g6p nhém I va 2 thinh mt nhém.. Khi dé ta sé cp nhat lai ma tran + xod cOt I va ding | cia nhém 1. Xod o6t 2 va dng 2 cia nhém 2. + Dé thém mét c6t va mét dong dé luw khodng cdch cia nhom (12) dén cdc nhém cén Iai ta tinh theo céng thite (*) Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang DL D(1,3)=6, d(2,3 = min(drs) véi r thude nhém (12), va s thuge nhém 3. =5. vay nén d(12,3)=5. Hoin toan tuong ty ta tinh duge d(12,3)-8, d(12,4)-9. Khi dé ta thu duge ma tran khoang cach méi DI 1a 059 Di-| 504 940 we B4: - Lap lai buée 2, khodng céch eiia nhém 5 va nhém 4 1a nhé nhat d(5,4)=3 - Lap lai bude 3, Ta sé gop nhém 4 va 5 thinh m9t nhém.. Khi dé ta sé cp nhat lai ma tran khoang céch méi la D2 + xoa ct 4 va dong 4 cia nhém 4. Xoa c6t 5 va déng 5 cua nhém 5 + Thém mit dang vi mot c6t dé luu khodng céch cia nhém (45) 6 cde nhém khdc. Ta tinh theo céng théte (*) D(45, 12)=min(drs) véi r thuge (45), s thuge (12) D@,I=10, 4(4,2)=9, (S,1)=9, (5,2)°8. vay d(45,12)-8. Hoan toan tong ty ta tinh duoc d(45,3)=4. Khi dé ta thu duge ma tran khoang cich_méi D2 la: 058 D2= 504 840 - Lap lai bude 2: d (45,3)=4 1a nho nat Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang ~ Lap lai bude 3: ta gOp nhém (45) va nhém 3 thanh mét nhém. Cp nhgt ma trén khoang, cach méi li D3. + Xo dong va cét ciia nhom (45), xod dong va c6t ciia nhom 3 + Thém mét dong f-va mét c6t dé lu khodng céch cita nhém moid nay dén cae nhom Khéc ta sé tinh khoang cach theo céng thire (*) D(345,12)= min( drs) véi r thude (345) va s thuge(12). DB,=6, 3,25, d(4,1I=10, d(4,2)=9, d(5,1)=9, d(5,2)=8. vay d(345,12)=5. Ta thu duge khoang cach méi la D3 1a: 05 D3 so | Cudi cing nhém thu dyoe sé 1a nhém (12543) So dé mé ta cdc bude: Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang 2.Phuong phap két néi day da: d(C1,C2) = max(drs), voir thugc C1; s thuge C2. 3.Phirong phap két ndi trung binh: Khoang cach gitta mot cluster nay va mét cluster khdc 1a twong duong khoang cach trung binh tir mét vai thinh vién_ cua mét nhém nay dén mét vai thanh vién cua nhém khac. D(C1,€2) xy y (drs) Véir thuge Cl, s thuge C2. nin2 Dinh gid: = C&e phuong phdp phan cp cé uu diém Ién 1a: khdi niém don gian, ly thuyét tét. Khi cum duge trén tach, quyét dinh 1a vinh citu, vi vay sé cde phuong an khdc can xem xét bj rit gidm. ~ idm yéu cia phuong phép phan cp: Do vige tron tach cde cum Ia vinh ctru nén quyét dinh sai 1a khong thé khie phye duge. Cée phuong phap phan chia cin théi gian tinh ton va khéng thé scalable cho tap dit ligu lon II1.2 Céc phuong phép dya trén phén hoach a. M6 ta phuong phip Cho mét co sé dir ligu D chita n déi tugng, tgo phan hogch thanh tp c6 k eum sao cho: ~ Méi cum chita it nhat mét déi tugng - Méi déi tugng thudc vé m6t cum duy nhit Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang - Cho trik, tim phan hoach cé k cum sao cho t6i wu hod tiéu chudn phan hoach duge chon, b. Cée phurong php b.1.Phuong php gom cum k-mean Input: Sé céc cum k cén gom va co sé dit ligu chita n déi tung. Output: k cum da duge gom. Thuat giai: gm 4 buée - Buécl: Phan hoach déi tugng thanh k tp con ( cum) ngdu nhién. - Buée 2: Tinh cde tim ( trung binh ciia cée déi tugng trong cum) cho timg cum trong phan hogch hign hanh - Bude 3: Gan mdi d6i tugng cho cum tam gan nhat - Bude 4: Néu cum khéng 6 su thay déi thi dimg, nguge lai quay lai bude 2. Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang ‘Vi du vé thuat toan k-mean, n=! 0, k=2 Bude 2: BE x 49 trung binh. Goi (x1, yl), (32,72) la toa d6 cita 2 diém hat gidng. Ta c6: PeeEEEEEE eee inh cdc diém hat gidng ta di tim toa dé ciia né bing cich tinh hoanh dé va tung x 3.67 Fie Leas “3.17 S_S+T47 yp-StT7 #8 _ 6 a5 4 Su 3444545 B= S44+5+5 _ 45 » 4 Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang Buse 3; Tinh khoang cach tir ede centroid dén ede diém STT] Toad cic | Khoing cich d&n Khoang eich dn Thuge | Thuge cum diém | centroid 1 (3.67, 5.17) | centroid 2 (6.75, 4.25) | _cum | 2 I 6) 4.2 3.62 x 2 (7.3) 3.86 124 x 3 G4) 1.22 3.71 x 4 (7.4) 3.45 0.36 x 5 (4.5) 0.30 2.82 x 6 (5.5) 1.30 1.88 x T (8.5) 4.30 152 x 8 (3.6) 1.22 4.12 x 9 (4.7) 2.02 3.89 x .8) 3,08 33, x Bude 4: Cac déi tugng trong cdc cum cé sy thay déi nén quay lai bude 2. Buse 2: Tinh toa dé cde diém centroid méi #44445 _ 36, 6 FeSHTATHS gas ya- t8#4°5_ 595 Buse 3: Tinh khoang cach ti cée centroid dén cde diém STT] Toad Khong each dn Khoing cach d&n Thuge | Thude cum cacdiém | centroid 1 (3.67, 5.17)_| centroid 2 (6.75, 4.25) |_cum1 2 I 6) 5.00 2.85 x 2 (73) 437 035 x 3 GH 1.95 3.82 x 4 4) 3.80 0.79 x 5 (45) 0.44 2.82 x 6 6.5) 137 247 x T 8,5) a4 215 x 8 3.6) 0.69 4.65 x 9 (4.7) 121 4.65 x 10 G.8) 2AT 6.05 x Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang han xét: Sau khi thye hign bude 3 cde cum khéng cé su thay di nén ditng tai day. Diém manh cita phwong phap gom cum k- means - Higu sudt tuong déi: O(nkt) véi n 1a sé déi tung, k 14 sé cum, t 14 sé ln lap. Thong thudng k, ( Bude 4: Néu gin tm méi thi quay lai buée 2, nguge lai thi dimg. Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang ‘Vi dy thuat toan k-medoid, n=10, aval waa tou, toot oe fora Si re Sena aing Fwe omar egceene, Sea ee as oe ongagh “ cme mee (Gén mBi a6i twang cdn lat vvao cum c6 tam méi Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang © Bude 1: Chon 2 diém c6 toa d6 KI (3,8) va K2(6,4) lam tim eta 2 cum. © Bude 2: Gan timg déi tugng cén lai vao cum c6 tam gan déi tugng nhit. STT | Toad} cic | Khoang cich dn | Khoing cach | Thude cum | Thugc cum digm K1G.8) dén K26,4) | kl ie i 2.6) 2.24 447 x 2 3.4) 4.00 3.00 x 3 (3.8) 0 5.00 x 4 47 141 3.61 x 3 (6.2) 671 2.00 x 6 (6.4) 5.00 0 x 7 7,3) 6.40 Tar x 8 (74) 5.66 1.00 x 9 (7.6) 4.47 2.24 x 10 (8.5) 5.83 2.24 x © Bude 3: Chon diém (7,6) lam tam. STT | Toad} cde | Khoang eich én | Khoing cach] Thuge cum | Thuge cum digm K1G.8) dén K2 (7.6) kl k2 I (2.6) 2.24 5.00) x 2 G4 4.00 447 x 3 3.8) 0 447 x 4 (47) TAT 3.16 x 3 (6.2) 671 4.12 x 6 (6.4) 5.00 2.24 x 7 (73) 6.40 3.00 x 8 (4) 5.66 2.00 x 9 (7.6) 4.47 0 x 10 (8.5) 5.83 141 x Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang + Bude 4: Cac d6i tugng trong cum kl, k2 thay déi. Déi tm (6,4) thanh (7,6) tao ra mot tp déi twrong vai tim méi 18 (7,6). Quay lai buée 2. © Bude 3: Chon diém (8,5) lam tim moi STT ] Toad cde | Khoing céch dfn [Khoang eich | Thude cum | Thude cum iém K1.8) den K2 (8.5) ki k2 1 (2.6) 2.24 6.08 x 2 G4) 4.00 Sl x 3 B.8) 0 5.83 x 4 (47) 141 4.47 x 5 (6.2) 6.71 3.61 x 6 (64) 5.00 2.24 x 7 (733) 6.40 2.24 x 8 (74) 5.66 Tat x 9 (7.6) 447 141 x 10 (85) 5.83 0 x Nhin x¢t: B4i tugng trong cum k1, k2 kh6ng thay doi nén dimg. Bai tap chuyén dé Datamining_nhém 2 GVHD: Nguyén Huong Giang TONG KET Phan tich gom cym céc d6i tugng dya trén sy tuong ty Phan tich gom cum c6 pham vi img dung to lon Cé thé tinh 46 do tuong ty cho nhieu loai dit ligu khée nhau. Vige Iva chon d6 do tong ty tiy thuge vao dit ligu duge ding va logi tong ty cin tim, ic phuong phép gom cum - Cac phuong phap phan cap - Cae phuong phap dya trén phan hoach

You might also like