1567 4990 1 PB PDF

You might also like

Download as pdf
Download as pdf
You are on page 1of 8
‘Tap chi Tin hge va Bib khig boo, P18, 8.4 (2002), 309-16 CACH TIEP CAN TAP THO TRONG VIEC PHAT HIEN TRI THUC TRONG CO SO DU LIEU NGUYEN PANG KHOA Abstract. In this paper we present the state and perspective of rough sets in knowledge database discovery’ (SDD). We concentrate also on some searching methods for global elementary block, related with data extraction which follows the description of each decision class. Besides of some algorithms for template generation, we introduce an improved method for short reducts generation, ‘Tém tat, Béo cio dé cap dén hin trang va trién vong cia tap tho trong vie phit ign tri thie trong co si dit Hou phuc vu tre gidp quyét dink. ‘Theo eéch tiép edn tap thd, chiing t01 tp trung vio mot 86 bal tosin tim kiém ning khci so esp 06 lien quan dén trich chon die liéu dé tir d6 tim ra ose mo t8 clin mdi Kip quyét dinh. Ban cmh mot s6 thust tosn tao sinh mu, ching t6i eting gidi thigu mot gidi thuAt ea tién cho vige tim kiém iit gom. 1. MO DAU ‘Tridt |y t€p tho la mot eich tiép cn ton hoe méi cho tinh khéng chinh xée, tinh mo hé va tinh Khong che chin. Quan hé khong phiin biét dirge Ia eo 96 ton hoe etia 1¥ thuyét tp tho. ‘Trong Iy thuyét tap tho, mdi khsii niém kh6ng chinh xc duvge thay thé bai mét ep ee khiiniém ehinh xe duge goi Ih xp xi dudi va xp xi trén (9). Lf thuyét tap tho ngay eing dire nghién ecru manh mé va o6 nhieu ving dung trong ede I vue hoc may, thu nhn tri thie, phan tich quyét dinh, phat hign tri thitc tir eie CSL, ee hé ehuy gia, Ip lun quy nap vi nhan dang miu, Né eiing gitt mét vai tr quan trong de bist di véi ese hé tro gitip quyét din (10)), h 2, CAC KHAI NIEM CO BAN CUA LY THUYET TAP THO. 2.4, Ce xp xi va ham thanh vién tho sit 66 c9 si tri thite K = (U,R), trong 46 U #2 la mat tap hia han duge goi le vit tru vi R [a mot ho cic quan hé tong duromg trén U. Voi mdi tip eon X CU, Re R, xp xi Redurdi va xp x1 Retren evia X’duege dinh nghia theo thi tir nhur saw R(X) = {2 € U: R(x) CX}, R(X) = {x EU: Re) AX £9}, ‘Trong 46 R(x) ky higu tap tat ed ede Adi tutomg khong phan bigt durge vi dizang chia x duge xic dinh béi quan hé twang dang R. POSR(X) = R(X), R—mién ditong (mien khing dinh) chia. X nghia la lop tuong NEGp(X) =U — R(X), R= mien am (mien phil dinh) cla X BNp(X) = R(X) — R(X), R= mién durimg bién cia X ‘Tap th X duge die tring boi hé $6 ae(X) (goi la d6 ehinh xée etia xp xl) duege xée dink nhur ao NGUYEN BANG KHOA card R(X) |R(X)| an(X) = ——— = card R(X) [R(X)| trong 6X / © vi [NX] ky higu Ine heong ctl tap X. Hign nhién 0 < a(X) <1 véi moi RE R va X CU. Néu axp(X) = 1 thi min durimg bién eda X la rong va tap X la chinh xie di vai R; nguge Iai néu ae(X) < 1 thi tap X 6 mien die’mg, bién rio 4 va Fs tha (con goi li. me hd) Asi we Him think vién thé 06 thé dege dink nghia bing edch ding quan hé trang dirang (quan hé khong phan biét dieac) li [XN R(x)} . 180) = Tre] ign al 10S wK(e) <1 Ham thinh vién thé cdn ding dé dinh nghia cic xdp xi va mién én cia mot tap: R(X) = {x EU WRG) =U; ROX) = {ee U: whl) > 0}; BN p(X) = (2 EU 0< pR(x) <1} Cie dink nghia trén cho théy & day tn tai mot lién két chit giita tinh mo hé va tinh khong chée chén trong If thuyét tp thd, Tink mo hé lien quan t6i cie tap, trong ki tinh khong ehite chan lien quan t6i cée phi tik cba tip. Do vay esc xiip xi lh can thiét khi néi Ve esie Khai nigm mer 1, trong Kbit him thinh vién thé lei cin én khi xem xét dir ligu khong chile ein, 2.2, Rit gon tri thite va ede phy thuge Ce di turgng 66 thé doe phin lp theo nhiéu miu, cho nén ta e6 thé e6 mot ho ese quan he Khong phan biét diwoe R= {Ri, Ray... Rn} trén vi tra U. Giao eta céc quan he turong dhtong {71, Ro... Ry} ky higas (YR = (jy Ri cfing a mot quan hé tong ditong. ‘Trong truimg hyp ny, ede tp so ep Ia ee Ip trong dirang eta quan hé tirong dirong (VR. Vise tip se effp xe dinh duy nbtt tri thite eta ch re ot 96 andi hain lop 06 thé dirge loai bm vin khOng lain thay d6i ho eke tip so ep, n6i eich Khe 1 bo tod tinh khong phan biét duge, ‘Pap exe tiéu R? ciia R sao cho (YR = (YR? sé duge goi lt mot rit gon alia R. Tét nhién Red thé e6 nhieu rit gon vi e6 nhieu phuong phéip tim ese rit gon Vain dé quan trong khée Ii mdi quan hé giita ese mau phin Ip khée nhau, nghia I gitta ee quan hé tong dvvong trong ho R. ‘Ta néi rang quan hé khéng phan biét durge R phy thude vio quan he khong phan biét duge It" ky higu f+ R, néu RC R, nghia fi moi Kip cia" duage chita trong dt lép tuong dirong nio dé ea R. Néi eich khée, diéu d6 nghia la néu RI + R, thi mdi tap se exp durge sinh boi’ dirge ehita trong mot tap s0 cap no a6 chrge sinh boi R, nghia lA moi het mb cia tri thnte lién két v6i R' La mot phiin eda hat, nhn no d6 eta tri thite lign két vai R. Do vay, sw phy thnoe gid thich mi quan he gitta nhién mau phan lap ((5, 10) 2.8. H@ thong tin va bang quyét dinh Mat fg thang tin la m@t cp A= (U, A) trong dé U la tip khong rong duege goi lh vit tru vA ATA tip khong rdng ee thide tinh. Moi a ¢ A I mot sinh x9, a: U = Va, trong d6 Va Ih tap tr} ela a Mot ting quyét dink I’ mot he thong tin dang A = (UAV {d}), trong a6 d ¢ A 1A mot thude tinh riéng dirge goi la quyét dink, Quyét dinh d xée dinh phan hogeh {X1...Xyiq)} eta vit tru U, trong dé Xp = {x € Us dle) =i} voi i € Va vA r(d) = |Val. Tap Ny duge goi la lép quyét dink the Yea A, + VOi BSA, quan hé B khong phin bet duae dieoe dinh nghia boi IND(B) = {(x,.r') < Ux U, véi moi a B, ate) =a(e’)} + Tip exie rit gon duege ky higu bai RED(A) va chia tit ed cic tap con exe tiéu (A6i véi phép ly bao him) B © A sao cho IND(A) = IND(B) CACH TIEP CAN TAP THO TRONG VIC PHAT HIEN au Ding esc phép ton xi'p xi tren va xp xi chudi trong IY thuyét tap tho ngwisi ta 66 thé gidi quyét mot loat ee bai todn oo bin nhue mo ta ee Adi turgng theo cae tri thuée tinh, ee phu thude giita cfc tr] thuge tinh, rit gon ee thude tinh va tao sinh exe lust quyét dinh.... Vi dy sau véi dir ligu Vé 6 cong chite minh hoa nhiing diéu néi 6 trén (Baing 1 Mi hing eiia bing 66 thé duge xem nhur thong tin ve mot odng chite eu thé. CCI dutge die trimg trong bing boi tap tri thude tinh, saus (DH, Khong), (CM, C6), (LB, C4) tao nén thong tin ¥é cong chite CCI. ‘Trong bang: + CC2, CCB, va CCS Ih khong phan bist duge d6i vi thude tinh BH; + CC3 va CCG Hi khong phiin bigt dirge d6i v6i ese thude tinh CM vi LBs + CC2 va CCS Ih khong phan biét dirge d6i v4i cde thude tinh BH, CM va QL. du cong ehite (QL, Cao), ‘Cong | Tot nghiép dai hoe | Ning hye chuyén | Trinh d6 quan If | Xét bo nhigm ehite_| (BH) mon (CM) (QU) inh dgo (LB) CGL_| Khong (K) CC) Cao CATS Khong Cao 7 om Ked 68 Rit cao CG] Khong C3 Binh thiring Khong C5 | CF Khong Cao Khong CO6_| Khong 8 Rivt cao C3 Vi thé vi dy thuge tinh BH sinh ra hai tap so ep {CC2, CCB, CCB} va {CC1, CCA, CCB}, trong hi cfc thude tinh BH vi CM tao thinh ede tap so exp (CCI, CCA, CCB}, {CC2, CCS} va {CCB} Tiong tir nei ta o6 thé dinh nghia tap s7 ep durge sink bai. tap bat kY eta ie thude tinh. HE 136 do 6 chink ave cia khai niém “xét b6 nhiém lanh dgo lanh dao-LD” li: [{ec1, CC3,008}| HOCH, CC2, C3, C03, CCF] aap(Xét b6 nhigmn lanh dao) vA v6i Khai “Khong xét b3 nhigm lanh dgo” ta 66 yo) = CC [[6C2, CC4, COR 1/3 an (Khong xét bé nbige | ‘Ta cing o6 thé tinh tri thinh vién cho mdi cong elute theo Kh nin “xét:b6 nhiém link dao” hove sm Hanh go”. ‘Tri him thanh vie chite CCL, CC2 durge tinh nhue sau ce1,cc ufc = Kec, ec Coa,CC6\N {CCC HEC2, CC3}] ‘Trong ty ta 66 Hf y(CC3) = 15 Hf y(CC4) = 0; wify(COS) = 1/2: wffy(CC8) = 1 Vige gidi thich cfc hé $6 eta a} chink xi eting nhur ede 6 thude dinh cho ee doe gi quan tim. Vin dé Joai bo ee thude tinh dir thira durge goi 18 rit-gon todn bd tap ee thude tinh, Neus ta e6 thé tinh ring dé vi vi du chi ra 6 bing 1, ta e6 hai nit gon: {DH, QL} va {CM, QL}. Diéw 46 nghia Ki hoe thuge tinh DH hoe CM e6 thé duge logi khéi bang ma khOng thay déi eée tap so clip cia 06, pl y(CC2) = BM ay a2 NGUYEN BANG KHOA 3. NHONG VAN DE KHAI PHA DU LIBU TRONG TAP THO 8.1, M@t s6 gidi phap cho bAi tosn khai pha dit ligu + Dit ligu exe lim: Rist gon tap dit ligu theo hing ngang bing eich tron ese bo ging nhaw sau ki thay thé mot tri thude tink bing tri mite eno hon trong mot he théng thie bie cic thude tinh pham tri hoje theo hing doe diém. Mot trong cée ehién hege diege diing la eich tiép edn huedng thudc tink cho viee hoc khéi nim uy nap ((1)) + Die lieu nhieu (Noisy Data): Phong, phip phat h ft bj ink heding bai nhiéu trong tgp dit ign khi vige nghién eit cya trén sy bién thién ela ede cay quyét dinh quy nap, phu thide vio noi vi sé lirgng nhiéu xust hién, + Cée tr Null (Null Values ):- ‘Tei mull khé 1 tri hong thé’ dp dung due. Mob s6 nghi thay trong [3] 4+ Die liéu king aly ai hovic die liu die thitas Khi die li iy chi, m6 Mink ph hi \ eX ese quydt dinh gin dking v6i mie tin edy mo 46. C6 nhieu gid phép gin t6i wu hod t6i wa, v6i d6 phitc tap thai gian hop Lf, nhdim logi bé ec thude tinh dee thiea (hole khong quan trong) khoi tip ee thuge tinh di cho bing cich sir dung ede trong s6 ela ie thuge tinh rieng bist hoie ket hop mt s6 thude tink, ++ Die lieu dng: Hin hét ede CSDL tre tuyén 1h dg, ta kh 06 thé ely din han loa dit lieu nay. Cée hé théng CSDL dang hoat dong luén sin sing eung exp e&e dieu kign d@ ding ki trigger (hoiie eée lust if — then) o6 thé duge ding nhieu dé thwe hien ese phuong phsp plait i dir lign ngy cing gie King 3.2, Cac truy vén Khai pha co sé dit ligu + Truy odn phu thude dit ligu: Cée phy thude dtr rong e&e thude tfuh da cho trong mot tp dir lieu hos ‘Truy van phu thude dit ligu thong qua viee xée di alin, dizge goi Ih kidta dink gi thist (bypothesistesting). + Truy edu phin ld. Looi tray vin ny bao gdm vige sinh mot him phin lp (edn dege hiéu 1 sinh m6t phan lp, khi niém hoe hotic phiin biét m6 ti cdc lap), nd phan hoach mot tap ede bo cho tntde thanh eée lép con e6 ¥ nghia déi v4i ee nhan duge dinh nghia boi nguiti diing hose eke tri eda mot s6 thude tinh quyét dink, + Truy edn phan cum: Ta goi phn hoach khong giém st dirge eta ee bd trong mot being quan hig [8 mot tray van phan cum. Cé nhiéu thust tosn phan cum tri tir e&e phong phip truyén thdng iin nhan dang mau dén ese ky thuat phin cum trong hge may. Ce tham 6 durge dink nghia bai ngwisi ding nhir s6 ewe dai ec bo trong mot phiin cum hose $6 ee phn eum e6 thé anh hurdng. ti ét qui cia mot truy vain phan cum, Mot phin lép 06 thé duoc thiét ké thinh mét tp ete mau ‘nhé hon duge gin nhin va sau d6 cho phép né hoat dong ma khong e sy gidm sit trén mot Lap ese 1g In khang durge gén nhin. Cé thé tg dung ese kj: thu phan cum trang ho nkim lien Két ste manh cia ee may tinh v6i tri thite cia con ngui ([2)), tim 1 trong DBMS durge diing dé rit gon s6 iy dumng, m6t 48 thi phy thude di ligu. két hop trong s6 ea exe thude tink hike 4. HIEN TRANG CUA TAP THO TRONG KHAI PHA DU LIBU Lf thuyét tp thd dra trén hole ee khong gian xp xi dai s6 hole ede khéng gian xp xi xe sudt, durge ding dé lap ludn vé dir ligu chita thong tin khing ehae chan cho 1 t hign dit ligu de bigt. Duedi day, ching t61 nhin Igi hign trang ela tap tho déi véi vén dé khai phé dit ligu Lf thuyét tap tho dia. trén gid thuyét vii tru duge bin ludn (hove tap «fe d6i tirang) 1a hira han, né xem xét mot chup dnb nhanh eiia mot CSDL, né khong thé lA mot thira nhin ding, néu tri thite nién thye chit Ih agng. Mot ligu php hyp 1f cho vin d@ ny Id thiét ké mot phuong phép tng din va téch tom tat va két qui ding cho burde sau. ‘Trong (2), trinh bay mot phuromg phsip phan kip CACH TIEP CAN TAP THO TRONG VIC PHAT HIEN aia ben trén dé phat trién mot phan lép tho téing din, ‘Trong khong gian dai s6,1¥ thuyét tap the da dura ra ese khdi nigm sir dung tp khéi nigm tren vi dirdi.. Tinh khong chie chan trong mot tap dit lign li do dit ligu bi wie hose khong iy dil, cach tigp cn d6i véi loai dir ligu nay it durge mong dgi. Tuy nhién e6 mot s6 phurong phap xaip xi tho ya trén ec dinh nghia khiée nhau vé ese mien durong (vi mign bién) ([4]). Mot tap so esp duge nh xv t6i mién dirong ela mot khii nig chia biét néu d6 thude eta n6 In hon tri nguong dieoe dinh nghia bai neu’ ding, Mot tiép cin khée 06 thé lam thay d6i mién ctia bai tosin tir khong gian dai s6 tdi Khong gian xée xndt, néu ngudi ta e6 thé grin ede phép do xée xudt wu tién d6i vai eke tp dinh nghia dhrge ((6, 7). Dit ligw die thita 06 thé diage logi bo bing eich bé bat mot s6 thude tinh kh6ng quan trong trong hé thing tin sao cho tip thuge tinh eta hé duge rit gon Ia dge lp va khing e6 thude ti no 06 thé bi Joai bé Khoi hé théng md khong, lam mat thong tin (]). Vige thm kiéwn totn dién t Khong gian cc thude tinh lA ham ma v6i s6 eée thude tinh, Khi kiém lai ede truy edn Khai pha dit gu d6i v4i phurong phép ludn tap tho, ta thy ring phan tich phy thude thude tinh vai phan Isp cic chil dé dirge quan tim nghién eitu hon. Kiem dink gid thiét va sy ket hap giita ede tr} cia mot thude tinh 06 thé durge aii quyét mot eel dB ding boi phurong phiip lun tap tho ([8)). Mot bai it 6 tinh Ly thuyét trong [4] me rong ede khai nigm cha xp xi va sy bing nhau thé cho vige phan tich khéi nigmm hinh thite. ‘Trong vige truy vin khai phé CSDL bai phuong phip Ingn tap tho, phan nhém thé d6i mat véi mat vain dé khi mot di turgng, mai (Aen tir ben ngoai tap dlr lieu) duoc dra ‘vio vi vige m6 ta etia d6i tirgmg lh Khong tim thay trong Kap trong ting, Néi eich Khe, van dé tim ra cic bao déng etia déi tirgng cho trurée dé biét diege kh nigm. Gidi phap thong thurimg cho vin dé nay [a sn xq ede tri khong-dinh long thinh md thang 96 (scale) va: ding mot him khong ich cho vige dinh gi 5. CAC HUONG TUONG LAL Nhu tinh bity é trén, mot s6 kha canh eta bin chit die ign (nghia Ia dit ligu khong day ad, dr thira vi khong chile chin) di durge nghién evra trong phirang phap Ian tp thd, nhung ching, cin dirge trae nghiém trong cae CSI Kim. Bi 06 mot s6 bio eso ve vige sir dung phnong php Inn tap tho dua trén ce edng ey phit hign tri thite trén ee dir ligu khong trye tuyén nh: KDD-R, mot hop cong, eu mé 66 tinh thi nghiém; LERS, mot hé hoc may tir cée vi du vi mot Data/Logie/R, mot n phim throng, mai cho vige khai pha CSDL va tra giip quyét dinh, Dudi day, ehiing toi trinh bay nhimg huréng nghién citu trong lai, d6 la cdc ting dung khai ph ir liu. ¥ Cée xp xi tho gia tang: Can du phong thut ton quyét inh xir If lién tye trong mo hinh tap tho va tri thie nén 1a dong. Céic luge 46 plain lép tho tién hia 06 thé duge phat trién, néu bing quyét dinh duce dieu tiét véi trutmg gia ting phite hp cha thn suit eée hing + Su gin nhau eta hai lugt; Xée dinh luit: gin nhét,trong trudmg hgp mé ta mot déi trong cho trade khong sinh hgp v6i cée ddi turgng etia Khai nigm da biét. Cac tray edn phéin cum li mot hii dé rit quan trong ein dirge nghién ettu trong obng déng tp tho. + Cée tri Null: Tri Null eva thuge tinh téng quit hon la tri chuea biét eda thude tinh d6 va suy un din vé ese tri null bn Ii vain dé ngd trong vige nghién esta khai phé dir ligu. Che try thuge tinh cha biét da durge Gralymala-Buse nghién ett vi dirge thie hign trong hé hoe méy LERS. + Truy vin die trimg héa: Phin tich phy thude dit ligu duge tmg dung dé die trung ee Ki nigm, song né cdn thiéu mot eitu trie ro ring nhur he théng thit bie ea efe khét nigm Bin (persistent) dé khdm phi ic phu thude. Chri dé niy da durge nghién ciru va sit dung cho mé hinh Kuti nigm. Ngwii ta dit nghion eu vige mi rong phurong phip ludn tp tho t6i link vue phiin tich Kui nigm bin thie + Cie Khia. canh tin iia phuong phap hin tap thé: Cée ving dung khai thée dit ligu di hoi nhieng ky thuat higu qui dé ting A chfnh xée cia thudt todn quyét dink. Trong tong lai rit Gin dén vige nghien eta to’n dién vé chi dé nity Khai phi CSDL Ii mot bai ton thye t8, né dn dit. nghién eu Ly thuyét hueGng téi lip lun ve dit ligu ln vi dang tén tai higu au NGUYEN BANG KHOA 6. MOT S6 PHUONG PHAP TAO SINH MAU TIBU BIBU Cé nhieu phurang phip higu qui dé téng hap ee Inst quyét dink oie tim ra ave quy Inst dé ‘di ofc bing dir ligu trong doi nhd, Didi day, ching toi tein bay mot phuemg phip mdi dixge diing cho cae bsing dit lién Ién, eva trén sir phan tach ec bing dir lin ld thanh e&e bang dit lew rnhé hon sao cho sir xap xi ciia him quyét dinh toan cue 66 thé thu duge tit him quyét dinh cue lien quan dén ee bing nhé d6. ‘Tp ese bing nhé hon nay 06 thé diege xem nhir mot tap ee phiin tit sinh (generators). Diing, cic phan tie sinh la “ese mau” dirge mo ta bei cae biéu thite thude tinh = try dé thire hign vige xaip xi di ding cho him quyét dinh ton cue. Ching ta cing e@ ging tim kiém eie miu o6 chit hrong cao ching han duge dic trung bai 36 ese déi tegng tee gidp mot mau nnhin v6i $6 clip thude tinh = fry md t mau va mong dgi thm ra ese quy te (Iugt) manh eho ee iién con 6 nhieu die diém chung dura téich tit mo G day trinh bay mot gidi thuat cdi tién tim kiém rit gon ngiin trén dir ligu durac vit gon vi mot 56 thudt toxin tao sinh miu. ‘Trong he thong tin A= (U, A) nlur di néu, mgt mdu d6i vGi A= {a,,03,..,ay} li mot xu retin trong 46 05 © Va, U{e} vii moi é vA“ IR angt Kg higu “hong es quan tan. Vi tet i eke mot miu trong tng voi thude tinh a. Néu **" xu bien & vj tri Unit § thi nghia Es mau “bd qua” thude v8 chi néu ay(c) I bing phin ti thi i eda miu néu phn ti niy khiée * véi moi é. Ching ta kg higu r.4(a,) la s6 dt firng trong A ma trén dé thuge tinh a e6 tri v, Tim kiém miu e6 thé durge thire hign theo nhieu ich hue san 6.1, Tim kiém ege mau véi dai Max, Mue dich etia phurong phap Max I tim kiém ede min véi dp dai Ién va 46 khép khong nhé hon dt e§n didi s nio d6. Ta ting din mau T bi ie mo t8 TA (a= va) dén khi do khGp cia mau dirge sinh nhé hon +, Khi chon ng nhién mt m6 ta trong tng s6 calc mo tA theo mat xde xustt ho d6 Pla =v) = (na(a,v))/ Dna(a,t,) ta thu duge nhieu han mot miu ni gidi thus sau: YT=2; 2) while 1(7) < im and fitness (T) > 8 do 3) begin 3.1) for moi thnde tink a fT sip xép cae 46: tirgng trong U theo eae tricia a dé xée dinh tri ye thuimg hay xust hign trong bing nhtt, nghia la n.a(a, v4) — max{na(a,e) : v & Va} trong, 6 Vy la tap tri eta a; 3.2) Chon mot cach ngiiu nhién m6 td a = vg véi xée xutt Pla = vq) = (na(a,»))/Dmalasva,) 3.8) U = tap ese di tigng trong U sinh hep voi mana = ve; A= A~ {a}; 34) T=TU{a= va}; 4) end 6.2, Tim cdc mau bang vige sit dung déi tugng va cdc trong s6 thuge tinh ‘Tat cd ede Adi twang trong bing quyét dinh duoe gan ede trong 86 thich hap, mo ta tiém ning, cin ce déi turgng thuge ve mgt mau “t6t” theo mot nghia nao dé. + Che trong 6 phin énh sy gidng nhau cba eée Ai twong: Cho A= (U,A) vax EU. Voi moi 6 U, ta tinh gey = {a= ale) ~ a(y)} nghia Ia $6 ee thude tinh o cting tri tren x vay. S6 ny hi i gin” caia.y dai voi 2. Sau 46, véi moi thuge tinh a € A, ta tinh waCe)= SD gay va eudi cing ténh trong s6 vant) w(e) = SD wale). Ta 6 w(x) = a2 y aca v + Cie trong 86 eiia exe Adi tugmg dirge din xuat tir Hin sust tri thude tinh: Cho A= (UA) va EU. VE mol a A gol wale) =na(a,a(e)) va w(x) = ¥ wale) Ce trong s6 nity cho phép vige phan cum rt théa ding ede Adi trgng vao ese miu trong Khi cée tri “ngiy tho” hom etia trong sé lam gidm chit heyng ese két qua, CACH TIEP CAN TAP THO TRONG VIC PHAT HIEN a6 Y turdng sit dung trong 96 oe. thude tink cho vige tao sinh man rat gidng, pharong phap “ese ‘trong 86 di tung”. Cho A= (U, A), m= |U|, n= |Al, Ta 66 thé sip thet ty ese tri thuge tinh cia a theo gid tri na(a,v) véi bat kV a © A. Ta ky higu vf 1a tej thit @ ea thude tinh a trong, ‘rat tur nay. ‘Tri of Ia tri xut hién ther’mg xuyén nhatt eva a trong A. Ta chon ngiu nhién thir tyr giita cdc tri v va wnéu ma(a,v) ~na(a,u), Ta ky higu wala) la Dé ding thay wa(a) € (0, 1}. Véi moi tru eba thuse tinh @ ta 66 thé dinh nghia trong s6 eta 18 4 Cu) = nalesn)/m. Ta e6 wh(n) © 0,1] va S> wh(e) = 1 voi mei a CA. Cée gi thuat tao sinh cde mau tt at dung ofc trong sf thude tinh vA cdc trong 96 déi tong dugc mé td chi tidt trong [i 6.3, Tim céc mau bang céch sit dung cée gidi thuat di truyén ‘Tim kiém ee mau Ién theo phong phip di truy'én durge mo td chi tiét trong [4]. Ce mau duge biéu dién bai e&e xu nhi phin e6 46 dai N (chi ra ese thude tinh nio duge o6 dinh) va moi ai hop vi ehting (diege goi la mot 46 tarong ov 5). Voi mot » thi khi cho trie mot di trong ey 36 2p, ta tim mot mau t6t nha sinh hgp vi x», Dé kim durge diéu dé, ta sie dung ‘mot gidi thudt tham lam (greedy). M&i mot miu eye dai ee bd 06 thé durge tim thay bling eich stt dung gii thnat nay - két qui phy thude vao thir tir cic thude tinh, Myc dich evn ta 18 tim ra thit tur rigng cita ede thude tinh va ta ding ede gidi thuat di truyén dé Jam cong vige nay. Nhiém sic thé cia ta 58 1A mot héa n vi 7 66 6 dai N. ‘Tri cia him khép bing kich thude etia mau tot nat durge tim thay. 6.4, Cie mau duge téng quat héa Y birding ese miu 06 thé duege m GT = (a, = rong thanh mau tng quét héa, nghia Ih ede mau e6 dang: Bip Von Vig = tig) Aaa A (Op, = Oy Vine V Oj = Yim) la tri cia mau GT. Ta néi Str khée nhau chinh 1a & chd thay vi mot tr] ta lai e6 nhieu vj tri ing d6i trong x théa mé ta durac téng quit haa =m V... Va = vy néu tri evia a trén x thude Vi tap {01,-sUn}- Mot d Mat siz mé rong khie erin rac, nghia las tong x thda miu téng quét CT néu né théa tat ea ede mé td eaia GT. turdng ny ¢6 thé dirge thie hign bai ede mau vai ese mé t& khong-re 0 [aig tig] V oe VE [Const Ce phuromg phap tim cic mau trinh bay & trén 66 thé dé ding duge chap nhén dé tim kiém cic miu tng quét héa_ trong ede bing dit liu Kim. ‘Trong tring hyp cic miu toan cue, ngs ta 6 thé bién déi him khép néu [Val > 1 thi s(a) = (|Val — &)/(Va — 1) v6i moi a € A, trong dé & bing d6 dai eiia mo ta tong aust evia a; ngargc Iai thi s(a) = 1, S6 ofa) ky higw mite do thude tinh «khong phai la tri (*) “khong ein quan tam” tie la s(a) = 0, nghia Th trén a ta 06 * va a(a ghia I mau chi ¢6 mot tr trén a. Do vay trong gidi thnit, ta e6 thé Lim ere dai 86 ede 46; trong thda man dirge niin len boi Ysa). aca 6.5. Cac mau quyét dinh ‘Ta 66 thé diing cde mau durge sinh bi cde gidi thut tim kiém 6 trén cho tinh chinh quy trong, CSDL. Vay tim ee Indt ring bude ese thuge tinh va eée quyét dinh nh thé nao. Gis sir cho mot bang quyét dinh A. Ta quan tim dén_vige mo t4 Kép quyét dinh thie # boi mot tp lust. quyst din ia IA bai gid thut quyét dinh cho lép nay, Mudn vay, ta tao ra t€p ce mau phi lp quyét din, ghia I phn lin ee déi tong trong Ip, sinh hgp mot trong eée mau, trong khi di véi ese Kip kh, eng it adi tung sinh hop voi ching thi eang tét. Gidi thst di trayien duege mé tA 6 trén 6 a6 NGUYEN BANG KHOA thé drge théch nghi dé tim kiém logi miu méi may: ta 6 thé dB dng thay Adi cing thite cho vige khop mau. Chat legng eta gidi thuat quyét dinh o6 durge bing ech dp dng phuzong phép nay phu thude vio hai yén 16: nd xp xi tot ese Kap quydt din nhue thé nio vA mo ta eta nd di bao nhi ‘Ta hudng ti sin xudt cée Iudt edng don gin cing t6t, Cac két qua duroc trinh bay trong [7] hinh hur thién vé phuong phép ny. Str dung giai thudt mo ta trong [8], ta ¢6 thé phi toin bb lop aquyét dinh v6i cée miu. Ta xudt phit véi mét déi trong ngdu nhién trong l6p lam déi tong eo bin, sau 46 mma thu duroe dirge lim git trong bo hd. Béi turgng ex bin tgp theo dirge Ot ech niu nhién trong lép, nhumg ta khong tinh t6i ee 46i tiramg duoc phi bei cée man da 06 sin 16 6.6. Quan hg dung sai vA trich chon mau ‘Trong cde muc trréc ta da gai ¥ tim kiém céc hinh mau (pattern) theo dang ee mau. Loai Ikhéc eta hinh mau ¢6 thé durge dinh nghia bai ee quan hé dung sai, nghia la efe quan hé nbi phi fg trong mon dd Usgug. Ta xen x6t ee quan be dung sai dire tuong tur duge xée dinh trén ese tri thude tinh, ‘Ta goi quan tap exe dai cae cap d6i trong e6 cling quyét dinh. Cae chién lirge t dung sai (dt ding sai con tdi mu) trong ese lép quan hé dung sai khiie nhau dye tinh bay trong [5]. Cé cic hinh mau, ta e6 thé phan teh bing bing each nhém lép ese d6i tang tong ty (theo nghia cain quan hé dung sai). Cie quan hé dung sai dire trich chon eting 66 thé dieac dimg cho vige xp xi cfc lp quyét dinh (bai vige xay ding ee cum) va diing phan logi eae di turgng mei 7. KET LUAN ‘Trén day ching t6i da gidi thigu mot sO hurdng tro gitip quyét dinh theo edeh tiép ein tap tho ‘VA mot 6 gidi thngt higu qud cho vige tgo sinh miu. Xay dmg lee dé téng quit cho vige mo th xp xi ede lop quyét dinh va cfc phurong phip da trinh bay & tren dé tao sinh mau néu diac két hop véi ede phirong phap phan tach cic bang dir ligu Kin thanh cée bing nhé hon t6 ra c6 nhieu Inia hen trong vige phat hign tri thite va én duge tiép tye nghién eifu. Chiing ta tin rang khai pha dir ligula mot Iinh vie img dung, trong d6 ese nghién eiru ly Inn eta ly thuyét tp tho e6 thé drege kkhiing dinh, gitip chting ta hiéu ro nhimg mat manh va nhimg mat yéu eva 1y thuyét ny trong thire han. TAI LIU THAM KHAO. [1] JW. Graymala-Busse On the urknow attribute values in learning from examples 1991 [2] J. S. Deogun, V.V.Raghavan and H.Sever. Rough set based classification methods and extended decision tables. In Proc. of The Int. Workshop on Rough Sets and Soft (1998), [3] J.D. Ullman, Principles of Database and Knowledye- Base Systems, Vol. 1 Computer Science Press, Rockville, Maryland, 1988, [4] Komorowski d., Pavlak 2, Polkowski L., Skowron A A rough set Perspective on Data and Knowle edge, 1999. [5] Nguyén Dang Khoa, Riit gon t§p tho, Tuyén tap Bio céo tai Héi nghi Khoa hoe nhan dip ky nigm 45 nim ngiy thinh lp tririmg DH Bach Khoa Ha Ngi, 2001 [6] Pawlak Z., Rough sets:Theoretical aspects of reasoning about data, Kluwer, Dortrecht. 1991 [7] Pawlak Z., Rough sets: Present State and Purther Prospect 199 [8] Pawlak Z., Rough sets approach to knowledge-based decision support Artificial Intelligence, 10S Press, Amsterdam 1995 (220-238), [9] S. H. Ngnyon, L. Polkowski, A. Skowron, P. Synak, J.Wro' blewski Searching for approximate description of decision classes, 1997 (4-5). [10] S. H. Nguyen, Skowron A., Synak P., Wroblewski Discovery in Databases: Rough Set Approach, 1999. Hoe wign Hiink chink Quée gia Nhén bai ngiiy 20 - 5 - 2002

You might also like