Download as pdf or txt
Download as pdf or txt
You are on page 1of 2

"Domain-Driven Data Mining" (การขุดข้อมูลโดเมนที่มงุ่ เน้น) เป็ นวิธีในการทาขุดข้อมูลที่เน้นการรวมความเข้าใจลึก

ลงในโดเมนธุรกิจหรือองค์กรลงในกระบวนการสารวจข้อมูล มีเป้าหมายเพื่อช่วยนักขุดข้อมูลในการตีความผลลัพธ์ของ
พวกเขาในบริบทของอุตสาหกรรมหรือองค์กรเฉพาะที่พวกเขากาลังทางานร่วมกัน โดยการจับความเข้าใจข้อมูลกับความ
ต้องการและวัตถุประสงค์ของธุรกิจในองค์กรนัน้ ๆ

"Process-Based Domain-Driven Data Mining (PBDDD)" (การขุดข้อมูลโดเมนที่ม่งุ เน้นกระบวนการแบบโดเมนที่มี


พืน้ ฐาน) เป็ นวิธีการที่เน้นการรวมความเข้าใจลึกลงในกระบวนการธุรกิจลงในกระบวนการขุดข้อมูล มีเป้าหมายเพื่อปรับ
สอดความวิเคราะห์ขอ้ มูลกับกระบวนการธุรกิจเฉพาะ ๆ ที่ช่วยองค์กรในการตัดสินใจที่มขี อ้ มูลเป็ นฐาน และเกี่ยวข้องกับ
การดาเนินงานและวัตถุประสงค์ของพวกเขาอย่างใกล้ชิด

--------------------------------------------------------------------------------------------------------------------------------------

กาหนดวัตถุประสงค์และความรูใ้ นโดเมน: เริ่มต้นโดยกาหนดวัตถุประสงค์อย่างชัดเจนและโดเมนที่คณ


ุ ต้องการค้นพบ
ข้อมูลที่นามาใช้ได้ ทาความเข้าใจปั ญหาหรือคาถามเฉพาะที่คณ
ุ ต้องการแก้ไข.

การเก็บรวบรวมข้อมูล: รวบรวมแหล่งข้อมูลที่เกี่ยวข้องกับโดเมนและวัตถุประสงค์ของคุณ ข้อมูลนีส้ ามารถเป็ นแบบ


โครงสร้างหรือแบบไม่โครงสร้าง ขึน้ อยู่กบั ลักษณะของปั ญหา.

การดาเนินการกับข้อมูล (Data Preprocessing): ทาความสะอาดข้อมูล กระบวนการนีอ้ าจรวมการจัดการค่าที่หายไป


ค่าที่ผิดปกติ และการแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมสาหรับการวิเคราะห์.

การเข้าใจในโดเมน (Domain Understanding): ใช้ความรูแ้ ละความเชี่ยวชาญในโดเมนเพื่อเข้าใจข้อมูลมากขึน้ การ


ระบุลกั ษณะที่เกี่ยวข้อง และสร้างตัวแปรที่มีความหมายโดยที่จะเกี่ยวข้องกับวัตถุประสงค์ของคุณ.

การวิเคราะห์ขอ้ มูลแบบสารวจ (Exploratory Data Analysis - EDA): ดาเนินการสารวจข้อมูลเพื่อค้นพบรูปแบบ


แนวโน้ม และข้อมูลสาคัญภายในข้อมูล ใช้เครื่องมือสร้างรูปแบบและเทคนิคสถิตใิ นขัน้ ตอนนี.้

ขัน้ ตอนขุดข้อมูล (Data Mining Algorithms): นามาใช้ขนั้ ตอนขุดข้อมูลและอัลกอริทึมการเรียนรูเ้ ครื่องจักรที่เหมาะสม


เช่น การจัดกลุม่ (clustering) การจัดหมวดหมู่ (classification) การสร้างสมการ (regression) หรือการขุดข้อมูลเชิง
สมมติ (association rule mining) เพื่อค้นพบรูปแบบและข้อมูลมูลค่าจากข้อมูล.
การประเมิน (Evaluation): ประเมินประสิทธิภาพของโมเดลของคุณโดยใช้ตวั ชีว้ ดั การประเมินที่เหมาะสม ขัน้ ตอนนีช้ ่วย
ให้คณ
ุ กาหนดคุณภาพของข้อมูลที่คน้ พบได้.

การตีความ (Interpretation): ตีความผลลัพธ์ในบริบทของโดเมนของคุณ ซึง่ รวมถึงการเข้าใจรูปแบบและข้อมูลที่คณ



ค้นพบ และการประเมินความสาคัญของมัน.

ข้อมูลที่นามาใช้ได้ (Actionable Knowledge): ระบุขอ้ มูลที่นามาใช้ได้หรือข้อเสนอแนะที่มาจากผลลัพธ์ของการขุด


ข้อมูลของคุณ ข้อมูลเหล่านีค้ วรเป็ นประโยชน์และสามารถนามาเป็ นข้อมูลหลักในการตัดสินใจหรือดาเนินการ.

การนามาใช้ (Implementation): นาข้อมูลที่นามาใช้ได้มาใช้ในกระบวนการธุรกิจหรือกรอบการตัดสินใจของคุณ


ตรวจสอบว่ามันถูกนามาใช้อย่างมีประสิทธิภาพและตรวจสอบผลกระทบของมัน.

วงจรของคาแนะนา (Feedback Loop): ประเมินผลลัพธ์ของการดาเนินการของคุณอย่างต่อเนื่องและรวบรวมความ


คิดเห็น ความคิดเห็นเหล่านีส้ ามารถใช้ในการปรับปรุงกระบวนการขุดข้อมูลของคุณและเพิ่มคุณภาพของข้อมูลที่นามาใช้
ได้ในระยะเวลาต่อไป.

บทความนีเ้ สนอแนวคิดใหม่ในการทา Data Mining ที่เปลี่ยนแปลงแนวคิดจากการใช้กรอบ Domain-Driven Data


Mining เป็ นกรอบ Process-Based Domain-Driven Data Mining-Actionable Knowledge Discovery (PD3M-
AKD) เพื่อเพิม
่ ประสิทธิภาพในการค้นความรูท้ ่สี ามารถใช้งานได้ในองค์กรและธุรกิจจริง ๆ
---------------------------------------------------------------------

PD3M-AKD ให้ความสาคัญกับปั จจัยที่เกี่ยวข้องกับกระบวนการธุรกิจที่เน้นไปที่การดาเนินงานของธุรกิจที่แตกต่างกัน


และรวมปั จจัยเหล่านีใ้ นกระบวนการขุดข้อมูลเพื่อสร้างรูปแบบและกฎที่มีความสามารถในการช่วยให้การตัดสินใจใน
ธุรกิจมีประสิทธิภาพและนาไปใช้งานได้ในสภาวะจริง ๆ
---------------------------------------------------------------------

แนวคิดการเปลีย่ นแปลงนีท้ าให้เราสามารถนาความรูท้ ่เี กี่ยวข้องกับกระบวนการธุรกิจมาใช้งานได้อย่างมีประสิทธิภาพใน


องค์กรและธุรกิจจริง ๆ

You might also like