Download as pdf or txt
Download as pdf or txt
You are on page 1of 11

‫المعالجة المسبقة للبيانات‬

‫أهمية المعالجة المسبقة للبيانات‬


‫جودة البيانات‬
‫التأكد من جودة البيانات قبل التحليل لتفادي األخطاء والتشويش‪.‬‬

‫الكفاءة‬
‫زيادة كفاءة العمليات وتوفير الوقت والجهد‪.‬‬

‫الدقة‬

‫ضمان دقة البيانات التخاذ القرارات الموثوقة والدقيقة‪.‬‬


‫تحديات المعالجة المسبقة للبيانات‬

‫تنوع البيانات‬ ‫حجم البيانات‬


‫مواجهة تحديات تحويل وتوحيد بيانات متنوعة من مصادر مختلفة‪.‬‬ ‫كيفية التعامل مع كميات كبيرة من البيانات وتحويلها بكفاءة‪.‬‬

‫سرعة البيانات‬
‫التعامل مع بيانات سريعة التغير وتحويلها لتحقيق الدقة والفعالية‪.‬‬
‫خطوات المعالجة المسبقة للبيانات‬

‫تحويل البيانات‬ ‫جمع البيانات‬ ‫تنظيف البيانات‬


‫تحويل البيانات لضمان توافقها مع األدوات وتقنيات‬ ‫جمع مجموعة البيانات الالزمة للتحليل والتقييم‪.‬‬ ‫تصفية البيانات وإزالة القيم المفقودة والمتداخلة‪.‬‬
‫التحليل‪.‬‬

‫‪Photos provided by Pexels‬‬


‫العمليات األساسية في المعالجة المسبقة‬
‫• ازالة القيم الشاذة‬
‫• معالجة القيم المنقوصة‬
‫• تنسيق البيانات‬
‫• العينات‬
‫• التجميع‬
‫• تخفيض األبعاد‬
‫• انتقاء مجموعة فرعية من الصفات‬
‫• تحويل صفات مستمرة الى فئات فئوية‬
‫• ترميز البيانات‬
‫تخفيض األبعاد‬
‫• هو تقليل عدد القيم التي تمثل سجل او كائن معين‬
‫يتم ذلك من خالل توليد مجموعة بيانات جديدة كتابع للقديمة و بعدد ابعاد اقل‪ ،‬أو اختيار مجموعة جزئية من‬ ‫•‬
‫الميزات‪.‬‬

‫له فوائد عديدة‪:‬‬ ‫•‬


‫‪ .1‬أغلب خوارزميات التنقيب لها اداء افضل مع عدد ابعاد اقل‬
‫‪ .2‬تزداد فعالية خوارزميات التنقيب من حيث الوقت و الذاكرة‬
‫‪ .3‬الحصول على نموذج مفهوم و اكثر وضوحا و خاصة مع األبعاد الكبيرة جدا‬
‫‪ .4‬سهولة اظهار البيانات بصريا‬
‫تخفيض األبعاد بواسطة تحليل المركبات األساسية ‪PCA‬‬
‫‪principle component analysis‬‬
‫عبارة عن اسقاط لشعاع البيانات الى فراغ ذو ابعاد اقل‬ ‫•‬
‫تخفيض األبعاد بواسطة تحليل المركبات األساسية ‪PCA‬‬
‫‪principle component analysis‬‬
‫عبارة عن اسقاط لشعاع البيانات الى فراغ ذو ابعاد اقل‬ ‫•‬
‫تخفيض األبعاد بواسطة تحليل المركبات األساسية ‪PCA‬‬
‫‪principle component analysis‬‬
‫نوجدددددد األشدددددعة الخاصدددددة‬ ‫•‬
‫لمصدددددددددددفوفة االنحدددددددددددرا‬
‫المعيددددداري و نرتبهدددددا فدددددي‬
‫مصفوفة حسب تناقص القيم‬
‫الخاصة الموافقة لها‪.‬‬
‫نحدددددتفظ بعددددددد قليدددددل مدددددن‬ ‫•‬
‫البددددداقي‬ ‫األشدددددعة و نحدددددذ‬
‫ونستخدم المصدفوفة الجديددة‬
‫السقاط األشعة األصلية الدى‬
‫فراغ جديد منخفض األبعاد‬
‫تخفيض األبعاد بواسطة تحليل المركبات األساسية ‪PCA‬‬
‫• خطوات تنفيذ خوارزمية ‪PCA‬‬

You might also like