Professional Documents
Culture Documents
التنقيب في البيانات و اتخاذ القرارات طيار أحسن
التنقيب في البيانات و اتخاذ القرارات طيار أحسن
كلية العلوم االقتصادية وعلوم التسيير كلية العلوم االقتصادية وعلوم التسيير
ahc_tiar@yahoo.fr chlabiamar@yahoo.fr
:ملخص
إن استخدام تقنيات التنقيب يف البيانات يوفر للمؤسسات يف مجيع اجملاالت القدرة على استكشاف و الرتكيز
على أهم املعلومات يف قواعد البيانات ،كما تركز تقنيات التنقيب يف البيانات كذلك على بناء التنبؤات
املستقبلية و استكشاف السلوك و االجتاهات مما يسمح باختاذ القرارات الصحيحة و اختاذها يف الوقت
.املناسب
Résumé :
L’utilisation des techniques de Data Mining donne aux entreprises dans tous les
domaines la capacité à extraire et à concentrer sur les informations essentielles
dans les bases de données. Ces techniques de Data Mining se basent sur la
construction des prévisions et la détection du comportement et les tendances ce
qui permet à prendre de bonnes décisions et dans le moment opportun.
:مقدمة
يتميز عصرنا الراهن (عصر االنرتنيت و االقتصاد الرقمي) بالسيل العظيم و االنتشار الواسع النطاق للبيانات
حىت أضحى من املستحيل على احملللني استخالص معلومات ذات معىن باللجوء فقط إىل املداخل التقليدية
.للتحليل التمهيدي للبيانات
مع وجود كميات كبرية من البيانات املخزنة يف قواعد البيانات و خمازن البيانات ازدادت احلاجة إىل تطوير
أدوات متتاز بالقوة لتحليل البيانات و استخراج املعلومات و املعارف منها ،من هنا ظهر ما يسمى بالتنقيب يف
البيانات كتقنية هتدف إىل استخراج املعرفة من كميات هائلة من البيانات .و هي تقنية حديثة فرضت نفسها
بقوة يف عصر املعلوماتية ،و استخدامها يوفر للشركات و املنظمات يف مجيع اجملاالت القدرة على استكشاف
و الرتكيز على أهم املعلومات يف قواعد البيانات ،كما تركز تقنيات التنقيب على بناء التنبؤات املستقبلية و
استكشاف السلوك و االجتاهات مما يسمح باختاذ القرارات الصحيحة و اختاذها يف الوقت املناسب .و اليت
تعترب بدورها مرحلة من مراحل عملية أكثر تعقيدا هي استكشاف املعرفة يف قواعد البيانات ،و املرتبطة إىل
حد بعيد بعملية تطوير أخرى مهمة جدا هي مستودعات البيانات .حيث أن الكثري من الشركات و
املنظمات الرائدة اليوم تستخدم عملية استكشاف املعرفة يف قواعد البيانات بشكل منهجي و منظم بوصفها
تشكل جوهر العمل الذي يعتمد عليه يف تفعيل النشاط و حتقيق امليزة التنافسية.
ظهر مصطلح التنقيب يف البيانات يف منتصف التسعينات يف الواليات املتحدة األمريكية ،وهو جيمع ما
بني اإلحصاء و تكنولوجيات اإلعالم (قواعد البيانات ،الذكاء االصطناعي ،التعلم اآليل « machine
.)... » Learning
و توجد عدة تعريفات هلذا املفهوم منها ،حيث ميكن تعريفها بأهنا " :االستكشاف اآليل أو املؤمتت ألمناط
شائقة و غري جلية خمفية يف قاعدة بيانات معينة"(، )1أو أهنا " :سريورة حتليل دقيقة وذكية ،تفاعلية و
تسلسلية ،تسمح ملسريي النشاطات عند استخدام هذه السريورة باختاذ قرارات والقيام بأعمال مالئمة يف
صاحل النشاط املسؤولني عنه و املؤسسة اليت يعملون هبا"( ،)2أو أهنا " :عبارة عن حتليالت لكمية كبرية من
البيانات بغرض إجياد قواعد و أمثلة و مناذج اليت ميكن أن تستخدم تقود و تدل أصحاب القرار ،و تتنبأ
بالسلوك املستقبلي"( ،)3كما ميكن تعريفها كذلك بأهنا " :حتليل جملموعات كبرية احلجم من البيانات املشاهدة
()4
.للبحث عن عالقات حمتملة و تلخيص للبيانات يف أشكال جديدة لتكون مفهومة و مفيدة ملستخدمها"
من خالل التعريفات السابقة ميكن القول أن التنقيب يف البيانات عبارة عن سريورة الستخراج أو اكتشاف
معرفة مفيدة و قابلة لالستغالل من خالل جمموعة كبرية من البيانات .حيث يساعد يف استكشاف املعرفة
.املخفّية والنماذج غري املتوّقعة ،إضافًة إىل استكشاف قواعد جديدة موجودة يف قواعد بيانات كبرية
اخنفاض تكاليف االتصاالت االلكرتونية مما يسر الوصول اىل قواعد البينات.
ظهور أساليب حتليل جديدة من أبرزها الشبكات العصبية ،نظم اخلوارزميات الوراثية ،شجرة
القرار و قواعد االستقراء.
ثورة اعمار احلاسوب و اليت متخضت عن والدة أجيال جديدة من الربجميات الصديقة للمستخدم،
مثل :مايكروسوفت ويندوز ،و برجميات العميل -اخلادم ()Client-Server
و غريها.
التطور اهلائل يف أساليب التخزين و من أبرز هذه األساليب تلك املتعلقة مبستودعات البيانات (
)Data Warehouseو أسواقها.
تنامي احلاجة اىل نتائج حتليلية سريعة من طرف املؤسسات املنافسة الشديدة و التغريات السريعة يف
بيئة العمل.
احنسار التنظيم اهلرمي حيث أصبح لزاما على املديرين االعتماد على أنفسهم يف احلصول على
احتياجاهتم من املعلومات التحليلية ،بعدما احنسر دور حمللي الدعم الذين كانوا يعتمدون عليهم.
ازدهار حركة التأليف و النشر خاصة يف جمال تكنولوجيا املعلومات و النرتنت و كل ما يرتبط
بعصر االقتصاد الرقمي.
النماذج التنبؤية هتدف إىل التنبؤ بقيمة بعض اخلصائص .مثل التنبؤ باحتمال الشراء للزبون .أما النماذج الوصفية
فتنقسم إىل صنفني :مناذج العنقدة اليت تسمح بتجميع األفراد ،و األحداث ،آو املنتجات يف عناقيد ،ومناذج
االرتباط اليت تسمح بتحديد العالقات بينهم.
.1التلخيص (:)Summarization
يشري التلخيص إىل أساليب تفتيت كتل البيانات الكبرية إىل مقاييس موجزة ،توفر وصفا عاما للمتغريات و
عالقاهتا( .)6و من األمثلة على أساليب التلخيص نذكر :املتوسطات ،و اجملاميع ،واإلحصائيات الوصفية اليت
تتضمن مقاييس النزعة املركزية مثل املتوسط احلسايب و الوسيط واملنوال ،ومقاييس التشتت مثل االحنراف
املعياري .و على الرغم من أن مقاييس التلخيص تعطي صورة كبرية عن بعض التفاصيل ذات العالقة فإهنا
.غالبا ما هتمل تفاصيل أخرى ذات أمهية كبرية تتعلق بسلوك املستهلك خصوصا
.2التصنيف(: )Classification
(
يتمثل التصنيف يف تفسري أو التنبؤ خباصية فرد ما من خالل خصائص أخرى .هذه اخلاصية هي عموما كيفية
.)7و ميكن اجناز التصنيف باالعتماد على األساليب اإلحصائية القدمية مثل االحندار و التحليل التمييزي ،أو
.باالعتماد على أساليب حديثة نسبيا مثل قوى االرتباط و االستنتاج املستند إىل احلالة و الشبكات العصبية
و كأمثلة عن طرق التصنيف املستعملة كجزء من تطبيقات استكشاف املعرفة اليت تتضمن تصنيف اجتاهات
.األسواق املالية ،و التحديد اآليل لألشياء املهمة يف صورة كبرية من قواعد البيانات
.3التنبؤ (: )Prediction
يشبه التنبؤ التصنيف أو التقدير ،ما عدا أن البيانات تصنف على أساس التنبؤ بسلوكها املستقبلي أو تقدير
قيمتها املستقبلية( .)8حيث أن املتغري التابع املتنبأ به هو متغري كمي .و من األدوات التقليدية املستخدمة يف
التنبؤ نذكر على سبيل املثال :االحندارات بأنواعها و التحليل التمييزي .أما األساليب اجلديدة فتشتمل على
قواعد االرتباط و شجرة القرار و الشبكات العصبية و اخلوارزميات الوراثية.
يتمثل التجميع العنقودي أو التجزئة إىل قطاعات يف البحث عن جمموعات متجانسة يف جمتمع من األفراد(.)9و
يشري التجميع العنقودي أو التجزئة إىل قطاعات إىل عملية تشكيل جمموعات أو قطاعات مؤلفة من أفراد أو
أصحاب أسر ،و ذلك باالستناد إىل معلومات متضمنة يف جماميع من املتغريات اليت تصفهم .و الغرض من
التجميع العنقودي املساعدة على تطوير برامج تسويقية مصممة على مقاسات الزبائن أنفسهم ،و اليت
باإلمكان استخدامها الستهداف أعضاء لكل قطاع من هذه القطاعات على أمل ترغيبهم يف تكرار الشراء أو
()10
.التحول إىل زبائن موالني
وتتم أساليب التجميع العنقودي غالبا مبساعدة أساليب التحليل العنقودي اإلحصائية و األساليب املستندة
.إىل شجرة القرار ،و الشبكات العصبية و اخلوارزميات الوراثية
.1فهم طبيعة األعمال ( :)Business Understandingيعترب املطلب األول الكتشاف املعرفة هو فهم
املشاكل و املسائل اليت اليت تواجهها األعمال .و مبعىن أخر ،كيف ميكن حتقيق املنفعة األعظم من
التنقيب يف البيانات ،مما يتطلب وجود صيغة واضحة و حمددة ألهداف األعمال.
فهم البيانات ( : )Data Understandingتعترب مسالة معرفة ماهية وطبيعة البيانات عامل مهم .2
يف جناح عملية التنقيب يف البيانات و اكتشاف املعرفة .حيث أن معرفة البيانات بصورة جيدة تعين مساعدة
املصممني على استخدام اخلوارزميات أو األدوات املستخدمة للمسائل احملددة بدقة عالية .و هذا يقود إىل
تعظيم فرص النجاح باإلضافة إىل رفع الفعالية و الكفاءة لنظام اكتشاف املعرفة.
و ال حتتاج عملية التنقيب يف البيانات إىل جتميع البيانات يف مستودع البيانات ،أما إذا كان مستودع
البيانات موجود يف املنظمة ،فمن األفضل عدم احتكار املستودع بشكل مباشر لغرض التنقيب يف البيانات.
و ميكن تلخيص اخلطوات الضرورية لعملية فهم البيانات كاآليت:
تجميع البيانات( : )Data Collectionو هي اخلطوة املوجهة حنو حتديد مصدر البيانات يف
الدراسة مبا يف ذلك استخدام البيانات العامة اخلارجية مثل الضرائب و غريها.
توصيف البيانات( : )Data Descriptionو هي اخلطوة اليت تركز على توصيف حمتويات امللف
الواحد من امللفات أو اجلداول.
جودة البيانات و تحقيقها( : )Data Quality and Verificationهذه اخلطوة حتدد ما إذا
كان تقليل أو إمهال بعض البيانات غري الضرورية أو كوهنا رديئة اجلودة و قد ال تنفع يف الدراسة.
ألن النموذج اجليد حيتاج إىل بيانات جيدة مما يتوجب أن تكون البيانات صحيحة و ذات مضمون
دقيق.
التحليل االسترشادي للبيانات ( :)Exploratory Analysis of Dataتستخدم األساليب
مثل اإلظهار املرئي أو التصور أو عملية التحليل املباشر( )OLAPاليت تؤدي إىل إجراء التحليل
األويل للبيانات .و تعترب هذه اخلطوة مهمة و ضرورية ألهنا تركز على تطوير الفرضيات املتعلقة
باملشكلة قيد الدراسة.
.3تهيئة البيانات( : )Data Preparationو تشمل اخلطوات التالية:
االختار( )Selectionو تعين اختيار املتغريات املتوقعة و حجم العينة.
صياغة المتغيرات و تحويلها()Construction and Transformation Variables
حيث جيب دائما أن تصاغ املتغريات اجلديدة لبناء النماذج الفعالة.
تكامل البيانات( : )Data Integrationحيث أن جماميع البيانات يف دراسة التنقيب عن البيانات
من املمكن خزهنا يف قواعد بيانات متعددة األغراض اليت تكون حباجة إىل توحيدها يف قاعدة بيانية
واحدة.
تصميم و تنسيق البيانات( )Data Formattingحيث تتعلق هذه اخلطوة يف إعادة ترتيب
حقول البيانات كما يتطلب يف منوذج التنقيب يف البيانات.
صياغة نماذج الحل و ثبوتها( :)Model Building and Validationإن بناء و صياغة .4
منوذج احلل السليم و الدقيق يتم من خالل عملية اخلطأ و الصواب ،حيث كثريا ما حتتاج مثل هذه العملية
إىل مساعدة املختصني يف التنقيب عن البيانات هبدف اختبار و فحص خمتلف البدائل للحصول على أفضل
منوذج حلل املشكلة قيد الدراسة.
.5التقييم و تعليل نتائج النموذج( : )Evaluation and Interpretationحاملا يتم صياغة النموذج
و التحقق من ثباته و صدقه ،جتري مباشرة عملية التحقق من ثبات حزمة البيانات اليت يتم تغذيتها بواسطة
النموذج .ومبا أن نتاجات هذه البيانات معروفة ،لذا فان النتائج املتوقعة تقارن مع النتائج الفعلية يف ثبات
حزمة البيانات قيد التشغيل .و تؤدي هذه املقارنة أو املفاضلة إىل التحقق من دقة النموذج.
نشر و توزيع النموذج( : )Model Deploymentحيث تشتمل هذه اخلطوة على نشر و توزيع .6
النموذج داخل املنظمة ملساعدة عملية صنع القرار .و أن النموذج الصاحل جيب أيضا أن حيقق الرضا لدى
املستفيدين طاملا أن اختيار النموذج البد أن يتم من خالل الدراسة االسرتشادية أو منوذج مصغر من الدراسة
الشاملة.
لقد عرف التنقيب يف البيانات جناحا كبريا و ازدادت تطبيقاته يف منظمات األعمال و ذاك راجع إىل النمو
الكبري يف البيانات خاصة املوجودة يف قواعد البيانات و خمازن البيانات ،و املنافسة الشديدة يف السوق ،مما
.يدفع هذه املنظمات إىل االستفادة القصوى من البيانات اليت متتلكها باستخدام التنقيب يف البيانات
و قد بدأ استخدام التنقيب يف البيانات يف منظمات التوزيع ،مث انتقلت بعدها سريعا إىل البنوك ،و
مؤسسات التأمني ،و شركات اهلاتف (خاصة اهلاتف النقال) ،و مؤسسات املياه و الكهرباء ،و مؤخرا
مؤسسات النقل اجلوي و النقل بالسكك احلديدية...اخل .و كانت تطبيقاهتا األوىل يف ميدان إدارة العالقة مع
الزبون من خالل حتليل سلوك الزبائن من أجل الوصول إىل جعلهم أكثر وفاء و اقرتاح منتجات وفق
.رغباهتم
()14
عموما ،هناك عدة ميادين لتطبيق التنقيب يف البيانات يف منظمات األعمال نذكر منها:
.1التسويق :استخدمت الشبكات العصبية االصطناعية يف دراسات التسويق املستهدف مبا يف ذلك
احلصص السوقية .و قد ساعدت هذه األساليب التسويق على استخدام هنج حتصيص الزبائن وفقا
إىل احلقائق الدميغرافية (السكانية) األساسية مثل اجلنس والعمر واجملموعات وكذلك أمناطهم
الشرائية.
التجزئة :لقد استخدمت أساليب التنقيب يف البيانات بصورة فعالة يف التنبؤ باملبيعات حيث أخذت .2
العديد من املتغريات يف الدراسات مثل متغريات السوق املتعددة ،قدرات الزبائن املستندة على العادات املتبعة
يف الشراء .كما ساعدت أساليب مثل حتليل السلة الشرائية أو السلة السوقية كثريا على إجياد أي من
املنتجات اليت ميكن أن تشرتى سوية من قبل الزبائن.
البنوك :لقد أثبتت تنبؤات األعمال واملالية على أهنا األساليب املمتازة يف تطبيقات أساليب التنقيب .3
يف البيانات .وقد استخدمت هذه األساليب يف إجياد األسعار املضمونة وتنبؤات السعر املستقبلية وأداء
األسهم .كما وقد حققت استخدامات مثل هذه األساليب النجاح يف تطوير أنظمة القياس الرقمية يف حتديد
خماطرة القروض واالحتياالت املالية.
التأمين :لقد استخدمت أساليب التنقيب يف البيانات كذلك وبصورة واسعة يف جمال شركات .4
التأمني وخاصة يف حتصيص جماميع الزبائن هبدف حتديد أسعار البوليصة وذبذبات املطالبات املتوقعة
مستقبال ،وحتديد املطالبات املزيفة.
االتصاالت :حيث استخدمت وبصورة فعالة أساليب التنقيب يف البيانات مثل الشبكات العصبية يف .5
حماولة تقليل – اخلضخضة -اليت تظهر عندما تفقد املنظمة هؤالء الزبائن خالل املنافسة وذهاهبم إىل املنافسني
اآلخرين.
إدارة العمليات :حيث استخدمت الشبكات العصبية يف عمليات التخطيط واجلدولة وإدارة املشاريع .6
باإلضافة إىل إدارة اجلودة.
خاتمة:
لقد أدى إدماج مزايا تكنولوجيا املعلومات مع الطرق اإلحصائية و اخلوارزميات إىل توفر اإلمكانات
الالزمة للتنبؤ بالسلوك املستقبلي و من مث وضع احللول املناسبة للمشكالت قبل وقوعها يف حال
إمكان حدوثها ،أو من باب التنبؤ هبدف التطوير و التحديث بشكل عام يف شىت اجملاالت كل ذلك
باستخدام تقنيات التنقيب يف البيانات اليت تشكل مرحلة من مسار أمشل هو استكشاف املعرفة يف
قواعد البيانات و اليت أصبحت من اهلموم الكبرية اليت تقع على عاتق الدول بكافة مؤسساهتا بشكل
عام.
:الهوامش و المراجع
.1بشري عباس ،العالق ،اإلدارة الرقمية :اجملاالت و التطبيقات ،مركز اإلمارات للدراسات و البحوث اإلسرتاتيجية ،ابوظيب ،2005 ،ص .84
2.Bazsalica M., Naim P., Data mining pour le Web, éd. Eyrolles, Paris, 2001, P. 61.
.3عبد الستار العلي ،عامر إبراهيم قنديلجي ،غسان العمري ،املدخل إىل إدارة املعرفة،دار املسرية للنشر و التوزيع و الطباعة ،الطبعة األوىل،
عمان ،2006 ،ص.157 .
4.Hand d., Mannila H., Smyth R., Principles of Data Mining, MIT Press, London, 2001, p. 01.
بشري عباس ،العالق ،مرجع سابق ،ص .ص .91-89 .5
بشري عباس ،العالق ،مرجع سابق ،ص92 . .6
7.Bazsalica M., Naim P., Op. Cit., pp.68-69.
8.Berry J. A. M., Linoff G. S., Data Mining Techniques For Marketing, Sales, and Customer
Relationship Management, 2° ed., Wiley Publishing,INC, Indianapolis, 2004, p. 10.
9.Bazsalica M., Naim P., Op. Cit., pp.66.
بشري عباس العالق ،مرجع سابق ،ص.93 . .10
11.Bazsalica M., Naim P., Op. Cit., pp.68.
بشري عباس العالق ،مرجع سابق ،ص.94-93 . .12
عبد الستار العلي ،عامر إبراهيم قنديلجي ،غسان العمري ،مرجع سابق ،ص .ص.102-100 . .13
عبد الستار العلي ،عامر إبراهيم قنديلجي ،غسان العمري ،مرجع سابق ،ص .ص.99-98 . .14