Download as doc, pdf, or txt
Download as doc, pdf, or txt
You are on page 1of 8

‫‪Syrian Arab Republic‬‬ ‫الجمهورية العربية السورية‬

‫‪Ministry of Higher Education‬‬ ‫وزارة التعـليــم العـالـــــــــي‬

‫‪Syrian Virtual University‬‬ ‫الجامعة االفتراضية السورية‬

‫خطة مشروع املاجستير ‪MWT‬‬

‫الدكتورة سيرا أستور‬ ‫اسم املشرف‪:‬‬

‫‪t_sastour@svuonline.org‬‬ ‫بريد املشرف‪:‬‬

‫مراد ططري‬ ‫اسم الطالب‪:‬‬

‫‪murad_42622@svuonline.org‬‬ ‫بريد الطالب‪:‬‬

‫التعلم اآللي لتصنيف عناوين ‪ URL‬الضارة‬ ‫عنوان املشروع باللغة العربية‪:‬‬

‫‪Machine Learning for Malicious URL Classification‬‬ ‫عنوان املشروع باالنكليزية‪:‬‬

‫‪ ‬إنتاج مجموعة بيانات مناسبة للتحليل الزمني املعجمي لعناوين‬


‫ُمل‬
‫‪ URL‬ا صنفة سواء كانت ضارة أو حميدة‪.‬‬

‫‪ ‬إنتاج رؤية يمكن أن تساعد في توجيه األبحاث املستقبلية حول‬


‫تعلم اآللة لتصنيف عناوين ‪ URL‬الضارة‪ .‬حيث يمكن‬ ‫الهدف من املشروع‪:‬‬

‫استخدامها من قبل مهندسي األمن وعلماء البيانات‪ .‬بحيث‬


‫يمكنهم اتخاذ قرارات مستنيرة بشأن اختيار النماذج التي تدوم‬
‫ًال‬
‫طوي‬

‫‪URL Syntax‬‬ ‫الكلمات املفتاحية‪:‬‬


‫‪Temporal Graph‬‬
‫‪AUC‬‬
‫‪Scatterplot‬‬
‫‪Syrian Arab Republic‬‬ ‫الجمهورية العربية السورية‬

‫‪Ministry of Higher Education‬‬ ‫وزارة التعـليــم العـالـــــــــي‬

‫‪Syrian Virtual University‬‬ ‫الجامعة االفتراضية السورية‬

‫‪Monotonic‬‬
‫‪BNB‬‬
‫‪DTC‬‬
‫‪ Dataset Counts‬‬

‫‪ Non-Rescaled Recall Rank-Order‬‬ ‫التقانات املقترحة‪:‬‬

‫‪ Temporal Analysis‬‬

‫عنوان البحـث‬

‫التعلم اآللي لتصنيف عناوين ‪ URL‬الضارة‬

‫مقدمة‪:‬‬

‫عند تطبيق التعلم اآللي (‪ )ML‬على مجموعات البيانات املصنفة‪ ،‬فان القياسي أن ‪ %70‬من مجموعة البيانات‬
‫تستخدم لنماذج التدريب‪ ،‬و‪ %30‬تستخدم لالختبار‪.‬‬
‫يفترض هذا النهج أن مجموعة البيانات ال تتغير بمرور الوقت‪.‬‬
‫بينما هذا التطبيق العملي يجعل عناوين ‪ URL‬تتغير بمرور الوقت‪ ،‬مما يعني أن أداء تعلم اآللة يجب أن‬
‫يتراجع بمرور الوقت عند تطبيقها على تصنيف عناوين ‪ URL‬الضارة‪.‬‬
‫ان عدم معرفة عواقب االنحراف والتراجع “حيث يتم تطبيق التعلم اآللي على عنوان ‪ URL‬الضار"صنف‬
‫باعتباره الفجوة املعرفية األساسية التي تهم هذا التطبيق العملي‪.‬‬
‫ُت‬
‫ظهر النماذج املقاومة لتدهور األداء استهالك كبير للطاقة‪.‬‬
‫لتحديد النماذج ذات استخدام الطاقة االفضل‪ ،‬تم إنشاء مجموعة بيانات ملعالجة املشكلة‬
‫‪Syrian Arab Republic‬‬ ‫الجمهورية العربية السورية‬

‫‪Ministry of Higher Education‬‬ ‫وزارة التعـليــم العـالـــــــــي‬

‫‪Syrian Virtual University‬‬ ‫الجامعة االفتراضية السورية‬

‫وتم ذكر أسئلة البحث والفرضيات‪ ،‬والتي تتعلق بفكرة التحليل الزمني ويمكن تحديد خوارزميات ‪ ML‬التي‬
‫تواجه أقل قدر من االنحراف واالنحالل عند استخدامها تصنيف عناوين ‪ URL‬الضارة‪ .‬حيث تحتوي‬
‫مجموعة البيانات الجديدة املقسمة مؤقًت ا على ‪ 2,292,882‬عنوان ‪،URL‬‬
‫مما يجعل مجموعة البيانات الخاصة بهذا التطبيق العملي واحدة من أكبر مجموعات بيانات عناوين ‪URL‬‬
‫الضارة حتى اآلن‪.‬‬

‫الهدف من املشروع‪:‬‬
‫ُمل‬
‫*إنتاج مجموعة بيانات مناسبة للتحليل الزمني املعجمي لعناوين ‪ URL‬ا صنفة سواء كانت ضارة أو حميدة‪.‬‬
‫*إنتاج رؤية يمكن أن تساعد في توجيه األبحاث املستقبلية حول تعلم اآللة لتصنيف عناوين ‪ URL‬الضارة‪.‬‬
‫*إنتاج رؤية يمكن استخدامها من قبل مهندسي األمن وعلماء البيانات‪ .‬بحيث يمكنهم اتخاذ قرارات مستنيرة‬
‫ًال‬
‫بشأن اختيار النماذج التي تدوم طوي‬

‫الدكتور املشرف سيرا أستور‬ ‫املهندس الدارس مراد ططري‬

‫مقترح مشروع بحث علمي لرسالة ماجستير‬


‫‪Syrian Arab Republic‬‬ ‫الجمهورية العربية السورية‬

‫‪Ministry of Higher Education‬‬ ‫وزارة التعـليــم العـالـــــــــي‬

‫‪Syrian Virtual University‬‬ ‫الجامعة االفتراضية السورية‬

‫القسم األول ‪:‬املعلومات اإلدارية‪:‬‬

‫‪ -1‬اسم الطالب‪ :‬مراد ططري‬


‫‪ -2‬الشهادة التي يحملها‪ :‬هندسة اتصاالت‬
‫‪ -3‬مكان إجراء البحث‪ :‬الجامعة االفتراضية‬
‫‪ -4‬املقررات التي درسها خالل مرحلة املاجستير‪:‬‬
‫‪WDE/WEC/WIM/WIS/WJD/WMS/WNT/WWD/WEG/WXL‬‬

‫االختصاص الدقيق‪:‬‬ ‫‪ -5‬األستاذ املشرف‪ :‬الدكتورة سيرا استور‬

‫‪ -6‬عنوان مشروع البحث باللغة العربية‪:‬‬

‫التعلم اآللي لتصنيف عناوين ‪ URL‬الضارة‬

‫عنوان مشروع البحث باللغة االنكليزية‪:‬‬

‫‪Machine Learning for Malicious URL Classification‬‬

‫‪ -7‬تاريخ البدء (املقترح)‪:‬‬


‫التوقيع ‪:‬‬ ‫اسم الطالب‪ :‬مراد ططري‬
‫التوقيع ‪:‬‬ ‫سيرا أستور‬ ‫اسم األستاذ املشرف‪:‬‬

‫القسم الثاني ‪ :‬معلومات تفصيلية حول مشروع بحث لرسالة ماجستير‬


‫‪Syrian Arab Republic‬‬ ‫الجمهورية العربية السورية‬

‫‪Ministry of Higher Education‬‬ ‫وزارة التعـليــم العـالـــــــــي‬

‫‪Syrian Virtual University‬‬ ‫الجامعة االفتراضية السورية‬

‫‪ -1‬عنوان البحث‬
‫باللغة العربية‪:‬‬

‫التعلم اآللي لتصنيف عناوين ‪ URL‬الضارة‬

‫باللغة االنكليزية‪:‬‬
‫‪Machine Learning for Malicious URL Classification‬‬

‫‪ -2‬املشكلة العلمية ومبررات مشروع البحث‪:‬‬

‫‪ -2-1‬املشكلة العلمية في مشروع البحث‪:‬‬

‫عند تطبيق التعلم اآللي (‪ )ML‬على مجموعات البيانات املصنفة‪ ،‬فان التقسيم القياسي أن ‪ %70‬من مجموعة‬
‫البيانات تستخدم لنماذج التدريب‪ ،‬و‪ %30‬تستخدم لالختبار‪.‬‬
‫يفترض هذا النهج أن مجموعة البيانات ال تتغير بمرور الوقت‪.‬‬
‫بينما هذا التطبيق العملي يجعل عناوين ‪ URL‬تتغير بمرور الوقت‪ ،‬مما يعني أن أداء تعلم اآللة يجب أن‬
‫يتراجع بمرور الوقت عند تطبيقها على تصنيف عناوين ‪ URL‬الضارة‪.‬‬

‫‪ -2-2‬مبررات مشروع البحث‪:‬‬

‫ُمل‬
‫*إنتاج مجموعة بيانات مناسبة للتحليل الزمني املعجمي لعناوين ‪ URL‬ا صنفة‬
‫سواء كانت ضارة أو حميدة‪.‬‬
‫*إنتاج رؤية يمكن أن تساعد في توجيه األبحاث املستقبلية حول تعلم اآللة لتصنيف عناوين ‪ URL‬الضارة‪.‬‬
‫*إنتاج رؤية يمكن استخدامها من قبل مهندسي األمن وعلماء البيانات‪.‬‬
‫ًال‬
‫بحيث يمكنهم اتخاذ قرارات مستنيرة بشأن اختيار النماذج التي تدوم طوي‬

‫‪ -3‬النتائج التطبيقية املتوقعة من البحث والجهات املستفيدة منها‪:‬‬


‫‪Syrian Arab Republic‬‬ ‫الجمهورية العربية السورية‬

‫‪Ministry of Higher Education‬‬ ‫وزارة التعـليــم العـالـــــــــي‬

‫‪Syrian Virtual University‬‬ ‫الجامعة االفتراضية السورية‬

‫تحديد خوارزميات ‪ ML‬التي تواجه أقل قدر من االنحراف واالنحالل عند استخدامها تصنيف عناوين ‪URL‬‬
‫الضارة‪ .‬حيث تحتوي مجموعة البيانات الجديدة املقسمة مؤقًت ا على ‪ 2,292,882‬عنوان ‪،URL‬‬
‫مما يجعل مجموعة البيانات الخاصة بهذا التطبيق العملي واحدة من أكبر مجموعات بيانات عناوين ‪URL‬‬
‫الضارة حتى اآلن‪.‬‬

‫‪ -4‬خطة البحث والبرنامج الزمني إلنجاز البحث‪:‬‬


‫تحديد وشرح مبررات البحث‬ ‫‪-1‬‬
‫مراجعة مفاهيم التعلم االلي‬ ‫‪-2‬‬
‫دراسة خوارزميات وأساليب فحص الروابط‬ ‫‪-3‬‬
‫انشاء نماذج لفحص العناوين‬ ‫‪-4‬‬
‫مراجعة وتوظيف النتائج‬ ‫‪-5‬‬

‫‪ 4-1‬خطة البحث‪:‬‬

‫التطبيق العملي‪ :‬تطوير تطبيق يقوم بإعطاء النتائج عند ادخال ‪URL‬‬

‫‪:‬البرنامج الزمني إلنجاز البحث ‪4-2-‬‬

‫النتائج‬ ‫أرقام األشهر في العام‬ ‫األعمال‬


‫ّق‬
‫املتو عة‬ ‫‪12 11 10 9 8‬‬ ‫‪7‬‬ ‫‪6‬‬ ‫‪5‬‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫التنفيذية‬
‫تكوين فكرة‬ ‫*‬ ‫*‬ ‫*‬ ‫*‬ ‫تحديد وشرح‬
‫عامة عن‬ ‫مبررات‬
‫البحث‬ ‫البحث‬

‫تعريف‬ ‫*‬ ‫* *‬ ‫مراجعة‬


‫بأساسيات‬ ‫مفاهيم التعلم‬
‫ومكونات‬ ‫االلي‬
‫البحث‬ ‫وال ‪url‬‬
‫شرح الطرق‬ ‫*‬ ‫*‬ ‫*‬ ‫*‬ ‫خوارزميات‬
‫القديمة‬ ‫وأساليب‬
‫املستخدمة في‬ ‫فحص‬
‫فحص‬ ‫الروابط‬
Syrian Arab Republic ‫الجمهورية العربية السورية‬

Ministry of Higher Education ‫وزارة التعـليــم العـالـــــــــي‬

Syrian Virtual University ‫الجامعة االفتراضية السورية‬

‫الروابط‬
‫انشاء طرق‬ * * * * * * ‫انشاء نماذج‬
‫اكثر فعالية‬ ‫لفحص‬
‫لفحص‬ ‫العناوين‬
‫الروابط‬
‫توظيف‬ * * * ‫مراجعة‬
‫واستخدام ما‬ ‫وتوظيف‬
‫تم‬ ‫النتائج‬
‫الوصول اليه‬
‫تلخيص‬ * * * ‫خاتمة البحث‬
‫الفكرة‬

:‫ املراجع املستخدمة‬-5

 Malicious URL prediction using machine learning techniques. Retrieved October 7, 2023,
from https://wwwproquest-com.proxygw.wrlc.org/docview/2564188868
 Towards web phishing detection limitations and mitigation. arXiv (Cornell University).
https://doi.org/10.48550/arxiv.2204.00985
 AdaBoost. (n.d.). Scikit-learn. Retrieved from
https://scikit-learn.org/stable/modules/ensemble.html#adaboost
 Conference on Advanced Communication Technology, 173–178. Retrieved from
http://icact.org/program/full_paper_counter.asp?full_path=/upload/
2013/0461/20130461_finalpaper.pdf
 An assessment of lexical, network, and contentbased features for detecting malicious URLs
using machine learning and deep learning models. Computational Intelligence and
Neuroscience, 2022, 1–14.
https://doi.org/10.1155/2022/3241216

Bahnsen, A. C., Bohorquez, E. C., Villegas, S., Vargas, J., & González, F. A. (2017). Classifying phishing
URLs using recurrent neural networks. 2017 APWG Symposium on Electronic Crime Research
(eCrime), 1–8.
https://doi.org/10.1109/ecrime.2017.7945048
Syrian Arab Republic ‫الجمهورية العربية السورية‬

Ministry of Higher Education ‫وزارة التعـليــم العـالـــــــــي‬

Syrian Virtual University ‫الجامعة االفتراضية السورية‬

Barlow, L., Bendiaby, G., Shiaeles, S., & Savage, N. (2020). A novel approach to detect
phishing attacks using binary visualization and machine learning. 2020 IEEE
World Congress on Services (SERVICES).
https://doi.org/10.1109/services48979.2020.00046

You might also like