Professional Documents
Culture Documents
MWT Plan Murad 42622
MWT Plan Murad 42622
Monotonic
BNB
DTC
Dataset Counts
عنوان البحـث
مقدمة:
عند تطبيق التعلم اآللي ( )MLعلى مجموعات البيانات املصنفة ،فان القياسي أن %70من مجموعة البيانات
تستخدم لنماذج التدريب ،و %30تستخدم لالختبار.
يفترض هذا النهج أن مجموعة البيانات ال تتغير بمرور الوقت.
بينما هذا التطبيق العملي يجعل عناوين URLتتغير بمرور الوقت ،مما يعني أن أداء تعلم اآللة يجب أن
يتراجع بمرور الوقت عند تطبيقها على تصنيف عناوين URLالضارة.
ان عدم معرفة عواقب االنحراف والتراجع “حيث يتم تطبيق التعلم اآللي على عنوان URLالضار"صنف
باعتباره الفجوة املعرفية األساسية التي تهم هذا التطبيق العملي.
ُت
ظهر النماذج املقاومة لتدهور األداء استهالك كبير للطاقة.
لتحديد النماذج ذات استخدام الطاقة االفضل ،تم إنشاء مجموعة بيانات ملعالجة املشكلة
Syrian Arab Republic الجمهورية العربية السورية
وتم ذكر أسئلة البحث والفرضيات ،والتي تتعلق بفكرة التحليل الزمني ويمكن تحديد خوارزميات MLالتي
تواجه أقل قدر من االنحراف واالنحالل عند استخدامها تصنيف عناوين URLالضارة .حيث تحتوي
مجموعة البيانات الجديدة املقسمة مؤقًت ا على 2,292,882عنوان ،URL
مما يجعل مجموعة البيانات الخاصة بهذا التطبيق العملي واحدة من أكبر مجموعات بيانات عناوين URL
الضارة حتى اآلن.
الهدف من املشروع:
ُمل
*إنتاج مجموعة بيانات مناسبة للتحليل الزمني املعجمي لعناوين URLا صنفة سواء كانت ضارة أو حميدة.
*إنتاج رؤية يمكن أن تساعد في توجيه األبحاث املستقبلية حول تعلم اآللة لتصنيف عناوين URLالضارة.
*إنتاج رؤية يمكن استخدامها من قبل مهندسي األمن وعلماء البيانات .بحيث يمكنهم اتخاذ قرارات مستنيرة
ًال
بشأن اختيار النماذج التي تدوم طوي
-1عنوان البحث
باللغة العربية:
باللغة االنكليزية:
Machine Learning for Malicious URL Classification
عند تطبيق التعلم اآللي ( )MLعلى مجموعات البيانات املصنفة ،فان التقسيم القياسي أن %70من مجموعة
البيانات تستخدم لنماذج التدريب ،و %30تستخدم لالختبار.
يفترض هذا النهج أن مجموعة البيانات ال تتغير بمرور الوقت.
بينما هذا التطبيق العملي يجعل عناوين URLتتغير بمرور الوقت ،مما يعني أن أداء تعلم اآللة يجب أن
يتراجع بمرور الوقت عند تطبيقها على تصنيف عناوين URLالضارة.
ُمل
*إنتاج مجموعة بيانات مناسبة للتحليل الزمني املعجمي لعناوين URLا صنفة
سواء كانت ضارة أو حميدة.
*إنتاج رؤية يمكن أن تساعد في توجيه األبحاث املستقبلية حول تعلم اآللة لتصنيف عناوين URLالضارة.
*إنتاج رؤية يمكن استخدامها من قبل مهندسي األمن وعلماء البيانات.
ًال
بحيث يمكنهم اتخاذ قرارات مستنيرة بشأن اختيار النماذج التي تدوم طوي
تحديد خوارزميات MLالتي تواجه أقل قدر من االنحراف واالنحالل عند استخدامها تصنيف عناوين URL
الضارة .حيث تحتوي مجموعة البيانات الجديدة املقسمة مؤقًت ا على 2,292,882عنوان ،URL
مما يجعل مجموعة البيانات الخاصة بهذا التطبيق العملي واحدة من أكبر مجموعات بيانات عناوين URL
الضارة حتى اآلن.
4-1خطة البحث:
التطبيق العملي :تطوير تطبيق يقوم بإعطاء النتائج عند ادخال URL
الروابط
انشاء طرق * * * * * * انشاء نماذج
اكثر فعالية لفحص
لفحص العناوين
الروابط
توظيف * * * مراجعة
واستخدام ما وتوظيف
تم النتائج
الوصول اليه
تلخيص * * * خاتمة البحث
الفكرة
: املراجع املستخدمة-5
Malicious URL prediction using machine learning techniques. Retrieved October 7, 2023,
from https://wwwproquest-com.proxygw.wrlc.org/docview/2564188868
Towards web phishing detection limitations and mitigation. arXiv (Cornell University).
https://doi.org/10.48550/arxiv.2204.00985
AdaBoost. (n.d.). Scikit-learn. Retrieved from
https://scikit-learn.org/stable/modules/ensemble.html#adaboost
Conference on Advanced Communication Technology, 173–178. Retrieved from
http://icact.org/program/full_paper_counter.asp?full_path=/upload/
2013/0461/20130461_finalpaper.pdf
An assessment of lexical, network, and contentbased features for detecting malicious URLs
using machine learning and deep learning models. Computational Intelligence and
Neuroscience, 2022, 1–14.
https://doi.org/10.1155/2022/3241216
Bahnsen, A. C., Bohorquez, E. C., Villegas, S., Vargas, J., & González, F. A. (2017). Classifying phishing
URLs using recurrent neural networks. 2017 APWG Symposium on Electronic Crime Research
(eCrime), 1–8.
https://doi.org/10.1109/ecrime.2017.7945048
Syrian Arab Republic الجمهورية العربية السورية
Barlow, L., Bendiaby, G., Shiaeles, S., & Savage, N. (2020). A novel approach to detect
phishing attacks using binary visualization and machine learning. 2020 IEEE
World Congress on Services (SERVICES).
https://doi.org/10.1109/services48979.2020.00046