Download as pdf or txt
Download as pdf or txt
You are on page 1of 25

‫القیاسات الويبومترية‬

‫‪Webometrics‬‬
‫القياسات الويبومترية‬
‫‪webometrics‬‬

‫القیاسات الويبومترية هي الدراسة الكمیة للظواهر ذات العالقة بالويب‪ ،‬ظهرت من خالل التحقق بأن الطرق املصممة أصال‬
‫للدراسات الببلیومتریة الخاصة بتحلیل خصائص االستشهادات في مقاالت الدوريات العلمية‪ ،‬ویمكن تطبيقها على الویب‪ .‬و قد‬
‫ظهرت العديد من املصطلحات املشابهة ملصطلح القیاسات الويبومترية من بینها‪:‬‬

‫تغطي البحث في القواعد الشبكیة‪ ،‬االتصال الشبكي باستعمال قیاسات املعلومات أو قیاسات أخرى‪ ،‬ذلك أن قیاسات‬
‫املعلومات تستعمل حساب الكلمات و تقنیات مشابهة یمكن تطبیقها في تقابلها ‪Hyperlinks‬الواب‪،‬و ما هو جدید أن شبكة‬
‫الواب هي بمثابة شبكة لالستشهادات و الروابط التشعبیة االستشهادات التقلیدیة‬
‫‪60‬‬

‫القياسات الويبومترية‬
‫‪webometrics‬‬

‫تهدف الدراسات الويبومترية إلى إعطاء مصداقية للروابط ‪ Links‬كمصدر جديد للمعلومات و قياس التأثير من‬ ‫•‬

‫االتصاالت الرسمية و غير الرسمية‪ ،‬و أحد املهام املفتاحية هو مقارنة بيانات الروابط مع بيانات أخرى ذات عالقة على‬
‫الخط املباشر أو غير املباشر‪ ،‬إضافة إلى أن املقارنة بين حساب الروابط التشعبية یمكن أن یعطي مصداقية للتعاون بين‬
‫‪ ISI‬للدوريات و املقاالت اإللكترونية مع حساب االستشهادات للروابط التشعبية للواب و االستشهادات الببليوغرافية‪.‬‬
‫‪61‬‬

‫‪metrics‬‬ ‫‪web‬‬ ‫‪webometrics‬‬

‫وحدة قياس الوثائق‬ ‫الشبكة العنكبوتية‬


‫(املتر الخطي)‬ ‫(صفحات الويب)‬
62
‫‪63‬‬

‫القياسات الهيكلية‬

‫أنواع القياسات‬
‫القياسات السلوكية‬
‫الويبومترية‬

‫قياسات املحتوى‬
‫‪64‬‬

‫تحليل‬
‫الروابط‬

‫التحليل‬ ‫تحليل‬
‫الكمي للويب‬ ‫االستشهادات‬
‫‪3.0‬‬ ‫املجاالت الرئيسية‬ ‫املرجعية‬

‫لقياسات الويب‬

‫الدراسات‬ ‫تقييم‬
‫الوصفية‬ ‫محركات‬
‫للويب‬ ‫البحث‬
‫‪65‬‬

‫القياس الكمي للكلمات‬


‫االكسيكومتري‬
‫القياس الكمي للكلمات‬
‫القياس الكمي للكلمات هو عملية تحويل الكلمات إلى أرقام‪ .‬يمكن استخدام هذا اإلجراء لقياس ‪:‬‬
‫عدد املرات التي تظهر فيها كلمة معينة في النص‪.‬‬ ‫•‬

‫مدى شيوع كلمة معينة في مجموعة بيانات‪.‬‬ ‫•‬

‫مدى ارتباط كلمتين أو أكثر ببعضهما البعض‪.‬‬ ‫•‬

‫ُ‬ ‫ً‬
‫شيوعا هو استخدام تقنية تعرف باسم‬ ‫هناك العديد من الطرق املختلفة لقياس الكلمات‪ .‬أحد أكثر الطرق‬
‫تحليل التردد ‪ .word frequency analysis‬يستخدم تحليل التردد لحساب عدد مرات ظهور كل كلمة في مجموعة‬
‫بيانات‪ .‬يمكن بعد ذلك استخدام هذه املعلومات إلنشاء مقياس كمي لكل كلمة‪.‬‬
‫‪67‬‬

‫أهداف القياس الكمي للكلمات‬


‫الترجمة اآللية‬ ‫التعرف على اللغة الطبيعية‬ ‫تحليل النص‬

‫يمكن استخدام القياس الكمي‬ ‫يمكن استخدام القياس الكمي‬ ‫يمكن استخدام القياس الكمي‬
‫للكلمات ملساعدة أنظمة‬ ‫للكلمات لتدريب نماذج التعرف‬ ‫للكلمات لتحليل محتوى النص‬
‫الترجمة اآللية على تحديد‬ ‫على اللغة الطبيعية‪ .‬تتعلم نماذج‬ ‫وتحديد األنماط‪ .‬على سبيل‬
‫املرادفات والترجمة الصحيحة‬ ‫التعرف على اللغة الطبيعية من‬ ‫املثال‪ ،‬يمكن استخدام القياس‬
‫للكلمات‪.‬‬ ‫العالقة بين الكلمات واملعنى‪.‬‬ ‫الكمي للكلمات لتحديد‬
‫يمكن استخدام القياس الكمي‬ ‫ً‬
‫شيوعا في النص‬ ‫الكلمات األكثر‬
‫للكلمات ملساعدة نماذج التعرف‬ ‫أو لتحديد الكلمات التي يتم‬
‫على اللغة الطبيعية على تعلم‬ ‫استخدامها ً‬
‫معا بشكل متكرر‪.‬‬
‫هذه العالقة‪.‬‬
‫‪68‬‬

‫تحليل تردد‬
‫الكلمات‬

‫قانون‬ ‫التردد‬ ‫طرق القياس‬


‫طرق‬
‫‪Booth‬‬ ‫القياس‬
‫النسبي‬ ‫الكمي الكلمات‬
‫للكلمات‬

‫قانون ‪zipfs‬‬
‫‪69‬‬

‫‪WordStat‬‬

‫‪SpaCy‬‬
‫أدوات‬
‫‪AntConc‬‬ ‫أدوات القياس‬
‫القياس‬
‫الكمي للكلمات‬

‫‪NLTK‬‬
‫‪70‬‬

‫تحليل تردد الكلمات‬


‫هو عملية حساب عدد مرات ظهور كل كلمة في مجموعة بيانات‪ .‬يمكن استخدام هذه املعلومات إلنشاء مقياس كمي لكل كلمة‪ ،‬مثل تردد الكلمة أو نسبة‬
‫الكلمة‪ .‬مكن بعد ذلك استخدام هذه املعلومات إلنشاء مقياس كمي لكل كلمة‪.‬‬
‫التردد التراكمي للكلمات هو مقياس إحصائي يستخدم لقياس تكرار الكلمات في مجموعة بيانات نصية‪ُ .‬يعرف ً‬
‫أيضا باسم التوزيع التراكمي للترددات أو التوزيع‬
‫التراكمي للكلمات‪.‬‬
‫يمكن استخدام التردد التراكمي للكلمات لفهم توزيع الكلمات في مجموعة البيانات‪ .‬على سبيل املثال‪ ،‬إذا كان التردد التراكمي للكلمات يزداد بسرعة في البداية‪،‬‬
‫ً‬
‫شيوعا‪.‬‬ ‫كبيرا من الكلمات األقل‬ ‫ً‬
‫وعددا ً‬ ‫صغيرا من الكلمات الشائعة ً‬
‫جدا‪،‬‬ ‫ً‬ ‫ثم يبدأ في التباطؤ‪ ،‬فهذا يعني أن هناك ً‬
‫عددا‬
‫يستخدم أيضا ملقارنة توزيع الكلمات في مجموعات بيانات مختلفة‪ .‬على سبيل املثال‪ ،‬إذا كان التردد التراكمي للكلمات في مجموعة بيانات من املقاالت الصحفية‬
‫أعلى منه في مجموعة بيانات من الكتب‪ ،‬فهذا يعني أن املقاالت الصحفية تحتوي على عدد أكبر من الكلمات الشائعة‪.‬‬
‫التردد التراكمي للكلمات هو مقياس يوضح عدد الكلمات التي تحدث أقل من أو تساوي قيمة معينة‪ .‬يمكن استخدامه لتحليل مجموعة بيانات نصية لفهم‬
‫توزيع الكلمات‪.‬‬
71
‫‪72‬‬
‫يتم ترتيب البيانات ترتيب تصاعدي‪ .‬قد يعني هذا ترتيب الكلمات ً‬
‫بناء على تردداتها‪ ،‬من األقل‬ ‫جدول توزيع التردد التراكمي‬
‫ً‬ ‫ً‬
‫تكرارا إلى األكثر شيوعا‪ .‬مثال‪ ،:‬يظهر "القفز" مرة واحدة‪" ،‬سريع "و "بني" مرتين‪" ،‬و" ‪" ،‬الثعلب‬ ‫للكلمات‬
‫‪" ،‬فوق‪" ،‬كسول‪" ،‬و "الكلب "كلها تظهر ثالث مرات‪.‬‬

‫التردد التراكمي‬ ‫التردد‬ ‫الكلمة‬ ‫‪ -1‬بناء جدول توزيع التردد التراكمي‬


‫‪1‬‬ ‫‪1‬‬ ‫يقفز‬ ‫يعد بناء جدول توزيع التردد التراكمي خطوة أساسية في‬
‫‪3‬‬ ‫‪2‬‬ ‫سريع‬ ‫عالم اإلحصاءات وتحليل البيانات‪ .‬إنه بمثابة أداة قوية‬
‫‪5‬‬ ‫‪2‬‬ ‫بني‬
‫‪8‬‬ ‫‪3‬‬ ‫و‬ ‫الكتساب رؤى في توزيع البيانات‪ ،‬خاصة عند التعامل‬
‫‪11‬‬ ‫‪3‬‬ ‫ثعلب‬ ‫مع مجموعات البيانات الكبيرة أو عند البحث عن‬
‫‪14‬‬ ‫‪3‬‬ ‫فوق‬
‫أنماط في املعلومات‪ ،‬كما هو الحال في كثير من األحيان‬
‫‪17‬‬ ‫‪3‬‬ ‫كسول‬
‫‪20‬‬ ‫‪3‬‬ ‫كلب‬ ‫عند فحص تواتر الكلمات في النصوص‪.‬‬
‫‪ .732‬حساب التردد التراكمي للكلمات‪:‬‬
‫وذلك باستخدام الصيغة التالية‪:‬‬

‫‪f(x) = n(x) / N‬‬

‫حيث‪:‬‬
‫)‪f(x‬هو التردد التراكمي للكلمات بعد ‪x‬كلمة‬
‫)‪n(x‬هو عدد الكلمات في مجموعة البيانات التي ترددها يساوي أو أقل من ‪x‬‬
‫‪N‬هو إجمالي عدد الكلمات في مجموعة البيانات = ‪ ،100‬ومنه‪:‬‬
‫‪f(20)= 20‬‬
‫)‪n(x)= 8(20‬‬
‫‪N=100‬‬
‫‪f = 8(20)/100 =160/100‬‬
‫‪f = 1,6‬‬
‫‪74‬‬

‫هو قانون تجريبي ينص على أن تكرار الكلمات في النص‬ ‫•‬

‫ً‬
‫شيوعا‬ ‫يتبع منحنى أس ي‪ .‬بمعنى آخر‪ ،‬فإن الكلمة األكثر‬
‫ً‬
‫شيوعا بكثير من الكلمة الثانية‬ ‫في النص ستكون أكثر‬
‫ً‬
‫شيوعا أكثر‬ ‫ً‬
‫شيوعا‪ ،‬وستكون الكلمة الثانية األكثر‬ ‫األكثر‬
‫ً‬
‫شيوعا‪ ،‬وهكذا‪.‬‬ ‫ً‬
‫شيوعا بكثير من الكلمة الثالثة األكثر‬
‫قانون زيف‬
‫)‪(Zipf's law‬‬
‫تم صياغته ألول مرة من قبل العالم اللغوي جورج‬ ‫•‬

‫كينغسلي زيف في عام ‪ .1949‬وقد لوحظ أن قانون زيف‬


‫ينطبق على مجموعة متنوعة من اللغات‪ ،‬بما في ذلك‬
‫اللغات الطبيعية والبرمجة‪.‬‬
‫‪75‬‬
‫و ً‬
‫فقا لقانون زيف‪ ،‬يتناسب التردد النسبي لعنصر (مثل كلمة في نص مكتوب) بشكل عكس ي مع ترتيبه‪ .‬بمعنى آخر‪ ،‬العناصر‬ ‫•‬

‫القليلة تحمل الوزن األكبر والعناصر الكثيرة تحمل الوزن األقل‪ .‬يمكن تعبير العالقة بين الترتيب )‪ )r‬والتردد)‪ )f‬بالعالقة التالية‪:‬‬

‫‪f(r) = C / rβ‬‬

‫حيث‪:‬‬
‫)‪f(r‬هو تكرار الكلمة في املرتبة ‪r‬‬ ‫•‬
‫‪c‬هو ثابت يعتمد على حجم مجموعة البيانات‬ ‫•‬
‫‪β‬هو معامل االنحدار يتراوح عادة ب ـ ‪1.0‬‬ ‫•‬
76
‫القياس الكمي للصوروالرسومات‬

‫• القياس الكمي للصور والرسومات هو عملية تحويل الصور والرسومات إلى بيانات رقمية يمكن تحليلها وإدارتها بسهولة‪ .‬يمكن‬
‫استخدام هذه البيانات لفهم املحتوى والخصائص األسلوبية للصور والرسومات‪ ،‬وملقارنة الصور والرسومات املختلفة‪ ،‬وإلنشاء‬
‫رسومات جديدة‪.‬‬
‫هناك العديد من الطرق املختلفة للقياس الكمي للصور والرسومات‪ .‬بعض الطرق الشائعة تشمل‪:‬‬
‫• تحليل التردد‪:‬‬
‫‪ :‬يقوم هذا التحليل بحساب عدد مرات ظهور كل لون أو شكل أو نمط في الصورة أو الرسم‪ .‬يمكن استخدام هذه املعلومات لتحديد‬
‫ً‬
‫شيوعا في الصورة أو الرسم‪ ،‬ولفهم كيفية ترتيب هذه العناصر‪.‬‬ ‫العناصر األكثر‬
‫• تحليل االنحدار‪:‬‬
‫يمكن استخدام تحليل االنحدار لتحديد العالقات بين املتغيرات في الصورة‪ .‬على سبيل املثال‪ ،‬يمكن استخدام تحليل االنحدار لتحديد‬
‫العالقة بين لون الصورة وموضوعها‪.‬‬
‫تحليل التعرف على األنماط‪:‬‬
‫يقوم هذا التحليل بتحديد موقع كل لون أو شكل أو نمط في الصورة أو الرسم‪ .‬يمكن استخدام هذه املعلومات لفهم كيفية تنظيم‬
‫العناصر في الصورة أو الرسم‪ ،‬ولتحديد العالقات بين العناصر املختلفة‪.‬‬
‫القياس الكمي للمؤشرات العلمية‬ ‫‪78‬‬

‫وتعني التحليل الرياض ي واالحصائي لألنماط البحثية في العلوم الطبيعة والحياة ‪Science of‬‬ ‫•‬
‫‪ ، science‬وبعض القياسات اإلحصائية تعتبر دراسات بيبليومترية مطبقة في العلوم ‪ ،‬حيث‬
‫تقوم السيناتوميتريكس بدراسة أيضا‪ :‬البنية والتطير واالتصاالت البحثية وسلوك البحث‬
‫عن املعلومات وسياسة الحكومات فيما يتعلق بالعلوم‬
‫بعض القیاسات اإلحصائیة في العلوم لیست إال دراسات ببلیومتریة مطبقة في العلوم و لكن‬ ‫•‬
‫تقوم القیاسات العلمیة بتحلیل‪ :‬البیئة و التطویر و االتصاالت العلمیة و سلوك البحث‬
‫عن املعلومات و سیاسات الحكومات فیما یتعلق بالعلوم‪ ،‬أي أن هناك عالقة وطیدة بين‬
‫القیاسات الببلیومتریة و القیاسات العلمیة إال أن هذه األخيرة أوسع مجاال فهي تقیس البیئة‬
‫العلمیة و االتصاالت و سلوك البحث العلمي و سیاسة العلم‪.‬‬
79
‫‪80‬‬

‫جمع‬
‫البيانات‬
‫وصف‬
‫البيانات‬
‫أساليب‬
‫القياسات‬
‫العلمية‬
‫نمذجة‬ ‫اختبار‬
‫البيانات‬ ‫الفرضيات‬
‫تحليل‬
‫التباين‬
‫‪81‬‬

‫القياس‬
‫املباشر‬

‫أساليب قياس‬
‫املؤشرات‬
‫العلمية‬
‫القياس‬ ‫القياس غير‬
‫االحصائي‬ ‫املباشر‬
‫الخصائص‬ ‫املؤلف‬ ‫القانون‬
‫يسمى ً‬
‫أيضا قانون لوتكا‪-‬بيرت‪.‬‬ ‫‪82‬‬
‫•‬
‫يصف توزيع املؤلفين حسب عدد املنشورات التي نشروها‪.‬‬ ‫•‬
‫ً‬ ‫عمال ً‬ ‫ً‬
‫واحدا فقط يتناسب عكسيا مع الجذر التربيعي‬ ‫ينص على أن عدد املؤلفين الذين ينشرون‬ ‫•‬ ‫ستيفان لوتكا‬ ‫قانون ‪Lotka‬‬
‫لعدد املؤلفين الذين ينشرون أكثر من عمل واحد‪.‬‬
‫يمكن استخدام هذا القانون لتحديد املؤلفين األكثر إنتاجية في مجال معين‪.‬‬ ‫•‬
‫يسمى ً‬
‫أيضا قانون قانون برادفورد‪-‬الك‪.‬‬ ‫•‬
‫• يصف توزيع املنشورات حسب مرتبتها‪.‬‬
‫ً‬
‫• ينص على أن عدد املنشورات التي تنتجها مجموعة معينة من املؤلفين يتناسب عكسيا مع مرتبة‬
‫سايمون برادفورد‬ ‫قانون ‪Bradford‬‬
‫املنشورات‪.‬‬
‫• يمكن استخدام هذا القانون لتوقع عدد املنشورات التي ستنتجها مجموعة معينة من املؤلفين في‬
‫املستقبل‪.‬‬
‫يسمى ً‬
‫أيضا قانون زيف‪-‬مارتن‪.‬‬ ‫•‬
‫• يصف توزيع املصطلحات حسب عدد مرات استخدامها‪.‬‬
‫ً‬
‫• ينص على أن عدد مرات استخدام كلمة معينة في مجموعة من النصوص يتناسب عكسيا مع‬ ‫جورج زيف‬ ‫قانون ‪Ziph‬‬
‫ً‬
‫استخداما‪.‬‬ ‫ترتيبها في املصطلحات األكثر‬
‫• يمكن استخدام هذا القانون لتحديد الكلمات األكثر أهمية في مجموعة من النصوص‪.‬‬

You might also like