Professional Documents
Culture Documents
المحاضرة 7
المحاضرة 7
Webometrics
القياسات الويبومترية
webometrics
القیاسات الويبومترية هي الدراسة الكمیة للظواهر ذات العالقة بالويب ،ظهرت من خالل التحقق بأن الطرق املصممة أصال
للدراسات الببلیومتریة الخاصة بتحلیل خصائص االستشهادات في مقاالت الدوريات العلمية ،ویمكن تطبيقها على الویب .و قد
ظهرت العديد من املصطلحات املشابهة ملصطلح القیاسات الويبومترية من بینها:
تغطي البحث في القواعد الشبكیة ،االتصال الشبكي باستعمال قیاسات املعلومات أو قیاسات أخرى ،ذلك أن قیاسات
املعلومات تستعمل حساب الكلمات و تقنیات مشابهة یمكن تطبیقها في تقابلها Hyperlinksالواب،و ما هو جدید أن شبكة
الواب هي بمثابة شبكة لالستشهادات و الروابط التشعبیة االستشهادات التقلیدیة
60
القياسات الويبومترية
webometrics
تهدف الدراسات الويبومترية إلى إعطاء مصداقية للروابط Linksكمصدر جديد للمعلومات و قياس التأثير من •
االتصاالت الرسمية و غير الرسمية ،و أحد املهام املفتاحية هو مقارنة بيانات الروابط مع بيانات أخرى ذات عالقة على
الخط املباشر أو غير املباشر ،إضافة إلى أن املقارنة بين حساب الروابط التشعبية یمكن أن یعطي مصداقية للتعاون بين
ISIللدوريات و املقاالت اإللكترونية مع حساب االستشهادات للروابط التشعبية للواب و االستشهادات الببليوغرافية.
61
القياسات الهيكلية
أنواع القياسات
القياسات السلوكية
الويبومترية
قياسات املحتوى
64
تحليل
الروابط
التحليل تحليل
الكمي للويب االستشهادات
3.0 املجاالت الرئيسية املرجعية
لقياسات الويب
الدراسات تقييم
الوصفية محركات
للويب البحث
65
ُ ً
شيوعا هو استخدام تقنية تعرف باسم هناك العديد من الطرق املختلفة لقياس الكلمات .أحد أكثر الطرق
تحليل التردد .word frequency analysisيستخدم تحليل التردد لحساب عدد مرات ظهور كل كلمة في مجموعة
بيانات .يمكن بعد ذلك استخدام هذه املعلومات إلنشاء مقياس كمي لكل كلمة.
67
يمكن استخدام القياس الكمي يمكن استخدام القياس الكمي يمكن استخدام القياس الكمي
للكلمات ملساعدة أنظمة للكلمات لتدريب نماذج التعرف للكلمات لتحليل محتوى النص
الترجمة اآللية على تحديد على اللغة الطبيعية .تتعلم نماذج وتحديد األنماط .على سبيل
املرادفات والترجمة الصحيحة التعرف على اللغة الطبيعية من املثال ،يمكن استخدام القياس
للكلمات. العالقة بين الكلمات واملعنى. الكمي للكلمات لتحديد
يمكن استخدام القياس الكمي ً
شيوعا في النص الكلمات األكثر
للكلمات ملساعدة نماذج التعرف أو لتحديد الكلمات التي يتم
على اللغة الطبيعية على تعلم استخدامها ً
معا بشكل متكرر.
هذه العالقة.
68
تحليل تردد
الكلمات
قانون zipfs
69
WordStat
SpaCy
أدوات
AntConc أدوات القياس
القياس
الكمي للكلمات
NLTK
70
حيث:
)f(xهو التردد التراكمي للكلمات بعد xكلمة
)n(xهو عدد الكلمات في مجموعة البيانات التي ترددها يساوي أو أقل من x
Nهو إجمالي عدد الكلمات في مجموعة البيانات = ،100ومنه:
f(20)= 20
)n(x)= 8(20
N=100
f = 8(20)/100 =160/100
f = 1,6
74
ً
شيوعا يتبع منحنى أس ي .بمعنى آخر ،فإن الكلمة األكثر
ً
شيوعا بكثير من الكلمة الثانية في النص ستكون أكثر
ً
شيوعا أكثر ً
شيوعا ،وستكون الكلمة الثانية األكثر األكثر
ً
شيوعا ،وهكذا. ً
شيوعا بكثير من الكلمة الثالثة األكثر
قانون زيف
)(Zipf's law
تم صياغته ألول مرة من قبل العالم اللغوي جورج •
القليلة تحمل الوزن األكبر والعناصر الكثيرة تحمل الوزن األقل .يمكن تعبير العالقة بين الترتيب ) )rوالتردد) )fبالعالقة التالية:
f(r) = C / rβ
حيث:
)f(rهو تكرار الكلمة في املرتبة r •
cهو ثابت يعتمد على حجم مجموعة البيانات •
βهو معامل االنحدار يتراوح عادة ب ـ 1.0 •
76
القياس الكمي للصوروالرسومات
• القياس الكمي للصور والرسومات هو عملية تحويل الصور والرسومات إلى بيانات رقمية يمكن تحليلها وإدارتها بسهولة .يمكن
استخدام هذه البيانات لفهم املحتوى والخصائص األسلوبية للصور والرسومات ،وملقارنة الصور والرسومات املختلفة ،وإلنشاء
رسومات جديدة.
هناك العديد من الطرق املختلفة للقياس الكمي للصور والرسومات .بعض الطرق الشائعة تشمل:
• تحليل التردد:
:يقوم هذا التحليل بحساب عدد مرات ظهور كل لون أو شكل أو نمط في الصورة أو الرسم .يمكن استخدام هذه املعلومات لتحديد
ً
شيوعا في الصورة أو الرسم ،ولفهم كيفية ترتيب هذه العناصر. العناصر األكثر
• تحليل االنحدار:
يمكن استخدام تحليل االنحدار لتحديد العالقات بين املتغيرات في الصورة .على سبيل املثال ،يمكن استخدام تحليل االنحدار لتحديد
العالقة بين لون الصورة وموضوعها.
تحليل التعرف على األنماط:
يقوم هذا التحليل بتحديد موقع كل لون أو شكل أو نمط في الصورة أو الرسم .يمكن استخدام هذه املعلومات لفهم كيفية تنظيم
العناصر في الصورة أو الرسم ،ولتحديد العالقات بين العناصر املختلفة.
القياس الكمي للمؤشرات العلمية 78
وتعني التحليل الرياض ي واالحصائي لألنماط البحثية في العلوم الطبيعة والحياة Science of •
، scienceوبعض القياسات اإلحصائية تعتبر دراسات بيبليومترية مطبقة في العلوم ،حيث
تقوم السيناتوميتريكس بدراسة أيضا :البنية والتطير واالتصاالت البحثية وسلوك البحث
عن املعلومات وسياسة الحكومات فيما يتعلق بالعلوم
بعض القیاسات اإلحصائیة في العلوم لیست إال دراسات ببلیومتریة مطبقة في العلوم و لكن •
تقوم القیاسات العلمیة بتحلیل :البیئة و التطویر و االتصاالت العلمیة و سلوك البحث
عن املعلومات و سیاسات الحكومات فیما یتعلق بالعلوم ،أي أن هناك عالقة وطیدة بين
القیاسات الببلیومتریة و القیاسات العلمیة إال أن هذه األخيرة أوسع مجاال فهي تقیس البیئة
العلمیة و االتصاالت و سلوك البحث العلمي و سیاسة العلم.
79
80
جمع
البيانات
وصف
البيانات
أساليب
القياسات
العلمية
نمذجة اختبار
البيانات الفرضيات
تحليل
التباين
81
القياس
املباشر
أساليب قياس
املؤشرات
العلمية
القياس القياس غير
االحصائي املباشر
الخصائص املؤلف القانون
يسمى ً
أيضا قانون لوتكا-بيرت. 82
•
يصف توزيع املؤلفين حسب عدد املنشورات التي نشروها. •
ً عمال ً ً
واحدا فقط يتناسب عكسيا مع الجذر التربيعي ينص على أن عدد املؤلفين الذين ينشرون • ستيفان لوتكا قانون Lotka
لعدد املؤلفين الذين ينشرون أكثر من عمل واحد.
يمكن استخدام هذا القانون لتحديد املؤلفين األكثر إنتاجية في مجال معين. •
يسمى ً
أيضا قانون قانون برادفورد-الك. •
• يصف توزيع املنشورات حسب مرتبتها.
ً
• ينص على أن عدد املنشورات التي تنتجها مجموعة معينة من املؤلفين يتناسب عكسيا مع مرتبة
سايمون برادفورد قانون Bradford
املنشورات.
• يمكن استخدام هذا القانون لتوقع عدد املنشورات التي ستنتجها مجموعة معينة من املؤلفين في
املستقبل.
يسمى ً
أيضا قانون زيف-مارتن. •
• يصف توزيع املصطلحات حسب عدد مرات استخدامها.
ً
• ينص على أن عدد مرات استخدام كلمة معينة في مجموعة من النصوص يتناسب عكسيا مع جورج زيف قانون Ziph
ً
استخداما. ترتيبها في املصطلحات األكثر
• يمكن استخدام هذا القانون لتحديد الكلمات األكثر أهمية في مجموعة من النصوص.