Download as ppt, pdf, or txt
Download as ppt, pdf, or txt
You are on page 1of 32

VEBOMETRIJA

Mihailo Škorić
– Netometrija
– Vebometrija
– Internetometrija
– Sajbermetrija
– Bibliometrija veba

U naučnoj zajednici uglavnom priznati kao sinonimi za


isto polje istraživanja.

Međutim u nekim preciznijim podelama vebometrija je


zapravo podskup sajbermetrije.
Uvod 1.0
• Šta je to vebometrija?

Vebometrija je kvantitativna studija fenomena


povezanih sa vebom.

Kvantitativna studija toga kako su različite vrste


informacija generisane, organizovane, distribuisane i
korišćene od strane različitih korisnika i u
različitim kontekstima.
Veb je od samih početaka bio korišćen za formalnu i
neformalnu akademsku komunikaciju i saradnju i stoga je
značaj kvantitativnog merenja ovog resursa brzo
prepoznat.

I na vebu se prepoznaju obrazci slični Bredfordovom


zakonu. Prema istraživanju Rusoa iz 1997. godine.
Obrazci se primećuju na distribuciji najviših internet
domena (top level domain) na neku zadatu temu.

Međutim glavni napredak u razvoju citatne analize na


vebu je bio kada je utvrđena sličnost između citatnih
mreža i hipertekstualnih struktura u dokumentu sredinom
devedesetih.
Nastala je iz shvtanja da se metode, koje su originalno
korišćene za bibliometričku analizu citatnih obrazaca
članaka u časopisima, mogu primeniti na sadržaj na vebu.

(Sve to pod pretpostavkom da komercijalne mašine za


pretraživanje mogu za te obrasce da obezbede sirove
podatke.)

Da li vebometrija treba da obuhvata istraživanja iz


naučnih polja van informacionih nauka, kao što su
studije komunikacija, statistička fizika i računarstvo?
KOMPARACIJA I ODNOS 1.1
Vebometrija i druge metrije prema Bjorneborgu
• Pre svega, vebometrija je podgrana informetrije koja
izučava kvantitativne svojine svih oblika informacija.

• Preseca se sa sajentometrijom, jer postoji sadržaj na


vebu koji nije naučan i postoji naučni sadržaj koji
nije na vebu.

• Podgrana je sajbermetrije jer je WWW samo jedan


vid informacija u sajber svetu.(Prema Bjornebornu i
Ingverstenu). Gde npr. ne spada internet komunikacija.

• Vebometrija se na dijagramu prikazuje kao podgrana i


bibliometrije jer kako kaže Bjorneborn
Celokupan sadržaj na www čine informacije
zapisane na različitim veb serverima.
Gde bi sve ono što tu ne spada pripalo sajbermetriji.
KONCEPTUALNA OKOSNICA 1.2

Koja su glavna polja istraživanja vebometrije?

1. Analiza sadržaja veb stranica

2. Analiza struktura linkova na tim veb stranicama

3. Analiza korišćenosti veba od strane korisnika

4. Analiza same veb tehnologije


Koja su glavni problemi vebometrije?

U početku su to bili nedostaci naučne osnove.

Nije problem u tome da hipertekst nema strukturu,


već u tome što mi nemamo reči da je opišemo.
Bernstejn, 1998

Međutim sada je ova oblast razvijenija.


Osnovni koncepti i
metode vebometrije 2.0
Jedinice analize veb sadržaja ili veb
čvorovi/nodovi:

1. Top level domen


2. Veb sajt
3. Direktorijum
4. Veb stranica
TERMINOLIGA LINKOVA 2.1

Dolazni/unutrašnji/sitat – link koji je primljen


od strane veb čvora.

Odlazni link – šalje van sajta ili na neki drugi


sajt.

Ali terminologija je komplikovanija od toga?

Jedan link može istovremeno biti i dolazni i


odlazni – zavisno od perspektive.
1. B ima dolazni link od A (inlink).
2. B ima odlazni link do C (outlink).
3. Bima refleksivni link ka samom sebi
(selflink).
4. E i F su recipročno linkovani.
5. A ima transverzalni link ka G koji
koristi kao prečica. Povezuje
nepovezano.
6. H je povezano sa A direknim putem
(linkpath).
7. I nema ni dolazne ni odlazne
linkove. I je izolovano.
8. B i E ko-linkuju ka D (co-outlink).
9. C i D su ko-linkovani od strane B
(co-inlink)
Pojednačavanje terminologije linkova i bibliometrije:

Odlazni link = referenca


Dolazni link = citat
Refleksivni link = samocitiranje
Ko-link(inlink) = ko-citiranje
Ko-link(outlink) = bibliografsko uparivanje
JEDINICE ANALIZE 2.2

Šta sve uopšte spada u web?

Ne-html automatski generisane stranice?


Stranice zaštićene lozinkom?
Duboki veb?

Da li treba vebom da se smatra sve čemu može da se


pristupi internet pretraživačem ili samo stranice
koje su indeksirane i dostupne?
Najčešća jedinica brojanja objekata na vebu je veb
sajt.

Brojanje veb stranica nailazi na problem frameset-


ova.

(Ono što izgleda kao jedna, može zapravo biti više


stranica.)
Šta su ADM? –> Alternativni modeli dokumenata.
Služe za preciznije određivanje jedinica.

1. Stranica - Sve stranice u jednom direktorijumu


(url) se broje kao jedna jedinica.
2. Domen – Sadrži sve stranice koje se nalaze na
jednom domenu.
3. Sajt - Dozvoljava i nekoliko vezanih domena.
Sadrži sve podjedinice.
4. SEAT – Žanrovska aralela sajtu. Kolekcija veb
stranica kreiranih od strane jedne osobe ili u
jednu određenu svrhu. (Seat može da bude
ekvivalntan sajtu, direktorijumu ili čak domenu).
• Kako se te jedinice koriste?

Mogu se prebrojavati poddomeni nekog domena; broj


stranica, direktorijuma ili sajtova koji sadrže
link (referencu) ka nekom drugom sajtu.

Koriste se da se reference stave u određene okvire


kako bi se lakše manipulisalo njihovim
prebrojavanjem i stanjem.
Predložene su i dve metode korišćenja:

Upoređivanje korelacija raznih statistika koje


koriste različite ADM-ove, vezanih za prikupljene
podatke, kako bi se došlo do zaključka.

Teorijski pristup koristeći pretpostavke u vezi


procesa koji uzrokuju kreiranje dokumenata i uvođenje
testova koji bi upoređivali u kojoj meri se te
pretpostavke slažu sa prikupljenim podacima.

U svakom slučaju neophodno je prikupljanje podataka.


METODE PRIKUPLJANJA
PODATAKA 2.3

Personalni veb paukovi/veb indekseri/web crowlers

Komercijalne mašine za pretraživanje

Veb logovi
Veb paukovi – sakupljaju linkove sa predodređene veb
stranice ili skupa stranica.

Oni takođe prate linkove koje indeksiraju i prate ih


dalje. Ali linkovi moraju da dođu u obliku u kojem ih
on razume.

Određeni broj nedostataka mogao da se reši tako što


paukovi ne bi išli po mreži već po serverima, ali za
to su potrebne posebne dozvole.

Neke druge nedostatke nadoknađuju komercijalni


pretraživači.
Komercijalne mašine za pretraživanje veba –

Imaju svoje probleme. Iz razloga što su komercijalni


njihovi algoritmi za pretraživanje su tajni, pa ih
istraživači teže koriste. Ne pokrivaju čitav veb.

Jedan metod je korišćenje više mašina i uzimanje


proseka za rezultat. Takođe, stranice koje su više
puta indeksirane dobijaju veću težinu.
Veb logovi –

Kreiraju se na serveru za svaki događaj ili


interakciju.

Obrađuju se od strane softvera za analizu veb logova.


Oni mogu da odgovore na pitanja kada, kako i ko
koristi određeni veb server i njegovu sadržinu.

Veliki problem što je veb logovima u velikoj meri


zabranjen pristup.
Kako nije moguće analizirati svaku veb stranicu i
svaki link za istraživanje se koriste uzorci, kao u
statistici.

Primer: za neku usko specifičnu oblast, moguće je da


se na određenom broju najpopularnijih strana mogu
naći svi relevantni podaci. Slično alociranosti
narelevantnijih članaka u nekolicini časopisa u
bibliometriji.
Faktori i mere 3.0
• Veličina
• Vidljivost
• Veb impakt faktor (WIF)

• Google scholar?
Veličina –

Najjednostavnija mera. Broj stranica na nekom veb


sajtu ili domenu.

Paralela broju objavljenih radova nekog naučnika u


tradicionalnoj bibliometriji.

Alternativa samoj veličini sajta je brojanje bogatih


datoteka (rich files). A mogu se uzeti i obe u obzir.

Ova mera se koristi pod pretopstavkom da nemaju sve


datoteke istu težinu.
Daje veću težinu pdf, ps, doc i ppt datotekama.
Vidljivost –

Broj dolaznih linkova ka nekoj od veb stranica


određenog veb sajta.

Paralela citiranosti radova nekog naučnika u


tradicionalnoj bibliometriji.

Normalizuje se uzimanjem kvadratnog korena ukuponog


broja linkova i množenjem sa brojem različitih domena
sa kojih ti linkovi dolaze radi ravnopravnosti.

Sqrt(L)*n
Veb impakt faktor je očiglenda paralela impakt
faktoru u tradicionalnoj bibliometriji.

Jedna je od najosnovnijih mera i računa se kao


količnik broja linkova ka nekom veb sajtu i broja
njegovih stranica. (Vidljivost/Veličina)

WIF=L/W

Na primer ukoliko nek veb sajt ima 100 stranica i 100


linkova ka nekoj od tih stranica, njegob WIF je 1.

On se, kao i impakt faktor, može normalizovati.


Scholar mera? –

Dodeljuje je Google scholar.

Koristi se pri vebometrijskom rangiranju univerziteta


unutar google scholar mreže.

Odnosi se na broj članaka i citata za svaki akademski


domain.
PROBLEMATIKA 3.1
U čemu je razlika između scholara i WIF-a?

Premda se odlazni linkovi računaju kao reference,


nisu ista stvar. Link ka nečemu ne mora da bude
referenca i ne mora da bude pokazatelj impakta.

Tu stupaju studije o motivaciji za kreiranje


linkova (na akademskim domenima). One pokušavaju
da odgovore na pitanje zašto je neki link kreiran
i da li može važiti za validnu referencu.

Na primer: linkovi ka lokalnim restoranima na


sajtovima univerziteta.
Zaključak 4.0

• Velika količina podataka je potrebna za preciznu


analizu.

• Kvantitativna izračunavanja u vebometriji


zahtevaju komplementarna kvalitativna izučavanja.

• Impakt institucije na vebu se može popraviti sa


boljim shvatanjem veba.
Univerzitet u Beogradu. 184. u Evropi, 431. u svetu
prema istraživanju sa www.webometrics.info.

50.00% impakt, 16.67% prisutnost, 16.67% otvorenost i


16.67% odličnost.

Impact rank - sqrt(L)*n, gde je n broj domena.


Presence rank – W, broj veb stranica prema Google.
Openness rank – broj objavljenih Bogatih datoteka
prema Google Scholaru.
Exellence rank – broj članaka u znamenitim časopisima.
Reference
• Nicola Bellis. 2009. Bibliometrics and citation analysis from the Science
citation index to cybermetrics, Lanham, Md.: Scarecrow Press.

• Lennart Björneborn. 2004. Small-world link structures across an


academic web space: a library and information science approach,
Copenhagen: Department of Information Studies, Royal School of Library
and Information Science.

• Mike Thewall, Liwen Vaughan, and Lennart Bjorneborn. Webometrics.


In Annual Review of Information Science and Technology. 81–135.

You might also like