Download as pptx, pdf, or txt
Download as pptx, pdf, or txt
You are on page 1of 31

Pretraživanje Web-a

Anida Zahirović Suhonjić, MA inž.organiz.nauk.


Uvod
 Mreža se pravi povezivanjem više računarskih uređaja

Poslovna informatika 2
ŠTA JE INTERNET ?
 Mreža može da se napravi od više podmreža
 Internet se dobiva povezivanjem mreža i podmreža.

Poslovna informatika 3
WORLD WIDE WEB ?
 Predstavlja sistem međusobno poveznih multimedijskih datoteka kojima
pristupamo putem interneta. Te datoteke pojavljuju se u obliku stranica u
programu koji se zove web browser.

 Koja je razlika između interenta i www ?

Poslovna informatika 4
OSNOVNI POJMOVI VEZANI ZA WWW ?
 Pristup interentu – Internet Service Provider
 Web server
 Web stranica
 Uniform Resource Locator (Web adresa određenog resursa na
Internetu)
 Hiperlink (međusobna veza između web stranica)
 HTTP (eng. HyperText Transfer Protocol)

Poslovna informatika 5
SOFTVER ZA KORIŠTENJE WWW ?
 Softveri za korištenje Weba - preglednici
 Web preglednik, web browser, Internet browser - je program
koji korisniku omogućuje pregled web stranica i multimedijalnih
sadržaja vezanih uz njih.
 Grafički interfejs, podržavaju hipertekst koncept, “klik” na
poveznicu (link) /tekst, slike/ šalju zahtjeve za podacima
odgovarajućim Web serverima (na aktiviranoj Web adresi)
 prikazuju sadržaj Web stranica koji su dobili od Web servera

Poslovna informatika 6
SOFTVER ZA KORIŠTENJE WWW ?
 Najpopularniji preglednici danas su:
 Firefox - besplatan preglednik otvorenog koda
 Mozilla - imenom Mozilla danas nazivamo spoj Firefoxa i
Thunderbirda
 Opera - besplatan preglednik zatvorenog koda preduzeća
Opera
 Internet Explorer - besplatan preglednik zatvorenog koda
(Microsoft)
 Safari - besplatan preglednik (Apple)
 Google Chrome - besplatan preglednik (Google)

Poslovna informatika 7
PRETRAŽIVANJE WEBA
 Te su informacije jako raznovrsne (po kvalitetu, pouzdanosti,
temi, opsegu i strukturiranosti)

 Većinom nisu bile podvrgnute nezavisnoj recenziji

 Nedostaju im metainformacije: ime autora, institucija u kojoj


autor radi, naslov i sažetak informacije, ključne riječi, datum
objavljivanja i sl.

 Mnoge od tih informacija nisu održavane ni ažurirane.

Poslovna informatika 8
PRETRAŽIVANJE WEBA
 Traženje informacija na Webu može biti mukotrpan i
neefikasan posao.
 Većina dobivenih informacija po sadržaju ne odgovara cilju
pretraživanja.

 Osnovni problem pretraživanja:


kako iz mnoštva nevažnih informacija izdvojiti one koje su
relevantne

Poslovna informatika 9
OSOBINE REZULTATA PRETRAŽIVANJA
Cilj pretraživanja:
• da svi pronađeni dokumenti budu relevantni
• da nađemo sve relevantne dokumente koji postoje na Webu

 Preciznost pretraživanja je veća što je među pronađenim


dokumentima veći udio dokumenata relevantnih za
pretraživanje
 Obuhvat je veći što je veći dio od svih postojećih relevantnih
dokumenata pronađeno

Poslovna informatika 1
0
OSOBINE REZULTATA PRETRAŽIVANJA
 Teško je postići i visoku preciznost i veliki obuhvat:
 ukoliko želimo veći obuhvat tada ublažavanjem uslova
pretraživanja povećavamo broj pronađenih relevantnih
dokumenata – ali, istovremeno povećavamo i broj
pronađenih irelevantnih dokumenata
 ukoliko želimo veću preciznost tada pooštravanjem uslova
pretraživanja smanjujemo udio irelevantnih dokumenata –
ali, istovremeno smanjujemo i broj pronađenih relevantnih
dokumenata

Poslovna informatika 1
1
OSOBINE REZULTATA PRETRAŽIVANJA
Rangiranje dokumenata
 u izvjesnoj mjeri ublažuje taj efekt jer omogućuje da na vrhu liste rezultata
pretraživanja imamo veći udio relevantnih dokumenata

Poslovna informatika 1
2
OSOBINE REZULTATA PRETRAŽIVANJA

Poslovna informatika 1
3
OSOBINE REZULTATA PRETRAŽIVANJA

Poslovna informatika 1
4
VRSTE PRETRAŽIVANJA
 Opća pretraživanja - omogućuju traženje bilo koje vrste informacija
 Tematski katalozi
 Tražilice
 Metatražilice
 Inteligentni agenti
 Specifična pretraživanja - odnose se na traženje specifičnih
informacija koje nam često trebaju (traženje adresa, telefonskih
brojeva, adresa elektronske pošte, knjiga, časopisa ili programa)

Poslovna informatika 1
5
GLAVNI ALATI ZA PRETRAŽIVANJA

Poslovna informatika 1
6
TRAŽILICE
 Internetski pretraživači rade prikupljajući informacije o mnogim Web
stranicama, koje pronađu na samom World Wide Web-u. Te stranice
je prikupio Web crawler, spider (pauk) – automatizovani Web
preglednik koji slijedi svaki link koji vidi.

 Sadržaj svake stranice se potom analizira, s ciljem ustanovljavanja


načina indeksiranja. Podaci o Web stranicama su spremljeni u bazu
podataka indeksa za upotrebu u sljedećim upitima.

 Kada korisnik postavi upit pretraživaču (obično koristeći ključne


riječi) pretraživač pregledava svoj indeks i osigurava listu najbolje
usklađenih Web stranica s kriterijima, u pravilu sa sažetkom koji
sadržava naslov dokumenta, a ponekad i dijelove teksta.

 Pretraživanje se temelji na kombinaciji ključnih riječi.


Poslovna informatika 1
7
TRAŽILICE
 Neka od osnovnih osobina pretraživača jesu u vezi s pitanjima:
 kako se često ažuriraju informacije u imeniku
 je li imenik napravljeno na temelju potpunog sadržaja Web
dokumenata ili samo njihovog manjeg dijela
 koliko je Web dokumenata sakupljeno u bazi podataka
pretraživača
 kakvi se načini pretraživanja mogu koristiti
 kojom se brzinom izvode pretraživanja imenika i rezultati
transportiraju do korisnika
 kako su poredani (rangirani) rezultati pretraživanja, tj. pronađeni
Web dokumenti

Poslovna informatika 1
8
TEHNIKE PRETRAŽIVANJA
 Logički (Booleovi) operatori AND, OR i NOT omogućuju postavljanje
odnosa među ključnim riječima (tj. pojmovima koji se traže)

 Ovisno o pretraživaču mogu se zamjeniti zankovima:


AND = + (dogs +cats)
NOT = - (dogs –cats)
OR = | (dogs |cats)

Poslovna informatika 1
9
TEHNIKE PRETRAŽIVANJA
 Operator AND sužava pretraživanje, tako da rezultati pretraživanja
uključuju samo one dokumente koji uključuju sve nazive povezane
operatorom.

Poslovna informatika 2
0
TEHNIKE PRETRAŽIVANJA
 Operator OR proširuje pretraživanja na dokumente koji uključuju bilo koji
pojam povezan operatorom. Upotrebom ovog operatora se isključuje se
dupliranje dokumenta

Poslovna informatika 2
1
Tehnike pretraživanja

Poslovna informatika 2
2
Tehnike pretraživanja
 Operator NOT koristi se za isljučivanje nekog termina iz pretraživanja.

Poslovna informatika 2
3
Tehnike pretraživanja

Poslovna informatika 2
4
TEHNIKE PRETRAŽIVANJA
 Pretraživanje fraza omogućuje specificiranje točnog izraza za pretraživanje
(npr. „poslovna informatika”)

Poslovna informatika 2
5
TEHNIKE PRETRAŽIVANJA
 Zamjenski znakovi (wildcards)

Poslovna informatika 2
6
TEHNIKE PRETRAŽIVANJA
 pronalaženje definicija define:(tražen pojam)
 pretraživanje prirodnim jezikom
Upišite pitanje koje sadržava onoliko riječi koliko ih je potrebno za
specificiranje upita. Npr: Which are the colours of rainbow?
 pretraživanje sinonima
Koristite tildu (~) ispred riječi za koju želite pronaći sinonime. (~
education – u rezultate pretraživanja bit će uključeni pojmovi: teacher,
school, university)
 pretraživanje po naslovu – intitle:(tražen pojam) ili allintitle:(tražen
pojam)
 pretraživanje po URL-u – inurl:(tražen pojam) ili allinurl:(tražen
pojam)

Poslovna informatika 2
7
TEHNIKE PRETRAŽIVANJA
 pretraživanje po domeni – (tražen pojam) site:(ime domene)
 pretraživanje stranica koje sadrže hiperlinkove prema određenoj
stranici – link:(traženi URL)
 Pretraživanje prema formatu – filetype:(tražen format)
 Pretraživanje srodnih stranica – related:(naziv određene stranice)

Poslovna informatika 2
8
TEHNIKE PRETRAŽIVANJA

Poslovna informatika 2
9
Pitanja za ponavljanje
 Koji logički operatori se koriste kao tehnika pretraživanja web-a?
 Koje rezultate pretraživanja ćemo dobiti ako upišemo:
poslovna | informatika
„poslovna informatika”
 Koje rezultate pretraživanja ćemo dobiti ako upišemo:
mjesec –oseka
mjesec +oseka

Poslovna informatika 3
0
Poslovna informatika

Anida Zahirović Suhonjić, MA inž.organiz.nauk.

You might also like