Pretraživači na internetu
SAOBRAĆAJNI FAKULTET U BEOGRADU
Predmet:
Elektronsko poslovanje
Pretraživači na internetu
Mentor: Student:
Sadržaj
1. Uvod ....................................................................................................................1
2. Web pretraživači..................................................................................................2
2. 1 Opšta podela Web pretraživača
........................................................................3
3. Problemi pretraživača..........................................................................................5
4. Napredno pretraživanje........................................................................................6
5. Google..................................................................................................................6
6. Domaći pretraživači ............................................................................................7
6. 1 WWW.YUSEARCH.COM
.........................................................................................8
6. 2 WWW.YU
.............................................................................................................8
6. 3 WWW.SRPKO.COM
..............................................................................................8
6. 4 WWW.TRAZIM.COM
..............................................................................................8
6. 5 WWW.ALADIN.INFO ..
...........................................................................................8
6. 6 WWW.KRSTARICA.COM
.......................................................................................9
6. 7 WWW.POGODAK.RS
............................................................................................9
6. 8 WWW.GOOGLE.RS
..............................................................................................9
7. Problemi domaćih pretraživača..........................................................................10
8. Zaključak............................................................................................................11
9. Literatura............................................................................................................12
2

2. Web pretraživači
Prvi veći pretraživač na web-u jeste Yahoo.com, koga su podigla
dva studenta sa idejom da naprave top listu svojih omiljenih site-ova. U
početku se na Yahoo-u našlo samo 10 site-ova, zatim 20, pa 50, 100 i
kako se broj povećavao rodila se ideja da naprave kategorije i da sve site-
ove razvrstaju po njima. Takvi pretraživači nazivaju se ''web direktorijum'' i
o njima će biti reči kasnije. Prvi ozbiljniji pretraživač jeste Altavista.com,
koji je počeo kao Yahoo, ali uskoro razvija način indeksiranja i postaje
''krolerski'' pretrazivač. [1]
Zadatak pretrage je da što efikasnije vrati što kvalitetniji rezultat.
Efikasnost se meri brzinom koja protekne od klika na dugme do pojave
rezultata, a kvalitet se meri sa brojem rezultata (stranica) koje pretraživač
vrati i njihovom relevantnošću. Za brzinu zadužen je proces indeksiranja i
algoritmi koji sortiraju podatke prilikom parsiranja. Broj rezultata zavisi od
broja indeksiranih stranica, odnosno broja stranica koje Web spajder
pretraživača poseti i preuzme u bazu. Relevantnost predstavlja
povezanosti sadržaja sajta sa traženim pojmom i zavisi od kvaliteta
algoritama koje pretraživač koristi.
Proces pretrage počinje dolaskom korisnika na stranicu web
pretraživača i unošenjem faze. Klikom na dugme pretraga (Eng. Search)
fraza se prosleđuje do parsera koji parsira frazu. Izbacuju se one reči koje
se nalaze na stop listi, a sve ostale proveravaju da li postoje u Lexicon-u.
Ukoliko fraza nije pronađena u Lexicon tabeli, korisnik dobija poruku da ne
postoji ni jedan dokument koji sadrži traženu frazu. U suprotnom za svaku
reč iz fraze dobija se Id pod kojom je ta reč snimljena u Lexicon tabeli.
Nakon dobijanja identifikatora za reči koje se nalaze u frazi izvršava
se upit nad inverted index tabelom koji vraća sve dokumente koji ih
sadrže. Ovde se proces pretrage završava za one pretraživače koji se ne
bave relevantnošću rezultata. Za sve ostale sledeći korak je upravo ono
što razlikuje dobre od loših – rangiranje rezultata.
Rangiranje rezultata predstavlja proces sortiranja na osnovu
relevantnosti. Najpre se za svaki od dokumenata koji sadrži tražene reči
broji broj pojavljivanja fraze na istom. Zatim za svako pojavljivanje reči
gleda se pozicija u dokumentu (naslov, anchor, URL, H1,H2,H3 tag…) i da
li je ta reč posebno naglašena (podebljana, zakrivljena, podvučena).
Svaka od pozicija i naglašavanje reči nosi određeni težinski faktor.
Sabiranjem težinskih faktora svih pojavljivanja dobija se samo delić
vrednosti po kojoj se posle dokumenti sortiraju. Ostali faktori relevantnosti
zavise od samog web pretraživača.
Nakon završenog sortiranja dokumenata (svih onih koji sadrže
unetu frazu) po relevantnosti, web pretraživač korisnika prebacuje na
novu stranicu na kojoj se nalaze izlistani sortirani linkovi ka dokumentima.
(internetzarada)
2
Ovaj materijal je namenjen za učenje i pripremu, ne za predaju.
Slični dokumenti