INTERNET<>
062000<><>

Internet pretraživači

Novi pretraživači

Alternativne ideje često donose bolje rezultate od onih koje se prve realizuju...

Izbor pretraživača danas je ono što je izbor novina i biblioteke bio juče. Ipak, kao i svaki drugi, i ovaj izbor podložan je promeni. Tri nova pretraživača FAST, Open Directory Project i Google zaslužuju pažnju, ne toliko zbog toga što su relativno novi u odnosu na „stare kuke” poput Yahooa i AltaViste, već zbog novih metoda pretraživanja koje uvode.

FAST

Posebnost FAST-a je u onome što mu adresa www.alltheweb.com kaže – momci nameravaju da na ovom pretraživaču indeksiraju CEO Web. Neka im je Bog u pomoći, a valjda samo On i zna kako će indeksirati nove stranice koje ljudi ne prijave. Naime, tehnički nije nemoguće držati indeks svih web stranica na jednom mestu, malo je veći problem brzina pretraživanja takvog indeksa (norveška firma FAST koja je ovaj pretraživač napravila tvrdi da je taj problem rešila), međutim najveći problem je odjavljivanje nepostojećih i prijavljivanje novih stranica. Na FAST-u se trenutno nalazi preko 300 miliona Web stranica, što je definitivno sahranilo AltaVistu; jedini razlog zbog koga bi je neko još uvek koristio jeste što ima napredniji Advanced search od FAST-a.

Ovaj pretraživač, naravno, nema direktorijume. Sem Web stranica, preko Lycosa pretražuje imena fajlova na FTP serverima, MP3 pesme i multimedijalni materijal (slike, zvukove, animacije...). Lycos, zauzvrat, kad nešto ne može da nađe, prikazuje rezultat FAST-ove pretrage. Lycos inače koristi tehnologiju firme FAST za kompresovanje i nalaženje multimedijalnih fajlova. Malo su ga zakomplikovali, ali bitno je da sve to lepo i brzo radi.

FAST radi na platformi Dell PowerEdge koja se sastoji od 4300 paralelno umreženih Pentium III kompjutera. Jedan je od retkih pretraživača koji sme da prikaže dužinu trajanja pretrage, i interesantno je da je ona tim duža što je broj nađenih stranica manji(?).

Open Directory Project

Open Directory Project (projekat otvorenog direktorijuma) je pretraživač koga uređuju korisnici. Prvobitno se zvao NewHoo, a pošto se ideja pokazala dobrom, otkupio ga je Netscape koji ga do danas drži, bez promena koncepcije. Iako se po imenu ne da pretpostaviti, nalazi se na adresi dmoz.org.

Urednik ovog pretraživača u određenoj kategoriji može postati bukvalno svako, jednostavnim klikom na „become an editor”. Trenutno ODP ima preko 24000 urednika i preko milion i po web stranica, što ga čini najvećim direktorijumom (direktorijum – pretraživač koji Web stranice razvrstava po kategorijama; termin se ponekad koristi i umesto naziva „kategorija” na takvom pretraživaču) na webu (neki pregledaju i više stranica, ali nije svaka raspoređena u svoju kategoriju).

Na prvi pogled bi se reklo da se urednici koji za svoj posao nisu plaćeni neće oko njega preterano truditi. Međutim, u stvarnosti su neke teme često bolje obrađene nego na drugim direktorijumima, jer su njihovi urednici entuzijasti koji ih znatno bolje poznaju nego plaćeni urednici „za sve”, a i komunikacija između webmastera i urednika je bolja. Još jedna prednost ovakvog načina rada je što se za svaki nađeni sajt prikazuje komentar urednika, ne vlasnika sajta. Naravno, postoji i pitanje zloupotrebe: ništa ne sprečava urednika da visoko kotira sopstveni sajt, recimo. Ako se korisnici i drugi urednici žale na njih, urednici se smenjuju, tako da su ovakvi slučajevi ipak retki.

Open Directory je toliko „open” da ga drugi pretraživači mogu besplatno koristiti kao dopunu svojoj bazi podataka, što često i čine (npr. AltaVista, Google, HotBot, Netscape...). Možda biste poželeli da celokupnoj populaciji Interneta budu na jednom mestu dostupni svi resursi vezani za vaše selo? Na ODP-u je to moguće.

Google

Pretraživač simpatičnog imena Google (www.google.com) koristi novu tehniku rangiranja Web stranica. On stranice ne ređa prema „osećaju” urednika, abecedno ili slučajnim redom, već prema broju linkova koji na njih pokazuju! I to ne samo prema prostom broju linkova, već uzima u obzir i kvalitet stranice na kojoj se link nalazi. Prosto je neverovatno kako ovo nikom ranije nije palo na pamet. Tako dobijeni rezultati ne zavise od ličnog mišljenja urednika (koji su i dalje potrebni samo radi smeštanja sajtova u kategorije), a uređivanje pretraživača je brže i jeftinije (pa više para može da se posveti softveru i mašini).

Broj linkova koji vode na neku stranicu prikazuje se zelenom linijom pored njenog imena. Za svaku nađenu stranicu moguće je aktivirati „GoogleScout” koji traži strane slične njoj i, u slučaju da je spora, ili privremeno ili stalno uklonjena, možete je pogledati iz Googleovog keša! (Ovo je malo smušeno urađeno – keš i GoogleScout dostupni su samo za stranice koje se nađu u pretrazi, dok se linija vidi samo u direktorijumu.) Posebna opcija pri pretraživanju je „I’m feeling lucky” koja vas direktno vodi na prvi nađeni sajt, što bi trebalo da bude korisno kod traženja komercijalnih sadržaja i da pokaže kako je Google dobar pretraživač; ipak – zaobiđite. Google se takođe usuđuje da prikaže trajanje pretrage (uglavnom je za red veličine veće od FAST-ovog i pored manjeg broja stranica; ovaj podatak ipak nije naročito važan zato što je vreme pretrage sitna stavka u vremenu HTTP doziva, odziva, prenosa...).

Summa summarum

U priloženoj tabeli nalaze se: ukupan broj stranica na pretraživaču, broj stranica o Beogradu u njegovom direktorijumu i rezultati pretrage za pretraživače iz ovog teksta i neke od poznatih pretraživača, za reči koje se često i retko traže i nalaze. Vidi se da najviše stranica nalazi FAST (mada ne za svaki pojam), zatim AltaVista, a NorthernLight ih tesno prati. Broj rezultata ODP-a varira prema pojmu (malo biznisa, više zabave), tako da ga treba koristiti samo za oblasti koje dobro pokriva. Google nalazi najveći broj stranica od svih direktorijuma (ako AltaVistu ne računamo kao direktorijum), tako da u kombinaciji sa načinom njihovog rangiranja predstavlja verovatno najbolji izbor. Takođe se vidi da je za pretragu domaćih sajtova najbolje koristiti domaće pretraživače (strani ponekad nađu više, ali često su u pitanju iste reči drugih jezika), i da Šerlok počinje da sustiže Krstaricu (uzgred, Šerlok je promenio adresu na www.pretrazivac.com).

Čime pretraživati? Uporedite Google i svoj omiljeni pretraživač, pa koristite onaj za koji zaključite da je bolji. A ako na njemu ne nađete dovoljno informacija, pođite brzo na FAST.

Nikola SMOLENSKI

DirektorijumAltaVistaFASTGoogleHotBotInfoSeek
Krstarica
ukupno stranica250.000.000300.000.000125.000.000110.000.00070.000.000
?
beograd11023 / 123 / 1?
6.587.301
internet56.153.65529.443.491~2.349.992+1.000.0006.587.301
+15.000
sex10.732.09019.985.801~763.000+1.000.0001.065.122
+1.000
seks69.950109.582~30.339+5.0009.849
+1.000
glass2.778.9603.016.233~387.000+500.000721.891
+900
staklo2.0492.047~1.610-100127
390
belgrade148.535188.373~63.500+10.00023.419
+15.000
beograd88.68081.128~39.599+5.0007.801
+25.000
borer31.85534.000~16.191+5.0007.036
22
burgija2766~28 (26)-1002
15

DirektorijumNorthernLightODPŠerlokWebcrawlerYahoo!
ukupno stranica200.000.0001.735.585339.31255.000.0001.200.000
beograd023 / 10996/8
internet156.570.515872.631 / 872+30.000323.85628.290 / 534
sex3.053.9934.972 / 1841.57349.5368.684 / 52
seks243.84912 / 058014630 / 1
glass2.744.2832.583 / 9097631.4234.057 / 161
staklo1.0640 / 0455569 / 0
belgrade156.614144 / 1427.478177467 / 5
beograd44.42712 / 0+30.0002538 / 1
borer36.8164 / 0326311 / 0
burgija150 / 02104 / 0

- Kosa crta razdvaja broj stranica i direktorijuma (23 / 1 znači 23 web stranice i 1 poddirektorijum)
- Tilda (~) označava približan broj stranica (~2.349.992 znači nađeno je oko 2.349.992 stranice)
- U zagradi je tačan broj nađenih stranica (26, manje od približnog)
- Plus označava daje nađeno više stranica nego što je napisano (+15.000 znači nađeno je preko 15.000 stranica)
- Minus označava da je nađeno manje stranica nego što je napisano (-100 znači nađeno je ispod 100 stranica)
 
Internet pretraživači
Šta mislite o ovom tekstu?
Virtuelni trezor
AOLizacija Amerike
Internet voicemail
Virusi i Internet
Kada vam zatreba prevod...
Dolijao „Mafiaboy”
Home / Novi brojArhiva • Opšte temeInternetTest driveTest runPD kutakCeDetekaWWW vodič • Svet igara
Svet kompjutera Copyright © 1984-2018. Politika a.d. • RedakcijaKontaktSaradnjaOglasiPretplata • Help • English
SKWeb 3.22
Opšte teme
Internet
Test Drive
Test Run
PD kutak
CeDeteka
WWW vodič
Svet igara



Naslovna stranaPrethodni brojeviOpšte informacijeKontaktOglašavanjePomoćInfo in English

Svet kompjutera