INTERNET<>
102010<><>

Internet pretraživači

Evolucija pretrage

Drugačiji načini dolaženja do informacija

Sigurno ćete se složiti sa konstatacijom da pretraživači čine veliki procenat stranica koje svakodnevno posećujemo na Internetu. Ovi sajtovi iza svog jednostavnog izgleda i još jednostavnije namene kriju kompleksnu tehnologiju indeksiranja, pretraživanja i sortiranja rezultata koji se zasnivaju na strogo poverljivim algoritmima koji se razvijaju godinama. Kako su se tokom godina mnoge kompanije oprobavale u kreiranju što boljeg algoritma pretraživanja Interneta tako su nastajali različiti pristupi problematici. Iz njih su evoluirali pretraživači sasvim drugačijih namena, od kojih ćemo vam predstaviti trenutno najnaprednije.

Opšta pretraga

 
Ovo je sigurno najzastupljenija vrsta pretrage Interneta. Svi popularni pretraživači zapravo su opšti pretraživači, a nema dileme da je Google (www.google.com) trenutno na čelu. Ovaj pretraživač toliko se ustalio da je pseudoglagol „guglati” postao sinonim za pretraživanje Interneta. To, naravno, nije bez razloga zato što Google trenutno nudi najbolje rezultate pretrage. Korisnik svoj upit može učiniti veoma detaljnim kroz napredne opcije i tako još bolje filtrirati bitne rezultate. Takođe, on je i vodeći inovator među pretraživačima. Međutim, ni Google nije bez mana. Njegov algoritam određuje relevantnost stranice na osnovu dve stvari – ranga stranice (page rank) i ključnih reči. Prilično je jasno kako se stranice sortiraju na osnovu ključnih reči, dok je situacija sa rangom stranice malo komplikovanija. Rang se određuje za svaku stranicu po broju linkova koji vode ka njoj. Što više linkova vodi ka određenoj stranici, njen rang će biti veći. Rang stranice ima mnogo veći prioritet u odnosu na ključne reči. To je dobro zato što će veoma posećene (i linkovane) stranice poput članaka na Wikipediji biti među prvim rezultatima, ali postoji velika šansa da se još bolji tekstovi sa manje popularnih sajtova ne pojave u rezultatu upita kao relevantni. Kako ne možemo da utičemo na Google da promeni svoj algoritam radi naše pretrage za manje linkovanim sajtovima, možemo se okrenuti drugim pretraživačima. Yahoo (www.yahoo.com) i Bing (www.bing.com), koji odskora rade na istom endžinu, imaju drugačiji algoritam koji ne dopušta rangu stranice da preovlada i pokušava da balansira između njega i ključnih reči iz upita.

Semantička pretraga

Ako se pomenuti rang stranice može nazvati problemom za neke situacije prilikom pretrage, onda semantički pretraživači svakako rade na njegovom eliminisanju. Ovaj način pretraživanja zasniva se isključivo na ključnim rečima i njihovom značenju. Cilj je dostaviti informacije koje su potpuno u kontekstu pretrage. Tva trenutno najnaprednija semantička pretraživača su pretraživač čudnog imena Duck Duck Go (www.duckduckgo.com) i (kreć’o) Hakia (www.hakia.com). O prvom smo ranije već pisali (SK 1/2010), pa ćemo ovog puta samo istaći njegove prednosti i unapređenja kojima je obogaćen u poslednje vreme. Najupečatljivija karakteristika DDG-a jeste vraćanje više vrsta rezultata ako je upit dvosmislen. Na primer, ako ukucate pojam „Serbia”, DDG će vam saopštiti da postoji više rezultata za vaš upit i izlistati gotovo sve političke periode kroz koje je država prolazila. Za slučaj da niste želeli ništa od navedenog s liste predloženih tema za dalju pretragu, možete pogledati linkove koje je pretraživač našao na zadatu ključnu reč. Rezultati pretrage na prvi pogled izgledaju sjajno, međutim ako kao ključnu reč pretrage unesemo „Srbija”, promena će biti drastična i ništa od dodatnih tema pretrage neće biti ponuđeno. Izgleda da se DDG zasad može ozbiljnije koristiti samo na engleskom jeziku. Ovaj pretraživač ima interesantnu mogućnost pretrage drugih sajtova sa sopstvenog interfejsa. Na primer, unošenjem prefiksa „!google”, „!twitter”, „!facebook”, „!youtube” i tako dalje pre ključnih reči možete pretražiti ove sajtove direktno iz DDG-a. Poduži spisak podržanih sajtova možete videti u podešavanjima. Ako ništa drugo, Duck Duck Go može da postane baza za pretraživanje velikog broja drugih servisa, što je interesantna ideja bar dok njegova mašinerija pretraživanja ne stane na noge. Hakia je sjajna alternativa za semantičko pretraživanje. Nije bogata opcijama već se zasniva na jednostavnosti koja je u ovom slučaju pozitivna stvar. Rezultati se sortiraju u kategorije (Web, vesti, slike, video, Wikipedia, Twitter itd.), što ide u prilog preglednosti i dopušta korisniku da u startu odbaci kategorije koje ga ne interesuju.

Nevidljiva pretraga

 
Deep web je izraz koji se koristi za označavanje delova Interneta koji nisu dostupni za indeksiranje opštim pretraživačima. Procenjuje se da je količina podataka iz dubokog Weba višestruko veća od one kojoj imamo pristup na površini. Radi se o zaštićenim dinamičkim podacima, tj. o bazama podataka za koje je potrebna određena autentifikacija zbog koje pomenuti pretraživači ne mogu da nastave sa praćenjem linkova pošto nailaze na „zatvorena vrata”. Zbog toga se ovi delovi Mreže nazivaju i „nevidljivi”. Međutim, postoje pretraživači koji su specijalizovani za ovakvu vrstu pretrage. Daleko od toga da ćete koristeći pretraživače za nevidljivi Web moći da upadate u privatne sisteme zaštićene šifrom. Od nevidljivog Weba najviše koristi imaće oni korisnici koji istražuju određenu temu a nisu zadovoljni samo mainstream informacijama sa popularnih pretraživača. Ako uđete malo dublje u Mrežu, možete doći do velikih biblioteka podataka koje opšti pretraživači nisu uspeli da zakače indeksiranjem, a koje su možda relevantne za vas. Upravo se zbog toga pretraživači nevidljivog Weba uglavnom specijalizuju za određenu oblast za koju imaju raspoložive biblioteke. Na primer, pretraživač Pipl (www.pipl.com) specijalizovan je za duboku pretragu osoba po imenu, prezimenu i mestu stanovanja. Njegov endžin na testu se pokazao prilično dobro. On rezultate sortira prema kategorijama i vrlo je pregledan i jasan za korišćenje, a iz prvog pokušaja dao je bolje i relevantnije rezultate od bilo kog opšteg pretraživača.

Pretraga slika

Ova pretraga bazira se na filtriranju rezultata prema ključnim rečima upita koje se porede sa nazivom slike. Ništa novo niti revolucionarno. Međutim, priča o pretrazi slika ne završava se na tome. Postoje još dva načina pretraživanja Interneta kada je u pitanju ovakav sadržaj – obrnuta pretraga slika i pretraga sličnih slika. U prvom slučaju pretraživaču prosleđujemo sliku kao upit (uploadovanjem ili upisivanjem URL adrese). Kao rezultat dobijamo vrlo praktične informacije, recimo na kojim se sve mestima na Webu nalazi ta slika, da li postoje neke njene drugačije varijante i da li postoji njena veća rezolucija. Jedan takav pretraživač je TinEye (www.tineye.com). TinEye je do sada indeksirao malo više od milijardu i po slika i pruža veoma pristojne rezultate koji mogu biti od koristi. Radi po principu uzimanja otiska slike iz upita, a poređenjem tog otiska sa svim slikama iz indeksa dolazi do traženih informacija. U rezultatima se uglavnom ne pojavljuju (mada može da se desi) slike koje su slične otisku, već kopije drugačijih dimenzija, rezolucija i oblika.

Traganjem za sličnim slikama bavi se GazoPa (www.gazopa.com). Kao upit takođe prosleđujemo sliku uploadovanjem ili sa URL-a, a postoji i zanimljiva opcija crtanja i pretrage na osnovu tog crteža. GazoPa pri filtriranju relevantnih rezultata uzima u obzir nekoliko faktora: boju, oblike i kompoziciju, tj. raspored elemenata na slici. Ovo je relativno mlad pretraživač koji je i dalje u beta fazi razvoja. Očigledno ima veliki potencijal i stremi uvođenju novih servisa u svet pretrage kojim se bavi. Nedavno je lansiran servis GazoPa Style (style.gazopa.com), koji cilja na ženski deo populacije i pametno koristi svoje mogućnosti za pretragu sličnih modela odeće.

• • •

Iako Google čvrsto drži prvo mesto po udelu u svim pretragama koje se trenutno obavljaju na Internetu, manji igrači se ne predaju i pokušavaju da unesu dozu svežine u svet pretrage, čime će krajnjem korisniku skratiti put do željene informacije. Kada se setimo kako je Google svojevremeno preuzeo tron od Yahooa, ostaje nam samo da se zapitamo da li postoji razvojni tim sa takvim algoritmom koji bi mogao da učini da se istorija ponovi?

Uroš ZORIĆ

 
.rs
Plaćanje na Internetu
Internet pretraživači
Šta mislite o ovom tekstu?
Društvene mreže
WWW vodič
Home / Novi brojArhiva • Opšte temeInternetTest driveTest runPD kutakCeDetekaWWW vodič • Svet igara
Svet kompjutera Copyright © 1984-2018. Politika a.d. • RedakcijaKontaktSaradnjaOglasiPretplata • Help • English
SKWeb 3.22
Opšte teme
Internet
Test Drive
Test Run
PD kutak
CeDeteka
WWW vodič
Svet igara



Naslovna stranaPrethodni brojeviOpšte informacijeKontaktOglašavanjePomoćInfo in English

Svet kompjutera