TEST RUN<>
022012<><>

Abbyy FineReader 11 Professional Edition

Optičko prepoznavanje karaktera

Skenirana i OCR-ovana stranica teksta
Praktično za svaku vrstu softvera postoje besplatne alternative koje se po kvalitetu mogu meriti sa komercijalnim programima, a često se dešava da besplatni alati čak i premašuju kvalitet komercijalnih. Jedan od retkih izuzetaka su OCR programi (programi za optičko prepoznavanje karaktera). U suštini, njih i nema mnogo – a zapravo samo dva takmaca vode mrtvu trku u borbi za najboljeg.

Jedan od glavnih razloga za takvu situaciju na tržištu jeste složenost algoritama za kvalitetno prepoznavanje oblika, u čiji se razvoj ulažu velika sredstva (što ne može svako sebi da priušti), kao i ogromna raznolikost aktivnih jezika i pisama u svetu. Da bi se neki proizvod smatrao univerzalnim programom za OCR, neophodno je da prepoznaje najrazličitije slovne znake. Na primer, algoritam koji se koristi za evropske jezike ne može se primeniti na istočne jezike (kineski ili japanski), koji se opet potpuno razlikuju od arapskog...

Verifikacija teksta u dokumentu
Nekrunisani kralj OCR programa, ne samo po pitanju raznovrsnosti jezika, jeste Abbyy FineReader. On prepoznaje čak 189 svetskih jezika (pisama), među kojima su i srpska ćirilica i latinica. Najbolje od svega je to što ne morate sami da podešavate koji je jezik aktivan. Ostavite tu opciju u automatskom modu i sve će raditi kako treba. U toku testiranja nije bilo nikakve razlike u tačnosti skeniranja kada smo ostavili automatski mod i kada smo kao jezik izabrali srpski.

U svojoj najnovijoj, jedanaestoj inkarnaciji FineReader se na prvi pogled ne razlikuje od prethodnih verzija. Ipak, taj prvi utisak vara. Promene postoje, samo što su uglavnom skrivene od pogleda korisnika. Možda se najveća promena odnosi na brzinu prepoznavanja teksta u dokumentima. Kod dokumenata koji su kvalitetno skenirani (i čisto tekstualni), a pri tom su još i na nekom od azijskih jezika, ubrzanje se kreće čak do 45 procenata u odnosu na prethodnu verziju programa. Kod složenijih dokumenata, u kojima postoje i grafički elementi i blokovi teksta koji moraju da se identifikuju i pravilno rasporede na strani, uz upotrebu evropskih pisama, prosečno ubrzanje je na nivou od oko 20 procenata. Koliko je proces obrade podataka brz govori i to da je OCR-ovanje ranije skenirane knjige od oko 160 stranica u PDF formatu FineReader obavio za 13 minuta. Naravno, moguće je i OCR-ovanje dokumenata direktno sa skenera, samo što tada čitav proces traje znatno duže, prvenstveno zbog samog procesa skeniranja. A ako vam je brzina od presudnog značaja, postoji i Fast Processing Mode, superbrzo skeniranje koje je i do 70 procenata brže od standardnog moda, ali uz kompromise po pitanju kvaliteta prepoznavanja teksta. Ovaj mod je zgodan onda kada se vrši arhiviranje nekih manje bitnih dokumenata za koje je važno da su pretraživi, pri čemu nije neophodno da budu potpuno tačno skenirani.

Tokom testiranja mi smo programu uglavnom „podmetali” dokumente koji su lošije skenirani sa ciljem provere kako se nosi sa takvim otežavajućim okolnostima. Kada je izvor teksta kvalitetan, OCR proces praktično nema grešak, pa se tu nismo ni mnogo zadržavali. Međutim, svoju pravu snagu FineReader pokazuje upravo kod manje kvalitetnih izvora teksta. Za svaki dokument koji prihvati i analizira FineReader predlaže u kojoj bi minimalnoj DPI rezoluciji trebalo da se obavi skeniranje kako bi se dobili najkvalitetniji rezultati. U zavisnosti od dokumenta, predlozi su se u toku našeg testiranja kretali od 200 DPI pa sve do 350 DPI.

Nakon samog čina OCR-ovanja, na tekstualnom, editabilnom delu stranice obeležiće se sve sumnjive situacije. Tada je moguće proći kroz proces verifikacije. Pokazalo se da je ovaj proces u najvećem broju slučajeva prestrog i da često kao sumnjive označava i karaktere koji su dobro prepoznati. Karakteri koji su relativno često bili pogrešno prepoznati su latinično „č” i „ć”. Naravno, frekvencija pojavljivanja ove greške direktno zavisi od kvaliteta dokumenta koji se skenira.

Većina sumnjivih situacija može da se izbegne i malim prilagođavanjem izvornog dokumenta. FineReader sadrži grafički editor, sa kojim je dozvoljena promena kontrasta i osvetljenja dokumenta, izoštravanje ivica teksta i još nekoliko drugih sistema za podizanje čitljivosti sadržaja u dokumentu koji se OCR-uje.

Formatiranje OCR-ovanog dokumenta ostaje praktično identično kao kod originala, prvenstveno zahvaljujući Advanced Document Recognition Technology (ADRT), koji je Abbyy razvio za svoje OCR programe. Ovaj sistem pravilno identifikuje stranice i sam radzvaja skenirane dokumente gde se na jednoj strani na slici nalaze dve stranice originalnog dokumenta. Time se znatno ubrzava proces skeniranja knjiga, jer se bez problema mogu odjednom skenirati obe otvorene strane, i to proslediti u FineReader bez daljih obrada. Sistem za korekciju fotografija napravljenih fotoaparatom ili mobilnim telefonom Camera OCR, predstavljen u prošloj verziji, sada je dodatno unapređen. Postoje opcije za uklanjanje zamućenja na slici, ISO šuma, izobličenja...

Možda je najinteresantnija novina u aktuelnoj verziji mogućnost kreiranja elektronskih knjiga. E-book čitači i tableti koji se uz pomoć e-book softvera koriste za čitanje knjiga postali su veoma popularni u poslednjih godinu dana. A pošto je FineReader pod svojom kapom imao sve što je potrebno za kreiranje elektronskih knjiga (sem najvažnijeg dela – snimanja u e-book formate), nekako je bilo logično da se, pored standardnih tekstualnih formata, konačno omogući i snimanje u formatima EPUB ili FB2. Time je zaokružen sistem za kreiranje elektronskih knjiga, koje će u potpunosti sačuvati formu originalnih, papirnih izdanja. Ukoliko koristite Amazon Kindle, ovako napravljenu knjigu možete direktno iz programa poslati na svoj nalog na tom servisu.

Demo verzija koju smo probali ima nekoliko ograničenja, a među najvažnijim su to da je aktivna samo 15 dana i da, bez obzira na to koliko stranica teksta pripremite, u tekstualni dokument snima se samo prva od njih. Ipak, ako vam je često potreban sistem za pretraživo elektronsko arhiviranje dokumenata, teško da ćete pronaći bolje rešenje od ovog.

Branislav BUBANJA

 
Windows Media Center, XBMC 10.1, Boxee 0.9, Plex Media Center 0.9.5.2 beta, MediaPortal 1.2.2
PhotoAnim
Abbyy FineReader 11 Professional Edition
Šta mislite o ovom tekstu?
Wondershare MobileGo 1.1.0
MKVToolNix 5.2.1
OpalCalc 1.31
Sothink Logo Maker 3.2
VIDEOzilla Video Converter 3.3
dvRenderCurve 1.1.0
Flexify 2
Font Size Increase 1.0.0.6
Gismeteo 1.0.2-2

Potrebno:
Windows
Veličina:
374,82 MB (trial), 745,13 MB na HD-u
Cena:
129 evra, proba 15 dana
Adresa:
finereader .abbyy .com
Home / Novi brojArhiva • Opšte temeInternetTest driveTest runPD kutakCeDetekaWWW vodič • Svet igara
Svet kompjutera Copyright © 1984-2018. Politika a.d. • RedakcijaKontaktSaradnjaOglasiPretplata • Help • English
SKWeb 3.22
Opšte teme
Internet
Test Drive
Test Run
PD kutak
CeDeteka
WWW vodič
Svet igara



Naslovna stranaPrethodni brojeviOpšte informacijeKontaktOglašavanjePomoćInfo in English

Svet kompjutera