Prikaz jedne poruke
Stara 22.9.2006, 10:47   #154
EDI the Little
Član
 
Član od: 21.9.2006.
Poruke: 41
Zahvalnice: 9
Zahvaljeno jedanput na jednoj poruci
Određen forumom Re: Web arhiva Sveta kompjutera ???

Vreme od 7,8 sati je potrebno da bi se iskeniralo 140 strana nekog dokumenta, brzina normalno varira od tipa skenera koji se koristi i rezolucije skeniranja.
Trenutno SK ima oko 140 strana, no koliko sam gledao stariji brojevi nemaju toliko strana, pa i vreme potrebno za skeniranje nebi bilo 7,8 sati.

Format pdf sam izabrao iz funkcionalnosti, kada bi ubacivao same slike u pdf nebi konkretno nista dobio sem grupisanja svih strana u jednu celinu i eventualno bi dobio index strana.
Ali ako se uradi OCR tada bi dobili tekst.
Sa dokumentom koji sadrzi tekst se moze manipulisati, pretrazivati i sl.
Adobe Reader ima Search koji ima mogucnost pretrage svih PDF dokumenata po nekoj kljucnoj reci, sto bi olaksalo pretragu za nekim tekstom ili sekcijom dokumenta.

Nameru da pomognem imam, ali trenutno sam u nemogucnosti, jer sam u velikom poslu do sredine oktobra (radim i subotom i nedeljom).
Drugi problem koji se pojavio je da su mi brojevi stariji od 2000. godine u porodicnoj kuci koja je udaljena 150km od mesta gde trenutno zivim.

Meni nije jedino jasno da od svih "vernih citalaca" vi samo radite taj posao, nijeli ipak sramota da za casopis ciji je tiraz toliko ogroman samo 3-4 coveka rade posao za dobrobit svih.
Nekazem, i ja sam na ovu temu naleteo tek pre neki dan i samo zbog nje sam se registovao.

Kada bi samo 200 ljudi od toliko hiljada uradio skeniranje samo jednog SK-a posao bi bio gotov za 2-3 meseca.
Treba se samo organizovati.

Trebalo bi da skeniranje SK-a bude prva faza projekta, a da u drugoj fazi sve skenirane SK-ove prebacimo u PDF pomocu OCR programa, treca faza .... .
Probacu ovih dana dali dokumenti koji su skenirani u rezolucijama 100DPI ili 150DPI mogu bez vecih problema da se prepoznaju pomocu OCR programa.
Skinuo sam broj 12/84 i primetio sam da u tim starijim brojevima nema mnogo slika tako da bi prepoznavanje tih brojeva islo brzo.

Ako neko zna neko bolji program od ABBY 7.0, 8.0 nek mi javi.
EDI the Little je offline   Odgovor sa citatom ove poruke