D
2012
JBIG2 Supported by OCR
HATLAPATKA, Radim
Basic information
Original name
JBIG2 Supported by OCR
Name in Czech
JBIG2 s podporou OCR
Authors
HATLAPATKA, Radim
Edition
Aachen, CEUR Workshop Proceedings, Volume 921, p. 82-90, 9 pp. 2012
Other information
Type of outcome
Proceedings paper
Field of Study
Informatics
Country of publisher
Germany
Confidentiality degree
is not subject to a state or trade secret
Publication form
printed version "print"
Marked to be transferred to RIV
Yes
RIV identification code
RIV/00216224:14330/12:00067428
Organization
Fakulta informatiky – Repository – Repository
Keywords (in Czech)
jbig2enc; JBIG2; optimalizace PDF; komprese; DML; OCR; pdfJbIm; DML-CZ; EuDML
Keywords in English
jbig2enc; JBIG2; PDF size optimization; compression; DML; OCR; pdfJbIm; DML-CZ; EuDML
Links
LA09016, research and development project. 250503, interní kód Repo.
In the original language
Digital Mathematical libraries contain a large volume of PDF documents containing scanned text. In this paper, we describe how this documents can be compressed and thus provide them more effectively to the users. We introduce a JBIG2 standard for compressing bitonal images such as scanned text and we discuss issues if OCR is used for improving the compression ratio of jbig2enc open-source encoder. For this purpose, we have designed API for using OCR in jbig2enc which we describe in this paper together with already achieved results.
In Czech
Digitální matematické knihovnz obsahují velké množství PDF dokumentů obsahujících skenovaný text. V tomto článku popisujeme, jakým způsobem mohou být takové dokumenty komprimovány, a tím pádem poskytovány uživateli efektivnější cestou. Za tímto účelem představujeme JBIG2 standard pro kompresi bitonálních obrázků (např. naskenovaný text) a diskutujeme přínosy a problémy použití OCR za účelem zvýšení komprese volně šiřitelného jbig2enc enkodéru. Za tímto účelem jsme navrhli a implementovali rozhraní pro používání OCR v jbig2enc enkodéru, které zde popisujeme spolu s předběžnými výsledky.
Displayed: 6/5/2026 21:01