D 2012

JBIG2 Supported by OCR

HATLAPATKA, Radim

Basic information

Original name

JBIG2 Supported by OCR

Name in Czech

JBIG2 s podporou OCR

Authors

HATLAPATKA, Radim

Edition

Aachen, CEUR Workshop Proceedings, Volume 921, p. 82-90, 9 pp. 2012

Publisher

Neuveden

Other information

Language

English

Type of outcome

Proceedings paper

Field of Study

Informatics

Country of publisher

Germany

Confidentiality degree

is not subject to a state or trade secret

Publication form

printed version "print"

References:

Marked to be transferred to RIV

Yes

RIV identification code

RIV/00216224:14330/12:00067428

Organization

Fakulta informatiky – Repository – Repository

ISSN

Keywords (in Czech)

jbig2enc; JBIG2; optimalizace PDF; komprese; DML; OCR; pdfJbIm; DML-CZ; EuDML

Keywords in English

jbig2enc; JBIG2; PDF size optimization; compression; DML; OCR; pdfJbIm; DML-CZ; EuDML

Links

LA09016, research and development project. 250503, interní kód Repo.
Changed: 1/9/2020 12:35, RNDr. Daniel Jakubík

Abstract

In the original language

Digital Mathematical libraries contain a large volume of PDF documents containing scanned text. In this paper, we describe how this documents can be compressed and thus provide them more effectively to the users. We introduce a JBIG2 standard for compressing bitonal images such as scanned text and we discuss issues if OCR is used for improving the compression ratio of jbig2enc open-source encoder. For this purpose, we have designed API for using OCR in jbig2enc which we describe in this paper together with already achieved results.

In Czech

Digitální matematické knihovnz obsahují velké množství PDF dokumentů obsahujících skenovaný text. V tomto článku popisujeme, jakým způsobem mohou být takové dokumenty komprimovány, a tím pádem poskytovány uživateli efektivnější cestou. Za tímto účelem představujeme JBIG2 standard pro kompresi bitonálních obrázků (např. naskenovaný text) a diskutujeme přínosy a problémy použití OCR za účelem zvýšení komprese volně šiřitelného jbig2enc enkodéru. Za tímto účelem jsme navrhli a implementovali rozhraní pro používání OCR v jbig2enc enkodéru, které zde popisujeme spolu s předběžnými výsledky.

Files attached