eprintid: 1787 rev_number: 15 eprint_status: archive userid: 1 dir: disk0/00/00/17/87 datestamp: 2001-01-12 13:55:00 lastmod: 2012-08-14 15:02:39 status_changed: 2012-08-14 15:02:39 type: preprint metadata_visibility: show creators_name: Pietzsch, Eberhard title: Wie kann in Millionen sehr kurzer OCR-Texte schnell und fehlertolerant gesucht werden? title_en: How Can Millions of Very Short OCR Texts be searched? ispublished: pub subjects: 000 divisions: 701000 keywords: sehr kurze Textevery short texts cterms_swd: Information Retrieval cterms_swd: Freitextsuche cterms_swd: Optische Zeichenerkennung note: Erschienen in ABI-Technik 21, Heft 3/2001, S. 206-218 abstract: In diesem Aufsatz wird ein Verfahren und seine Implementierung vorgestellt, wie in großen Mengen sehr kurzer OCR-Texte schnell und fehlertolerant recherchiert werden kann. Solche OCR-Texte entstehen beispielsweise bei der Digitalisierung älterer Bibliothekskataloge, die als Imagekataloge über Internet zugänglich gemacht werden, und bei denen die Images einer OCR-Texterkennung unterzogen werden. Das Verfahren soll dazu dienen, das Potential solcher Imagekataloge unter Verzicht auf manuelle Eingriffe voll auszuschöpfen. Einfache Implementierung und kurze Antwortzeiten sind wichtige Entwurfsziele. date: 2001 date_type: published id_scheme: DOI id_number: 10.11588/heidok.00001787 ppn_swb: 1646176391 own_urn: urn:nbn:de:bsz:16-heidok-17873 language: ger bibsort: PIETZSCHEBWIEKANNINM2001 full_text_status: public citation: Pietzsch, Eberhard (2001) Wie kann in Millionen sehr kurzer OCR-Texte schnell und fehlertolerant gesucht werden? [Preprint] document_url: https://archiv.ub.uni-heidelberg.de/volltextserver/1787/1/retrieval1.pdf