title: Wie kann in Millionen sehr kurzer OCR-Texte schnell und fehlertolerant gesucht werden? creator: Pietzsch, Eberhard subject: 000 subject: 000 Generalities, Science description: In diesem Aufsatz wird ein Verfahren und seine Implementierung vorgestellt, wie in großen Mengen sehr kurzer OCR-Texte schnell und fehlertolerant recherchiert werden kann. Solche OCR-Texte entstehen beispielsweise bei der Digitalisierung älterer Bibliothekskataloge, die als Imagekataloge über Internet zugänglich gemacht werden, und bei denen die Images einer OCR-Texterkennung unterzogen werden. Das Verfahren soll dazu dienen, das Potential solcher Imagekataloge unter Verzicht auf manuelle Eingriffe voll auszuschöpfen. Einfache Implementierung und kurze Antwortzeiten sind wichtige Entwurfsziele. date: 2001 type: Preprint type: info:eu-repo/semantics/preprint type: NonPeerReviewed format: application/pdf identifier: https://archiv.ub.uni-heidelberg.de/volltextserverhttps://archiv.ub.uni-heidelberg.de/volltextserver/1787/1/retrieval1.pdf identifier: DOI:10.11588/heidok.00001787 identifier: urn:nbn:de:bsz:16-heidok-17873 identifier: Pietzsch, Eberhard (2001) Wie kann in Millionen sehr kurzer OCR-Texte schnell und fehlertolerant gesucht werden? [Preprint] relation: https://archiv.ub.uni-heidelberg.de/volltextserver/1787/ rights: info:eu-repo/semantics/openAccess rights: http://archiv.ub.uni-heidelberg.de/volltextserver/help/license_urhg.html language: ger