Directly to content
  1. Publishing |
  2. Search |
  3. Browse |
  4. Recent items rss |
  5. Open Access |
  6. Jur. Issues |
  7. DeutschClear Cookie - decide language by browser settings

Wie kann in Millionen sehr kurzer OCR-Texte schnell und fehlertolerant gesucht werden?

Pietzsch, Eberhard

English Title: How Can Millions of Very Short OCR Texts be searched?

[img]
Preview
PDF, German
Download (598Kb) | Terms of use

Citation of documents: Please do not cite the URL that is displayed in your browser location input, instead use the persistent URL or the URN below, as we can guarantee their long-time accessibility.

Abstract

In diesem Aufsatz wird ein Verfahren und seine Implementierung vorgestellt, wie in großen Mengen sehr kurzer OCR-Texte schnell und fehlertolerant recherchiert werden kann. Solche OCR-Texte entstehen beispielsweise bei der Digitalisierung älterer Bibliothekskataloge, die als Imagekataloge über Internet zugänglich gemacht werden, und bei denen die Images einer OCR-Texterkennung unterzogen werden. Das Verfahren soll dazu dienen, das Potential solcher Imagekataloge unter Verzicht auf manuelle Eingriffe voll auszuschöpfen. Einfache Implementierung und kurze Antwortzeiten sind wichtige Entwurfsziele.

Item Type: Preprint
Date Deposited: 12. Jan 2001 13:55
Date: 2001
Faculties / Institutes: Service facilities > Universitätsbibliothek (UB)
Subjects: 000 Generalities, Science
Controlled Keywords: Information Retrieval, Freitextsuche, Optische Zeichenerkennung
Uncontrolled Keywords: sehr kurze Textevery short texts
Additional Information: Erschienen in ABI-Technik 21, Heft 3/2001, S. 206-218
About | FAQ | Contact | Imprint |
OA-LogoLogo der Open-Archives-Initiative