TY - CHAP U1 - Konferenzveröffentlichung A1 - Steinke, Karl-Heinz T1 - Lokalisierung von Schrift in komplexer Umgebung N2 - Das Forschungsprojekt „Herbar Digital” startete 2007 mit dem Ziel der Digitalisierung des Bestands von mehr als 3,5 Millionen getrockneter Pflanzen bzw. Pflanzenteile auf Papierbögen (Herbarbelege) des Botanischen Museums Berlin. Die Aufgabe des Autors ist die Analyse der hochaufgelösten Bilder mit 10400 Zeilen und 7500 Spalten. Die Herbarbelege können außerdem unterschiedliche Objekte enthalten wie Umschläge mit zusätzlichen Pflanzenteilen, gedruckte oder handgeschriebene Etiketten, Farbtabellen, Maßstäbe, Stempel, Barcodes, farbige „Typus-Etiketten“ und handschriftliche Anmerkungen direkt auf dem Beleg. Die schriftlichen Anmerkungen, insbesondere in Handschrift, sind von besonderem Interesse. Kommerzielle OCR-Software kann oftmals Schrift in komplexen Umgebungen nicht lokalisieren, wie sie häufig auf den Herbarbelegen vorliegt, auf denen Schrift zwischen Blättern, Wurzeln und anderen Objekten angeordnet ist. Im folgenden wird eine Methode vorgestellt, die es ermöglicht, Schriftpassagen im Bild automatisch zu finden. KW - Herbarium KW - Angewandte Botanik KW - Gepresste Pflanzen KW - Digitalisierung KW - Virtualisierung KW - Erkennungssoftware KW - OCR KW - Herbar Digital KW - Recognition software Y1 - 2009 UN - https://nbn-resolving.org/urn:nbn:de:bsz:960-opus-2838 U6 - https://doi.org/10.25968/opus-230 DO - https://doi.org/10.25968/opus-230 ER -