@techreport{Steinke2009, type = {Working Paper}, author = {Steinke, Karl-Heinz}, title = {Untersuchung von kommerzieller Software f{\"u}r den Einsatz im Projekt Herbar Digital}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:960-opus-2532}, year = {2009}, abstract = {Die vorliegende Arbeit untersucht den m{\"o}glichen Einsatz kommerzieller Software im Projekt Herbar Digital. Dabei werden zwei Kategorien unterschieden: OCR-Software und Barcodesoftware. Von der ersten Kategorie gibt es eine Vielzahl k{\"a}uflicher Programme auf dem Markt sowie auch einige kostenlose Freewareprogramme. Die Qualit{\"a}t ist jedoch sehr unterschiedlich, insbesondere fallen die Freewareprogramme stark ab. Es kristallisieren sich vier hochqualitative Programme heraus, die genau untersucht werden. Von diesen eignen sich zwei f{\"u}r das Projekt, wobei Omnipage 16 der Vorzug gegeben wird. In der Kategorie der Barcodesoftware fiel die Wahl auf QS-Barcode 4.0, da sich OCR-Programme f{\"u}r das Lesen von Barcodes als ungeeignet erwiesen. Die anf{\"a}ngliche Erkennungsrate von 90\% konnte durch eigene Verfahren zur Bildvorverarbeitung auf 100\% gesteigert werden.}, subject = {Herbarium}, language = {de} } @inproceedings{Steinke2009, author = {Steinke, Karl-Heinz}, title = {Lokalisierung von Schrift in komplexer Umgebung}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:960-opus-2838}, year = {2009}, abstract = {Das Forschungsprojekt „Herbar Digital" startete 2007 mit dem Ziel der Digitalisierung des Bestands von mehr als 3,5 Millionen getrockneter Pflanzen bzw. Pflanzenteile auf Papierb{\"o}gen (Herbarbelege) des Botanischen Museums Berlin. Die Aufgabe des Autors ist die Analyse der hochaufgel{\"o}sten Bilder mit 10400 Zeilen und 7500 Spalten. Die Herbarbelege k{\"o}nnen außerdem unterschiedliche Objekte enthalten wie Umschl{\"a}ge mit zus{\"a}tzlichen Pflanzenteilen, gedruckte oder handgeschriebene Etiketten, Farbtabellen, Maßst{\"a}be, Stempel, Barcodes, farbige „Typus-Etiketten" und handschriftliche Anmerkungen direkt auf dem Beleg. Die schriftlichen Anmerkungen, insbesondere in Handschrift, sind von besonderem Interesse. Kommerzielle OCR-Software kann oftmals Schrift in komplexen Umgebungen nicht lokalisieren, wie sie h{\"a}ufig auf den Herbarbelegen vorliegt, auf denen Schrift zwischen Bl{\"a}ttern, Wurzeln und anderen Objekten angeordnet ist. Im folgenden wird eine Methode vorgestellt, die es erm{\"o}glicht, Schriftpassagen im Bild automatisch zu finden.}, subject = {Herbarium}, language = {de} } @inproceedings{Praetel2009, author = {Pr{\"a}tel, Klaus}, title = {Lokalisierung von Objekten in Herbarbelegen}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:960-opus-2844}, year = {2009}, abstract = {An der Fachhochschule Hannover wurde Mitte 2007 das Projekt "Herbar-Digital" gestartet. In dem Forschungsprojekt "Herbar-Digital" sollen aus 3,5 Millionen Papierb{\"o}gen (Herbarbelege) des Botanischen Museums Berlin m{\"o}glichst alle Objekte erkannt werden und separat verarbeitbar sein. Bei den Objekten handelt es sich um Barcodes, T{\"u}ten, Stempel, Farbtabellen, Elemente aus dem Pflanzenbereich sowie Hand- und Druckschriften. Es soll unter Zuhilfenahme des ADA-BOOST-Algorithmus vom Verfasser eine Objekterkennung realisiert werden, die folgende Eigenschaften aufweist: Position der zu erkennenden Objekte im Bild variabel, auch dreidimensionale - und konturschwache Objekte m{\"u}ssen erkannt werden, gleiche Objekte unterschiedlicher Form m{\"u}ssen erkennbar sein, das System muss lernf{\"a}hig sein.}, subject = {Herbarium}, language = {de} } @inproceedings{DzidoGehrkeSteinke2009, author = {Dzido, Robert and Gehrke, Martin and Steinke, Karl-Heinz}, title = {Erkennung von Schreibern mittels handgeschriebener Buchstaben}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:960-opus-2858}, year = {2009}, abstract = {Das Forschungsprojekt „Herbar Digital" [JKS00] startete 2007 mit dem Ziel der Digitalisierung des Bestands von mehr als 3,5 Millionen getrockneter Pflanzen bzw. Pflanzenteile auf Papierb{\"o}gen (Herbarbelege) des Botanischen Museums Berlin. Da gelegentlich der Sammler der Pflanze unbekannt ist, wurde in der vorliegenden Arbeit ein Verfahren entwickelt, um aus kursiv geschriebenen Buchstaben deren Schreiber zu bestimmen. Dazu muss der statische Buchstabe in eine dynamische Form gebracht werden. Dies geschieht mit dem Modell einer tr{\"a}gen Kugel, die durch den Schriftzug rollt. Bei dieser Offline-Schreibererkennung werden verschiedene Verfahren wie die Nachbildung der Schreiblinie einzelner Buchstaben durch z.B. Legendre-Polynome verwendet. Bei Verwendung nur eines Buchstabens der Schreiber wird eine Erkennungsrate von durchschnittlich 40\% erreicht. Durch Kombination von mehreren Buchstaben steigt die Erkennungsrate stark an und betr{\"a}gt bei 13 Buchstaben und 93 Schreibern einer internationalen Datenbank 98,6\%.}, subject = {Herbarium}, language = {de} } @techreport{Steinke2009, type = {Working Paper}, author = {Steinke, Karl-Heinz}, title = {Entwicklung und Untersuchung von Erkennungssoftware f{\"u}r den Einsatz im Projekt Herbar Digital}, url = {https://nbn-resolving.org/urn:nbn:de:bsz:960-opus-2520}, year = {2009}, abstract = {Kommerzielle OCR-Programme sind nicht in der Lage kursiv geschriebene Handschriften zu lesen. Deshalb wurde in der vorliegenden Arbeit ein Verfahren entwickelt, um kursive handgeschriebene Buchstaben zu erkennen und dar{\"u}ber hinaus auch deren Schreiber zu bestimmen. Dazu muss der statische Buchstabe in eine dynamische Form gebracht werden. Dies geschieht mit dem Modell einer tr{\"a}gen Kugel, die durch den Schriftzug rollt. {\"U}ber den Schreiber kann evtl. der Name des Entdeckers einer Pflanze bestimmt werden. Bei dieser Offline-Schreibererkennung werden verschiedene Verfahren wie die Nachbildung der Schreiblinie einzelner Buchstaben durch z.B. Legendre-Polynome verwendet. Bei Verwendung nur eines Buchstabens der Schreiber wird eine Erkennungsrate von bis zu 80\% erreicht.}, subject = {Herbarium}, language = {de} }