TY - RPRT A1 - Steinke, Karl-Heinz T1 - Entwicklung und Untersuchung von Erkennungssoftware für den Einsatz im Projekt Herbar Digital T1 - Development and analysis of recognition software for the adoption in project Herbar Digital N2 - Kommerzielle OCR-Programme sind nicht in der Lage kursiv geschriebene Handschriften zu lesen. Deshalb wurde in der vorliegenden Arbeit ein Verfahren entwickelt, um kursive handgeschriebene Buchstaben zu erkennen und darüber hinaus auch deren Schreiber zu bestimmen. Dazu muss der statische Buchstabe in eine dynamische Form gebracht werden. Dies geschieht mit dem Modell einer trägen Kugel, die durch den Schriftzug rollt. Über den Schreiber kann evtl. der Name des Entdeckers einer Pflanze bestimmt werden. Bei dieser Offline-Schreibererkennung werden verschiedene Verfahren wie die Nachbildung der Schreiblinie einzelner Buchstaben durch z.B. Legendre-Polynome verwendet. Bei Verwendung nur eines Buchstabens der Schreiber wird eine Erkennungsrate von bis zu 80% erreicht. N2 - Commercial OCR-programs are not able to read cursively written handwriting. Therefore in the available work a procedure was developed in order to recognize cursive hand written letters and beyond that to determine also their writer. For that the static letter must be brought into a dynamic form. This happens with the model of a inert ball which rolls through the writing. By finding out the writer possibly the name of the discoverer of a plant can be determined. For this off-line writer recognition different procedures are used such as the reproduction of the writing line of individual letters e.g. by Legendre-polynomials. Using only one letter of the writers a recognition rate of nearly 80% can be achieved. KW - Herbarium KW - Angewandte Botanik KW - Gepresste Pflanzen KW - Digitalisierung KW - Virtualisierung KW - Erkennungssoftware KW - OCR KW - Herbar Digital KW - Recognition software Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:960-opus-2520 ER - TY - CHAP A1 - Dzido, Robert A1 - Gehrke, Martin A1 - Steinke, Karl-Heinz T1 - Erkennung von Schreibern mittels handgeschriebener Buchstaben T1 - Writer recognition by handwritten characters N2 - Das Forschungsprojekt „Herbar Digital” [JKS00] startete 2007 mit dem Ziel der Digitalisierung des Bestands von mehr als 3,5 Millionen getrockneter Pflanzen bzw. Pflanzenteile auf Papierbögen (Herbarbelege) des Botanischen Museums Berlin. Da gelegentlich der Sammler der Pflanze unbekannt ist, wurde in der vorliegenden Arbeit ein Verfahren entwickelt, um aus kursiv geschriebenen Buchstaben deren Schreiber zu bestimmen. Dazu muss der statische Buchstabe in eine dynamische Form gebracht werden. Dies geschieht mit dem Modell einer trägen Kugel, die durch den Schriftzug rollt. Bei dieser Offline-Schreibererkennung werden verschiedene Verfahren wie die Nachbildung der Schreiblinie einzelner Buchstaben durch z.B. Legendre-Polynome verwendet. Bei Verwendung nur eines Buchstabens der Schreiber wird eine Erkennungsrate von durchschnittlich 40% erreicht. Durch Kombination von mehreren Buchstaben steigt die Erkennungsrate stark an und beträgt bei 13 Buchstaben und 93 Schreibern einer internationalen Datenbank 98,6%. KW - Herbarium KW - Angewandte Botanik KW - Gepresste Pflanzen KW - Digitalisierung KW - Virtualisierung KW - Erkennungssoftware KW - OCR KW - Herbar Digital KW - Recognition software Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:960-opus-2858 ER - TY - CHAP A1 - Steinke, Karl-Heinz A1 - Dzido, Robert A1 - Gehrke, Martin A1 - Prätel, Klaus T1 - Feature recognition for herbarium specimens (Herbar-Digital) N2 - Our research project, "Rationalizing the virtualization of botanical document material and their usage by process optimization and automation (Herbar-Digital)" started on July 1, 2007 and will last until 2012. Its long-term aim is the digitization of the more than 3,5 million specimens in the Berlin Herbarium. The University of Applied Sciences and Arts in Hannover collaborates with the department of Biodiversity Informatics at the BGBM (Botanic Garden and Botanical Museum Berlin-Dahlem) headed by Walter Berendsohn. The part of Herbar-Digital here presented deals with the analysis of the generated high resolution images (10,400 lines x 7,500 pixel). KW - Herbarium KW - Angewandte Botanik KW - Gepresste Pflanzen KW - Digitalisierung KW - Virtualisierung KW - Erkennungssoftware KW - OCR KW - Herbar Digital KW - Recognition software Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:960-opus-2888 ER - TY - CHAP A1 - Steinke, Karl-Heinz T1 - Lokalisierung von Schrift in komplexer Umgebung T1 - Localisation of scripture in complex environments N2 - Das Forschungsprojekt „Herbar Digital” startete 2007 mit dem Ziel der Digitalisierung des Bestands von mehr als 3,5 Millionen getrockneter Pflanzen bzw. Pflanzenteile auf Papierbögen (Herbarbelege) des Botanischen Museums Berlin. Die Aufgabe des Autors ist die Analyse der hochaufgelösten Bilder mit 10400 Zeilen und 7500 Spalten. Die Herbarbelege können außerdem unterschiedliche Objekte enthalten wie Umschläge mit zusätzlichen Pflanzenteilen, gedruckte oder handgeschriebene Etiketten, Farbtabellen, Maßstäbe, Stempel, Barcodes, farbige „Typus-Etiketten“ und handschriftliche Anmerkungen direkt auf dem Beleg. Die schriftlichen Anmerkungen, insbesondere in Handschrift, sind von besonderem Interesse. Kommerzielle OCR-Software kann oftmals Schrift in komplexen Umgebungen nicht lokalisieren, wie sie häufig auf den Herbarbelegen vorliegt, auf denen Schrift zwischen Blättern, Wurzeln und anderen Objekten angeordnet ist. Im folgenden wird eine Methode vorgestellt, die es ermöglicht, Schriftpassagen im Bild automatisch zu finden. KW - Herbarium KW - Angewandte Botanik KW - Gepresste Pflanzen KW - Digitalisierung KW - Virtualisierung KW - Erkennungssoftware KW - OCR KW - Herbar Digital KW - Recognition software Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:960-opus-2838 ER - TY - RPRT A1 - Steinke, Karl-Heinz T1 - Untersuchung von kommerzieller Software für den Einsatz im Projekt Herbar Digital T1 - Analysis of commercial software for the adoption in project Herbar Digital N2 - Die vorliegende Arbeit untersucht den möglichen Einsatz kommerzieller Software im Projekt Herbar Digital. Dabei werden zwei Kategorien unterschieden: OCR-Software und Barcodesoftware. Von der ersten Kategorie gibt es eine Vielzahl käuflicher Programme auf dem Markt sowie auch einige kostenlose Freewareprogramme. Die Qualität ist jedoch sehr unterschiedlich, insbesondere fallen die Freewareprogramme stark ab. Es kristallisieren sich vier hochqualitative Programme heraus, die genau untersucht werden. Von diesen eignen sich zwei für das Projekt, wobei Omnipage 16 der Vorzug gegeben wird. In der Kategorie der Barcodesoftware fiel die Wahl auf QS-Barcode 4.0, da sich OCR-Programme für das Lesen von Barcodes als ungeeignet erwiesen. Die anfängliche Erkennungsrate von 90% konnte durch eigene Verfahren zur Bildvorverarbeitung auf 100% gesteigert werden. N2 - The available work examines the possible use of commercial software in the project Herbar Digital. Two categories are differentiated: OCR software and bar code software. From the first category there is a multiplicity of available programs on the market as well as some free programs. The quality between them is very differing; particularly the freeware programs are falling behind. Four high-quality programs emerge which are examined exactly. Two of these are suitable for the project, whereby Omnipage 16 the preference is given. In the category of the bar code software the choice fell on QS-Barcode 4.0, since OCR programs for reading bar codes proved as unsuitable. The initial recognition rate of 90% could be increased by own procedures of picture preprocessing on 100%. KW - Herbarium KW - Angewandte Botanik KW - Gepresste Pflanzen KW - Digitalisierung KW - Virtualisierung KW - Herbar Digital KW - Erkennungssoftware KW - Herbar Digital KW - Recognition software Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:960-opus-2532 ER - TY - CHAP A1 - Gehrke, Martin A1 - Steinke, Karl-Heinz A1 - Dzido, Robert T1 - Writer recognition by characters, words and sentences N2 - The methods developed in the research project "Herbar Digital" are to help plant taxonomists to master the great amount of material of about 3.5 million dried plants on paper sheets belonging to the Botanic Museum Berlin in Germany. Frequently the collector of the plant is unknown. So a procedure had to be developed in order to determine the writer of the handwriting on the sheet. In the present work the static character is transformed into a dynamic form. This is done with the model of an inert ball which is rolled through the written character. During this off-line writer recognition, different mathematical procedures are used such as the reproduction of the write line of individual characters by Legendre polynomials. When only one character is used, a recognition rate of about 40% is obtained. By combining multiple characters, the recognition rate rises considerably and reaches 98.7% with 13 characters and 93 writers (chosen randomly from the international IAM-database [3]). Another approach tries to identify the writer by handwritten words. The word is cut out and transformed into a 6-dimensional time series and compared e.g. by means of DTW-methods. A global statistical approach using the whole handwritten sentences results in a similar recognition rate of more than 98%. By combining the methods, a recognition rate of 99.5% is achieved. KW - Herbarium KW - Angewandte Botanik KW - Gepresste Pflanzen KW - Digitalisierung KW - Virtualisierung KW - Erkennungssoftware KW - OCR KW - Herbar Digital KW - Recognition software Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:960-opus-2873 ER - TY - CHAP A1 - Steinke, Karl-Heinz A1 - Gehrke, Martin A1 - Dzido, Robert T1 - Writer Recognition by Combining Local and Global Methods N2 - The research project "Herbar Digital" was started in 2007 with the aim to digitize 3.5 million dried plants on paper sheets belonging to the Botanic Museum Berlin in Germany. Frequently the collector of the plant is unknown, so a procedure had to be developed in order to determine the writer of the handwriting on the sheet. In the present work the static character was transformed into a dynamic form. This was done with the model of an inert ball which was rolled along the written character. During this off-line writer recognition, different mathematical procedures were used such as the reproduction of the write line of individual characters by Legendre polynomials. When only one character was used, a recognition rate of about 40% was obtained. By combining multiple characters, the recognition rate rose considerably and reached 98.7% with 13 characters and 93 writers (chosen randomly from the international IAM-database [3]). A global statistical approach using the whole handwritten text resulted in a similar recognition rate. By combining local and global methods, a recognition rate of 99.5% was achieved. KW - Herbarium KW - Angewandte Botanik KW - Gepresste Pflanzen KW - Digitalisierung KW - Virtualisierung KW - Erkennungssoftware KW - OCR KW - Herbar Digital KW - Recognition software Y1 - 2009 U6 - http://nbn-resolving.de/urn/resolver.pl?urn:nbn:de:bsz:960-opus-2867 ER -