@inproceedings{LueschowWartena2017, author = {L{\"u}schow, Andreas and Wartena, Christian}, title = {Classifying Medical Literature Using k-Nearest-Neighbours Algorithm}, series = {NKOS 2017: 17th European Networked Knowledge Organization Systems (NKOS) Workshop ; Proceedings of the 17th European Networked Knowledge Organization Systems Workshop co-located with the 21st International Conference on Theory and Practice of Digital Libraries 2017 (TPDL 2017), Thessaloniki, Greece, September 21st, 2017}, booktitle = {NKOS 2017: 17th European Networked Knowledge Organization Systems (NKOS) Workshop ; Proceedings of the 17th European Networked Knowledge Organization Systems Workshop co-located with the 21st International Conference on Theory and Practice of Digital Libraries 2017 (TPDL 2017), Thessaloniki, Greece, September 21st, 2017}, issn = {1613-0073}, url = {http://nbn-resolving.de/urn:nbn:de:bsz:960-opus4-11464}, pages = {26 -- 38}, year = {2017}, abstract = {The amount of papers published yearly increases since decades. Libraries need to make these resources accessible and available with classification being an important aspect and part of this process. This paper analyzes prerequisites and possibilities of automatic classification of medical literature. We explain the selection, preprocessing and analysis of data consisting of catalogue datasets from the library of the Hanover Medical School, Lower Saxony, Germany. In the present study, 19,348 documents, represented by notations of library classification systems such as e.g. the Dewey Decimal Classification (DDC), were classified into 514 different classes from the National Library of Medicine (NLM) classification system. The algorithm used was k-nearest-neighbours (kNN). A correct classification rate of 55.7\% could be achieved. To the best of our knowledge, this is not only the first research conducted towards the use of the NLM classification in automatic classification but also the first approach that exclusively considers already assigned notations from other classification systems for this purpose.}, subject = {Klassifikation}, language = {en} } @masterthesis{Lueschow2016, type = {Bachelor Thesis}, author = {L{\"u}schow, Andreas}, title = {Automatische Klassifizierung medizinischer Literatur durch Analyse verf{\"u}gbarer Notationen}, doi = {10.25968/opus-1058}, url = {http://nbn-resolving.de/urn:nbn:de:bsz:960-opus4-10583}, school = {Hochschule Hannover}, year = {2016}, abstract = {In den letzten Jahren ist, nicht zuletzt aufgrund der schnellen und einfachen Verf{\"u}gbarkeit von Daten und Informationen, ein Anstieg an ver{\"o}ffentlichter Literatur zu beobachten. Bibliotheken stehen vor der Herausforderung, diese Ressourcen zu erschließen und damit verf{\"u}gbar zu machen. Ein Teilaspekt ist hierbei die Klassifizierung. Die Arbeit untersucht Voraussetzungen und M{\"o}glichkeiten der automatischen Klassifizierung am Beispiel medizinischer Literatur. Der erste, theoretische Teil beinhaltet die Beschreibung der Grundlagen der Inhaltserschließung, des Data Mining und der automatischen Klassifizierung sowie eine umfassende {\"U}bersicht {\"u}ber den aktuellen Forschungsstand in diesem Bereich. Im zweiten Teil wird die Auswahl, Aufbereitung und Analyse eines aus Katalogdatens{\"a}tzen der Bibliothek der Medizinischen Hochschule Hannover bestehenden Datenbestandes erl{\"a}utert. Die Anwendung von Verfahren des maschinellen Lernens zur Klassifizierung bibliographischer Datens{\"a}tze wird am Beispiel des Algorithmus k-nearest-neighbours verdeutlicht. Hierbei l{\"a}sst sich eine korrekte Klassifizierung von rund 58 \% der Dokumente erreichen. Abschließend werden Optimierungsans{\"a}tze (z.B. semi-automatische Verfahren) und Herausforderungen automatischer Klassifizierungsverfahren (z.B. uneinheitlich erschlossene Datens{\"a}tze oder ungleiche Verteilung der Klassen einer Systematik in den Dokumenten) aufgezeigt.}, language = {de} }