- search hit 1 of 1
Automatische Klassifizierung medizinischer Literatur durch Analyse verfügbarer Notationen
- In den letzten Jahren ist, nicht zuletzt aufgrund der schnellen und einfachen Verfügbarkeit von Daten und Informationen, ein Anstieg an veröffentlichter Literatur zu beobachten. Bibliotheken stehen vor der Herausforderung, diese Ressourcen zu erschließen und damit verfügbar zu machen. Ein Teilaspekt ist hierbei die Klassifizierung. Die Arbeit untersucht Voraussetzungen und Möglichkeiten der automatischen Klassifizierung am Beispiel medizinischer Literatur. Der erste, theoretische Teil beinhaltet die Beschreibung der Grundlagen der Inhaltserschließung, des Data Mining und der automatischen Klassifizierung sowie eine umfassende Übersicht über den aktuellen Forschungsstand in diesem Bereich. Im zweiten Teil wird die Auswahl, Aufbereitung und Analyse eines aus Katalogdatensätzen der Bibliothek der Medizinischen Hochschule Hannover bestehenden Datenbestandes erläutert. Die Anwendung von Verfahren des maschinellen Lernens zur Klassifizierung bibliographischer Datensätze wird am Beispiel des Algorithmus k-nearest-neighbours verdeutlicht. Hierbei lässt sich eine korrekte Klassifizierung von rund 58 % der Dokumente erreichen. Abschließend werden Optimierungsansätze (z.B. semi-automatische Verfahren) und Herausforderungen automatischer Klassifizierungsverfahren (z.B. uneinheitlich erschlossene Datensätze oder ungleiche Verteilung der Klassen einer Systematik in den Dokumenten) aufgezeigt.
Author: | Andreas Lüschow |
---|---|
URN: | urn:nbn:de:bsz:960-opus4-10583 |
DOI: | https://doi.org/10.25968/opus-1058 |
Advisor: | Christian WartenaORCiDGND, Ina BlümelORCiDGND |
Document Type: | Bachelor Thesis |
Language: | German |
Year of Completion: | 2016 |
Publishing Institution: | Hochschule Hannover |
Granting Institution: | Hochschule Hannover, Fakultät III - Medien, Information und Design |
Date of final exam: | 2016/12/21 |
Release Date: | 2017/03/06 |
Tag: | Automatische Klassifikation; Bibliografische Beschreibung; Data Mining; Datenanalyse; Inhaltserschließung |
Link to catalogue: | 884124274 |
Institutes: | Fakultät III - Medien, Information und Design |
DDC classes: | 020 Bibliotheks- und Informationswissenschaft |
Licence (German): | ![]() |