020 Bibliotheks- und Informationswissenschaft
Refine
Year of publication
- 2016 (19) (remove)
Document Type
- Bachelor Thesis (11)
- Conference Proceeding (5)
- Study Thesis (2)
- Article (1)
Has Fulltext
- yes (19)
Is part of the Bibliography
- no (19)
Keywords
- Öffentliche Bibliothek (3)
- Benutzerfreundlichkeit (2)
- Forschungsdaten (2)
- Klassifikation (2)
- Open Access (2)
- SKOS (2)
- Semantic Web (2)
- Semantik (2)
- Thesaurus (2)
- API (1)
Institute
In den letzten Jahren ist, nicht zuletzt aufgrund der schnellen und einfachen Verfügbarkeit von Daten und Informationen, ein Anstieg an veröffentlichter Literatur zu beobachten. Bibliotheken stehen vor der Herausforderung, diese Ressourcen zu erschließen und damit verfügbar zu machen. Ein Teilaspekt ist hierbei die Klassifizierung. Die Arbeit untersucht Voraussetzungen und Möglichkeiten der automatischen Klassifizierung am Beispiel medizinischer Literatur. Der erste, theoretische Teil beinhaltet die Beschreibung der Grundlagen der Inhaltserschließung, des Data Mining und der automatischen Klassifizierung sowie eine umfassende Übersicht über den aktuellen Forschungsstand in diesem Bereich. Im zweiten Teil wird die Auswahl, Aufbereitung und Analyse eines aus Katalogdatensätzen der Bibliothek der Medizinischen Hochschule Hannover bestehenden Datenbestandes erläutert. Die Anwendung von Verfahren des maschinellen Lernens zur Klassifizierung bibliographischer Datensätze wird am Beispiel des Algorithmus k-nearest-neighbours verdeutlicht. Hierbei lässt sich eine korrekte Klassifizierung von rund 58 % der Dokumente erreichen. Abschließend werden Optimierungsansätze (z.B. semi-automatische Verfahren) und Herausforderungen automatischer Klassifizierungsverfahren (z.B. uneinheitlich erschlossene Datensätze oder ungleiche Verteilung der Klassen einer Systematik in den Dokumenten) aufgezeigt.
The CogALex-V Shared Task provides two datasets that consists of pairs of words along with a classification of their semantic relation. The dataset for the first task distinguishes only between related and unrelated, while the second data set distinguishes several types of semantic relations. A number of recent papers propose to construct a feature vector that represents a pair of words by applying a pairwise simple operation to all elements of the feature vector. Subsequently, the pairs can be classified by training any classification algorithm on these vectors. In the present paper we apply this method to the provided datasets. We see that the results are not better than from the given simple baseline. We conclude that the results of the investigated method are strongly depended on the type of data to which it is applied.
Das vorliegende Shortpaper befasst sich mit dem Thema Datenschnittstellen und Datenmapping im Bibliothekswesen für den Austausch von bibliografischen Daten. Ausgangspunkt der Arbeit ist die Schnittstelle Z39.50, welche den Austausch von Metadaten zwischen Bibliotheken als derzeitigen Standard bildet. Neben diesem Austauschformat sind die Darstellungsformate MAB, MARC 21, MARC-XML und als Weiterentwicklung von Z39.50 das SRU (Search/Retrieve via URL) genannt. Weiterhin wird auf das Linked Open Data Netzwerk Bezug genommen. Dieses Netzwerk, auch Semantic Web genannt, wird im Allgemeinen auch mit den Begriffen Web 3.0, Linked Open Data und Web of Data in Verbindung gebracht. Die technische Seite wird anhand von RDF (Resource Description Framework), XML (Extensible Markup Language) erläutert und im Weiteren wird auf die Wichtigkeit der CC0-Lizenzen (Creative Commons Lizenzen) eingegangen. Abschließend wird auf den Begriff Mapping im Kontext der Bibliothekslandschaft eingegangen und die Zusammenarbeit zwischen den Institutionen hervorgehoben.
Discovery and efficient reuse of technology pictures using Wikimedia infrastructures. A proposal
(2016)
Multimedia objects, especially images and figures, are essential for the visualization and interpretation of research findings. The distribution and reuse of these scientific objects is significantly improved under open access conditions, for instance in Wikipedia articles, in research literature, as well as in education and knowledge dissemination, where licensing of images often represents a serious barrier.
Whereas scientific publications are retrievable through library portals or other online search services due to standardized indices there is no targeted retrieval and access to the accompanying images and figures yet. Consequently there is a great demand to develop standardized indexing methods for these multimedia open access objects in order to improve the accessibility to this material.
With our proposal, we hope to serve a broad audience which looks up a scientific or technical term in a web search portal first. Until now, this audience has little chance to find an openly accessible and reusable image narrowly matching their search term on first try - frustratingly so, even if there is in fact such an image included in some open access article.
Die Einführung von Discovery-Systemen in wissenschaftlichen Bibliotheken ist aktuell ein viel diskutiertes Thema in der deutschen Bibliothekslandschaft. In dieser Bachelorarbeit wird die konkrete Implementierung des Discovery-Systems in der Herzog August Bibliothek (HAB) in Wolfenbüttel betrachtet. Hierfür wird zunächst ein generelles Verständnis für Bibliothekskatalogsysteme geschaffen. Eine vergleichende Studie der Recherchequalität zwischen dem Discovery-System und dem bestehenden OPAC (Online Public Access Catalogue) wird durchgeführt, um zum einen Empfehlungen für notwendige Anpassungen an dem Discovery-System auszusprechen und zum anderen letztendlich eine Aussage über die Möglichkeit einer Abschaltung des OPACs zu treffen. Eine Abschaltung des OPACs ist aufgrund der Ergebnisse nur dann erfolgreich möglich, wenn die HAB ihre Viel- und Intensivnutzer in den Implementierungsprozess mit einbezieht und deren Anforderungen und Wünsche an das Discovery-System umsetzt. Die Studie zeigt, dass die Benutzer der HAB an den OPAC gewohnt sind und für die HAB daher die Herausforderung in der Akzeptanzschaffung für das neue System liegt.
Editorial for the 15th European Networked Knowledge Organization Systems Workshop (NKOS 2016)
(2016)
Knowledge Organization Systems (KOS), in the form of classification systems, thesauri, lexical databases, ontologies, and taxonomies, play a crucial role in digital information management and applications generally. Carrying semantics in a well-controlled and documented way, Knowledge Organisation Systems serve a variety of important functions: tools for representation and indexing of information and documents, knowledge-based support to information searchers, semantic road maps to domains and disciplines, communication tool by providing conceptual framework, and conceptual basis for knowledge based systems, e.g. automated classification systems. New networked KOS (NKOS) services and applications are emerging, and we have reached a stage where many KOS standards exist and the integration of linked services is no longer just a future scenario. This editorial describes the workshop outline and overview of presented papers at the 15th European Networked Knowledge Organization Systems Workshop (NKOS 2016) in Hannover, Germany.
Einführung einer institutionellen Forschungsdateninfrastruktur an der Helmut-Schmidt-Universität
(2016)
Die vorliegende Bachelorarbeit untersucht den zur Einführung einer institutionellen Forschungsdateninfrastruktur zu berücksichtigenden Handlungsrahmen an der Helmut-Schmidt-Universität/ Universität der Bundeswehr Hamburg (HSU/ UniBw H) und gibt unter besonderer Berücksichtigung möglicher Aufgabenfelder der Universitätsbibliothek allgemeine Handlungsempfehlungen für deren Implementierung. Da sich die Arbeit sowohl an die Verantwortlichen zur Einführung einer Forschungsdateninfrastruktur an der HSU/ UniBw H als auch an Interessierte der akademischen Gemeinschaft richtet, werden die zum besseren Verständnis besonders relevanten Begriffe zunächst herausgestellt. Auf der Grundlage aktueller Forschungsliteratur und verfügbarer Praxiserfahrung anderer Universitäten wurde mittels Webseitenanalyse und der Auswertung von Fragebögen eine gesamtheitliche Beschreibung für die Implementierung einer institutionellen Forschungsdateninfrastruktur zum Abgleich mit der Ausgangssituation an der HSU/ UniBw H erstellt. Die Arbeit verdeutlicht in den daraus abgeleiteten Handlungsempfehlungen den zu berücksichtigenden allgemeinen Handlungsrahmen in seiner Komplexität und zeigt vor allem diesbezügliche Aufgabenfelder der Universitätsbibliothek von der Initiierung bis zum Abschluss der Implementierung auf. Im Wesentlichen wird hierbei herausgestellt, dass die Universitätsbibliothek als klassische Gedächtnisorganisation und zentraler Informationsdienstleister ihre Kompetenzen besonders bei der Entwicklung und Verwirklichung des Forschungsdatenmanagements sinnvoll einbringen und zukunftsorientiert erweitern kann und sollte. Auslegungsbestimmend ist die von der Universitätsleitung festzulegende Ziel- und Zweckbestimmung der institutionellen Forschungsdateninfrastruktur. Diese dient dem Forschungsdatenmanagement zur Skalierung und Bestimmung von Umfang, Komplexität und Anforderungen an die potentiellen Aufgabenbereiche insbesondere der Universitätsbibliothek. Somit leistet diese Bachelorarbeit einen grundlegenden Beitrag zur weiteren Strukturierung und Konkretisierung der initiatorischen Überlegungen der Universitätsbibliotheksleitung zu den Möglichkeiten der Einführung einer institutionellen Forschungsdateninfrastruktur an der HSU/ UniBw H.
Anwendungen in Bibliotheken auf Basis von Augmented Reality (AR), der Erweiterung der Realität durch zusätzliche, virtuelle Informationen, existieren bislang nur vereinzelt. Das vom Bundesministerium für Wirtschaft und Energie geförderte Forschungsprojekt mylibrARy ermittelt seit Juni 2014 Szenarien für den Einsatz von AR in Bibliotheken und Informationseinrichtungen. Das Projekt zielt auf die Entwicklung einer deutschlandweit einsetzbaren Applikation (App). An diesen Gedanken knüpft die vorliegende Arbeit mit der Entwicklung eines Konzepts für Einführungen in Hochschulbibliotheken mittels AR-Technik. Aus der Analyse aktueller Führungsmodelle von Bibliotheken der Hochschulen im Exzellenzcluster 2012-2017, werden die für die Modellführung benötigten charakteristischen Merkmale einer Bibliotheksführung abgeleitet. Auf die technisch relevanten Grundlagen der AR folgt eine Bestandsaufnahme der bisherigen Augmented-Reality-Projekte im internationalen Bibliothekskontext. Daran schließt die Formulierung der theoretischen Anforderungen und die Ausarbeitung der Funktionen im Einzelnen. Nachfolgend lenkt eine kritische Betrachtung den Fokus auf Mehrwert und Risiken der AR für Bibliothek und Nutzer. Mit einer Zusammenfassung und dem Ausblick auf die zukünftige Entwicklung findet die Arbeit ihren Abschuss.
Integrating distributional and lexical information for semantic classification of words using MRMF
(2016)
Semantic classification of words using distributional features is usually based on the semantic similarity of words. We show on two different datasets that a trained classifier using the distributional features directly gives better results. We use Support Vector Machines (SVM) and Multirelational Matrix Factorization (MRMF) to train classifiers. Both give similar results. However, MRMF, that was not used for semantic classification with distributional features before, can easily be extended with more matrices containing more information from different sources on the same problem. We demonstrate the effectiveness of the novel approach by including information from WordNet. Thus we show, that MRMF provides an interesting approach for building semantic classifiers that (1) gives better results than unsupervised approaches based on vector similarity, (2) gives similar results as other supervised methods and (3) can naturally be extended with other sources of information in order to improve the results.
In distributional semantics words are represented by aggregated context features. The similarity of words can be computed by comparing their feature vectors. Thus, we can predict whether two words are synonymous or similar with respect to some other semantic relation. We will show on six different datasets of pairs of similar and non-similar words that a supervised learning algorithm on feature vectors representing pairs of words outperforms cosine similarity between vectors representing single words. We compared different methods to construct a feature vector representing a pair of words. We show that simple methods like pairwise addition or multiplication give better results than a recently proposed method that combines different types of features. The semantic relation we consider is relatedness of terms in thesauri for intellectual document classification. Thus our findings can directly be applied for the maintenance and extension of such thesauri. To the best of our knowledge this relation was not considered before in the field of distributional semantics.