Refine
Year of publication
- 2014 (13) (remove)
Document Type
- Article (6)
- Bachelor Thesis (2)
- Book (2)
- Conference Proceeding (2)
- Report (1)
Has Fulltext
- yes (13)
Is part of the Bibliography
- no (13)
Keywords
- Approval (1)
- Auskunftsdienst (1)
- Benutzerfreundlichkeit (1)
- Bibliothek (1)
- Bibliothekswebseite (1)
- Chatbot (1)
- Clinical Trials (1)
- DALY (1)
- Developing Countries (1)
- Disease Burden (1)
Institute
- Fakultät III - Medien, Information und Design (13) (remove)
The dependency of word similarity in vector space models on the frequency of words has been noted in a few studies, but has received very little attention. We study the influence of word frequency in a set of 10 000 randomly selected word pairs for a number of different combinations of feature weighting schemes and similarity measures. We find that the similarity of word pairs for all methods, except for the one using singular value decomposition to reduce the dimensionality of the feature space, is determined to a large extent by the frequency of the words. In a binary classification task of pairs of synonyms and unrelated words we find that for all similarity measures the results can be improved when we correct for the frequency bias.
Der Arbeitsalltag von Wissenschaftlerinnen und Wissenschaftlern hat sich in den letzten Jahren dramatisch verändert. Forschen, Schreiben und Publizieren sind mittlerweile stark durch netzbasierte Anwendungen geprägt. Das digitale Zeitalter aber hat nicht nur neue technische Werkzeuge hervorgebracht, sondern auch neue Wege eröffnet, um Wissen zu generieren und zu verbreiten. Dies gilt sowohl innerhalb der akademischen Welt als auch über diese hinaus. Das Arbeiten mit dem Netz stellt unsere bisherigen etablierten wissenschaftlichen Praktiken in Frage. Forschung wird zunehmend vernetzt, kollaborativ, multimedial, trans- bzw. interdisziplinär durchgeführt. Das vorliegende Handbuch beschreibt diese sich herausbildenden wissenschaftlichen Praktiken. Ziel der Autoren war es dabei, ein praxisnahes und leicht verständliches Handbuch zu schreiben.