@phdthesis{Moelck2013, type = {Master Thesis}, author = {Letitia-Venetia M{\"o}lck}, title = {M{\"o}glichkeiten zur Unterst{\"u}tzung der automatischen Spracherkennung in wissenschaftlichen Videos mit Hilfe von Fachterminologie}, doi = {10.25968/opus-342}, url = {http://nbn-resolving.de/urn:nbn:de:bsz:960-opus-4128}, year = {2013}, abstract = {Automatische Spracherkennungssysteme (Automatic Speech Recognition - ASR) k{\"o}nnen derzeit nicht alle W{\"o}rter korrekt erkennen und daher noch keine guten Transkriptionen erstellen. Die Qualit{\"a}t der automatischen Spracherkennung wird von vielen Faktoren beeinflusst. Einer davon ist das Vokabular. Je vielf{\"a}ltiger und komplexer die Themen, desto gr{\"o}{\"s}er die Anzahl der fachspezifischen W{\"o}rter ist, die erkannt werden m{\"u}ssen, desto schwieriger ist die Erkennungsaufgabe und desto schlechter sind die Transkriptionsergebnisse. Die Sprachmodelle von automatischen Spracherkennungssystemen m{\"u}ssen durch Training angepasst werden, damit sie auch bei Gebieten mit speziellem Vokabular gute Resultate erzielen k{\"o}nnen. In dieser Arbeit wird untersucht, ob der prozentuale Anteil der korrekt erkannten W{\"o}rter durch Training des Sprachmodells der automatischen Spracherkennung mit fachspezifischer Terminologie wirksam gesteigert werden kann. Anhand von Ergebnissen der durchgef{\"u}hrten Experimente wird dargelegt, welche Anzahl und Art von Daten ben{\"o}tigt wird, um den Prozentsatz der falsch erkannten W{\"o}rter zu senken. Die Ergebnisse der Dom{\"a}nen-Adaption bilden die Basis f{\"u}r den anschlie{\"s}enden Vergleich des fachspezifischen Vokabulars in Vorlesungsvideos und wissenschaftlichen Publikationen, um die Unterschiede hinsichtlich der verwendeten Fachsprache aufzuzeigen. Grundlage und Ausgangspunkt f{\"u}r die gesamte Untersuchung stellt die Erkennung der Fachterminologie und ihre Unterscheidung von der Allgemeinsprache dar.}, language = {de} }