@techreport{WartenaEderberg2017, author = {Wartena, Christian and Ederberg, Hans-Peter}, title = {Clustering von deutschen Ortsnamen}, doi = {10.25968/opus-1028}, institution = {Fakult{\"a}t III - Medien, Information und Design}, year = {2017}, abstract = {Diese Studie untersucht Gruppen von Ortsnamen in Deutschland (in den Postleitregionen) nach vorhandenen {\"A}hnlichkeiten. Als Messgr{\"o}ße wird ein H{\"a}ufigkeitsvektor von Trigrammen in jeder Gruppe herangezogen. Mit der Anwendung des Average Linkage-Algorithmus auf die Messgr{\"o}ße werden Cluster aus r{\"a}umlich zusammenh{\"a}ngenden Gebieten gebildet, obwohl das Verfahren keine Kenntnis {\"u}ber die Lage der Cluster zueinander besitzt. In den Clustern werden die zehn h{\"a}ufigsten n-Gramme ermittelt, um charakteristische Wortpartikel darzustellen. Die von den Clustern umschriebenen Gebiete lassen sich zwanglos durch historische oder linguistische Entwicklungen erkl{\"a}ren. Das hier verwendete Verfahren setzt jedoch kein linguistisches, geographisches oder historisches Wissen voraus, erm{\"o}glicht aber die Gruppierung von Namen in eindeutiger Weise unter Ber{\"u}cksichtigung einer Vielzahl von Wortpartikeln in einem Schritt. Die Vorgehensweise ohne Vorwissen unterscheidet diese Studie von den meisten bisher angewendeten Untersuchungen.}, language = {de} }