@techreport{WartenaEderberg2017, author = {Christian Wartena and Hans-Peter Ederberg}, title = {Clustering von deutschen Ortsnamen}, doi = {10.25968/opus-1028}, url = {http://nbn-resolving.de/urn:nbn:de:bsz:960-opus4-10286}, year = {2017}, abstract = {Diese Studie untersucht Gruppen von Ortsnamen in Deutschland (in den Postleitregionen) nach vorhandenen {\"A}hnlichkeiten. Als Messgr{\"o}{\"s}e wird ein H{\"a}ufigkeitsvektor von Trigrammen in jeder Gruppe herangezogen. Mit der Anwendung des Average Linkage-Algorithmus auf die Messgr{\"o}{\"s}e werden Cluster aus r{\"a}umlich zusammenh{\"a}ngenden Gebieten gebildet, obwohl das Verfahren keine Kenntnis {\"u}ber die Lage der Cluster zueinander besitzt. In den Clustern werden die zehn h{\"a}ufigsten n-Gramme ermittelt, um charakteristische Wortpartikel darzustellen. Die von den Clustern umschriebenen Gebiete lassen sich zwanglos durch historische oder linguistische Entwicklungen erkl{\"a}ren. Das hier verwendete Verfahren setzt jedoch kein linguistisches, geographisches oder historisches Wissen voraus, erm{\"o}glicht aber die Gruppierung von Namen in eindeutiger Weise unter Ber{\"u}cksichtigung einer Vielzahl von Wortpartikeln in einem Schritt. Die Vorgehensweise ohne Vorwissen unterscheidet diese Studie von den meisten bisher angewendeten Untersuchungen.}, language = {de} }