@techreport{WartenaEderberg2017,
  author    = {Christian Wartena and Hans-Peter Ederberg},
  title     = {Clustering von deutschen Ortsnamen},
  doi       = {10.25968/opus-1028},
  url       = {http://nbn-resolving.de/urn:nbn:de:bsz:960-opus4-10286},
  year      = {2017},
  abstract  = {Diese Studie untersucht Gruppen von Ortsnamen in Deutschland (in den Postleitregionen) nach vorhandenen {\"A}hnlichkeiten. Als Messgr{\"o}{\"s}e wird ein H{\"a}ufigkeitsvektor von Trigrammen in jeder Gruppe herangezogen. Mit der Anwendung des Average Linkage-Algorithmus auf die Messgr{\"o}{\"s}e werden Cluster aus r{\"a}umlich zusammenh{\"a}ngenden Gebieten gebildet, obwohl das Verfahren keine Kenntnis {\"u}ber die Lage der Cluster zueinander besitzt. In den Clustern werden die zehn h{\"a}ufigsten n-Gramme ermittelt, um charakteristische Wortpartikel darzustellen. Die von den Clustern umschriebenen Gebiete lassen sich zwanglos durch historische oder linguistische Entwicklungen erkl{\"a}ren. Das hier verwendete Verfahren setzt jedoch kein linguistisches, geographisches oder historisches Wissen voraus, erm{\"o}glicht aber die Gruppierung von Namen in eindeutiger Weise unter Ber{\"u}cksichtigung einer Vielzahl von Wortpartikeln in einem Schritt. Die Vorgehensweise ohne Vorwissen unterscheidet diese Studie von den meisten bisher angewendeten Untersuchungen.},
  language  = {de}
}