Das Zentrum-Problem ist ein Clustering-Problem, bei dem wir einen vollständigen ungerichteten Graphen mit einem Abstand zwischen jedem Knotenpaar . Die Abstände entsprechen der Dreiecksungleichheit und der Modellähnlichkeit. Wir erhalten auch eine ganze Zahl .kG=(V,E)dij≥0i,j∈Vk
In dem Problem müssen wir Cluster finden, die die Scheitelpunkte, die am ähnlichsten sind, zu Clustern zusammenfassen. Wir wählen eine Menge von Clusterzentren. Jeder Scheitelpunkt ordnet sich dem nächstgelegenen Clusterzentrum zu und gruppiert die Scheitelpunkte in verschiedene Cluster. Ziel ist es, den maximalen Abstand eines Scheitelpunkts zu seinem Clusterzentrum zu minimieren. Wir wollen also geometrisch die Zentren von verschiedenen Kugeln mit dem gleichen Radius , die alle Punkte abdecken, damit so klein wie möglich ist.kS⊆V,|S|=kkkkrr
Der optimale Algorithmus ist gierig und auch sehr einfach und intuitiv. Wir wählen zuerst einen Scheitelpunkt willkürlich aus und setzen ihn in unsere Menge von Cluster-Zentren. Wir wählen dann das nächste Clusterzentrum so aus, dass es so weit wie möglich von allen anderen Clusterzentren entfernt ist. Also während , so finden wir immer wieder eine Ecke für die der Abstand maximiert wird und es hinzuzufügen . Einmal wir sind fertigS | S | < K j ∈ V d ( j , S ) S | S | = ki∈VS|S|<kj∈Vd(j,S)S|S|=k
Der beschriebene Algorithmus ist ein Approximationsalgorithmus für das Zentrumsproblem. In der Tat, wenn es existiert ein -Approximationsalgorithmus für das Problem mit dann . Dies kann leicht mit einer Reduktion des NP-vollständigen Dominanzmengenproblems gezeigt werden, indem gezeigt wird, dass wir eine dominante Menge von Größen höchstens wenn eine Instanz des Zentrumsproblems, in der alle Abstände entweder 1 oder 2 sind, einen optimalen Wert hat 1. Der Algorithmus und die Analyse werden von Gonzales, Clustering, 1985, zur Minimierung der maximalen Entfernung zwischen den Clustern angegeben . Eine andere Variante einerk ρ ρ < 2 P = N P k k 22kρρ<2P=NPkk2-Näherung wird von Hochbaum und Shmoys gegeben, Eine bestmögliche Heuristik für das k-Zentrum-Problem, 1985 .