|
|
Wie berechnet K-Means Distanzen |
|
GeoGecco |
Forum-Newbie
|
|
Beiträge: 2
|
|
|
|
Anmeldedatum: 26.06.15
|
|
|
|
Wohnort: ---
|
|
|
|
Version: ---
|
|
|
|
|
|
Verfasst am: 26.06.2015, 15:50
Titel: Wie berechnet K-Means Distanzen
|
|
|
|
|
Hallo Leute,
ich benutze zur Zeit die 'kmeans' function von Matlab für das Clustern von Graphen.
Wenn ich eine spectral clusterung durchführe, werden in die Funktion keine Punkte üergeben, sondern die Eigenvektoren meiner Adjazenzmatrix (Knotenbeziehungen des Graphen) übergeben.
Ich kann nicht ganz nachvollziehen wie kmeans damit umgeht, da die Eigenvektorenmatrix ja sehr lang ist und ich wüsste gerne welche Elemente der Matrix dort zu Berechnung des "Abstandes" benutzt werden.
Ich mache quasi das hier:
% only compute 'k' largest eigenvalues/vectors
[U,D] = eigs(C,6,'la',options);
% calculate k-clusters from largest eigenvectors
ndx = kmeans(U,6,'Distance','cosine','Start','sample','Replicates',nrep);
Ich hab bis jetzt nur hier gelesen:
http://de.mathworks.com/help/stats/kmeans.html
dort steht nur, dass zur jeden Zeile der Matrix die in kmeans geht die Abstände berechnet werden. Was ist aber wenn die Matrix 3900x6 ist? Kmeans rechnet richtig, aber ich versteh einfach nicht wie die Funktion die Abstände in der Eigenvektormatrix rechnet.
Hier der Auszug aus meinem 'U'
0,0159739517488036 0,0200798243316826 -0,0298429363375344 -0,0134164056850626 -0,0378911848569531 -0,0149942704518242
0,0159739517488036 0,0201669396014487 -0,0299160835389219 -0,0134644031354121 -0,0383074396876401 -0,0150301146794551
0,0159739517488036 0,0201675222984250 -0,0299514956292116 -0,0134877000212275 -0,0383449045780820 -0,0150907431294424
0,0159739517488036 0,0201935344326533 -0,0299269104869128 -0,0134719825936411 -0,0384195377062451 -0,0150169918106496
0,0159739517488036 0,0201145314379238 -0,0299364331325826 -0,0134792451009709 -0,0381104926469794 -0,0151092730915414
0,0159739517488036 0,0201733648084938 -0,0299585091443205 -0,0134931920908033 -0,0383677028811731 -0,0150890155666447
0,0159739517488036 0,0201925110099447 -0,0299180536596589 -0,0134669868814961 -0,0383999509267469 -0,0149954730920525
0,0159739517488036 0,0199682446307357 -0,0298271986550395 -0,0134103738316475 -0,0374081968277096 -0,0150534388072779
Ich würde mich sehr freuen, wenn mir da jemand helfen könnte.
Gruß
GeoGecco
|
|
|
|
|
Jan S |
Moderator
|
|
Beiträge: 11.057
|
|
|
|
Anmeldedatum: 08.07.10
|
|
|
|
Wohnort: Heidelberg
|
|
|
|
Version: 2009a, 2016b
|
|
|
|
|
|
Verfasst am: 28.06.2015, 01:23
Titel: Re: Wie berechnet K-Means Distanzen
|
|
Hallo GeoGecco,
Zitat: |
Kmeans rechnet richtig, aber ich versteh einfach nicht wie die Funktion die Abstände in der Eigenvektormatrix rechnet. |
Wird das im Abschnitt
Zitat: |
'Distance' Distance measure
'sqeuclidean' (default) | 'cityblock' | 'cosine' | 'correlation' | 'hamming' |
nicht gut erklärt?
Gruß, Jan
|
|
|
GeoGecco |
Themenstarter
Forum-Newbie
|
|
Beiträge: 2
|
|
|
|
Anmeldedatum: 26.06.15
|
|
|
|
Wohnort: ---
|
|
|
|
Version: ---
|
|
|
|
|
|
Verfasst am: 28.06.2015, 08:46
Titel:
|
|
Danke für die Antwort.
Die Formeln da habe ich schon gesehen aber ich weiß nicht wie die Matrizen aussehen.
z.B. ich rechne bei Matlab immer mit 'cosine' und die Formel dazu ist:
Demnach muss ja X dann die Matrix mit den Eigenvektoren sein aber wie sieht dann z.B. C aus?
Bei normalen Punkten nimmt man ja einfach random k-Punkte.
Kannst du mir zeigen wie dann hierbei die C Matrix aussieht?
|
|
|
Jan S |
Moderator
|
|
Beiträge: 11.057
|
|
|
|
Anmeldedatum: 08.07.10
|
|
|
|
Wohnort: Heidelberg
|
|
|
|
Version: 2009a, 2016b
|
|
|
|
|
|
Verfasst am: 28.06.2015, 17:11
Titel:
|
|
Hallo GeoGecco,
Zitat: |
Die Formeln da habe ich schon gesehen aber ich weiß nicht wie die Matrizen aussehen. |
Hast Du die Dokumentation gelesen? Dort steht:
Zitat: |
c is a centroid (a row vector) |
Die c Vektoren sind also jeweils die zu berechnenden Zentren und das Endergebnis des Minimierungs-Prozesses.
Zitat: |
Bei normalen Punkten nimmt man ja einfach random k-Punkte.
Kannst du mir zeigen wie dann hierbei die C Matrix aussieht? |
Ich verstehe nicht, wo der Unterschied zwischen "normalen Punkten" und "Eigenvektoren meiner Adjazenzmatrix (Knotenbeziehungen des Graphen)" sein soll. Matlab bekommt einfach nur Vektoren geliefert und hat keine Ahnung, was sie bedeuten. Es ist dem KMEANS-Algorithmus egal, ob das Punkte oder Eigenvektoren sind.
Ich verstehe also die Frage nicht und vermute, dass die Antwort trivial ist.
Gruß, Jan
|
|
|
|
|
Einstellungen und Berechtigungen
|
|
Du kannst Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen. Du kannst Dateien in diesem Forum posten Du kannst Dateien in diesem Forum herunterladen
|
|
Impressum
| Nutzungsbedingungen
| Datenschutz
| FAQ
| RSS
Hosted by:
Copyright © 2007 - 2024
goMatlab.de | Dies ist keine offizielle Website der Firma The Mathworks
MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.
|
|