WICHTIG: Der Betrieb von goMatlab.de wird privat finanziert fortgesetzt. - Mehr Infos...

Mein MATLAB Forum - goMatlab.de

Mein MATLAB Forum

 
Gast > Registrieren       Autologin?   

Partner:




Forum
      Option
[Erweitert]
  • Diese Seite per Mail weiterempfehlen
     


Gehe zu:  
Neues Thema eröffnen Neue Antwort erstellen

k-Means in höheren Dimensionen anwenden + visualisieren

 

clustering_n00b
Forum-Century

Forum-Century


Beiträge: 129
Anmeldedatum: 05.09.11
Wohnort: ---
Version: R2011a, R2012b
     Beitrag Verfasst am: 05.09.2011, 09:52     Titel: k-Means in höheren Dimensionen anwenden + visualisieren
  Antworten mit Zitat      
Hallo zusammen! Smile

Bin neu hier. Das ist meine erste Post Very Happy

Ich arbeite mich gerade in das Gebiet von Machine Learning ein.
Ich möchte k-Means auf meine Daten anwenden.
Dazu habe ich zuerst einen Probelauf (mithilfe der k-Means Doku) gestartet.

Gegeben:
Datenmenge X: 200 x 2 Matrix
Clusteranzahl k: 2
Labelmenge labels: 200 x 1 Binär-Vektor

Gesucht:
Gruppierung idx: 200 x 1 Vektor


Code:

X = [randn(100,2)+ones(100,2);...
     randn(100,2)-ones(100,2)];
label = round(rand(200,1));
opts = statset('Display','final');

[idx,ctrs] = kmeans(X,2,...
                    'Distance','city',...
                    'Replicates',5,...
                    'Options',opts);

plot(X(idx==1,1),X(idx==1,2),'r.','MarkerSize',12)
hold on
plot(X(idx==2,1),X(idx==2,2),'b.','MarkerSize',12)
plot(X(label==0,1),X(label==0,2),'ko','MarkerSize',12,'LineWidth',0.5)
plot(X(label==1,1),X(label==1,2),'kx','MarkerSize',12,'LineWidth',0.5)
legend('Cluster 1','Cluster 2','Label 0', 'Label 1',...
       'Location','NW')
 


Das Bild dazu ist im Anhang.


Nun geht's an die echten Daten und das echte Problem.

Die Datenmenge ist in zwei Klassen A und B aufgeteilt. Nun geht es darum (beliebig viele) Unterklassen in B zu finden. Die Validierungsmöglichkeit ist ganz einfach (A oder B), d.h. wenn ich einen Überschneidungscluster in A und B finde, dann weiss ich, dass der Algo falsch liegt.

Plotten hilft hier nicht allzu viel, da ich nun 20 Dimensionen habe.
Gibt es aber trotzdem einen Weg, das Ganze überzeugend visuell darzustellen, evtl. mit imagesc?

Gegeben:
Datenmenge X: 37 x 20 Matrix
Clusteranzahl k: unbekannt --> Vorschlag: Iteration von 2 bis 10
Labelmenge labels: 37 x 1 Binär-Vektor

Gesucht:
Gruppierung idx: 200 x 1 Vektor
Visualisierung



Brauche eure Hilfe Question

probe.jpg
 Beschreibung:
Probelaufbild

Download
 Dateiname:  probe.jpg
 Dateigröße:  35.5 KB
 Heruntergeladen:  492 mal
Private Nachricht senden Benutzer-Profile anzeigen


Neues Thema eröffnen Neue Antwort erstellen



Einstellungen und Berechtigungen
Beiträge der letzten Zeit anzeigen:

Du kannst Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.
Du kannst Dateien in diesem Forum posten
Du kannst Dateien in diesem Forum herunterladen
.





 Impressum  | Nutzungsbedingungen  | Datenschutz | FAQ | goMatlab RSS Button RSS

Hosted by:


Copyright © 2007 - 2025 goMatlab.de | Dies ist keine offizielle Website der Firma The Mathworks

MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.