Ich arbeite mich gerade in das Gebiet von Machine Learning ein.
Ich möchte k-Means auf meine Daten anwenden.
Dazu habe ich zuerst einen Probelauf (mithilfe der k-Means Doku) gestartet.
Gegeben:
Datenmenge X: 200 x 2 Matrix
Clusteranzahl k: 2
Labelmenge labels: 200 x 1 Binär-Vektor
Gesucht:
Gruppierung idx: 200 x 1 Vektor
Code:
X = [randn(100,2)+ones(100,2);...
randn(100,2)-ones(100,2)];
label = round(rand(200,1));
opts = statset('Display','final');
Nun geht's an die echten Daten und das echte Problem.
Die Datenmenge ist in zwei Klassen A und B aufgeteilt. Nun geht es darum (beliebig viele) Unterklassen in B zu finden. Die Validierungsmöglichkeit ist ganz einfach (A oder B), d.h. wenn ich einen Überschneidungscluster in A und B finde, dann weiss ich, dass der Algo falsch liegt.
Plotten hilft hier nicht allzu viel, da ich nun 20 Dimensionen habe.
Gibt es aber trotzdem einen Weg, das Ganze überzeugend visuell darzustellen, evtl. mit imagesc?
Gegeben:
Datenmenge X: 37 x 20 Matrix
Clusteranzahl k: unbekannt --> Vorschlag: Iteration von 2 bis 10
Labelmenge labels: 37 x 1 Binär-Vektor
Gesucht:
Gruppierung idx: 200 x 1 Vektor
Visualisierung
Du kannst Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen. Du kannst Dateien in diesem Forum posten Du kannst Dateien in diesem Forum herunterladen
MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.