WICHTIG: Der Betrieb von goMatlab.de wird privat finanziert fortgesetzt. - Mehr Infos...

Mein MATLAB Forum - goMatlab.de

Mein MATLAB Forum

 
Gast > Registrieren       Autologin?   

Partner:




Forum
      Option
[Erweitert]
  • Diese Seite per Mail weiterempfehlen
     


Gehe zu:  
Neues Thema eröffnen Neue Antwort erstellen

Clustering Methode

 

Tobi92
Forum-Anfänger

Forum-Anfänger


Beiträge: 10
Anmeldedatum: 04.12.18
Wohnort: ---
Version: ---
     Beitrag Verfasst am: 30.01.2020, 09:23     Titel: Clustering Methode
  Antworten mit Zitat      
Hallo,

ich muss Labordaten auf bestimmte Eigenschaften untersuchen und diese dann clustern. Im Anhang habe ich eine Skizze hinzugefügt, um mein Problem zu verdeutlichen.

Anfangen muss ich damit, ob meine Datei zu der Gruppe A oder B gehört. Diese Zuordnung kann ich aber leider nicht zu 100% machen. Also manchmal bin ich mir sicher, dass es aufgrund bestimmter Bedingungen zur Gruppe A/B gehört. Aber die Daten geben das nicht immer her.

Nachdem ich meine Datei einer Gruppe zugeordnet habe, geht es darum, sie einer Eigenschaft zuzuordnen. Wie bei der Gruppe kann ich das auch nicht immer zu 100% herausfinden. Der letzte Schritt besteht dann darin, der Datei noch eine Prägung zu geben. Dabei stehen mir 4 verschiedene zur Auswahl.

In Wirklichkeit habe ich mehr Gruppen, Eigenschaften und Prägungen. Nur der Einfachheitshalber habe ich die Struktur nicht zu groß aufgezogen.

Bis jetzt habe ich das regelbasiert gemacht. Also z. B.: "Wenn Bedingung x, y und z zutreffen, dann ist es Gruppe A. Ansonsten ist es Gruppe B usw."

Bei den Eigenschaften und Prägungen bin ich ähnlich vorgegangen. Man muss auch sagen, dass ich mit Schwellwerten arbeite. Also ich habe Bedingungen wie "Wenn die Länge von Objekt x zwischen 10 und 20 ist ...".

Ich frage mich aber, ob meine Methode bis jetzt richtig ist bzw. im Sinne des Clustering ist. Ich habe mir einiges zu Clustering durchgelesen und habe u.a. auch den Link hier gefunden: https://de.mathworks.com/discovery/cluster-analysis.html

Dort wird zwischen folgenden 4 Algorithmenarten des Clusterings unterschieden:


    - Hierarchisches Clustering

    - k-Means-Clustering

    - Gaussian Mixture Models

    - Selbstorganisierende Karten



Ich mache das bis jetzt regelbasiert und habe mir vorher auch nicht überlegt, welche Clustering-Methoden es gibt und welche die beste für mich ist. Ich habe direkt mit den Daten gearbeitet und mir diese Bedingungen und Regeln überlegt. Nun versuche ich alles zu kombinieren, um ein automatisiertes Clustering zu erreichen.

Ich würde gerne eure Meinung dazu hören, da es hier bestimmt den einen oder anderen Clustering-Experten gibt, bevor ich näher zum Programmieren und zum Code komme.

cluster_struktur.png
 Beschreibung:

Download
 Dateiname:  cluster_struktur.png
 Dateigröße:  40.04 KB
 Heruntergeladen:  253 mal
Private Nachricht senden Benutzer-Profile anzeigen


Harald
Forum-Meister

Forum-Meister


Beiträge: 24.495
Anmeldedatum: 26.03.09
Wohnort: Nähe München
Version: ab 2017b
     Beitrag Verfasst am: 30.01.2020, 10:06     Titel:
  Antworten mit Zitat      
Hallo,

sieht so aus, als ob du fitctree verwenden könntest, um deine händische Vorgehensweise zu automatisieren.
https://de.mathworks.com/help/stats/view-decision-tree.html

Grüße,
Harald
_________________

1.) Ask MATLAB Documentation
2.) Search gomatlab.de, google.de or MATLAB Answers
3.) Ask Technical Support of MathWorks
4.) Go mad, your problem is unsolvable ;)
Private Nachricht senden Benutzer-Profile anzeigen
 
Tobi92
Themenstarter

Forum-Anfänger

Forum-Anfänger


Beiträge: 10
Anmeldedatum: 04.12.18
Wohnort: ---
Version: ---
     Beitrag Verfasst am: 30.01.2020, 10:15     Titel:
  Antworten mit Zitat      
Vielen Dank für deine Antwort.

Das ist dann aber kein Clustering mehr, sondern eine Klassifikation. Ich muss jedoch eine Clusteringmethode auf mein Beispiel anwenden.
Private Nachricht senden Benutzer-Profile anzeigen
 
Harald
Forum-Meister

Forum-Meister


Beiträge: 24.495
Anmeldedatum: 26.03.09
Wohnort: Nähe München
Version: ab 2017b
     Beitrag Verfasst am: 30.01.2020, 10:36     Titel:
  Antworten mit Zitat      
Hallo,

ich sehe mich jetzt nicht als der absolute Statistik-Experte, aber die von dir beschriebene bisher gewählte Vorgehensweise ist ja dann gerade Klassifikation. Auf dieser Basis lässt sich für mich nicht sagen, welche Methode des Clustering du nun anwenden solltest. Am ehesten dürfte clusterdata bzw. pdist / linkage / cluster passen.

Grüße,
Harald
_________________

1.) Ask MATLAB Documentation
2.) Search gomatlab.de, google.de or MATLAB Answers
3.) Ask Technical Support of MathWorks
4.) Go mad, your problem is unsolvable ;)
Private Nachricht senden Benutzer-Profile anzeigen
 
Tobi92
Themenstarter

Forum-Anfänger

Forum-Anfänger


Beiträge: 10
Anmeldedatum: 04.12.18
Wohnort: ---
Version: ---
     Beitrag Verfasst am: 30.01.2020, 10:48     Titel:
  Antworten mit Zitat      
Vielen Dank für die weiteren Tipps. Ich gucke mir die an.

Das ist auch übrigens genau das Problem. Ich muss ein Clustering machen, aber meine bisherige Vorgehensweise gleicht einer Klassifikation und hat nur wenig mit dem eigentlichen Clustering zu tun. Deshalb habe ich den Thread gestartet, da ich aus meiner Klassifikation gerne ein Clustering machen würde.
Private Nachricht senden Benutzer-Profile anzeigen
 
Neues Thema eröffnen Neue Antwort erstellen



Einstellungen und Berechtigungen
Beiträge der letzten Zeit anzeigen:

Du kannst Beiträge in dieses Forum schreiben.
Du kannst auf Beiträge in diesem Forum antworten.
Du kannst deine Beiträge in diesem Forum nicht bearbeiten.
Du kannst deine Beiträge in diesem Forum nicht löschen.
Du kannst an Umfragen in diesem Forum nicht mitmachen.
Du kannst Dateien in diesem Forum posten
Du kannst Dateien in diesem Forum herunterladen
.





 Impressum  | Nutzungsbedingungen  | Datenschutz | FAQ | goMatlab RSS Button RSS

Hosted by:


Copyright © 2007 - 2025 goMatlab.de | Dies ist keine offizielle Website der Firma The Mathworks

MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.