|
|
Multivariate lineare oder doch nichtlineare Regression? |
|
TWS |
Gast
|
|
Beiträge: ---
|
|
|
|
Anmeldedatum: ---
|
|
|
|
Wohnort: ---
|
|
|
|
Version: ---
|
|
|
|
|
|
Verfasst am: 14.01.2017, 08:19
Titel: Multivariate lineare oder doch nichtlineare Regression?
|
|
|
|
|
Hallo,
ich habe einen großen Satz x und y Messdaten (200T Zeilen). Ziel ist es möglichst genau von x auf y schließen zu können. Zeichne ich x und y in einen Scatter-Plot ergibt das zwar einen recht guten Korrelationskoeffizienten (die Punktewolke verläuft schräg nach oben) aber die Spreizung / Streuung in y-Richtung ist doch recht hoch, zu hoch sozusagen.
Frage 1:
Ist es unter diesen Ausgangsbedingungen mit weiteren Prädiktoren (x) überhaupt möglich ein besseres Ergebnis zu erziehlen? Eine bessere Vorhersage.
Frage 2:
Ich verfüge über weitere Prädiktoren die eigentlich - nach Verständnis - einen Einfluss auf y haben müssten. Allerdings kann ich nicht sagen welchen. Wie kann ich denn unter Einbeziehung dieser weiteren Prädiktoren eine bessere Näherung gestalten? Wie gesagt, ich weiß nicht ob linear oder nichtlinear oder wie ihr Einfluss eben ist. Wie finde ich das heraus und wie gehe ich damit dann in MATLAB um, welche Funktion hilft hier?
Im Anhang die Punktewolke über Prädiktor x1 und als Beispiel auch über x2 und x3.
Danke schonmal!
Beschreibung: |
|
Download |
Dateiname: |
y über x3.PNG |
Dateigröße: |
99.4 KB |
Heruntergeladen: |
480 mal |
Beschreibung: |
|
Download |
Dateiname: |
y über x2.PNG |
Dateigröße: |
73.68 KB |
Heruntergeladen: |
476 mal |
Beschreibung: |
y über x1 (Primärer Prädiktor) |
|
Download |
Dateiname: |
y über x1.PNG |
Dateigröße: |
82.18 KB |
Heruntergeladen: |
461 mal |
|
|
|
|
|
Harald |
Forum-Meister
|
|
Beiträge: 24.492
|
|
|
|
Anmeldedatum: 26.03.09
|
|
|
|
Wohnort: Nähe München
|
|
|
|
Version: ab 2017b
|
|
|
|
|
|
Verfasst am: 14.01.2017, 10:00
Titel:
|
|
Hallo,
die zusammengefasste Antwort: das hängt von deinen Daten ab.
Zu 1.: Durchaus. Stelle dir z.B. vor, dass x2 im wesentlichen angibt, wie weit du im Plot von x1 von der Gerade weg bist.
Was ich als ersten Schritt machen würde: visualisiere mal y in Abh. von x1 und nutze dann x2 oder x3 als Farbe (4. Argument von scatter), damit du siehst, ob da ein Zusammenhang wie der gerade erwähnte besteht.
Ich würde es dann mal mit
stepwiselm
versuchen, um auch Interaktionen soweit relevant zu berücksichtigen.
Grüße,
Harald
|
|
|
TWS |
Gast
|
|
Beiträge: ---
|
|
|
|
Anmeldedatum: ---
|
|
|
|
Wohnort: ---
|
|
|
|
Version: ---
|
|
|
|
|
|
Verfasst am: 15.01.2017, 11:10
Titel: Weitere Vorgehensweise
|
|
|
|
|
Danke schonmal für Deine Hilfe!
Anbei der Scatter-Plot mit x und y und dann jeweils eingefärbt nach einem der 6 weiteren Prädiktoren (x1:x6).
Über stepwiselm(...,'PEnter',0.06) ist der R-squared Fehler mit fast 0.8 allerdings zu groß (Wertebereich y geht von -3 bis 6).
Entweder ich habe falsche Prädiktoren, der Fehler ist so groß wegen Ausreißern nach denen man praktisch nicht optimieren kann oder aber es ist nicht ausschließlich (oder überhaupt) ein linearerer Zusammenhang gegeben, richtig?
Beschreibung: |
Eingefärbt nach Prädiktor x5 |
|
Download |
Dateiname: |
x5.png |
Dateigröße: |
711.35 KB |
Heruntergeladen: |
484 mal |
Beschreibung: |
Eingefärbt nach Prädiktor x4 |
|
Download |
Dateiname: |
x4.png |
Dateigröße: |
742.19 KB |
Heruntergeladen: |
475 mal |
Beschreibung: |
Eingefärbt nach Prädiktor x3 |
|
Download |
Dateiname: |
x3.png |
Dateigröße: |
727.96 KB |
Heruntergeladen: |
470 mal |
Beschreibung: |
Eingefärbt nach Prädiktor x2 |
|
Download |
Dateiname: |
x2.png |
Dateigröße: |
743.23 KB |
Heruntergeladen: |
466 mal |
Beschreibung: |
Eingefärbt nach Prädiktor x1 |
|
Download |
Dateiname: |
x1.png |
Dateigröße: |
550.99 KB |
Heruntergeladen: |
496 mal |
|
|
|
TWS |
Gast
|
|
Beiträge: ---
|
|
|
|
Anmeldedatum: ---
|
|
|
|
Wohnort: ---
|
|
|
|
Version: ---
|
|
|
|
|
|
Verfasst am: 15.01.2017, 11:10
Titel: Prädiktor x6 vergessen
|
|
Prädiktor x6 vergessen
Beschreibung: |
|
Download |
Dateiname: |
x6.png |
Dateigröße: |
750.72 KB |
Heruntergeladen: |
473 mal |
|
|
|
Harald |
Forum-Meister
|
|
Beiträge: 24.492
|
|
|
|
Anmeldedatum: 26.03.09
|
|
|
|
Wohnort: Nähe München
|
|
|
|
Version: ab 2017b
|
|
|
|
|
|
Verfasst am: 15.01.2017, 12:12
Titel:
|
|
Hallo,
was meinst du mit zu großem R squared-Fehler?
Das R² - Maß geht doch von 0 (extrem schlecht) bis 1 (perfekt). Ein "zu groß" gibt es demnach nicht.
Grüße,
Harald
|
|
|
TWS |
Gast
|
|
Beiträge: ---
|
|
|
|
Anmeldedatum: ---
|
|
|
|
Wohnort: ---
|
|
|
|
Version: ---
|
|
|
|
|
|
Verfasst am: 16.01.2017, 09:33
Titel: Root Mean Squared Error
|
|
|
|
|
Hi,
richtig, ich hatte versehentlich die falsche Begrifflichkeit verwendet.
Ich hatte nun verschiedene Varianten von stepwiselm probiert und hierbei x1:x6 konstant gehalten aber alternativ auch ein anderes x verwendet, dass von vornenherein deutlich besser zu korrelieren scheint (siehe Anhang).
Ebenfalls im Anhang dargestellt sind y über x und x1:x6 (Einfärbung entsprechend x1:x6).
Allerdings komme ich mit stepwiselm - ungeachtet der Prädiktoren und der Varianten - nicht unter einen Root-Mean-Squared-Error von ca. 0.3 (R-squared liegt bei .92 bis .93)
Kann man sagen:
Hätte ich weitere passende Prädiktoren wäre es theoretisch möglich näher ranzukommen aber praktisch wahrscheinlich nicht? Die Outlier in den Diagrammen fallen ja auf.
Und:
Wie verwende ich denn nun so ein stepwiselm-Objekt? Kann ich es nicht mit weiteren x-Werten füttern um einen y-Wert zu erhalten?
Vielen Dank!
Beschreibung: |
Anfangs verwendetes x und neues x (jeweils zuzüglich x1:x6) |
|
Download |
Dateiname: |
x_anfangs und x_neu.PNG |
Dateigröße: |
145.93 KB |
Heruntergeladen: |
471 mal |
Beschreibung: |
Weitere Prädiktoren x1-x6 |
|
Download |
Dateiname: |
Weitere Prädiktoren x1-x6.png |
Dateigröße: |
375.72 KB |
Heruntergeladen: |
526 mal |
|
|
|
Harald |
Forum-Meister
|
|
Beiträge: 24.492
|
|
|
|
Anmeldedatum: 26.03.09
|
|
|
|
Wohnort: Nähe München
|
|
|
|
Version: ab 2017b
|
|
|
|
|
|
Verfasst am: 16.01.2017, 12:38
Titel:
|
|
|
|
TWS |
Gast
|
|
Beiträge: ---
|
|
|
|
Anmeldedatum: ---
|
|
|
|
Wohnort: ---
|
|
|
|
Version: ---
|
|
|
|
|
|
Verfasst am: 17.01.2017, 15:17
Titel: Weitere Tipps
|
|
Verstehe, funktioniert aber dauert schon einige Zeit wenn man einige Werte so berechnen möchte.
Da Du Dich mit dieser Thematik gut auszukennen scheinst:
Hast Du noch Tipps oder kennst Du weitere Möglichkeiten wie man bei so einer Datengrundlage bzw. Aufgabenstellung vorgehen kann?
Meine Idee war nun:
Ich schau mir die Tage mit vielen Ausreißern an und wenn sie auf offensichtlichen Messfehlern oder sonstigen seltenen Ereignissen beruhen entferne ich sie aus den Daten oder wähle eine Robust-Methode und prüfe dann anschließend ob es lohnt über x (Strom) hinaus weitere Prädiktoren zu berücksichtigen (oder ob es auch eine simple Regressions-Gerade Q über I tut).
|
|
|
|
|
Einstellungen und Berechtigungen
|
|
Du kannst Beiträge in dieses Forum schreiben. Du kannst auf Beiträge in diesem Forum antworten. Du kannst deine Beiträge in diesem Forum nicht bearbeiten. Du kannst deine Beiträge in diesem Forum nicht löschen. Du kannst an Umfragen in diesem Forum nicht mitmachen. Du kannst Dateien in diesem Forum posten Du kannst Dateien in diesem Forum herunterladen
|
|
Impressum
| Nutzungsbedingungen
| Datenschutz
| FAQ
| RSS
Hosted by:
Copyright © 2007 - 2024
goMatlab.de | Dies ist keine offizielle Website der Firma The Mathworks
MATLAB, Simulink, Stateflow, Handle Graphics, Real-Time Workshop, SimBiology, SimHydraulics, SimEvents, and xPC TargetBox are registered trademarks and The MathWorks, the L-shaped membrane logo, and Embedded MATLAB are trademarks of The MathWorks, Inc.
|
|