Startseite » Datenbank Lexikon » Statistisches Modell

Statistisches Modell

Ein statistisches Modell ist eine mathematische Darstellung eines physikalischen Prozesses (z.B. die Mortalität und Morbidität einer Population mit bestimmten Attributen), die zum Beispiel im Business Intelligence-Bereich verstärkt eingesetzt werden.

Einige Modelle können kein statistisches Element aufweisen, zum Beispiel Cash-Flow-Modelle im Finanzbereich.

Viele Modelle verwenden statistische Methoden, um Näherungswerte zukünftiger Ereignisse auf der Grundlage vergangener Ereignisse abzuleiten oder die zugrundeliegenden Mechanismen vergangener Ereignisse besser zu verstehen.

Besonders im Data Mining- und Data Science-Bereich werden verschiedene statistische Modelle eingesetzt, um ein besseres Ergebnis zu erzielen.

Statistische Modelle im Überblick – welche statistischen Modelle gibt es?

Clustering

Das Clustering ist eine iterative Methode, um eine Population in Gruppen so aufzuteilen, dass die Mitglieder jeder Gruppe mehr miteinander teilen als die Mitglieder einer anderen Gruppe.

Dieser Ansatz wird häufig bei der Segmentierung von Kunden nach bestimmten Attributen oder Körben von Attributen (z. B. Demographie, Verhaltenshaltung usw.) verwendet.

Lineare Regression

Eine Lineare Regression wird eingesetzt, wenn Daten aus Paaren wie Eingabewert und Ausgabewert bestehen. Dann kann es auf der x (Eingabe) und y (Ausgabe) Achse eines Graphen aufgetragen werden.

Eine lineare Regression ist gleichbedeutend mit Zeichnen einer Linie der besten Anpassung an die resultierende x-y-Grafik. Die Linie, die am besten passt, minimiert den Abstand von allen geplotteten Punkten und Salden und teilt die Punkte in ungefähr gleiche Populationen.

Dieser Ansatz kann auf mehr als einen Eingabewert skaliert werden, solange ein einzelner Ausgabewert verbleibt, also x-Achse (Eingang 1), y-Achse (Eingang 2) und z-Achse (Ausgang).

Logistische Regression

Die Logistische Regression ist eine Form der Regression, bei der wieder (vielleicht mehrere) Eingabewerte und ein Ausgabewert vorhanden sind, aber die Ausgabe kann nur diskrete Werte (z. B. bestanden oder nicht bestanden, Abstimmung für einen der Kandidaten A, B oder C) und nicht kontinuierliche Werte annehmen.

Multivariate Analyse

Die Multivariate Analyse deckt den Fall ab, in dem es mehr als einen Ausgabewert gibt, d. h. mehr als eine Variable, daher multivariabel.

Zum Beispiel können für Fahrzeuge die Variablen Anzahl der Sitze, Gewicht, Länge usw. erhoben werden. In der univariaten Analyse hingegen wird jede Variable einzeln analysiert.

Zusammenhangs- bzw. Abhängigkeitsstrukturen zwischen den Variablen, z. B. größere Anzahl von Sitzen bedingt ein größeres Gewicht, können nur mit einer multivariaten Analyse, nicht aber mit einer univariaten Analyse erkannt werden.

Sensitivitätsanalyse

Die Sensitivitätsanalyse bestimmt, wie die Variabilität in der Ausgabe eines Modells mit der Variabilität seiner Eingaben zusammenhängt.

Zum Beispiel, wie sich eine Änderung des Produktpreises auf die Profitabilität auswirkt (weniger Umsatz in eine Richtung, mehr Wert pro Verkauf in die andere Richtung).

Zeitreihenanalyse

Eine Zeitreihenanalyse beinhaltet eine Menge von Daten, die nach der Zeit geordnet werden können, z.B. Verkauf pro Tag, Schlusskurs pro Tag, Durchschnittstemperatur pro Monat und so weiter.

Die Zeitreihenanalyse definiert den Prozess des Erkennens von Trends und Mustern in dieser Art von Daten, normalerweise mit dem Ziel, Vorhersagen darüber zu treffen, wie sich die Daten in der Zukunft verhalten werden.

Der Begriff der Zeitreihenanalyse kann vieles umfassen, von dem Zeichnen eines einfachen Liniendiagramms mit der Zeit als eine Achse bis zum Verwenden einer mathematischen Technik, die Fourier-Analyse genannt wird, um das Spektrum einer Zeitreihe zu erzeugen, die ein zyklisches Element (z.B. Saisonalität) besitzt.

Weiterführende Artikel

Autor: Markus
2 Bewertungen 1 Stern2 Sterne3 Sterne4 Sterne5 Sterne
Loading...
0