Daten

Die Ausgangsdaten für die Analyse müssen als CSV-File vorhanden sein. Es sind mindestens zwei Spalten notwendig

Das CSV-File sollten im Ecoding UTF-8 gespeichert sein. Als Trennzeichen zwischen den Spalten wird ";" angenommen. Dezimalzeichen ist "," und es sind keine Trennungszeichen für Tausender und ähnliches erlaubt.

Datumsformat

Zur Zeit ist das Datumsformat noch fix vorgegeben, das wird in der nächsten Version geändert, so dass aus unterschiedlichen Datumsformaten ausgewählt werden kann. Derzeit ist das Datumsformat auf YYYY-MM-DD fixiert.

Zielgröße

Die Zielgröße ist jene Größe, für die eine Vorhersage gemacht werden soll. Zur Zeit sind nur postive Werte und 0 erlaubt. Monate die im Datensatz nicht aufscheinen werden als 0 angenommen und automatisch ergänzt. Gibt es zu einem Monat mehrere Werte, so werden diese aufsummiert.

Gruppierungsvariable

Optional kann eine Gruppierungsvariable, die unterschiedliche Kategoeiren enthält, angegeben werden. Ist das der Fall, dann wird für jede Kategorie ein eigenes Modell gerechntet. So eine Gruppierungsvariable könnte zum Beispiel Filialen, Materialien und regionale Einheiten sein.

Zusammenfassen von Kategorien

Kategorien einer Gruppierungsvariable, für die kein passendes Modell gefunden wird, werden zu einer Kategorie zusammengefasst. Für diese kumulierte Kategorie wird dann ebenfalls ein Modell berechnet und eine Vorhersage ausgegeben.

Spezifikation

Zuordnung der Daten

Bei der Spezifikation ist es möglich unterschiedliche Spalten aus dem Datensatz den einzelnen Variablen (Datum, Zielgröße, Gruppierung) zuzuordnen. Dadurch ist es möglich einen bereits hochgelandenen Daternsatz nach unterschiedlichen Aspekten zu analysieren.

.

Zeiteinheit

Im Moment ist es nur möglich Daten auf monatlicher Basis zu modellieren um Vorhersagen zu treffen. Dies wir in späteren Versionen sukzessiv auf Wochen und Tage ausgeweitet.

Treshold für Vorhersagegenauigkeit

Dieser Treshold gibt an, ab welcher Vorhersagegenauigkeit ein Modell für eine Kategorie als ausreichend erachtet wird. Liegt die Genauigkeit eines Modells über diesem Wert, so kommt diese Kategorie in den Pool jener, die am Ende zu einer Kategorie zusammengefasst werden.

Modellierung

Auswahl des besten Modells aus einer Vielzahl von unterschiedlichen Modellklassen

Bei der Modelllierung werden Modelle aus unterschiedlichen Modellklassen an die Daten angepasst. Ziel ist es dabei ein Modell zu finden, welches das Muster in den historischen Daten am besten abbildet.

Er wird die Annahme getroffen, dass sich dieses Muster auch in der Zukunft vortsetzt. Unter dieser Annahme kann die Vorhersage und die dazu angegebene Genauigkeit als valide angesehen werden. Es kann natürlich jedezeit sein, dass sich dieses Muster ändert und die Vorhersagen daher nicht mehr valide ist.

Modellfindung

Für die Analyse wird der Datensatz in zwei Teile geteilt. Es werden die ersten 80% der Daten dafür verwendet, um in jeder Modellklasse das beste Modell auszuwählen. Die restlichen 20% der Daten werden dann dazu verwendet um die Vorhersagengenauigkeit der einzelnen Modelle zu bestimmen. Es wird jenes Modell ausgewählt, welches die höchste Genauighkeit aufweist.

Vorhersage

Ist das beste Modell gefunden, so werden alle Daten verwendet um anhand diesen Modells die Vorhersage für das nächste Monat zu treffen. Als Vorhersagegenauigkeit wird der Wert aus dem Validierungsschritt verwendet. Es werden untere und obere Grenzen für die Genauigkeit angegeben, die einer Abwichung von ± 1 Standardabweichung entsprechen.

Ergebnis

Vorhersage für das nächste Monat.

Das Ergebnis der Analyse ist die Vorhersage der Zielgöße für das nächste Monat. Zusätzälich wird die Genauigkeit dieser Vorhersage angegeben.

Graphische Darstellung

Im Liniendiagramm sind drei Linien über die Zeit aufgetragen. Die schwarze Linie gibt die beobachteten Werte wieder. Die hellblaue Linie beschreibt jene Werte die das Modell für den Trainingszeitraum berechnet hat. Dieser Bereich geht bis zur roten horizontalen Linie. Die rote Linie beschreibt jene Werte die das Modell für den Testzeitraum vorhergesagt hat. Die Abweichung der roten Punkte zu den schwarzen Punkten wird verwendet um die Vorhersagegenauigkeit zu berechnen. Der rote Punkt rechts von der goldenen horizontalen Linie ist die Vorhersage für das nächste Monat. Die horizontal eingezeichneten Linien beschreiben die Genauigkeit der Vorhersage in Form von ± 1 Standardabweichnung.

Tabelle

In der Tabelle ist für jeder Kategorie der vorhergesagte Wert und die unteren und oberen Schranken für die Genauigkeit angegeben. Zusätzlich ist die Reduktion der Unsicherheit im Verhältnis zu einem fortgeschriebenen arithmetischen Mittel angegeben. Dieser Wert liegt zwischen 1 und 0. Je näher dieser bei 0 ist, desto größer ist die Reduktion der Unsicherheit im Vergleich zu einem fortgeschriebene arithm. Mittel. Anders Ausgedrückt bedeutet ein kleiner Wert eine hohe Genauigkeit und somit eine sehr valide Vorhersage für das nächste Monat.