Blogeinträge
share
27.01.2022
Small Data kann Prognosen

Big Data hat inzwischen jede/r zur Genüge gehört, der/die sich mit der Digitalisierung auseinandersetzt. Und allen ist klar, dass in diesen Datenmengen großes Potenzial steckt. Wie aber ist es mit kleineren Datenmengen, die in KMUs oftmals vorliegen, in Unternehmen, in denen erst seit jüngerer Vergangenheit Fokus auf das Potenzial von Daten gelegt wird?

Liebe Besucher*innen des progBlogs,

in diesem Blogbeitrag von 2019 haben wir zum ersten Mal über das Thema „Small Data“ berichtet. Selbst nach fast drei Jahren in einer schnelllebigen Zeit ist die Bedeutung des Themas nicht geschmälert. Zwar haben viele Unternehmen inzwischen reagiert und sammeln Daten – und damit oft auch viele Daten. Andererseits aber gibt es immer noch eine Vielzahl, die sich erst seit Kurzem so richtig mit dem Thema „Daten“ beschäftigt oder die mit einer eher kleinen Datenhistorie leben muss: Hierzu gehören z. B. KMUs, die den Digitalisierungsschub der vergangenen beiden Corona-Jahre gespürt haben und ihn in für sie neuer Weise nutzen möchten, erst kürzlich neu gegründete oder neu strukturierte Unternehmen, oder Unternehmen, die nach einer Umstellung z. B. ihres ERP-Systems datentechnisch beinahe einen Reset erlebt haben. Nicht nur die Unternehmensgröße oder das Unternehmensalter spielen hierbei also eine Rolle, sondern beispielsweise auch das zu untersuchende Phänomen: Selbst innerhalb eines Traditionsunternehmens gehen neue Use Cases gelegentlich mit einer kleinen Datenhistorie einher: Da die analytische Verarbeitung der Daten erst neuerdings im Vordergrund steht, müssen Anforderungen an die Datenstruktur und -qualität erst umgesetzt werden.

Wir haben im vergangenen Oktober in einem Onlinevortrag auf der WueWW das Thema „Small Data“ wieder aufgegriffen und anhand eines konkreten Beispiels einmal etwas detaillierter hineingeschaut, mit welchen Techniken man basierend auf kleinen Datenmengen Prognosen erstellen kann. Gerne möchten wir einen im Vortrag vorgestellten Transfer-Learning-Ansatz auch in diesem Blogbeitrag teilen.

Das Beispiel Sales Forecasting mit Small Data

Ein junges Start-up-Unternehmen besitzt ein stetig wachsendes Portfolio an unterschiedlichen Produkten. Die Verkaufszahlen der einzelnen Produkte in den nächsten Monaten möglichst gut einschätzen zu können, steigert die Effizienz von internen Beschaffungsprozessen und vermeidet Lieferschwierigkeiten. Die manuelle Planung möglichst frühzeitig durch KI-gestützte Verfahren zu ergänzen, stellt die Weichen für einen höheren Automatisierungsgrad, der bei einer weiteren Unternehmensskalierung unabdingbar wird. Eine Herausforderung für datenbasierte Forecasting-Algorithmen ist an dieser Stelle sicherlich die relativ kurze Datenhistorie, da die Sales-Historie mit maximal drei Jahren (36 Datenpunkte auf Monatsbasis) gegeben ist und viele neue Produkte mit einer deutlich kürzeren Datenhistorie vorliegen können. Zudem ist aus Business-Sicht bei vielen Produkten ein ‚Gefühl‘ von saisonalen Effekten vorhanden: Suppen verkaufen sich im Winter stärker als in den Sommermonaten. Die einzelnen Suppenprodukte, z. B. Gemüsesuppe, weisen eine zu kurze oder teilweise zu volatile Verkaufshistorie auf, um diese Saisonalität in valider Weise direkt auf der Einzelproduktebene abzuleiten und für die Forecasts zu nutzen.

Prognose von Artikelmengen trotz kurzer Historie

Abbildung: Saisonaler Forecast durch Transfer-Learning-Ansatz für ein Produkt mit einer Datenhistorie von nur 3 Monaten.

Eine sinnvolle Strategie ist hier ein Transfer-Learning-Ansatz mit Modulation durch saisonale Transitionsfaktoren. Die Einzelprodukte werden hierbei zunächst in Produktgruppen geclustert. Auf der deutlich stabileren aggregierten Historie lässt sich ein gemeinsames Saisonalitätsmuster erkennen und datenbasiert schätzen. Über Transitionsfaktoren kann dieses Saisonalitätsmuster dann Eingang finden in Prognosemodelle, die individuell für jedes Einzelprodukt trainiert werden. Die (noch) knappe Datenhistorie gewährt wenig Raum für umfangreiche Kreuzvalidierungsstrategien und historische Simulationen. Ein agiler Ansatz ist hier genau richtig:

  1. Starte mit geringem Aufwand und einem Minimal Viable Product.
  2. Monitore die Forecast Performance im Live-Modus.
  3. Identifiziere Verbesserungspotentiale und priorisiere diese nach Aufwand und Nutzen. Solche Erweiterungen können z. B. der Einbezug von Zusatzinformation sein, etwa bereits vorliegender Bestellungen eines Produkts für die Zukunft oder die gezielte Analyse des Bestellverhaltens einzelner Kunden, die ein Produkt kaufen.
  4. Profitiere von der frühzeitigen Weichenstellung eines datenbasierten Vorgehens mit wachsender Datenmenge durch Zeit- und Kostenersparnis, einer sehr guten Skalierbarkeit sowie durch objektive, planerunabhängige Prognosen.

Small Data ist sehr wertvoll

Wenn man auch manchmal Nicht-Standard-Analysetechniken anwenden muss und Zusammenhänge und Interpretationen der Daten noch genauer ansehen und einsetzen muss, kann man auf kleinen Datenmengen durchaus robuste Modelle und wertvolle Prognosen bilden. Nebenbei haben Small-Data- ggü. Big-Data-Lösungen den Vorteil, dass die Modelle oft anschaulicher und besser interpretierbar sind als typische Big-Data-Modelle, die so manches Mal als Blackbox erscheinen. Außerdem zwingt Small Data den Anwender gewissermaßen zu einem agilen Entwicklungsansatz, der bei datenbasierten Lösungen sowieso oft empfehlenswert ist. Gemeinsam mit den Datenmengen kann auch die Lösungsstrategie wachsen und sich jederzeit geeignet auf die veränderte Datenlage anpassen. In vielen Fällen kann es damit sogar eine bewusste Entscheidung sein, Big Data statt Small Data zu analysieren, und sich gezielt auf eine bedeutungsstärkere, evtl. transformierte, Datenteilmenge zu konzentrieren, was auch unter dem Stichwort „Smart Data“ bekannt ist. Es lohnt sich also, auch mit kleinen Datensätzen zu arbeiten. Dennoch sollte man die Chance des größer werdenden Datensatzes nicht verpassen. Mehr Daten tragen doch zumindest potentiell mehr Informationen in sich, und man hat dann immerhin die Wahl, wie man mit den Daten umgehen möchte.

Weitere Anwendungsmöglichkeiten von Small-Data-Techniken

Da wir uns in diesem Blogbeitrag in erster Linie auf den oben genannten Sales-Forecasting-Use-Case fokussiert haben, möchten wir Ihnen hier zumindest einmal in einer kurzen Übersicht Bereiche nennen, in denen Ihnen Small Data (auch) begegnen kann und für die passende Lösungsstrategien entwickelt werden können:

  1. Sales Forecasting / Demand Planning / Logistik / Produktion: Oft liegt eine kurze Datenhistorie oder ein kurzer Lebenszyklus von Produkten vor.
  2. Monitoring und Anomalie-Erkennung: Maschinenausfälle, die möglichst frühzeitig über charakteristische Patterns aus Sensormessung identifiziert werden können, sind idealerweise seltene Vorkommnisse, sodass meist nur wenige historische Trainingsbeispiele zur Verfügung stehen.
  3. Computer Vision: Bei der Bildklassifikation mit Neuronalen Netzen gibt es gelegentlich nur eine geringe Anzahl an vorliegenden Beispielbildern.
  4. Finance / Umsatz: Anstatt direkt mit Big Data (viele Redundanzen) zu arbeiten, ist es oft von Vorteil, über Dimensionsreduktionstechniken den Informationsgehalt der Daten in passenden aggregierten Größen zu kondensieren. In simpelster Form kann das z. B. eine Aggregation auf ein hohes hierarchisches oder zeitliches Level sein. In vielen Fällen ist es eine gute und sinnvolle Entscheidung, bewusst von Big Data zu Small Data überzugehen.
  5. Klinische & soziologische Forschung: Die Fallzahl in Studien ist begrenzt auf Grund von ethischen Aspekten, seltenen Krankheitsbildern, personellen Kapazitäten (Datenerhebung) etc.

Falls gewünscht, können wir in einem zukünftigen Beitrag einmal einen der anderen genannten Bereiche etwas genauer unter die Lupe nehmen. Lassen Sie uns wissen, was Sie interessiert und teilen Sie Ihre Meinung mit uns über Twitter, Xing oder LinkedIn oder schreiben Sie uns eine E-Mail an business.development@prognostica.de.

Falls Sie sich noch einmal unseren Blogbeitrag über Small Data von 2019 in Erinnerung rufen möchten, geht es hier lang:

Vorheriger Eintrag: 7 Fragen an ... Katharina Donath, Data Scientist bei prognostica
Nächster Eintrag: 10 Eigenschaften eines guten Forecasts

Sie möchten mehr über künstliche Intelligenz und ihr Potenzial erfahren? Nutzen Sie die Vorteile und trauen Sie sich, in Ihr erstes KI-Projekt zu starten:

Jetzt kostenlos E-Book downloaden

Kontakt

prognostica GmbH
Prymstr. 3
D-97070 Würzburg
P: +49 931 497 386 0

Ihr Partner für Predictive Analytics und Data Science.

Weitere Angaben, u. a. zum Datenschutz, finden Sie in unserem Impressum und unserer Datenschutzerklärung.

Folgen Sie uns!

© 2022 prognostica GmbH

Kontakt