Data Analytics

Dienstleistungen
Data Wrangling
DATA WRANGLING beschreibt den Prozess der Datenaufbereitung und Transformation für nachgelagerte Analyseanwendungen wie Business Intelligence (BI), Data Mining und Data Prototyping. Im Kern stellt DATA WRANGLING einen Datentransformationsprozess dar, bei dem Daten aus mehreren verschiedenen Quellsystemen in einem oder mehreren sogenannten Datamarts vereinigt werden. Bei der Vereinigung von Datenquellen können Datenduplikate entstehen oder Daten falsch formatiert werden, was in den nachgelagerten Prozessschritten zu Problemen führt. Daher ist eine anschliessende Bereinigung, bekannt als DATA CLEANING, unerlässlich.
Anwendungsfälle
-
Konzipierung und Aufbereitung von Datamarts
Optimierung und Weiterentwicklung bestehender Datamarts
-
Aufbereitung historischer Zeitreihendaten (Zeitreihen- und Tick-Daten).
Data Cleaning
DATA CLEANING erfolgt im Anschluss an DATA WRANGLING. Dabei werden Duplikate und irrelevante Datensätze entfernt, strukturelle Fehler korrigiert, Ausreisser (Outliers) beseitigt, fehlende Werte ergänzt oder entfernt und abschliessend eine Qualitätskontrolle durchgeführt. Dieser Schritt ist oft zeitaufwendig und entscheidend für die Qualität der Analyseergebnisse. Es gilt die Faustregel, dass etwa 80% der Zeit auf DATA WRANGLING und DATA CLEANING und nur etwa 20% auf die eigentliche Analyse entfallen. Dies unterstreicht das Effizienzsteigerungspotenzial im Bereich der Datenaufbereitung und der Datenbereinigung.
Anwendungsfälle
-
Daten Duplikate
Fehlende Datenpunkte
Formatierungsfehler bei nummerischen und textbasierten Daten
-
Entfernung Daten-Duplikate
Bereinigung Extremwerte (Outliers)
Bereinigung fehlender Daten
Data Prototyping
DATA PROTOTYPING bezeichnet den Prozess, bei dem eine vorläufige Testversion eines Datamarts, Datenmodells oder einer Datenvisualisierung erstellt wird, um das Design und die Funktionalität eines datenbezogenen Projekts vor der umfangreichen Implementierung zu testen, zu bewerten und zu optimieren. DATA PROTOTYPING ermöglicht es Unternehmen, potenzielle Probleme frühzeitig zu identifizieren und notwendige Anpassungen vorzunehmen, was das Risiko teurer Fehler reduziert und die Gesamtqualität und Effektivität des endgültigen Datenprodukts oder Datenprozesses verbessert. DATA PROTOTYPING findet häufig Anwendung in der Entwicklung datengesteuerter Prozesse.
Anwendungsfälle
-
Data Wrangling
Data Cleaning
Data Analytics
-
Simulation Daten Ladeprozesse
Koordination Daten Stakeholder
Data Analytics
DATA ANALYTICS beschreibt den Prozess der Untersuchung und Analyse von Daten, um Trends und Muster zu erkennen. Die daraus resultierenden Erkenntnisse zielen darauf ab, Entscheidungsfindungsprozesse zu verbessern und zu beschleunigen (data-driven-decision-making). Die gewonnenen Erkenntnisse werden in der Regel in Form von Reporting-Dashboards visualisiert oder an angeschlossene Umsysteme geliefert. Im digitalen Zeitalter gibt es unzählige Anwendungsbereiche. Besonders relevant ist Data Analytics im Bereich von Industrie 4.0 und künstlicher Intelligenz.
Anwendungsfälle
-
Beschreibende Statistikauswertungen
Regressionsanalysen (Supervised Machine Learning)
Classification (Supervised Machine Learning)
Clustering (Unsupervised Machine Learning)
Hauptkomponenten Analyse (Unsupervised Machine Learning)
Monte-Carlo Simulationen
Zeitreihen Simulationen (Forecasting und Backtesting)
-
Daten Visualisierungen
Daten Storytelling