Heute fallen in Unternehmen und Organisationen immer mehr und größere Datenmengen an. In diesen "Big Data" ist wertvolles Wissen verborgen. Die Extraktion dieses Wissens erfordert umfassende Kenntnisse aus Mathematik und Statistik, Informatik und anderen Disziplinen. Mit unserem Know How und unseren Erfahrungen helfen wir Organisationen, dieses Wissen zu extrahieren und operationalisierbar zu machen.
Data Science - die Datenwissenschaft - ist das Fachgebiet zur Extraktion von Wissen aus Daten. Data Science ist ein interdisziplinäres Feld und kann als die Gesamtheit der Methoden und Vefahren zur Extraktion von Erkenntnissen, Mustern und Schlüssen aus strukturierten wie auch unstrukturierten Daten angesehen werden.
Data Mining („Datenschürfen“) bezeichnet den Vorgang des Extrahierens von implizit vorhandener, aber noch unbekannter Information aus einem Datenbestand, den Rohdaten. Es geht dabei um die systematische Anwendung von Methoden auf einen Datenbestand mit dem Ziel, darin verborgene Information zu entdecken. Man könnte diesen Prozess daher auch mit Wissensentdeckung (Knowledge Discovery) übersetzen. Das maschinelle Lernen stellt ein umfassendes Arsenal an Werkzeugen und Techniken zur Verfügung. Oft werden auch mathematisch-statistische Methoden eingesetzt, z.B. lineare and nicht-lineare Regressionstechniken. Andere nicht-statistische Methoden sind etwa Entscheidungsbäume oder neuronale Netze.
Notwendige Voraussetzung für das Data Mining sind repräsentative Daten und deren geeignete Aufbereitung. Hier ist große Sorgfalt erforderlich; unzureichende Datenbestände können leicht zu fehlerhaften Schlüssen führen.
Es geht beim Data Mining also um die Transformation von Daten in nutzbare Information bzw. in Wissen. Mit Verfahren des Data Mining lassen sich geschäftsrelevante Muster, Auffälligkeiten und Regeln in Massendaten entdecken. Die Anwendungsmöglichkeiten sind äußerst vielfältig. Z.B. lassen sich