Data Science steht im Kern für die Extraktion von Wissen aus Daten. Dazu werden Algorithmen, Verfahren und Techniken aus den Bereichen der Mathematik, Statistik und Informationstechnologie angewandt und mit Fachwissen kombiniert. Data Science ist eine etablierte Disziplin, die durch die zunehmende Digitalisierung und die damit verbundene Verfügbarkeit von immer mehr Daten einen Aufschwung erlebt hat und immer mehr Momentum bekommt.
Die Herausforderung bei Data Science besteht darin, dass hier Probleme an der Schnittstelle Mathematik, IT und Domäne/Fachgebiet gelöst werden müssen. Nur wenn all diese drei Aspekte entsprechend berücksichtigt werden, ist es möglich gute und nützliche Lösungen zu erzielen. Data Science Projekte sind in der Regel das Ergebnis von Teamarbeit aus unterschiedlichsten Fachgebieten.
Resultate aus Data Science Projekten umfassen neben dem Wissensgewinn meist auch Algorithmen und Software, die automatisierte und skalierbare Entscheidungen ermöglicht.
– Ist ein wichtiger Aspekt im Zusammenhang mit Data Science. Die Daten, die später analysiert werden sollen, müssen erst zusammengetragen bzw. bereitgestellt, aufbereitet und validiert werden. Teilweise kommen hier auch Big Data Techniken zum Einsatz.
– und hier insbesondere der Bereich des maschinellen Lernens ist ein wichtiges Werkzeug für Data Scientists. Dabei lernen Computer anhand von Daten intelligentes Verhalten, ohne dass sie dafür explizit programmiert werden.
Unter Anwendung von Data Science, Data Engineering und KI lassen sich Anwendungsfälle wie Predictive Maintenance, Product Recommendation, Sales Forecasting, Image Recognition oder Fraud Detection realisieren, um nur einige zu nennen.
Begriff „Data Science“