h) Jenseits der Algorithmen. Einsichten aus der Datenanalyse in der experimentellen Wissenschaft

Dr. Dieter Bingemann

Data Science folgt einem traditionellen Analysemodell zur iterativen Verbesserung der Analyse eines Datensatzes. In diesem Artikel werfen wir ein Blick darauf, wie die „Sciences“ mit Data umgehen – der wissenschaftlichen Datenanalyse – und finden Herangehensweisen, die auch auf Data-Science-Projekte zutreffen können und die den Horizont in der Entwicklung von Data-Science-Modellen deutlich erweitern könnten. Insbesondere schlagen wir parallel zur experimentellen chemischen Analytik vor,
die Daten nicht als gegeben, sondern als Resultat eines Experimentes anzusehen. Wir schlussfolgern, dass neue Daten mit neuen Experimenten erzeugt werden können; aber auch, dass es gute und schlechte Experimente sowie gute und schlechte Daten gibt. Diese Sichtweise erweitert den Horizont des Data Scientist weg von einem engen Fokus auf die Auswertealgorithmen hin zu einer Sichtweise, die das Data-Science-Projekt als System begreift und die Datenaufnahme als ein Experiment. Die Verbesserung dieses
Experimentes und die Entfernung von externen Einflüssen aus den Daten sind dann die größten Hebel, durch deren Einsatz man die besten Resultate erzielen kann.