Data-Science-Technologien

Die Zusammenwirkung verschiedenster Kompetenzen

Mehrwerte durch wissenschaftliche Methoden

Data Science umfasst den Zusammenschluss verschiedener Kompetenzen – von Statistik über Branchen-Know-how bis hin zur Informatik. Im Bereich Informatik werden wissenschaftliche Verfahren und Methoden eingesetzt, um Daten zu analysieren und daraus einen Mehrwert zu ziehen. Entsprechend ist die Programmierung im Data-Science-Kontext darauf ausgelegt, die Daten einfach zu verarbeiten, zu analysieren und Vorhersagen daraus zu generieren.

Entsprechend fokussieren sich unsere Expertinnen und Experten auf datenzentrierte Programmiersprachen – etwa R und Python kombiniert mit Jupyter Notebooks und den jeweiligen Fachbibliotheken wie numpy, pandas, scikit-learn, keras, tensorflow, prophet, OpenCV oder Shiny.

Bevor wir zusammen mit Ihnen in Großprojekten Use Cases umsetzen, bieten wir Ihnen die Möglichkeit, schnell erste Use Cases in einem Proof of Concept (PoC) zu erproben. Hierzu empfehlen wir die Open-Source-Programmiersprachen Python und R.

Dank Open-Source ergeben sich zwei zentrale Vorteile:

  • Es fallen keine teuren Lizenzgebühren an.
  • Der Zeitaufwand wird durch zahlreiche vorimplementierte Methoden deutlich verringert.

Ein weiterer Vorteil von Python und R ist, dass fast alle großen Hersteller – etwa Microsoft, SAS, SAP oder Cloudera – Schnittstellen für die Programmiersprachen zur Verfügung stellen. Auf diese Weise können im PoC entwickelte Data-Science-Modelle einfach ins Produktivsystem überführt werden. Aus diesem Grund bilden wir unsere Data Scientists stetig in den Bereichen Programmierung, Datenanalyse und Visualisierung weiter und haben bereits unser Know-how in zahlreichen Projekten einsetzen können.

python

python ist derzeit die am weitesten verbreitete Programmiersprache für maschinelles Lernen und insbesondere für die Entwicklung von anspruchsvollen Modellen und Vorhersagemodulen geeignet, die direkt in Produktionssysteme eingebunden werden können. Aus diesem Grund beherrschen unsere Mitarbeiterinnen und Mitarbeiter alle wichtigen python-Bibliotheken im Data-Science-Bereich.

Die Bibliothek scikit-learn bietet alle notwendigen Algorithmen und Methoden des Maschinellen Lernens. Diese haben eine Reichweite von gängigen Regressionen, Clustering-Verfahren bis hin zu Klassifikations- und Vorhersagemodulen.

Je nach Komplexität der Problemstellung können auch Methoden aus dem Deep Learning zum Einsatz kommen. In diesem Bereich sind unsere Data Scientists zertifiziert und verfügen über ein umfangreiches Know-how in den Bibliotheken keras, tensorflow und pytorch. Diese eignen sich vor allem aufgrund ihrer Flexibilität besonders gut für die Implementierung eigener Deep-Learning-Lösungen.

R

R eine ist leistungsfähige und flexible Skriptsprache, die insbesondere zur Analyse und Visualisierung von Daten genutzt wird. Ein Großteil aller Neuentwicklungen in den Bereichen Statistik und maschinelles Lernen findet in R statt, was unseren Expertinnen und Experten ein stetiges Erproben von neuen statistischen Verfahren ermöglicht.

Zudem ist R sehr gut automatisierbar und integrierbar – etwa in Git, ODBC, Oracle R Enterprise, Spark oder Hadoop. Wie Python verfügt auch R über eine große Bibliothekanzahl. Für die Datenaufbereitung großer Datenmengen ist data.table besonders gut geeignet. Mit Hilfe der Bibliothek caret sind alle Verfahren aus den Bereichen Machine- und Deep Learning anwendbar. Visualisierungen können wir besonders eindrucksvoll mit Bibliotheken wie ggplot oder plotly gestalten. Soll der Use Case anschließend mittels einer App-Anwendung in den Produktionsbetrieb gehen, so greifen unsere Spezialisten zu der Bibliothek Shiny.

Rollen im Data-and-Analytics-Umfeld

Das Data-and-Analytics-Umfeld umfasst verschiedene statistische Methoden. Genauso vielfältig ist auch die Tätigkeit in diesem Umfeld.

Mehr erfahren

Sie haben Fragen?

Keine Webseite und keine Broschüre kann das persönliche Gespräch über Ihre Ziele und Ihre Themen ersetzen. Wir freuen uns auf einen Termin bei Ihnen vor Ort.

Kontakt

Diese Seite speichern. Diese Seite entfernen.