
Der Mangel an gut ausgebildeten IT-Fachkräften ist bekannt. Doch nun spitzt sich die Problematik weiter zu. Big Data, für manche nur ein Hype-Thema, für einige bereits die ernste Realität. Riesige, zum Teil unstrukturierte Datenberge warten darauf erfasst, konsolidiert und nutzbar gemacht zu werden. Doch dafür braucht es einiges an interdisziplinärer Erfahrung. Nicht jeder ist den Anforderungen dieses neuen Berufsbilds gewachsen. Die Ausbildung geeigneter Fachkräfte hinkt hinterher und der Bedarf an ihnen wächst wie die Datenberge selbst.
Big Data – Eine Begriffsklärung
Als Big Data bezeichnet man sehr große Datenmengen, die durch die gängigen Datenmanagement-Systeme nicht oder nur unzureichend verarbeitet werden können.
Derzeitige Prognosen zeigen auf, dass sich das weltweite Datenvolumen alle zwei Jahre verdoppelt. Die zunehmende maschinelle Erzeugung von Daten treibt diese Entwicklung beständig voran.
Die IT-Beratungs und Dienstleistungsfirma Tata Consultancy Services (TCS) erörtert in ihrer Studie “The Emerging Big Returns on Big Data“ um welche Informationen aus welchen Quellen es in Big Data-Projekten geht. Dabei werden die Daten nach verschiedenen Kriterien eingeteilt.
Man differenziert nach der Form
- Strukturierte Daten: Daten,die in fest definierten Feldern vorliegen, beispielsweise in Datenbanken oder Excell-Tabellen
- Unstrukturierte Daten: E-mail-Korrespondenzen, Video- und Audio-Files, Beiträge auf Social Media-Platformen und in Online-Foren
- Halbstrukturierte Daten: Befinden sich nicht in fest definierten Feldern, sind aber zumindest getaggt bzw. markiert
und nach der Quelle der Daten.
- Interne Daten: Daten, die vom Unternehmen selbst ermittelt werden
- Externe Daten: Aus Social Media-Diensten, von Datenhändlern, Mobilfunkfirmen etc.
Laut TCS sind Europa 50% der Daten in strukturierter Form und ca. jeweils 25% sind halb- und unstrukturierte Daten. Analysen geben an dass 68% der Informationen selbst erfasste Daten der Unternehmen sind und 32% aus externen Quellen bezogen werden. Enorme Datenmengen aus unterschiedlichsten Quellen in unterschiedlichster Form müssen erfasst, zusammengefügt und in nutzbare Informationen umgewandelt werden.
Schwierig sind vor allem die Erfassung, die Speicherung, die Suche, die Verteilung, die statistische Analyse und die Visualisierung von großen Datenmengen. Das Volumen dieser Datenmengen geht in die Terabytes, Petabytes und Exabytes.
Branchenbedarf
In folgende Branchen ist Big Data ein ernstzunehmendes Thema:
- in der Finanzindustrie (Finanz-Transaktionen, Börsendaten)
- im Energiesektor (Verbrauchsdaten)
- im Gesundheitswesen (Verschreibungen)
- in der Wissenschaft
Was für Berufe mit welchem Anforderungsprofil entstehen?
Ein spezielles Know-how im Bereich Infrastruktur ist hierbei unumgänglich. Gerade in Bezug auf die Auswertung von Echtzeitinformationen, welches eine der Hauptherausforderungen im Bereich der Big Data ist. Besonders in kleinen und mittelständischen Betrieben fehlen dafür oft die IT-Ressourcen in Form von Server-Kapazitäten und Analysemöglichkeiten.
Es werden neue Spezialisten benötigt, die fachübergreifend denken können und interdisziplinäre Erfahrung aufweisen. Allerdings werden nicht nur in der IT-Abteilung neue Jobs entstehen. Entsprechende Ausbildungen dauern in der Regel 2-3 Jahre, werden aber bisher noch im unzureichenden Maße angeboten. Derartige Datenwissenschaftler brauchen Wissen aus den unterschiedlichsten Fachbereichen. Gerade aber solche themen- und fachübergreifenden Angebote haben bisher eher Seltenheitswert.
Im Zuge der neuen Thematik sollen, wenn man euphorischen Einschätzungen von Marktforschern und IT-Unternehmen glauben mag, folgende neue Berufsbilder entstehen:
- Data Scientist: Solide Kenntnisse in Mathematik und Statistik, legt Analysefomen und benötigte Rohdaten fest, braucht auch Kenntnisse über IT-Technologien wie Datenbanken, Netzwerktechniken und Programmierung
- Data Artist oder Data Visualizer: Der „Künstler“ unter den Big Data Experten, soll die Ergebnisse den verantwortlichen Vorgesetzten verständlich präsentieren, bastelt Grafiken, Charts und Diagramme
- Data Architect: Erstellt Datenmodelle, legt Analysetool und Datenquellen fest, Kentnisse im Bereich: Datenbanken, Datenanalyse, Business Intelligence
- Information Broker: Kann mehrere Rollen spielen, z.B. Datenhändler oder Inhaouse Experte der Datenbestände beschafft, entwickelt Ideen diese Daten gewinnbringend einzusetzen
- Daten Ingenieur: Ist für die Hard- und Software der IT-Infrastruktur - das Big Data-Analysesystems zuständig
- Data Change Agents: Politische Funktion, analysiert und passt Prozesse an, ausgeprägte Kommunikationsfähigkeiten und ein Verständnis für Unternehmensprozesse
Ergänzend werden meist noch Fachkenntnisse über die entsprechende Branche erwartet. Zudem ist die Komponente emotionale Kompetenz nicht zu verachten, da die Prozesse in den meisten Fällen teamübergreifend strukturiert sind. Es wird viel erwartet und es werden viele gebraucht von den Big Data-Spezialisten der Zukunft. Vermutlich wird der Ausbildungsmarkt analog nachziehen und entsprechende Zertifizierungen anbieten. Welche davon sich durchsetzen ist abzuwarten. Fachleuten, welche sich auf dem Big-Data-Gebiet verdingen wollen ist anzuraten, sich breit aufzustellen. Der Markt ist groß – die Chancen sind da.