Data Scientist
- Inhalt/Beschreibung
Zielgruppe: Der Lehrgang richtet sich an Personen mit abgeschlossenem Studium in der Informatik, Wirtschaftsinformatik, BWL, Mathematik oder vergleichbarer Qualifikation.
Data Scientists handhaben die Aufarbeitung und Analyse von Daten und können anhand komplexer Datenmustern Modellierungen zur Vorhersage von Businessszenarien erstellen. Der Lehrgang erläutert daher zunächst die Anforderungen von Daten und Datenbanken, die Data Warehouse Modellierung und den ETL-Prozess. Ein weiterer Schwerpunkt liegt auf der Datenanalyse sowie deren Programmierung, Visualisierung und Management im Big Data Kontext.
Weiter werden die zentralen Aufgaben der Machine Learning-Entwicklung vorgestellt: von den Grundlagen des maschinellen Lernens, zu den Kategorien Überwachtes und Unüberwachtes Lernen bis zum Thema Evaluierung und Verbesserung. Es wird gezeigt, wie IT-Systeme in der Lage sind, Muster in bestehenden Datenbeständen zu identifizieren und wie mithilfe von Algorithmen eigenständige Lösungen für Probleme gefunden werden können. Abschließend erläutert der Kurs die Methoden des Deep Learnings auf Basis von neuronalen Netzen.
Lehrgangsinhalte:
Data Engineer
Grundlagen Business Intelligence (ca. 2 Tage)
- Anwendungsfelder, Dimensionen einer BI Architektur
- Grundlagen Business Intelligence, OLAP, OLTP, Aufgaben eines Data Engineers
- Data Warehousing (DWH): Umgang und Verarbeitung von strukturierten, semi-strukturierten und unstrukturierten Daten
Anforderungsmanagement (ca. 2 Tage)
- Aufgaben, Ziele und Vorgehensweise in der Anforderungsanalyse
- Datenmodellierung, Einführung / Modellierung mit ERM
- Einführung/Modellierung in der UML
- Klassendiagramme
- Use-Case Analyse
- Aktivitätsdiagramme
Datenbanken (ca. 3 Tage)
- Grundlagen von Datenbanksystemen
- Architektur von Datenbankmanagementsystemen
- Anwendung RDBMS,
- Umsetzung Datenmodell in RDBMS, Normalformen
- Praktische und theoretische Einführung in SQL
- Grenzen von Relationalen Datenbanken, csv, json
Data Warehouse (ca. 4 Tage)
- Star Schema
- Datenmodellierung
- Erstellung Star Schema in RDBMS
- Snowflake Schema, Grundlagen, Datenmodellierung
- Erstellung Snowflake Schema in RDBMS
- Galaxy Schema: Grundlagen, Datenmodellierung
- Slowly Changing Dimension Tables Typ 1 bis 5 - Restating, Stacking, Reorganizing, mini Dimension und Typ 5
- Einführung in normal, causal, mini und monster, heterogeneous und sub Dimensions
- Vergleich von state und transaction oriented Faktentabellen, Density und Storage vom DWH
ETL (ca. 4 Tage)
- Data Cleansing
- Null Values
- Aufbereitung von Daten
- Harmonisierung von Daten
- Anwendung von Regular Expressions
- Data Understanding
- Datenvalidierung
- Statistische Datenanalyse
- Datenschutz, Datensicherheit
- Praktischer Aufbau von ETL-Strecken
- Data Vault 2.0, Grundlagen, Hubs, Links, Satellites, Hash Key, Hash Diff.
- Datavault Datenmodellierung
- Praktischer Aufbau eines Data Vault Modells - Raw Vault, Praktische Umsetzung von Hash-Verfahren
Projektarbeit (ca. 5 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
Data Analytics
Einführung Datenanalyse (ca. 1 Tag)- CRISP-DM Referenzmodell
- Data Analytics Workflows
- Begriffsabgrenzung Künstliche Intelligenz, Machine Learning, Deep Learning
- Anforderungen und Rolle im Unternehmen des Data Engineers, Data Scientists und Data Analysts
Wiederholung Grundlagen Python (ca. 1 Tag)
- Datentypen
- Funktionen
Datenanalyse (ca. 3 Tage)
- Zentrale Python-Module im Kontext Data Analytics (NumPy, Pandas)
- Prozess der Datenaufbereitung
- Data Mining Algorithmen in Python
Datenvisualisierung (ca. 3 Tage)
- Explorative Datenanalyse
- Insights
- Datenqualität
- Nutzenanalyse
- Visualisierung mit Python: Matplotlib, Seaborn, Plotly Express
Datenmanagement (ca. 2 Tage)
- Big Data Architekturen
- Relationale Datenbanken mit SQL
- Vergleich von SQL- und NoSQL-Datenbanken
- Business Intelligence
- Datenschutz im Kontext der Datenanalyse
Datenanalyse im Big Data Kontext (ca. 1 Tag)
- MapReduce-Ansatz
- Spark
- NoSQL
Dashboards (ca. 3 Tage)
- Bibliothek: Dash
- Aufbau von Dashboards – Dash Components
- Customizing von Dashboards
- Callbacks
TextMining (ca. 1 Tag)
- Data Preprocessing
- Visualisierung
- Bibliothek: SpaCy
Projektarbeit (ca. 5 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
Machine Learning
Einführung in Machine Learning (ca. 5 Tage)- Warum Machine Learning?
- Anwendungsbeispiele
- Überwachtes Lernen, Unüberwachtes Lernen, Teilüberwachtes Lernen, Reinforcement Lernen
- Beispiele für Datenbestände
- Daten kennenlernen
- Trainings-, Validierungs- und Testdaten
- Daten sichten
- Vorhersagen treffen
Überwachtes Lernen (ca. 5 Tage)
- Klassifikation und Regression
- Verallgemeinerung, Overfitting und Underfitting
- Größe des Datensatzes
- Algorithmen zum überwachten Lernen
- Lineare Modelle
- Bayes-Klassifikatoren
- Entscheidungsbäume
- Random Forest
- Gradient Boosting
- k-nächste-Nachbarn
- Support Vector Machines
- Conditional Random Field
- Neuronale Netze und Deep Learning
- Wahrscheinlichkeiten
Unüberwachtes Lernen (ca. 5 Tage)
- Arten unüberwachten Lernens
- Vorverarbeiten und Skalieren
- Datentransformationen
- Trainings- und Testdaten skalieren
- Dimensionsreduktion
- Feature Engineering
- Manifold Learning
- Hauptkomponentenzerlegung (PCA)
- Nicht-negative-Matrix-Faktorisierung (NMF)
- Manifold Learning mit t-SNE
- Clusteranalyse
- k-Means-Clustering
- Agglomeratives Clustering
- Hierarchische Clusteranalyse
- DBSCAN
- Clusteralgorithmen
Evaluierung und Verbesserung (ca. 2 Tage)
- Modellauswahl und Modellevaluation
- Abstimmung der Hyperparameter eines Schätzers
- Kreuzvalidierung
- Gittersuche
- Evaluationsmetriken
- Klassifikation
Projektarbeit (ca. 3 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
Deep Learning
Einführung Deep Learning (ca. 1 Tag)
- Deep Learning als eine Art von Machine Learning
Grundlagen in neuronalen Netzen (ca. 4 Tage)
- Perceptron
- Berechnung neuronaler Netze
- Optimierung der Modellparameter, Backpropagation
- Deep-Learning-Bibliotheken
- Regression vs. Klassifikation
- Lernkurven,
- Überanpassung und Regularisierung
- Hyperparameteroptimierung
- Stochastischer Gradientenabstieg (SGD)
- Momentum,
- Adam Optimizer
- Lernrate
Convolutional Neural Network (CNN) (ca. 2 Tage)
- Bildklassifizierung
- Convolutional-Schichten, Pooling-Schichten
- Reshaping-Schichten, Flatten, Global-Average-Pooling
- CNN-Architekturen ImageNet-Competition
- Tiefe neuronale Netze, Vanishing Gradients, Skip-Verbindungen, Batch-Normalization
Transfer Learning (ca. 1 Tag)
- Anpassen von Modellen
- Unüberwachtes Vortrainieren
- Image-Data-Augmentation, Explainable AI
Regional CNN (ca. 1 Tag)
- Objektlokalisierung
- Regressionsprobleme
- Verzweigte neuronale Netze
Generative Adversarial Networks (ca. 1 Tag)
- Anwendungen von GANs
- Deepfakes
- Deep-Convolutional-GANs
Recurrente neurale Netze (ca. 2 Tage)
- Sequenzanalyse
- Rekurrente Schichten
- Backpropagation through time (BPTT)
- Analyse von Zeitreihen
- Exploding und Vanishing Gradient Probleme
- LSTM (Long Short-Term Memory)
- GRU (Gated Recurrent Unit)
- Deep RNN
- Deep LSTM
Textverarbeitung durch neuronale Netze (ca. 2 Tage)
- Text-Preprocessing
- Embedding-Schichten
- Text-Klassifizierung
- Sentimentanalyse
- Transfer-Learning in NLP
- Übersetzungen
- Seqence-to-Sequence-Verfahren, Encoder-Decoder-Architektur
Sprachmodelle (ca. 1 Tag)
- BERT
- Attention-Schichten, Transformers
- Textgeneration-Pipelines
- Summarization
- Chatbots
Deep Reinforcement Learning (ca. 1 Tag)
- Steuerung dynamischer Systeme
- Agentensysteme
- Training durch Belohnungen
- Policy Gradients
- Deep-Q-Learning
Bayes´sche neuronale Netze (ca. 1 Tag)
- Unsicherheiten in neuronalen Netzen
- Statistische Bewertung von Prognosen
- Konfidenz, Standardabweichung
- Unbalancierte Daten
- Sampling-Methoden
Projektarbeit (ca. 3 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
Änderungen möglich. Die Lehrgangsinhalte werden regelmäßig aktualisiert
Präsenzlehrgänge mit Videotechnik der neuesten Generation
er Einsatz von Videokonferenzsystemen gehört zum Lehrgangskonzept von alfatraining. Diese Form von Unterricht trainiert das Arbeiten in einer vernetzten Arbeitsumgebung, wie sie in Industrie und Wirtschaft existiert. In der globalisierten Arbeitswelt arbeiten Firmen heutzutage sowohl firmenintern als auch mit anderen Unternehmen deutschlandweit, europaweit oder weltweit über moderne Kommunikationstechniken und Netzwerke zusammen. Sie lernen im Unterricht den Umgang und Einsatz dieser modernen Techniken kennen.Wie funktioniert der Unterricht bei alfatraining?
Bei alfatraining findet der Unterricht via alfaview®, einer Videokonferenzsoftware, statt. Die Dozierenden und die Teilnehmenden können sich gegenseitig sehen, hören und miteinander sprechen – live, lippensynchron und in Fernsehqualität! Über den virtuellen Klassenraum alfaview® ist es möglich, dass Sie sowohl mit Dozierenden als auch mit allen Teilnehmerinnen und Teilnehmern Ihres Kurses sprechen und im Team standortübergreifend gemeinsam an Projekten arbeiten. Zusätzliche separate Online-Besprechungsräume eignen sich zur vertraulichen Kommunikation in Kleingruppen.
- Lernziel
Sie beherrschen Prozesse rund um die Zusammenführung, Aufbereitung, Anreicherung und Weitergabe von Daten sowie die Anwendung von Machine Learning. Auch die Einsatzbereiche von Deep Learning und die Funktionsweisen neuronaler Netzwerke sind Ihnen vertraut.
- Angaben zur geschlechterspezifischen Nutzung
- keine Einschränkungen
- Fachliche Zugangsvoraussetzungen
Programmierkenntnisse in Python und Erfahrungen mit Datenbanken (SQL) werden vorausgesetzt.
- Gesundheitliche Zugangsvoraussetzungen
keine Einschränkungen
Hinweis des Datenbankbetreibers: Informationen über die Barrierefreiheit erfragen Sie bitte beim Anbieter.
- Technische Zugangsvoraussetzungen
keine Einschränkungen
- Zeitmuster
- Vollzeit
- Lehr- und Lernform
- Präsenzveranstaltung
- Abschlussart
- Teilnahmebestätigung / Zertifikat des Anbieters
- Nähere Bezeichnung des Abschlusses
- alfatraining-Zertifikat „Data Scientist“
- Voraussichtliche Dauer
- 16 Woche(n)
- Termin
- Termine auf Anfrage
- Bemerkungen zum Termin
- Kursstart alle 4 Wochen
- Mindestteilnehmeranzahl
- 3
- Maximale Teilnehmerzahl
- 25
- Teilnahmegebühr
- Bitte erfragen
Hinweis des Datenbankbetreibers: Bitte erfragen Sie beim Anbieter eventuell auftretende Nebenkosten!
- Fördermöglichkeiten
- Weitere Informationen im Internet
- Themengebiet
- Informatik-, Informations- und Kommunikationstechnologie
Bildungsanbieter
alfatraining Bildungszentrum GmbH
Bildungszentrum Rostock
- Internet
- a:7633/cs_id:305648https://www.alfatraining.de
- Bildungsanbieter-Infos
- Bildungsanbieter-Infos
Kontakt
alfatraining Bildungsberatung
- Telefon
- 0800 3456500
- wmv(at)alfatraining.deKontaktformular
- Internet
- https://www.alfatraining.de/kontakt/rostock/https://www.alfatraining.de/kontakt/rostock/
- anerkanntes Qualitätsmanagementsystem
- DIN EN ISO 9001, Trägerzulassung nach AZAV
Veranstaltungsort
alfatraining Bildungszentrum GmbH
Bildungszentrum Rostock
- Besucheranschrift
- Doberaner Straße 110
18057 Rostock
Deutschland - Google Maps
- Telefon
- 0800-3456-500
- Wegbeschreibung
- Wegbeschreibung
- wmv(at)alfatraining.deKontaktformular
- Internet
- a:7633/cs_id:305648https://www.alfatraining.de
Kurs aktualisiert am 03.01.2023, Datenbank-ID 00305648