Data Analyst

Inhalt/Beschreibung

Zielgruppe: Der Lehrgang richtet sich an Personen mit abgeschlossenem Studium in der BWL, Mathematik oder (Wirtschafts-) Informatik, vergleichbarer Qualifikation.

Data Analysts überprüfen und verarbeiten Datensätze anhand relationaler Datenbanken und der Programmiersprache Python, werten diese mithilfe statistischer Methoden aus und visualisieren die Ergebnisse anschaulich. Der Lehrgang erläutert daher in einem ersten Schritt Instrumente der Statistik zur Analyse verschiedener Datengruppen, bevor im Anschluss Fachwissen in der Programmierung mit Python sowie der Entwicklung und Abfrage relationaler Datenbanen mit SQL vermittelt wird. Kenntnisse in der Data Warehouse Modellierung und dem ETL-Prozess sowie in der Datenanalyse, -visualisierung und dem Datenmanagement runden den Kurs ab.

Lehrgangsinhalte

Statistik
Statistische Grundlagen (ca. 6 Tage)

  • Messtheoretische Grundlagen (Grundgesamtheit und Stichprobe, Stichprobenarten, Messung und Skalenniveaus)
  • Univariate Deskriptivstatistik (Häufigkeitsverteilungen, Zentralmaße, Streuungsmaße, Standardwerte, Histogramme, Balkendiagramme, Kreisdiagramme, Liniendiagramme und Boxplots)
  • Bivariate Deskriptivstatistik (Zusammenhangsmaße, Korrelationskoeffizienten, Kreuztabellen, Streudiagramme und gruppierte Balkendiagramme)
  • Grundlagen der induktiven Inferenzstatistik (Wahrscheinlichkeitsverteilung, Normalverteilung, Mittelwerteverteilung, Signifikanztest, Nullhypothesentest nach Fisher, Signifikanz, Effektgröße, Parameterschätzung, Konfidenzintervalle, Fehlerbalkendiagramme, Poweranalysen und Ermittlung des optimalen Stichprobenumfangs)

Methoden zum Vergleich von zwei Gruppen (ca. 5 Tage)

  • z- und t-Test für eine Stichprobe (Abweichung von einem vorgegebenen Wert)
  • t-Test für den Mittelwertsunterschied von zwei unabhängigen/ verbundenen Stichproben
  • Prüfung der Wirksamkeit von Aktionen, Maßnahmen, Interventionen und anderen Veränderungen mit t-Tests (Pretest-Posttest-Designs mit zwei Gruppen)
  • Unterstützende Signifikanztests (Anderson-Darling-Test, Ryan-Joiner-Test, Levene-Test, Bonnet-Test, Signifikanztest für Korrelationen)
  • Nonparametrische Verfahren (Wilcoxon-Test, Vorzeichentest, Mann-Whitney-Test
  • Kontingenzanalysen (Binomialtest, Exakter Test nach Fisher, Chi-Quadrat-Test, Kreuztabellen mit Assoziationsmaße)

Methoden zum Mittelwertvergleich von mehreren Gruppen (ca. 5 Tage)

  • Ein- und zweifaktorielle Varianzanalyse (einfache und balancierte ANOVA)
  • Mehrfaktorielle Varianzanalyse (Allgemeines Lineares Modell)
  • Feste, zufällige, gekreuzte und geschachtelte Faktoren
  • Mehrfachvergleichsverfahren (Tukey-HSD, Dunnett, Hsu-MCB, Games-Howell)
  • Interaktionsanalyse (Analyse von Wechselwirkungseffekten)
  • Trennschärfe und Poweranalyse bei Varianzanalysen

Einführung in die Versuchsplanung (DoE, Design of Experiments) (ca. 1 Tag)

  • Voll- und teilfaktorielle Versuchspläne

Projektarbeit (ca. 3 Tage)

  • Zur Vertiefung der gelernten Inhalte
  • Präsentation der Projektergebnisse

SQL - Relationale Datenbanken
Grundlagen von Datenbanksystemen
(ca. 3 Tage)

  • Entitätsmengen
  • Relationen
  • Entity Integrity
  • Microsoft SQL Server Management Studio
  • Datenbanken/Tabellen
  • Schlüsselfelder
  • Einsatz Indizes
  • Datenbanksystemtypen
  • Datentypen: Standard- und spezielle Datentypen
  • Verwendungshinweise
  • Datenintegrität, -sicherheit und -schutz
  • Konkurrierender Datenzugriff
  • Primär- und Fremdschlüssel
  • Referentielle Integrität
  • Beziehungen zwischen Relationen
  • Entity-Relationship-Modell
  • Datenbankentwurf: Vom Fachproblem zur fertigen Datenbank
  • Datenbankkonflikte
  • Normalisierung: Normalformen 1 - 3, BCNF, Relevanz in der Praxis

Einführung in die DDL (ca. 2 Tage)

  • Erstellung von Tabellen
  • Gültigkeitsregeln (Check)
  • Setzen von Schlüsseln und Standardwerten
  • Manipulieren von Datenstrukturen
  • Verändern und Löschen von Tabellen
  • Nachträgliches Hinzufügen von Schlüsseln
  • Erstellen, Ändern und Löschen von Sichten
  • Vor- und Nachteile von Sichten

Einführung in die DQL (ca. 3 Tage)

  • SELECT mit Filterung und Sortierung
  • Wichtigste SQL-Inline-Funktionen
  • Skalar- und Aggregatfunktionen
  • Gruppierung und Gruppenfilter
  • Tabellen miteinander verknüpfen: Kartesisches Produkt und JOIN-Befehle
  • Equi- und Non-Equijoins
  • Verschachtelte SELECT-Anweisungen
  • Arithmetische-, Bitweise-, Vergleichs-, Verbindungs-, Logische, Zeichenketten- und Unäre Operatoren
  • Mengenoperationen: Union, Except, Intersect, Distinct
  • IIF und CASE-Anweisungen
  • Funktion Coalesce

DML-Befehle (ca. 1 Tag)

  • Insert-, Update-, Delete-, Merge-Befehle
  • Kombinationen von DML- mit DQL-Befehlen

DCL - Data Control Language (ca. 1 Tag)

  • Berechtigungen setzen, zurücknehmen, verweigern
  • Anlegen/Löschen von Logins und Usern
  • Zuweisen von Datenbankrollen
  • Anmelden mit anderen Logins
  • Zuordnung und Vererbung von Rollenberechtigungen

Einführung in die T-SQL-Programmierung (ca. 5 Tag)

  • Variablen (Skalar- und Tabellenvariablen)
  • Maskieren des Anführungszeichens
  • In Variablen gespeicherter SQL-Code ausführen
  • Temporäre Tabellen: lokal, global, permanent If-Anweisung und while-Schleife
  • Erstellen, Ändern und Löschen von Funktionen und Prozeduren
  • Ein- und Ausgabeparameter bei Prozeduren
  • Prozeduren mit mehreren Parametern
  • Unterschiede zwischen Prozeduren und Funktionen
  • Common Table Expressions
  • Tabellenwertfunktionen
  • Nutzung von Zeigern
  • FETCH-Befehl
  • Werte von Zeigern abfangen und in Variablen speichern
  • Triggertypen, -arten, -regeln und -sicherheit
  • Einführung in DML- und DDL-Trigger
  • DML-Trigger bei schlechtem/gutem Datenbankdesign Fehlerbehandlung: TRY-CATCH
  • Schweregrade von Fehlern
  • Erzeugen von Fehlermeldungen
  • Lesezeichen im MS Management Studio

Einführung in MS Access (ca. 1 Tag)

  • ODBC-Datenverbindung erstellen
  • Tabellen und Sichten einbinden
  • Abfragen erstellen
  • Pass-Through-Abfragen erstellen
  • Berichte und Formulare generieren

Projektarbeit (ca. 4 Tage)

  • Zur Vertiefung der gelernten Inhalte
  • Präsentation der Projektergebnisse

Programmierung mit Python
Grundlagen Python (ca. 1 Tag)

  • Geschichte, Konzepte
  • Verwendung und Einsatzgebiete
  • Syntax

Erste Schritte mit Python (ca. 5 Tage)

  • Zahlen
  • Zeichenketten
  • Datum und Zeit
  • Standardeingabe und -ausgabe
  • list, tuple dict, set
  • Verzweigungen und Schleifen (if, for, while)

Funktionen (ca. 5 Tage)

  • Eigene Funktionen definieren
  • Variablen
  • Parameter, Rekursion
  • Funktionale Programmierung

Fehlerbehebung (ca. 0,5 Tage)

  • try, except
  • Programmunterbrechungen abfangen

Objektorientierte Programmierung (ca. 4,5 Tage)

  • Python-Klassen
  • Methoden
  • Unveränderliche Objekte
  • Datenklasse
  • Vererbung

Grafische Benutzeroberfläche (ca. 1 Tag)

  • Buttons und Textfelder
  • grid-Layout
  • Dateiauswahl

Projektarbeit (ca. 3 Tage)

  • Zur Vertiefung der gelernten Inhalte
  • Präsentation der Projektergebnisse

Data Engineer
Grundlagen Business Intelligence
(ca. 2 Tage)

  • Aufgaben eines Data Engineers
  • Data Warehousing (DWH): Umgang und Verarbeitung von strukturierten, semi-strukturierten und unstrukturierten Daten
  • OLAP
  • OLTP

Anforderung von Daten (ca. 2 Tage)

  • Aufgaben, Ziele und Vorgehensweise in der Anforderungsanalyse
  • Einführung/Modellierung in der UML
    - Use-Case Analyse
    - Klassendiagramme
    - Aktivitätsdiagramme
    - Modellierung mit ERM

Datenbanken (ca. 2 Tage)

  • Grundlagen von Datenbanksystemen
  • Einführung/Modellierung in der UML
  • Architektur von Datenbankmanagementsystemen
  • Praktische und theoretische Einführung in SQL
  • Grenzen von Relationalen Datenbanken

Data Warehouse Modellierung (ca. 4 Tage)

  • Star Schema
  • Snowflake Schema
  • Galaxy Schema
  • Data Vault 2.0
    - Hubs
    - Satellites
    - Links im Raw- und Business Vault
    - Hash Key
    - Hash Diff
  • Slowly Changing Dimension Tables Typ 1 bis 5 (Restating, Stacking, Reorganizing, Mini Dimension und Typ 5
  • Einführung in normal, causal, mini und monster, heterogeneous und subdimensions
  • Vergleich von state und transaction oriented Faktentabellen
  • Density und Storage vom DWH

ETL (ca. 5 Tage)

  • Data Cleansing
    - Null Values
    - Aufbereitung von Daten
    - Harmonisierung von Daten
    - Anwendung von Regular Expressions
  • Datensicherheit/Datenschutz
  • Data Understanding
    - Datenvalidierung
    - Statistische Datenanalyse
  • Praktischer Aufbau von ETL-Strecken
  • Praktischer Aufbau eines Data Vault Modells - Business und Raw Vault
  • Praktische Umsetzung von Hash-Verfahren
  • Verwendung von Datenbanken (SQLite, PostgreSQL)
  • json
  • csv

Projektarbeit (ca. 5 Tage)

  • Zur Vertiefung der gelernten Inhalte
  • Präsentation der Projektergebnisse

Data Analytics
Einführung Datenanalyse (ca. 1 Tag)

  • CRISP-DM Referenzmodell
  • Data Analytics Workflows
  • Begriffsabgrenzung Künstliche Intelligenz, Machine Learning, Deep Learning
  • Anforderungen und Rolle im Unternehmen des Data Engineers, Data Scientists und Data Analysts

Wiederholung Grundlagen Python (ca. 1 Tag)

  • Datentypen
  • Funktionen

Datenanalyse (ca. 3 Tage)

  • Zentrale Python-Module im Kontext Data Analytics (NumPy, Pandas)
  • Prozess der Datenaufbereitung
  • Data Mining Algorithmen in Python

Datenvisualisierung (ca. 3 Tage)

  • Explorative Datenanalyse
  • Insights
  • Datenqualität
  • Nutzenanalyse
  • Visualisierung mit Python: Matplotlib, Seaborn, Plotly Express

Datenmanagement (ca. 2 Tage)

  • Big Data Architekturen
  • Relationale Datenbanken mit SQL
  • Vergleich von SQL- und NoSQL-Datenbanken
  • Business Intelligence
  • Datenschutz im Kontext der Datenanalyse

Datenanalyse im Big Data Kontext (ca. 1 Tag)

  • MapReduce-Ansatz
  • Spark
  • NoSQL

Dashboards (ca. 3 Tage)

  • Bibliothek: Dash
  • Aufbau von Dashboards – Dash Components
  • Customizing von Dashboards
  • Callbacks

TextMining (ca. 1 Tag)

  • Data Preprocessing
  • Visualisierung
  • Bibliothek: SpaCy

Projektarbeit (ca. 5 Tage)

  • Zur Vertiefung der gelernten Inhalte
  • Präsentation der Projektergebnisse

Änderungen möglich. Die Lehrgangsinhalte werden regelmäßig aktualisiert.

Abschlussprüfung: Praxisbezogene Projektarbeit mit Abschlusspräsentation

Präsenzlehrgänge mit Videotechnik der neuesten Generation
Der Einsatz von Videokonferenzsystemen gehört zum Lehrgangskonzept von alfatraining. Diese Form von Unterricht trainiert das Arbeiten in einer vernetzten Arbeitsumgebung, wie sie in Industrie und Wirtschaft existiert. In der globalisierten Arbeitswelt arbeiten Firmen heutzutage sowohl firmenintern als auch mit anderen Unternehmen deutschlandweit, europaweit oder weltweit über moderne Kommunikationstechniken und Netzwerke zusammen. Sie lernen im Unterricht den Umgang und Einsatz dieser modernen Techniken kennen.

Wie funktioniert der Unterricht bei alfatraining?
Bei alfatraining findet der Unterricht via alfaview®, einer Videokonferenzsoftware, statt. Die Dozierenden und die Teilnehmenden können sich gegenseitig sehen, hören und miteinander sprechen – live, lippensynchron und in Fernsehqualität! Über den virtuellen Klassenraum alfaview® ist es möglich, dass Sie sowohl mit Dozierenden als auch mit allen Teilnehmerinnen und Teilnehmern Ihres Kurses sprechen und im Team standortübergreifend gemeinsam an Projekten arbeiten. Zusätzliche separate Online-Besprechungsräume eignen sich zur vertraulichen Kommunikation in Kleingruppen.

Lernziel

Nach diesem Lehrgang verfügen Sie über wesentliche Kenntnisse in der Statistik, können komplexe Abfragen über relationale Datenbanken mit SQL durchzuführen und beherrschen die Programmiersprache Python. Verbunden mit dem im Kurs vermittelten Fachwissen des Data Engineerings und der Datenanalyse sind Sie in der Lage, umfangreiche Datensätze zu managen, statistisch effizient auszuwerten und die Ergebnisse anschaulich und leicht verständlich zusammenzufassen.

Angaben zur geschlechterspezifischen Nutzung
keine Einschränkungen
Fachliche Zugangsvoraussetzungen

keine Einschränkungen

Gesundheitliche Zugangsvoraussetzungen

keine Einschränkungen


Hinweis des Datenbankbetreibers: Informationen über die Barrierefreiheit erfragen Sie bitte beim Anbieter.
Technische Zugangsvoraussetzungen

keine Einschränkungen

Zeitmuster
Vollzeit
Lehr- und Lernform
Seminar/Präsenzveranstaltung
Abschlussart
Teilnahmebestätigung / Zertifikat des Anbieters
Nähere Bezeichnung des Abschlusses
alfatraining-Zertifikat „Data Analyst“
Voraussichtliche Dauer
20 Woche(n)
Termin
Termine auf Anfrage
Bemerkungen zum Termin
Kursstart alle 4 Wochen
Mindest­teilnehmer­anzahl
3
Maximale Teilnehmerzahl
25
Teilnahmegebühr
Bitte erfragen
Hinweis des Datenbankbetreibers: Bitte erfragen Sie beim Anbieter eventuell auftretende Nebenkosten!
Fördermöglichkeiten
Weitere Informationen im Internet
Themengebiet
Informatik-, Informations- und Kommunikationstechnologie

Bildungsanbieter

alfatraining GmbH

Bildungszentrum Rostock

Internet
https://www.alfatraining.de
Bildungsanbieter-Infos
Bildungsanbieter-Infos

Kontakt

alfatraining Bildungsberatung

Telefon
0800 3456500
Internet
https://www.alfatraining.de/kontakt/rostock/
anerkanntes Qualitätsmanagementsystem
DIN EN ISO 9001, Trägerzulassung nach AZAV

Veranstaltungsort

alfatraining GmbH

Bildungszentrum Rostock

Besucheranschrift
Doberaner Straße 110
18057 Rostock
Deutschland
Telefon
0800-3456-500
Wegbeschreibung
Wegbeschreibung
Internet
https://www.alfatraining.de

Fanden Sie die Kursbeschreibung hilfreich?

Kurs aktualisiert am 18.05.2022, Datenbank-ID 00305646