Data Analyst
- Inhalt/Beschreibung
Zielgruppe: Der Lehrgang richtet sich an Personen mit abgeschlossenem Studium in der BWL, Mathematik oder (Wirtschafts-) Informatik, vergleichbarer Qualifikation.
Data Analysts überprüfen und verarbeiten Datensätze anhand relationaler Datenbanken und der Programmiersprache Python, werten diese mithilfe statistischer Methoden aus und visualisieren die Ergebnisse anschaulich. Der Lehrgang erläutert daher in einem ersten Schritt Instrumente der Statistik zur Analyse verschiedener Datengruppen, bevor im Anschluss Fachwissen in der Programmierung mit Python sowie der Entwicklung und Abfrage relationaler Datenbanen mit SQL vermittelt wird. Kenntnisse in der Data Warehouse Modellierung und dem ETL-Prozess sowie in der Datenanalyse, -visualisierung und dem Datenmanagement runden den Kurs ab.
Lehrgangsinhalte:
Statistik
Statistische Grundlagen (ca. 6 Tage)- Messtheoretische Grundlagen (Grundgesamtheit und Stichprobe, Stichprobenarten, Messung und Skalenniveaus)
- Univariate Deskriptivstatistik (Häufigkeitsverteilungen, Zentralmaße, Streuungsmaße, Standardwerte, Histogramme, Balkendiagramme, Kreisdiagramme, Liniendiagramme und Boxplots)
- Bivariate Deskriptivstatistik (Zusammenhangsmaße, Korrelationskoeffizienten, Kreuztabellen, Streudiagramme und gruppierte Balkendiagramme)
- Grundlagen der induktiven Inferenzstatistik (Wahrscheinlichkeitsverteilung, Normalverteilung, Mittelwerteverteilung, Signifikanztest, Nullhypothesentest nach Fisher, Signifikanz, Effektgröße, Parameterschätzung, Konfidenzintervalle, Fehlerbalkendiagramme, Poweranalysen und Ermittlung des optimalen Stichprobenumfangs)
Methoden zum Vergleich von zwei Gruppen (ca. 5 Tage)
- z- und t-Test für eine Stichprobe (Abweichung von einem vorgegebenen Wert)
- t-Test für den Mittelwertsunterschied von zwei unabhängigen/ verbundenen Stichproben
- Prüfung der Wirksamkeit von Aktionen, Maßnahmen, Interventionen und anderen Veränderungen mit t-Tests (Pretest-Posttest-Designs mit zwei Gruppen)
- Unterstützende Signifikanztests (Anderson-Darling-Test, Ryan-Joiner-Test, Levene-Test, Bonnet-Test, Signifikanztest für Korrelationen)
- Nonparametrische Verfahren (Wilcoxon-Test, Vorzeichentest, Mann-Whitney-Test
- Kontingenzanalysen (Binomialtest, Exakter Test nach Fisher, Chi-Quadrat-Test, Kreuztabellen mit Assoziationsmaße)
Methoden zum Mittelwertvergleich von mehreren Gruppen (ca. 5 Tage)
- Ein- und zweifaktorielle Varianzanalyse (einfache und balancierte ANOVA)
- Mehrfaktorielle Varianzanalyse (Allgemeines Lineares Modell)
- Feste, zufällige, gekreuzte und geschachtelte Faktoren
- Mehrfachvergleichsverfahren (Tukey-HSD, Dunnett, Hsu-MCB, Games-Howell)
- Interaktionsanalyse (Analyse von Wechselwirkungseffekten)
- Trennschärfe und Poweranalyse bei Varianzanalysen
Einführung in die Versuchsplanung (DoE, Design of Experiments) (ca. 1 Tag)
- Voll- und teilfaktorielle Versuchspläne
Projektarbeit (ca. 3 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
SQL - Relationale Datenbanken
Grundlagen von Datenbanksystemen mit Access (ca. 3 Tage)- Redundante Daten
- Datenintegrität
- Normalisierung
- BCNF
- DB-Entwurf
- Beziehung 1:n, m:n
- Datentypen
- Tabellen
- Primär- und Fremdschlüssel
- Referentielle Integrität
- Beziehungen zwischen Relationen
- Entity-Relationship-Modell
- Index, Standartwert
- Einschränkungen (Check)
- Abfragen
- Formulare, Berichte
- Zirkelbezug
Einführung in SQL Server Management Studio (SSMS) (ca. 2 Tage)
- Übersicht
- Phys. DB-Design
- Tabellen erstellen
- Datentypen in MS SQL
- Primary Key
- Einschränkungen, Standartwerte, Diagramm, Beziehungen
- Backup und Restore
Einführung in DDL (ca. 8 Tage)
- SQL Grundlagen
- Syntax
- Befehle
- Mehrere Tabellen
- Operatoren
- Ablaufkontrolle
- Skalarwertfunktionen
- Tabellenwertfunktionen
- Systemfunktionen
- Prozeduren mit und ohne Parameter
- Fehlertypen
- Transaktionen, Sperren, DeadLock
DCL – Data Control Language (ca. 1 Tag)
- Anmeldungen
- Benutzer
- Rollen
- Berechtigungen
Datentypen, Datenimport und -export (ca. 1 Tag)
- Datentyp geography
- Datenexport, Datenimport
Projektarbeit (ca. 5 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
Programmierung mit Python
Grundlagen Python (ca. 1 Tag)- Geschichte, Konzepte
- Verwendung und Einsatzgebiete
- Syntax
Erste Schritte mit Python (ca. 5 Tage)
- Zahlen
- Zeichenketten
- Datum und Zeit
- Standardeingabe und -ausgabe
- list, tuple dict, set
- Verzweigungen und Schleifen (if, for, while)
Funktionen (ca. 5 Tage)
- Eigene Funktionen definieren
- Variablen
- Parameter, Rekursion
- Funktionale Programmierung
Fehlerbehebung (ca. 0,5 Tage)
- try, except
- Programmunterbrechungen abfangen
Objektorientierte Programmierung (ca. 4,5 Tage)
- Python-Klassen
- Methoden
- Unveränderliche Objekte
- Datenklasse
- Vererbung
Grafische Benutzeroberfläche (ca. 1 Tag)
- Buttons und Textfelder
- grid-Layout
- Dateiauswahl
Projektarbeit (ca. 3 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
Data Engineer
Grundlagen Business Intelligence (ca. 2 Tage)
- Anwendungsfelder, Dimensionen einer BI Architektur
- Grundlagen Business Intelligence, OLAP, OLTP, Aufgaben eines Data Engineers
- Data Warehousing (DWH): Umgang und Verarbeitung von strukturierten, semi-strukturierten und unstrukturierten Daten
Anforderungsmanagement (ca. 2 Tage)
- Aufgaben, Ziele und Vorgehensweise in der Anforderungsanalyse
- Datenmodellierung, Einführung / Modellierung mit ERM
- Einführung/Modellierung in der UML
- Klassendiagramme
- Use-Case Analyse
- Aktivitätsdiagramme
Datenbanken (ca. 3 Tage)
- Grundlagen von Datenbanksystemen
- Architektur von Datenbankmanagementsystemen
- Anwendung RDBMS,
- Umsetzung Datenmodell in RDBMS, Normalformen
- Praktische und theoretische Einführung in SQL
- Grenzen von Relationalen Datenbanken, csv, json
Data Warehouse (ca. 4 Tage)
- Star Schema
- Datenmodellierung
- Erstellung Star Schema in RDBMS
- Snowflake Schema, Grundlagen, Datenmodellierung
- Erstellung Snowflake Schema in RDBMS
- Galaxy Schema: Grundlagen, Datenmodellierung
- Slowly Changing Dimension Tables Typ 1 bis 5 - Restating, Stacking, Reorganizing, mini Dimension und Typ 5
- Einführung in normal, causal, mini und monster, heterogeneous und sub Dimensions
- Vergleich von state und transaction oriented Faktentabellen, Density und Storage vom DWH
ETL (ca. 4 Tage)
- Data Cleansing
- Null Values
- Aufbereitung von Daten
- Harmonisierung von Daten
- Anwendung von Regular Expressions
- Data Understanding
- Datenvalidierung
- Statistische Datenanalyse
- Datenschutz, Datensicherheit
- Praktischer Aufbau von ETL-Strecken
- Data Vault 2.0, Grundlagen, Hubs, Links, Satellites, Hash Key, Hash Diff.
- Datavault Datenmodellierung
- Praktischer Aufbau eines Data Vault Modells - Raw Vault, Praktische Umsetzung von Hash-Verfahren
Projektarbeit (ca. 5 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
Data Analytics
Einführung Datenanalyse (ca. 1 Tag)- CRISP-DM Referenzmodell
- Data Analytics Workflows
- Begriffsabgrenzung Künstliche Intelligenz, Machine Learning, Deep Learning
- Anforderungen und Rolle im Unternehmen des Data Engineers, Data Scientists und Data Analysts
Wiederholung Grundlagen Python (ca. 1 Tag)
- Datentypen
- Funktionen
Datenanalyse (ca. 3 Tage)
- Zentrale Python-Module im Kontext Data Analytics (NumPy, Pandas)
- Prozess der Datenaufbereitung
- Data Mining Algorithmen in Python
Datenvisualisierung (ca. 3 Tage)
- Explorative Datenanalyse
- Insights
- Datenqualität
- Nutzenanalyse
- Visualisierung mit Python: Matplotlib, Seaborn, Plotly Express
Datenmanagement (ca. 2 Tage)
- Big Data Architekturen
- Relationale Datenbanken mit SQL
- Vergleich von SQL- und NoSQL-Datenbanken
- Business Intelligence
- Datenschutz im Kontext der Datenanalyse
Datenanalyse im Big Data Kontext (ca. 1 Tag)
- MapReduce-Ansatz
- Spark
- NoSQL
Dashboards (ca. 3 Tage)
- Bibliothek: Dash
- Aufbau von Dashboards – Dash Components
- Customizing von Dashboards
- Callbacks
TextMining (ca. 1 Tag)
- Data Preprocessing
- Visualisierung
- Bibliothek: SpaCy
Projektarbeit (ca. 5 Tage)
- Zur Vertiefung der gelernten Inhalte
- Präsentation der Projektergebnisse
Änderungen möglich. Die Lehrgangsinhalte werden regelmäßig aktualisiert.
Präsenzlehrgänge mit Videotechnik der neuesten Generation
Der Einsatz von Videokonferenzsystemen gehört zum Lehrgangskonzept von alfatraining. Diese Form von Unterricht trainiert das Arbeiten in einer vernetzten Arbeitsumgebung, wie sie in Industrie und Wirtschaft existiert. In der globalisierten Arbeitswelt arbeiten Firmen heutzutage sowohl firmenintern als auch mit anderen Unternehmen deutschlandweit, europaweit oder weltweit über moderne Kommunikationstechniken und Netzwerke zusammen. Sie lernen im Unterricht den Umgang und Einsatz dieser modernen Techniken kennen.Wie funktioniert der Unterricht bei alfatraining?
Bei alfatraining findet der Unterricht via alfaview®, einer Videokonferenzsoftware, statt. Die Dozierenden und die Teilnehmenden können sich gegenseitig sehen, hören und miteinander sprechen – live, lippensynchron und in Fernsehqualität! Über den virtuellen Klassenraum alfaview® ist es möglich, dass Sie sowohl mit Dozierenden als auch mit allen Teilnehmerinnen und Teilnehmern Ihres Kurses sprechen und im Team standortübergreifend gemeinsam an Projekten arbeiten. Zusätzliche separate Online-Besprechungsräume eignen sich zur vertraulichen Kommunikation in Kleingruppen.
- Lernziel
Nach diesem Lehrgang verfügen Sie über wesentliche Kenntnisse in der Statistik, können komplexe Abfragen über relationale Datenbanken mit SQL durchzuführen und beherrschen die Programmiersprache Python. Verbunden mit dem im Kurs vermittelten Fachwissen des Data Engineerings und der Datenanalyse sind Sie in der Lage, umfangreiche Datensätze zu managen, statistisch effizient auszuwerten und die Ergebnisse anschaulich und leicht verständlich zusammenzufassen.
- Angaben zur geschlechterspezifischen Nutzung
- keine Einschränkungen
- Fachliche Zugangsvoraussetzungen
keine Einschränkungen
- Gesundheitliche Zugangsvoraussetzungen
keine Einschränkungen
Hinweis des Datenbankbetreibers: Informationen über die Barrierefreiheit erfragen Sie bitte beim Anbieter.
- Technische Zugangsvoraussetzungen
keine Einschränkungen
- Zeitmuster
- Vollzeit
- Lehr- und Lernform
- Präsenzveranstaltung
- Abschlussart
- Teilnahmebestätigung / Zertifikat des Anbieters
- Nähere Bezeichnung des Abschlusses
- alfatraining-Zertifikat „Data Analyst“
- Voraussichtliche Dauer
- 20 Woche(n)
- Termin
- Termine auf Anfrage
- Bemerkungen zum Termin
- Kursstart alle 4 Wochen
- Mindestteilnehmeranzahl
- 3
- Maximale Teilnehmerzahl
- 25
- Teilnahmegebühr
- Bitte erfragen
Hinweis des Datenbankbetreibers: Bitte erfragen Sie beim Anbieter eventuell auftretende Nebenkosten!
- Fördermöglichkeiten
- Weitere Informationen im Internet
- Themengebiet
- Informatik-, Informations- und Kommunikationstechnologie
Bildungsanbieter
alfatraining Bildungszentrum GmbH
Bildungszentrum Rostock
- Internet
- a:7633/cs_id:305646https://www.alfatraining.de
- Bildungsanbieter-Infos
- Bildungsanbieter-Infos
Kontakt
alfatraining Bildungsberatung
- Telefon
- 0800 3456500
- wmv(at)alfatraining.deKontaktformular
- Internet
- https://www.alfatraining.de/kontakt/rostock/https://www.alfatraining.de/kontakt/rostock/
- anerkanntes Qualitätsmanagementsystem
- DIN EN ISO 9001, Trägerzulassung nach AZAV
Veranstaltungsort
alfatraining Bildungszentrum GmbH
Bildungszentrum Rostock
- Besucheranschrift
- Doberaner Straße 110
18057 Rostock
Deutschland - Google Maps
- Telefon
- 0800-3456-500
- Wegbeschreibung
- Wegbeschreibung
- wmv(at)alfatraining.deKontaktformular
- Internet
- a:7633/cs_id:305646https://www.alfatraining.de
Kurs aktualisiert am 03.01.2023, Datenbank-ID 00305646