Jan Krol-Datenexperte
Tagessatz prüfen
Erfahrungen
Datenexperte
Fertigung
Datenexperte
Intralogistik
- Beratung und Umsetzung von AWS-Infrastruktur zur Unterstützung globaler Prozessabläufe im Transport und in der Logistik
- Bereitstellung und Betrieb von Servern, Betriebssystemumgebungen und Datenbanken in AWS
- Identifikation und Präsentation von Optimierungspotenzialen in kaufmännischen und technischen Aspekten
- Administration und Wartung bereitgestellter Systeme
- Entwicklung von Wartungs- und Monitoring-Konzepten
- Beratung von Entwicklungsprojekten zur Systemnutzung, -konfiguration und -optimierung
- Beratung zu Architekturen und Betriebskonzepten mit AWS Cloud
- Schulung interner Mitarbeiter zu neuen AWS-Services und Arbeitsweisen
Services: AWS Glue, Redshift, EMR, SageMaker, Python
Datenexperte
Logistik
- Entwicklung und Implementierung einer standardisierten Big-Data-Architektur für konzernweite Plattformservices im Transport- und Logistikbereich auf Azure
- Automatisierte Lösungen mit Infrastructure as Code (Terraform, Ansible)
- Vorstellung und Diskussion von Teilprojektarchitekturen auf Azure
- Umsetzung von Echtzeit-Daten-Streaming mit Apache Kafka und Monitoring-Lösungen
- Beratung zur Azure-Plattformstrategie und Referenzarchitekturen
- Entwicklung von Mechanismen zur proaktiven Beseitigung von Schwachstellen in Azure- und Kubernetes-Clustern
- Konzeption von Container-Orchestrierungsplattformen mit Kubernetes CI/CD
- Erstellung von Benutzer- und Berechtigungskonzepten nach Konzernvorgaben
- Betrieb operativer Services im agilen Team
Services: Azure Purview, Azure Synapse Analytics, Azure Data Factory, Azure Databricks, Terraform, GitLab Runner, Azure DevOps
Datenexperte
E-Commerce
- Strategische Entwicklung und Migration von Analytics-Datenpipelines in eine Data-Lakehouse-Architektur auf AWS
- Ausbau der Big-Data-Lake-Umgebung und Sicherstellung strenger Datenqualität und DSGVO-Konformität
- Explorative Analyse und Algorithmusentwicklung durch Datenbereitstellung und -aufbereitung (AWS Glue, Spark, Lambda)
- Entwicklung von ETL-Jobs und Datenpipelines zur Bereitstellung bereit nutzbarer Datenquellen (AWS Glue, Redshift, Spark, PySpark)
- Durchführung von Regressionstests und Qualitätsprüfungen in Datenpipelines und im Data Lake
- Implementierung leistungsstarker Streaming-Datenverarbeitung mit Kinesis, Kafka und Lambda
- Orchestrierung und Verbindung mehrerer Datenquellen
- Automatisierte Deployments mit DevOps-Best-Practices (CodeBuild, CodePipeline, GitHub Actions)
- Aufbau der Infrastruktur mit IaC (AWS CDK)
- Überwachung von Datenqualität, Compliance und Kosten
Services: AWS Glue, Kinesis, Kafka, Apache Spark, Data Catalog, S3, Athena, Redshift, Lambda, ECS, Step Functions
Datenexperte
E-Commerce
- Begleitung interner E-Commerce-Produktteams bei der Entwicklung, Implementierung und Wartung leistungsstarker Datenverarbeitungs- und Integrationssysteme
- Migration bestehender Datendienste, Pipelines und Assets in eine neue ereignisbasierte Serverless-Architektur
- Entwicklung und Ausführung von Lambda-Funktionen und PySpark-Jobs
- Entwurf von Architektur und Integration mit Kafka für Echtzeit-Verarbeitung und -Analyse von Ereignisdaten
- Implementierung von PySpark-Transformationen, Filtern und Aggregationen
- Sicherstellung einer effizienten und zuverlässigen Anbindung an Kafka, Konfiguration der Sicherheitseinstellungen und Integration mit anderen Komponenten
- Einrichtung umfangreicher Test- und Monitoring-Mechanismen
- Bereitstellung eines leistungsstarken, skalierbaren Ereignissystems zur datengetriebenen Entscheidungsfindung
Services: AWS Glue, Apache Spark, Data Catalog, S3, Athena, Redshift, Lambda, ECS, Step Functions
Datenexperte
Transport & Logistik
- Integrierte Logistikdatenströme mit Event Hub und Kafka unter Verwendung von PySpark Structured Streaming
- Entwarf und implementierte eine Pipeline zum Erfassen, Verarbeiten und Weiterleiten von Datenströmen
- Verwendete PySpark Structured Streaming für effiziente Echtzeit-Datenverarbeitung
- Konfigurierte und initialisierte PySpark-Streaming-Jobs und definierte die notwendigen Datenstrukturen
- Führte umfassende Tests und Monitoring durch, um einen reibungslosen Datentransfer und hohe Datenqualität sicherzustellen
- Ermöglichte eine robuste und effiziente Integration von Logistikdatenströmen mit Event Hubs
- Realisierte die Echtzeit-Nutzung von Logistikdaten für Analysen und weitere Verarbeitung
Dienste: Azure Synapse Analytics, Purview Data Catalog, Apache Spark, Event Hub, Structured Streaming, GraphFrame, Azure Storage v2, Power BI
Datenexperte
Transport & Logistik
- Führte die Entwicklung einer robusten Datenstrategie und eines Governance-Frameworks an, um die Datenverarbeitungskapazitäten zu optimieren und zu verbessern
- Baute eine ausgefeilte Datenmanagement-Plattform auf Databricks
- Entwarf und implementierte eine effiziente Ingestionsplattform für den Daten-Hub
- Leitete die Konzeption und Einrichtung einer unternehmensweiten Datenstrategie im Einklang mit den Geschäftszielen
- Entwickelte ein umfassendes Data-Governance-Framework zur Sicherstellung von Datenrichtigkeit, Datenschutz und Compliance
- Überwachte die Bereitstellung und Anpassung der Datenmanagement-Plattform auf Databricks
- Verbesserte die Datenverarbeitung, Analyse und Reporting-Funktionen mit Power BI
- Entwickelte einen robusten Daten-Hub mit erweiterten Ingestions-Pipelines basierend auf AWS EventBridge
- Optimierte den Datenfluss aus verschiedenen Quellen zu zentralen Speichersystemen (Data Lake House auf Azure)
- Arbeitete mit funktionsübergreifenden Teams zusammen, um die Datenmanagement-Plattform in die bestehende IT-Infrastruktur zu integrieren
- Führte Schulungen und Workshops durch, um eine datengetriebene Kultur zu fördern und die Datenkompetenz zu erhöhen
Dienste: Azure Databricks, Databricks Data Catalog, AWS EventBridge, Kinesis, Event Hub, Structured Streaming, Apache Spark
Datenexperte
Transport & Logistik
- Fungierte als technischer Leiter und leitete ein Team von 3 Offshore-Entwicklern bei der Implementierung skalierbarer und robuster Datenlösungen in Azure Databricks
- Führte Databricks Live Tables zur Schema- und Tabellenverwaltung ein
- Implementierte Databricks Asset Bundle nach dem Infrastructure-as-Code-Prinzip
- Entwarf und verfeinerte die Medallion-Datenarchitektur, um Datenverarbeitungsabläufe zu optimieren
- Arbeitete eng mit verschiedenen Fachbereichen zusammen, um sicherzustellen, dass die Datenlösungen deren spezifische Anforderungen erfüllten
- Etablierte Coding-Standards und Best Practices für das Entwicklungsteam
- Führte Code-Reviews durch und gab technische Anleitung
- Ermöglichte Wissensaustausch und technische Schulungen
- Entwickelte skalierbare ETL-Pipelines in Azure Databricks
- Schuf optimierte Datenspeicherlösungen mit Blick auf zukünftige Skalierbarkeit
- Etablierte einen vollständigen IaC-Workflow für Datenplattform-Komponenten
- Integrierte Versionskontrolle und CI/CD für Databricks Asset Bundles
- Automatisierte die Bereitstellung von Tabellen-Schemas, Jobs und Notebooks
- Implementierte Strategien zur Umgebungs-Promotion (Dev/Test/Prod)
- Verwaltete Konfigurationen für Konsistenz über alle Umgebungen
Dienste: Azure Databricks, Databricks Live Tables, Databricks Asset Bundle, Azure Data Factory, Delta Lake, Spark SQL, Azure Key Vault, Azure Storage, Power BI
Branchenerfahrung
Sieh, in welchen Branchen dieser Freelancer den Großteil seiner beruflichen Laufbahn verbracht hat.
Erfahren in Transport und Logistik, Fertigung und Einzelhandel.
Erfahrung nach Fachbereich
Zeigt, in welchen Abteilungen und Funktionen dieser Freelancer am meisten mitgewirkt hat.
Erfahren in Business Intelligence, Informationstechnologie (IT) und Qualitätssicherung.
Zusammenfassung
Big Data-Spezialist, Schwerpunkt: Big Data, Cloud-Architektur, Plattformen für Datenmanagement
Fähigkeiten
Big Data-Plattform-Spezialist Mit Schwerpunkt Auf Amazon Web Services Und Microsoft Azure
Etl-Prozesse/-Pipelines Und Data Engineering
Architektur Von Datenmanagement-Plattformen In Unternehmen
Aufbau Von Data Lakes Und Data Lakehouses
Anwendungs-Migrationen Mit Cloud-Services
Beratung Und Umsetzung Von Automatisierungskonzepten, Besonders Devops
Integration Von Active Directory, Sicherheitskonzepten Und Compliance-Anforderungen
Monitoring Und Logging
Sicher In Python, Sql, Typescript, Golang
Big Data-Cloud-Architektur (Aws Und Microsoft Azure)
Data Engineering (Databricks, Synapse Analytics, Fabric, Apache Spark, Aws Glue, Athena, Redshift Und Emr)
Infrastructure As Code (Terraform, Pulumi, Aws Cdk, Arm)
Sprachen
Zertifikate & Bescheinigungen
AWS Business Professional
AWS Certified Cloud Practitioner
AWS Certified Machine Learning – Specialty
AWS Certified Solutions Architect – Associate
AWS Technical Professional
Azure Solutions Architect Expert: AZ-300: Microsoft Azure Architect Technologies AZ-301: Microsoft Azure Architect Design
Databricks Certified Associate Developer For Apache Spark 3.0
HashiCorp Certified: Terraform Associate
Statistiken
Erfahrung
Fachkenntnisse
Qualifikationen
Profil
Häufig gestellte Fragen
Du hast Fragen? Hier findest du mehr.
Durchschnittlicher Tagessatz für ähnliche Positionen
Die Tagessätze basieren auf aktuellen Projekten und enthalten keine FRATCH-Marge.
Ähnliche Freelancer
Entdecke andere Experten mit ähnlichen Qualifikationen und Erfahrungen
Freelancer in der Nähe
Fachkräfte, die in oder in der Nähe von Berlin, Deutschland arbeiten
