Gwang Jin (Josephus) Kim-Data Scientist / Forscher für angewandte KI, Automatisierung und Datensysteme
Tagessatz prüfen
Erfahrungen
Data Scientist / Forscher für angewandte KI, Automatisierung und Datensysteme
Selbstständig
- Entwicklung und Erprobung von Prototypen in den Bereichen angewandte GenAI, RAG, GraphRAG, lokale LLM, agentische KI und Dokumentenintelligenz für strukturierte Analysen, Extraktion von Befunden, semantische Suche, technisches Reasoning und entscheidungsrelevantes Reporting
- Aufbau privater lokaler-LLM-Workflows und KI-Systemmuster mit Fokus auf Datenschutz, Reproduzierbarkeit, Prüfbarkeit, kostengünstige Inferenz und praktische Nutzerkontrolle
- Erstellung reproduzierbarer Python-/R-Workflows für Datenanalyse, Automatisierung, API-gesteuerte Tools, Validierungslogik, technische Dokumentation und KI-gestützte Softwareentwicklung
- Gestaltung von Workflows auf Basis expliziter Annahmen, nachverfolgbarer Eingaben, prüfbarer Ausgaben und Bewusstsein für Fehlermodi statt Black-Box-"sieht gut aus"-Demos
- Unterstützung der RAHN AG in einem chemischen/Regulierungsumfeld bei der Datenextraktion und -verarbeitung rund um WERCS, einer Regulierungsanwendung für Chemieprodukte und Compliance-Daten
- Analyse komplexer Anwendungs-/Datenbankschemata und Erstellung verschachtelter SQL-Abfragen zur Informationsgewinnung für Mischungsberechnungen, Komponentenbeziehungen, regulatorische Regeln und Reporting-Logik
- Fortführung der praktischen Arbeit in Git/GitHub/GitLab/Bitbucket, Docker-/Linux-Deployment-Mustern, REST-/API-Workflows, Fehlerbehandlung, technischem Schreiben und schneller KI-gestützter Prototypentwicklung
- Aufbau von Workflows für technische Dokumentation, die komplexe Systeme in klare Runbooks, Checklisten, Entscheidungsnotizen und nutzerorientierte Erklärungen überführen
Associate Expert Digitale Lösungen
Novartis AG (über Actalent / Allegis Group)
- Erstellung von Machine-Learning- und Deep-Learning-Modellen für Bioprozess- und Spektraldaten, einschließlich CNN-basierter Vorhersage analytischer Messwerte aus Raman-/Spektraleingaben unter realistischen Small-Data-Bedingungen
- Entwicklung von Validierungslogik, Vergleich des Modellverhaltens, Analyse von Fehlern in Vorhersagen und Behandlung von Modellausfällen als nützliche Hinweise auf Daten-, Vorverarbeitungs- und Versuchsgrenzen
- Entwicklung von Tools auf Basis von Python, Streamlit, Flask und REST-APIs für Prozessüberwachung, Datenabruf, Visualisierung, Reporting und operative Entscheidungsunterstützung
- Erstellung eines Python-Wrappers für eine interne REST-API, um Live-Prozess- und Bioreaktordaten leichter zugänglich, prüfbar, analysierbar, wiederverwendbar und erklärbar zu machen
- Automatisierung von Workflows für Datenextraktion, -bereinigung, Reporting, Backup und Monitoring mit Python, PowerShell, Bash, SQL und strukturierter Dokumentation
- Arbeit in einem regulierten Biopharma-F&E-/Antikörperproduktionsumfeld, in dem Modelloutputs, Dashboards und Datenworkflows für technische Anwender verständlich, nachvollziehbar und nützlich sein mussten
- Unterstützung von datenbankgestützten Anwendungs-/Datenworkflows rund um Lucullus, ein Bioreaktor-Software-System zur Sammlung von Sensordaten und Unterstützung vor Ort bei Bioreaktor-Operationen
- Enge Zusammenarbeit mit Wet-Lab-, Dry-Lab-, IT-, Automatisierungs- und Support-Teams zur Klärung von Workflowproblemen, Validierung von Datenverhalten und Umsetzung analytischer Anforderungen in nutzbare Werkzeuge
- Unterstützung von Kolleg*innen und leitenden Data Scientists bei R-/Python-Scripting, Deep Learning, Modellinterpretation, praktischer Validierung und der Überführung von Modellierungsideen in Workflows, die andere nutzen können
Postdoktoraler Bioinformatiker / Data Scientist
Universität Freiburg, SFB 992 „Medizinische Epigenetik“
- Durchführung vollständiger Analysen großer biomedizinischer Datensätze, einschließlich Einzelzell-RNA-Seq, Bulk-RNA-Seq, ChIP-Seq und ATAC-Seq: QC, Vorverarbeitung, differenzielle Analyse, Annotation, Visualisierung, Interpretation und Unterstützung bei Publikationen
- Aufbau reproduzierbarer Linux-/HPC-Pipelines für große Datensätze mit Bash, R/Bioconductor, Python, Git, Conda-Umgebungen, Make-ähnlicher Automatisierung und Job-Schedulern
- Verarbeitung strukturierter und semi-strukturierter Daten aus Probenblättern, Genom-Annotationen, Ergebnistabellen, Metadaten, großen Text-/Annotationsdateien und Tool-Ausgaben
- Entwicklung und Bewertung von ML-orientierten Ansätzen für Genomikfragen, einschließlich Feature Engineering, Dimensionsreduktion, statistischer Validierung, Analyse von Fehlermodi und sorgfältiger Interpretation
- Gestaltung von Analyse-Strategien, bei denen Schlussfolgerungen QC-, biologieplausibilitätsprüfungen, alternative Erklärungen und Kollegen-Reviews überstehen mussten
- Beratung von Professorinnen, Postdocs, Doktorandinnen, Masterstudierenden und Medizinstudierenden zu Analyse-Design, Gültigkeitsgrenzen, Reproduzierbarkeit, Fehlersuche und fundierter Interpretation
- Verfassen praktischer HPC-, Pipeline- und Workflow-Dokumentationen, die die Nutzbarkeit über meine eigene Forschungsgruppe hinaus verbesserten
- Beitrag zu peer-reviewten Publikationen, einschließlich Arbeiten, die als Cover-Feature in Nature Cell Biology erschienen sind
Forscher in der Molekularbiologie – PhD Molekulare Medizin
Universität Freiburg
- Durchführung von publikationsreifer Forschung in Humangenetik, Entwicklungsbiologie, Krankheitsmechanismen, regulatorischer Genomik, Molekularbiologie und experimentellen Modellsystemen
- Arbeit mit strukturierter experimenteller Dokumentation, Sequenz-/Annotationsressourcen, experimentellen Datensätzen, Kontrolllogik, Fehlerquellen und reproduzierbarer Interpretation
- Aufbau der wissenschaftlichen Grundlage, die ich weiterhin in meiner ML-Arbeit nutze: Versuchsdesign, Kontrollen, Kausalität, Störfaktoren, Datenqualität, Fehlermodi und vorsichtige Interpretation
- Forschung zu Genregulation, Dicer-/SOX9-/SOX8-bezogener Biologie und genetischen Krankheitskontexten, verbunden mit hochkarätigen Publikationen
Masterstudent und studentische Hilfskraft, Molekulare Medizin
Universität Freiburg
- Entwicklung früher quantitativer und experimenteller Disziplin durch Biomathematik/Biostatistik, qRT-PCR, Genotypisierung, rekombinante Virologie, Immunhistologie, primäre Zellkultur und strukturierte Dateninterpretation
- Arbeit in Forschungsumgebungen der Genetik, Inneren Medizin und Virologie mit starkem Fokus auf Evidenz, Kontrollen, Datenqualität und Reproduzierbarkeit
Branchenerfahrung
Sieh, in welchen Branchen dieser Freelancer den Großteil seiner beruflichen Laufbahn verbracht hat.
Erfahren in Bildung, Biotechnologie, Chemie, Informationstechnologie (IT) und Pharmazeutika.
Erfahrung nach Fachbereich
Zeigt, in welchen Abteilungen und Funktionen dieser Freelancer am meisten mitgewirkt hat.
Erfahren in Forschung und Entwicklung (F&E), Informationstechnologie (IT) und Qualitätssicherung.
Zusammenfassung
Angewandter Machine-Learning-Ingenieur und promovierter Naturwissenschaftler mit über 10 Jahren Erfahrung in datenintensivem Modeling, wissenschaftlichem Rechnen, Automatisierung und Machine Learning, einschließlich direkter Arbeit bei Novartis F&E in einem regulierten Biopharma-Umfeld. Umfassende praktische Erfahrung in Python, Deep Learning, CNNs, Modellevaluation, Datenpipelines, Versuchsdesign, Fehleranalyse, wissenschaftlicher Validierung und produktionseinschlägigen digitalen Werkzeugen.
Besonders geeignet für Vision-Language-Model- und multimodale KI-Projekte, bei denen Modelle sorgfältig evaluiert, iterativ verbessert und mit realen Anwendungsfällen verknüpft werden müssen, statt nur als beeindruckende Demos zu dienen. Meine zentrale Stärke ist die Kombination aus ML-Implementierung, datenorientierter Experimentierung, Benchmark-Design, Robustheitsdenken und der wissenschaftlichen Gewohnheit, zu fragen, warum ein Modell versagt, bevor man behauptet, dass es funktioniert.
Für FRATCHs konversationellen Fahr-/Parkanwendungsfall sehe ich mich als angewandten ML-Entwickler, der VLM-basierte Lösungen, Datensätze, Evaluationsrahmen, Prompting-/Feinabstimmungsstrategien, Fehleranalyse, automatisierte Tests und die Zusammenarbeit mit Integrations- oder Fachexperten unterstützen kann. Ich habe nicht direkt im Automotive-ADAS-Bereich gearbeitet, aber häufig in Bereichen, in denen sensorähnliche Daten, komplexe Systeme, Modellzuverlässigkeit und Domänenvorgaben zusammenkommen müssen.
Fähigkeiten
Angewandtes Ml / Deep Learning: üBerwachtes Lernen, Cnns, Klassifikation, Regression, Modellanpassung, Modellevaluation, Fehleranalyse, Fehlertaxonomie, Small-Data-Modellierung, RobustheitsprüFungen Und Vorsichtige Interpretation
Vision- / Multimodal-Ki-Bereitschaft: Grundlagen Der Computer Vision, Bild-/Signal-Daten-Denken, Multimodale Ki, Vision-Language-Modelle, Foundation-Model-Evaluation, Prompt-Basierte Anpassung, Fine-Tuning-Konzepte Und Modell-Output-Validierung
Evaluation Und Experimentierung: Benchmark-Design, Diszipliniertes Experiment-Tracking, Ablations-Denken, Leistungskennzahlen, Entdeckung Von RandfäLlen, Analyse Von Fehlermodi, Modellvergleiche Und Datenorientierte Verbesserungszyklen
Datenengineering FüR Ml: Datensatzaufbau, Vorverarbeitung, Auf Annotationen Ausgerichtetes Denken, Datenvalidierung, Feature Engineering, Versionierte Eingaben, Reproduzierbare Pipelines, Automatisiertes Reporting Und QualitäTssicherungstore
Python-Ml-Implementierung: Python, Pytorch, Tensorflow/Keras, Scikit-Learn, Xgboost, Pandas/Numpy, Jupyter, Streamlit/Flask, Rest-Apis, Git, Linux Und Reproduzierbare Umgebungen
Llm-/Genai-Systeme: Llms, Rag, Graphrag, Embeddings, Dokumentenintelligenz, Prompt Engineering, Context Engineering, Strukturierte Ausgaben, Halluzinationsreduktion Und üBerprüFbare Ki-Workflows
ZuverläSsigkeit Von Modellen In Der Praxis: Umwandlung Vager DomäNenanforderungen In Messbare Tests, Identifikation Von DatenlüCken, Dokumentation Von Annahmen, ErkläRung Von Unsicherheit Und Aufbau Von Werkzeugen, Die Andere PrüFen Und Wiederverwenden KöNnen
Bereitstellung üBer Fachgrenzen Hinweg: Zusammenarbeit Mit Wissenschaftlern, Ingenieuren, It-/Support-Teams Und Fachexperten; ÜBersetzung Von DomäNenanforderungen In Technische Konzepte, Experimente, Berichte Und Nutzbare Werkzeuge
Machine Learning / Deep Learning: Deep Learning, Cnns, Klassifikation, Regression, üBerwachtes Lernen, Modellvalidierung, Fehleranalyse, RobustheitsprüFungen, ErkläRbarkeit, Kommunikation Von Unsicherheit, Small-Data-Modellierung, Scikit-Learn, Xgboost, Pytorch, Tensorflow/Keras
Vision / Multimodale Ki: Vision-Language-Modelle, Multimodale Ki, Grundlagen Der Computer Vision, Bild-/Signal-Daten, Foundation-Modelle, Prompt-Basierte Anpassung, Fine-Tuning-Konzepte, Evaluation Von Modell-Outputs, Randfallanalyse
Evaluation / Experimentierung: Benchmark-Design, DatensäTze FüR Model-Assessment, Versuchsdesign, Metriken, Fehlertaxonomien, Datenorientierte Verbesserung, Validierungstore, Reproduzierbare Reports, Automatisierte Evaluierungskonzepte
Datenengineering: Datensatzaufbau, Datenbereinigung, Vorverarbeitung, Auf Annotationen Ausgerichtete Workflows, Umgang Mit Metadaten, Feature Engineering, DatenqualitäT, Versionierte Eingaben, Pipelines, Strukturierte Exporte, Monitoring-Bereite Workflows
Programmierung: Python, R, Sql, Bash, Powershell, Git, Linux, Macos, Windows, Common Lisp, Grundkenntnisse In Julia, Grundkenntnisse In Javascript
Python-Ml-/Daten-Stack: Pandas, Numpy, Scipy, Matplotlib, Plotly, Jupyter, Scikit-Learn, Xgboost, Pytorch, Tensorflow/Keras, Streamlit, Flask, Rest-Apis
Llm-/Genai-Systeme: Llms, Genai, Rag, Graphrag, Embeddings, Semantische Suche, Prompt Engineering, Context Engineering, Lokale Llms, Dokumentenintelligenz, Strukturierte Ausgaben, Halluzinationsreduktion, Ki-Evaluation
Datenbanken / Strukturierte Daten: Sql, Relationale Datenbanken, Postgresql/Mysql/Mariadb, Erste Erfahrungen Mit Sql Server, Schema-Erkundung, Joins, Verschachteltes Sql, Datenextraktion, DatenqualitäTsprüFungen Und Reporting-Workflows
Deployment-Nahe Tools: Erste Erfahrungen Mit Docker, Linux-Deployment-Mustern, Reproduzierbare Umgebungen, Rest-/Api-Integration, Logging-Orientiertes Denken, Monitoring-Logik, Technische Dokumentation, Ci/Cd-Erfahrung
Sprachen
Ausbildung
Universität Freiburg
PhD, Molekulare Medizin · Molekulare Medizin · Freiburg im Breisgau, Deutschland
Universität Freiburg
MSc / Diplom, Molekulare Medizin · Molekulare Medizin · Freiburg im Breisgau, Deutschland
Zertifikate & Bescheinigungen
Agile Softwareentwicklung: Scrum für Entwickler
LinkedIn Learning
Datenanalyse mit Python
freeCodeCamp
JavaScript-Algorithmen und Datenstrukturen
freeCodeCamp
Neo4j Graph Data Science Zertifizierung
Neo4j
Wissenschaftliches Rechnen mit Python
freeCodeCamp
Statistiken
Erfahrung
Globale Erfahrung
Fachkenntnisse
Qualifikationen
Profil
Häufig gestellte Fragen
Du hast Fragen? Hier findest du mehr.
Durchschnittlicher Tagessatz für ähnliche Positionen
Die Tagessätze basieren auf aktuellen Projekten und enthalten keine FRATCH-Marge.
Ähnliche Freelancer
Entdecke andere Experten mit ähnlichen Qualifikationen und Erfahrungen
Experten, die kürzlich an ähnlichen Projekten gearbeitet haben
Freelancer mit praktischer Erfahrung in vergleichbaren Projekten als Data Scientist / Forscher für angewandte KI, Automatisierung und Datensysteme
Freelancer in der Nähe
Fachkräfte, die in oder in der Nähe von Zürich, Schweiz arbeiten
