Themenschwerpunkt: XAI, MLOps, Data Science
Webseite/Blog: https://www.linkedin.com/in/verena-barth-7a6546192/
Sprache/n: Deutsch, Englisch, Spanisch
Stadt: Köln
Land: Deutschland
Themen: machine learning, artificial intelligence, data science, xai, bias in ai, mlops
Ich biete: Vortrag, Interview
Ich bin bereit, für eine Veranstaltung zu reisen.
Ich bin bereit, für gemeinnützige Zwecke kostenfrei zu sprechen.
Ich interessiere mich für faire, verantwortliche, transparente und menschenzentrierte KI, wobei mein beruflicher Schwerpunkt auf Automatisierung (MLOps) und mein privater auf den ethischen Aspekten liegt.
Indem ich die Gesellschaft für die potenzielle Diskriminierung von KI sensibilisiere und die Wichtigkeit der Erklärbaren KI (XAI, Explainable AI) hervorhebe und ihre Anwendung fördere, versuche ich, die Interpretierbarkeit von und das Vertrauen in ML-Modelle zu verbessern, ohne ihre (Lern-)Leistung einzuschränken.
Verena Barth ist als Beraterin bei der viadee IT-Unternehmensberatung tätig. Sie besitzt sowohl praktische als auch theoretische Erfahrungen in den Bereichen Data Mining, Data Science und Künstliche Intelligenz.
Neben dem KI-Kontext besitzt sie Praxiserfahrung im Software Engineering sowohl mit Frontend- als auch mit Backend-Technologien. Ihr besonderer Fokus liegt in der Optimierung und Automatisierung von ML-Workflows (MLOps) und der Prüfung der resultierenden KI-Systeme bezüglich ihrer Nachvollziehbarkeit (XAI).
Vorträge / Referenzen:
Die MLOps-Plattform Kubeflow hat sich zum Ziel gesetzt, die Bereitstellung von End-to-End Workflows für maschinelles Lernen (ML) einfach, portabel, reproduzierbar und skalierbar zu machen - und das gelingt nirgends besser als in Kubernetes in der Cloud!
Die modulare Multi-Architektur und Multi-Cloud setzt sich aus verschiedenen Best-of-breed-Open-source-Systemen zusammen und schlägt die Brücke zwischen den experimentierfreudigen Data Scientists und dem DevOps-Team.
In diesem Vortrag lernt ihr einige ML-spezifische Probleme kennen und erfahrt, wie Kubeflow sie adressiert. Mit einer beispielhaften Pipeline wird verdeutlicht, wie man einen Lebenszyklus mit Kubeflow-Pipelines abbildet und ihn dann auf Kubernetes ausführt.
Dieser Vortrag ist auf: Deutsch
Tiefe neuronale Netze (DNNs) sind zu beliebten und verbreiteten Werkzeugen für genaue und effiziente Klassifikationen oder Prognosen geworden. Aufgrund ihrer inhärenten Komplexität sind sie jedoch für den Menschen oft unverständlich und ihre Entscheidungen nicht nachvollziehbar.
Die mangelnde Transparenz dieser sogenannten Black-Boxes ist ein großer Nachteil und besonders in kritischen Bereichen, in denen eine Interpretierbarkeit entscheidend ist, ein Hindernis bei ihrem Einsatz.
Erklärbare Künstliche Intelligenz (XAI, Explainable Artificial Intelligence) versucht mithilfe von verschiedenen Methoden, das Problem fehlender Transparenz von ML-Modellen zu adressieren und die Ergebnisse der Lösung für den Menschen verständlich zu machen.
In diesem Vortrag wird das Potenzial von XAI erschlossen und aufgezeigt, wie man die Interpretierbarkeit von und das Vertrauen in ML-Modelle fördert, ohne ihre (Lern-)Leistung einzuschränken. Es werden verschiedene XAI-Methoden vorgestellt und taxonomisch eingeordnet. Zudem wird erläutert, welche Kriterien eines spezifischen Modell-, Daten- und Nutzungskontexts bei der Auswahl und Bewertung der Eignung von XAI-Methoden zu berücksichtigen sind. Nach einer kurzen Vorstellung ausgewählter XAI-Methoden werden abschließend allgemeine Handlungsempfehlungen zur Sicherstellung interpretierbarer ML-Modelle innerhalb eines Entwicklungs- und Deployment-Workflows gegeben.
Dieser Vortrag ist auf: Deutsch
Metadaten von Daten und ML-Modellen sind entscheidend für die Reproduzierbarkeit beim maschinellen Lernen und Reproduzierbarkeit ist entscheidend für zuverlässige Produktionseinsätze.
Um ein Modell zu verstehen, es zu analysieren, Probleme zu beheben und es zu verbessern, müssen Datenwissenschaftler:innnen die Input-Daten und ihre Verarbeitung verstehen. Die Kubeflow Plattform unterstützt uns dabei: Das automatische Tracken und Archivieren aller im Lebenszyklus eines Modells produzierten und erhobenen Daten ist ein Hauptmerkmal der Kubeflow Pipelines. Sobald die Plattform allerdings für reale Anwendungsfälle mit großen Datenmengen genutzt wird, können einige Features für die Reproduzierbarkeit des Modell-Lebenszyklus dem Nutzer zum Nachteil gereichen. In diesem Vortrag werden die Gründe dafür beleuchtet und verschiedene Varianten (und ihre jeweiligen Schwierigkeiten) aufgeführt, die Big Data und Kubeflow Pipelines effizient kombinieren können.
Dieser Vortrag ist auf: Deutsch
Die Plattformen SAS Viya und Kubeflow ermöglichen es beide skalierbare Machine Learning Modelle als koordinierte Dienste bereitzustellen. Beide Plattformen können auf allen gängigen Cloud-Plattformen oder auch On-Premise betrieben werden und basieren technisch auf Kubernetes und wiederverwendbaren ML-Pipelines, die als DAG strukturiert sind. Doch wie unterscheiden sich die Plattformen etwa hinsichtlich Datenmanagement, Feature Engineering, Modellbildung und -validierung? Kann SAS Viya mit der OpenSource Plattform mithalten?
Dieser Vortrag ist auf: Deutsch