Finance meets Artificial Intelligence

Privacy-preserving natural language

Wie k?nnen Millionen von Daten automatisiert gebündelt und zum Training von Algorithmen aufbereitet werden und gleichzeitig die sensiblen Inhalte geschützt und die Privatsph?re der Betroffenen gewahrt bleiben? 
Dieser Aufgaben m?chten wir uns mit dem Thema KI-basierte Textverarbeitung unter Wahrung der Privatsph?re und des Datenschutz (Privacy-preserving Natural Language Processing) stellen, denn ein gro?er Teil von Nutzerdaten stammen aus natürlicher Sprache, wie beispielsweise von Such- und Chatbot-Anfragen, Call Centern, Gespr?chsnotizen, (automatische) Verschriftungen von Telefonaten, Sprachassistenten, sowie text-basierten Informationen wie Emails, Dokumente und Webseiten, um nur einige zu nennen. Es ist daher essentiell wichtig, NLP-Datens?tze zu kuratieren, die die Privatsph?re der Nutzer bewahren und Machine Learning Modelle zu trainieren, die ausschlie?lich nicht-identifizierende Nutzerdaten speichern.

Die wichtigsten Methoden und Herausforderungen sind hierbei:

1. Die Erkennung pers?nlicher Informationen, d.h. wie k?nnen diejenigen W?rter oder Phrasen in Texten automatisch gefunden werden, die pers?nliche Nutzerinformationen enthalten,

2. Die datenschutzerhaltende Textanalyse, d.h. wie k?nnen Differential Privacy Methoden und homomorphe Verschlüsselungsverfahren in die automatische Textanalyse integriert werden

3.  Datenschutz-verbessernde Technologien, d.h. wie k?nnen Datenschutz und Privatsph?re in aktuelle KI-Methoden integriert und verbessert werden.

 

Leitung: Prof. Dr.-Ing. Tanja Schultz

Ansprechpartner: Lily Meister