{"id":5615,"date":"2023-08-09T12:14:32","date_gmt":"2023-08-09T12:14:32","guid":{"rendered":"https:\/\/laizee.ai\/?p=5615"},"modified":"2024-04-16T15:23:37","modified_gmt":"2024-04-16T15:23:37","slug":"entwicklung-nlp-ki-systeme-beachtung-datenschutz","status":"publish","type":"post","link":"https:\/\/laizee.ai\/blog\/entwicklung-nlp-ki-systeme-beachtung-datenschutz","title":{"rendered":"Wie lassen sich NLP-Systeme entwickeln ohne den Datenschutz zu gef\u00e4hrden?"},"content":{"rendered":"<style>.kadence-column5615_fcdb9d-b5 > .kt-inside-inner-col,.kadence-column5615_fcdb9d-b5 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column5615_fcdb9d-b5 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column5615_fcdb9d-b5 > .kt-inside-inner-col{flex-direction:column;}.kadence-column5615_fcdb9d-b5 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column5615_fcdb9d-b5 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column5615_fcdb9d-b5{position:relative;}@media all and (max-width: 1024px){.kadence-column5615_fcdb9d-b5 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column5615_fcdb9d-b5 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column5615_fcdb9d-b5\"><div class=\"kt-inside-inner-col\"><style>.wp-block-kadence-advancedheading.kt-adv-heading5615_b97df6-a4, .wp-block-kadence-advancedheading.kt-adv-heading5615_b97df6-a4[data-kb-block=\"kb-adv-heading5615_b97df6-a4\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_b97df6-a4 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_b97df6-a4[data-kb-block=\"kb-adv-heading5615_b97df6-a4\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_b97df6-a4 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_b97df6-a4[data-kb-block=\"kb-adv-heading5615_b97df6-a4\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_b97df6-a4 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_b97df6-a4\">Nur wenige Bereiche der Informatik sind momentan so popul\u00e4r wie das maschinelle Lernen (ML) und insbesondere der Bereich des Natural Language Processing (NLP). Wer kennt nicht die Bedienung des Smartphones oder Radios mittels Sprachassistent (Siri, Alexa etc.)? Wie angenehm ist es doch die Adresse, zu der man navigiert werden will, einfach einzusprechen? Selbst die automatische Erkennung von Kundenanliegen bei der Dunkelverarbeitung von Briefen ist m\u00f6glich.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_a6822b-a2, .wp-block-kadence-advancedheading.kt-adv-heading5615_a6822b-a2[data-kb-block=\"kb-adv-heading5615_a6822b-a2\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_a6822b-a2 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_a6822b-a2[data-kb-block=\"kb-adv-heading5615_a6822b-a2\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_a6822b-a2 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_a6822b-a2[data-kb-block=\"kb-adv-heading5615_a6822b-a2\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_a6822b-a2 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_a6822b-a2\">Trotz bereits vorhandener Helfer und etablierten Prozess- und Vorgehensmodellen, wie zum Beispiel STAMP4NLP [1], ist die Erstellung einer solchen Anwendung immer noch mit hohem Aufwand verbunden. Um die notwendigen statistischen Modelle, die in der Lage sind Muster innerhalb von Daten zur Informationsextraktion abzubilden, trainieren zu k\u00f6nnen, m\u00fcssen zun\u00e4chst geeignete Daten identifiziert werden und aufbereitet werden. Dazu z\u00e4hlt sowohl die Bereinigung von Rechtschreibfehlern, als auch das manuelle Tagging, welches die Markierung von Elementen im Text ist. Auf Basis des annotierten Korpus wird in der Trainingsphase das Modell trainiert und nach abgeschlossener Optimierung in ein KI-System integriert, dass produktiv einsetzbar ist (siehe <em>Abbildung 1<\/em>).<\/p>\n\n\n<style>.kb-image5615_ee7d96-84 .kb-image-has-overlay:after{opacity:0.3;}<\/style>\n<figure class=\"wp-block-kadence-image kb-image5615_ee7d96-84 size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"574\" src=\"https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/KI_System-1024x574.png\" alt=\"Visualisierung der KI Schritte\" class=\"kb-img wp-image-5707\" srcset=\"https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/KI_System-1024x574.png 1024w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/KI_System-300x168.png 300w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/KI_System-768x431.png 768w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/KI_System-1536x861.png 1536w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/KI_System.png 1794w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption><a>Abbildung\u00a0<\/a>1:\u00a0Entwicklungsprozess KI-System<\/figcaption><\/figure>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_fa4021-9b, .wp-block-kadence-advancedheading.kt-adv-heading5615_fa4021-9b[data-kb-block=\"kb-adv-heading5615_fa4021-9b\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_fa4021-9b mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_fa4021-9b[data-kb-block=\"kb-adv-heading5615_fa4021-9b\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_fa4021-9b img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_fa4021-9b[data-kb-block=\"kb-adv-heading5615_fa4021-9b\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_fa4021-9b wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_fa4021-9b\">Ein Punkt, der bei der Erstellung von KI-Systemen immer mehr in den Fokus r\u00fcckt, ist der Datenschutz&nbsp;[2]. Auf Grund der hohen Komplexit\u00e4t in der Erstellung von NLP-Anwendungen sind viele Unternehmen auf die Hilfe von externen Firmen und Entwicklern angewiesen. Dabei sind allerdings Daten, die auch datenschutzkritische Informationen enthalten, herauszugeben, auf deren Basis die neuen Anwendungen trainiert werden. Dies ist der Punkt an dem bisher der Gro\u00dfteil dieser Unternehmen die Einf\u00fchrung von NLP im eigenen Betrieb zur\u00fcckzieht, da eine Anonymisierung der Daten mit hohem Aufwand verbunden ist.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_972306-89, .wp-block-kadence-advancedheading.kt-adv-heading5615_972306-89[data-kb-block=\"kb-adv-heading5615_972306-89\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_972306-89 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_972306-89[data-kb-block=\"kb-adv-heading5615_972306-89\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_972306-89 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_972306-89[data-kb-block=\"kb-adv-heading5615_972306-89\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_972306-89 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_972306-89\">Insbesondere durch die EU-Datenschutz-Grundverordnung (DSGVO) hat das Thema datenschutzkonforme Anonymisierung von Daten nochmal Aufwind bekommen&nbsp;[3]. Durch die drohenden hohen Strafen bei Zuwiderhandlung stellt der Datenschutz aktuell ein besonders gro\u00dfes Hindernis zur Einf\u00fchrung von NLP dar.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_b6cd86-7e, .wp-block-kadence-advancedheading.kt-adv-heading5615_b6cd86-7e[data-kb-block=\"kb-adv-heading5615_b6cd86-7e\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_b6cd86-7e mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_b6cd86-7e[data-kb-block=\"kb-adv-heading5615_b6cd86-7e\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_b6cd86-7e img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_b6cd86-7e[data-kb-block=\"kb-adv-heading5615_b6cd86-7e\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_b6cd86-7e wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_b6cd86-7e\">Existierende Verfahren, die relativ einfach die datenschutzkritischen Informationen gegen k\u00fcnstliche austauschen, sind nicht ohne weiteres nutzbar. Dies ist einerseits durch die jeweilige Anwendungsdom\u00e4ne begr\u00fcndet. Im Kontext von Versicherungen sind exemplarisch sicherlich die Kennungen von Policen, Namen, Ereignisdaten und Adressen als kritisch anzusehen. Hingegen ist im Kontext von medizinischen Daten ein gro\u00dfes Augenmerk auf Attribute wie z.B. Gr\u00f6\u00dfe, Gewicht, Symptome und Diagnosen zu legen. Folglich sind f\u00fcr jede Dom\u00e4ne erst einmal die kritischen Attribute zu identifizieren.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_d8c666-5f, .wp-block-kadence-advancedheading.kt-adv-heading5615_d8c666-5f[data-kb-block=\"kb-adv-heading5615_d8c666-5f\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_d8c666-5f mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_d8c666-5f[data-kb-block=\"kb-adv-heading5615_d8c666-5f\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_d8c666-5f img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_d8c666-5f[data-kb-block=\"kb-adv-heading5615_d8c666-5f\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_d8c666-5f wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_d8c666-5f\">Zudem ist zu ber\u00fccksichtigen, dass ausreichend Informationen anonymisiert werden. Wenn mit den verbliebenen Informationen und Hinzunahme einer weiteren Datenquelle wieder R\u00fcckschl\u00fcsse auf die Ursprungsdaten m\u00f6glich sind, liegt keine r\u00fcckschlussfreie Anonymisierung vor. Ein Beispiel hierf\u00fcr ist die Entfernung des Namens und der Adresse, aber zugleich Erhalt des Geburtsdatums und des Geschlechts in einem medizinischen Bericht. Nimmt man nun das Melderegister hinzu und grenzt es auf den Einzugsbereich des Krankenhauses ein, ist eine Identifikation der betroffenen Person mit geringem Aufwand m\u00f6glich&nbsp;[4].<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_1927f2-2f, .wp-block-kadence-advancedheading.kt-adv-heading5615_1927f2-2f[data-kb-block=\"kb-adv-heading5615_1927f2-2f\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_1927f2-2f mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_1927f2-2f[data-kb-block=\"kb-adv-heading5615_1927f2-2f\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_1927f2-2f img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_1927f2-2f[data-kb-block=\"kb-adv-heading5615_1927f2-2f\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_1927f2-2f wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_1927f2-2f\">Andererseits ist au\u00dferdem auch die Auswahlm\u00f6glichkeit an Verfahren zu beachten. Hierbei stehen exemplarisch Varianten zur Verf\u00fcgung, die Namen zuf\u00e4llig gegen die 100 h\u00e4ufigsten Namen innerhalb Deutschlands tauschen. Es ist aber auch ein schematischer 1:1 Austausch denkbar oder komplexere Verfahren m\u00f6glich. Dabei darf der Einfluss der Anonymisierung auf das zu trainierende Modell nicht unber\u00fccksichtigt bleiben. Wenn im produktiven Betrieb der NLP-Anwendung ein Dokument mit einem Namen auftaucht, der nicht zu den 100 h\u00e4ufigsten z\u00e4hlt, kann dieser unter Umst\u00e4nden nicht erkannt werden. Folglich ist der Erhalt der Daten-Varianz innerhalb der anonymisierten Attribute zu ber\u00fccksichtigen.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_62ae38-31, .wp-block-kadence-advancedheading.kt-adv-heading5615_62ae38-31[data-kb-block=\"kb-adv-heading5615_62ae38-31\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_62ae38-31 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_62ae38-31[data-kb-block=\"kb-adv-heading5615_62ae38-31\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_62ae38-31 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_62ae38-31[data-kb-block=\"kb-adv-heading5615_62ae38-31\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_62ae38-31 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_62ae38-31\">Hinzukommt, dass auch die Erhaltung von Zusammenh\u00e4ngen innerhalb der Daten bei der Anonymisierung wichtig ist. Andernfalls wird \u00fcber S\u00e4tze hinweg nicht erkannt, dass auf dieselbe Person Bezug genommen wird oder beschriebene Abl\u00e4ufe miteinander zusammenh\u00e4ngen. Insgesamt schr\u00e4nken bisherige Verfahren durch Informationsverlust das Training von Modellen auf anonymisieren Daten zu sehr ein.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_897279-d3, .wp-block-kadence-advancedheading.kt-adv-heading5615_897279-d3[data-kb-block=\"kb-adv-heading5615_897279-d3\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_897279-d3 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_897279-d3[data-kb-block=\"kb-adv-heading5615_897279-d3\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_897279-d3 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_897279-d3[data-kb-block=\"kb-adv-heading5615_897279-d3\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_897279-d3 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_897279-d3\">Ziel ist es, das Gleichgewicht zwischen Einhaltung der Datenschutzvorschriften und dem Training einer qualitativ hochwertigen Anwendung zu finden. Ein m\u00f6glicher Ablauf, wie per Anonymisierung die Einf\u00fchrung von NLP machbar ist, wird in der folgenden Vorgehensskizze dargestellt.<\/p>\n<\/div><\/div>\n\n\n<style>.kadence-column5615_e9dbff-f8 > .kt-inside-inner-col,.kadence-column5615_e9dbff-f8 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column5615_e9dbff-f8 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column5615_e9dbff-f8 > .kt-inside-inner-col{flex-direction:column;}.kadence-column5615_e9dbff-f8 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column5615_e9dbff-f8 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column5615_e9dbff-f8{position:relative;}.kadence-column5615_e9dbff-f8, .kt-inside-inner-col > .kadence-column5615_e9dbff-f8:not(.specificity){margin-top:var(--global-kb-spacing-lg, 3rem);}@media all and (max-width: 1024px){.kadence-column5615_e9dbff-f8 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column5615_e9dbff-f8 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column5615_e9dbff-f8\"><div class=\"kt-inside-inner-col\"><style>.wp-block-kadence-advancedheading.kt-adv-heading5615_95ac19-cc, .wp-block-kadence-advancedheading.kt-adv-heading5615_95ac19-cc[data-kb-block=\"kb-adv-heading5615_95ac19-cc\"]{text-align:left;font-size:var(--global-kb-font-size-lg, 2rem);font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_95ac19-cc mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_95ac19-cc[data-kb-block=\"kb-adv-heading5615_95ac19-cc\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_95ac19-cc img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_95ac19-cc[data-kb-block=\"kb-adv-heading5615_95ac19-cc\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<h2 class=\"kt-adv-heading5615_95ac19-cc wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_95ac19-cc\">Vorgehensskizze<\/h2>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_17cfce-e9, .wp-block-kadence-advancedheading.kt-adv-heading5615_17cfce-e9[data-kb-block=\"kb-adv-heading5615_17cfce-e9\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_17cfce-e9 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_17cfce-e9[data-kb-block=\"kb-adv-heading5615_17cfce-e9\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_17cfce-e9 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_17cfce-e9[data-kb-block=\"kb-adv-heading5615_17cfce-e9\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_17cfce-e9 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_17cfce-e9\">Wir betrachten als Beispiel ein Unternehmen, das per Kontaktformular mit seinen Kunden kommuniziert. Um nicht jede Nachricht h\u00e4ndisch verarbeiten zu m\u00fcssen, sollen diese m\u00f6glichst automatisch verarbeitet werden.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_7e5f9c-d0, .wp-block-kadence-advancedheading.kt-adv-heading5615_7e5f9c-d0[data-kb-block=\"kb-adv-heading5615_7e5f9c-d0\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_7e5f9c-d0 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_7e5f9c-d0[data-kb-block=\"kb-adv-heading5615_7e5f9c-d0\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_7e5f9c-d0 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_7e5f9c-d0[data-kb-block=\"kb-adv-heading5615_7e5f9c-d0\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_7e5f9c-d0 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_7e5f9c-d0\">Die Entwicklung einer entsprechenden NLP-Anwendung \u00fcbernimmt ein externer NLP-Dienstleister, der hierf\u00fcr vom Unternehmen erhaltene Kundennachrichten anfordert. Da diese Nachrichten aber personenbezogene Daten enthalten, die unter den Datenschutz fallen, darf das Unternehmen diese nicht herausgeben.<\/p>\n\n\n<style>.kb-image5615_280d7d-bc .kb-image-has-overlay:after{opacity:0.3;}<\/style>\n<figure class=\"wp-block-kadence-image kb-image5615_280d7d-bc size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"913\" height=\"1024\" src=\"https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Modellerstellung-913x1024.png\" alt=\"Flowchart Diagramm KI Modellerstellung Im Berich NLP\" class=\"kb-img wp-image-5708\" srcset=\"https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Modellerstellung-913x1024.png 913w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Modellerstellung-268x300.png 268w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Modellerstellung-768x861.png 768w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Modellerstellung.png 1270w\" sizes=\"auto, (max-width: 913px) 100vw, 913px\" \/><figcaption><a>Abbildung\u00a0<\/a>2:\u00a0Vorgehen zur Modellerstellung<\/figcaption><\/figure>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_0c20e5-fb, .wp-block-kadence-advancedheading.kt-adv-heading5615_0c20e5-fb[data-kb-block=\"kb-adv-heading5615_0c20e5-fb\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_0c20e5-fb mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_0c20e5-fb[data-kb-block=\"kb-adv-heading5615_0c20e5-fb\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_0c20e5-fb img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_0c20e5-fb[data-kb-block=\"kb-adv-heading5615_0c20e5-fb\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_0c20e5-fb wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_0c20e5-fb\">Entsprechend zu <em>Abbildung 2<\/em> wird deshalb folgendes Vorgehen angewandt: Zuerst erstellt das Unternehmen einen Korpus und annotiert diesen. Er wird als Gold-Standard gesichert. Anschlie\u00dfend ist der Korpus zu anonymisieren. Eine g\u00e4ngige L\u00f6sung ist, dass Mitarbeiter des Unternehmens die kritischen Stellen innerhalb der Mitteilungen markieren und gegen entsprechende Label tauschen.<\/p>\n\n\n<style>.wp-block-kadence-image.kb-image5615_063e62-17:not(.kb-specificity-added):not(.kb-extra-specificity-added){margin-right:var(--global-kb-spacing-3xl, 6.5rem);margin-left:var(--global-kb-spacing-3xl, 6.5rem);}.kb-image5615_063e62-17 .kb-image-has-overlay:after{opacity:0.3;}<\/style>\n<figure class=\"wp-block-kadence-image kb-image5615_063e62-17 size-large\"><img loading=\"lazy\" decoding=\"async\" width=\"1024\" height=\"838\" src=\"https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Anonymisierung-1024x838.png\" alt=\"Bild welches die Anonymisierung von sensiblen Daten in Texten darstellt\" class=\"kb-img wp-image-5704\" srcset=\"https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Anonymisierung-1024x838.png 1024w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Anonymisierung-300x246.png 300w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Anonymisierung-768x628.png 768w, https:\/\/laizee.ai\/wp-content\/uploads\/2024\/04\/Anonymisierung.png 1046w\" sizes=\"auto, (max-width: 1024px) 100vw, 1024px\" \/><figcaption>Abbildung\u00a03:\u00a0Beispiel Anonymisierung einer E-Mail<\/figcaption><\/figure>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_bf23ba-71, .wp-block-kadence-advancedheading.kt-adv-heading5615_bf23ba-71[data-kb-block=\"kb-adv-heading5615_bf23ba-71\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_bf23ba-71 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_bf23ba-71[data-kb-block=\"kb-adv-heading5615_bf23ba-71\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_bf23ba-71 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_bf23ba-71[data-kb-block=\"kb-adv-heading5615_bf23ba-71\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_bf23ba-71 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_bf23ba-71\">Hierf\u00fcr sind zun\u00e4chst alle dom\u00e4nenspezifischen kritischen Informationskategorien zu identifizieren. Wir befinden uns hier beispielhaft in der Versicherungsbranche. Entsprechend sind Name, Datum, Kundennummer und E-Mail-Adresse, sowie eventuell weitere Attribute, auszutauschen (siehe <em>Abbildung 3<\/em>).<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_ea27d2-f5, .wp-block-kadence-advancedheading.kt-adv-heading5615_ea27d2-f5[data-kb-block=\"kb-adv-heading5615_ea27d2-f5\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_ea27d2-f5 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_ea27d2-f5[data-kb-block=\"kb-adv-heading5615_ea27d2-f5\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_ea27d2-f5 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_ea27d2-f5[data-kb-block=\"kb-adv-heading5615_ea27d2-f5\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_ea27d2-f5 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_ea27d2-f5\">Sobald die Anonymisierung durchgef\u00fchrt wurde, wird der Datensatz mit den anonymisierten E-Mails an den NLP-Dienstleister verschickt. Dieser ersetzt die Label mit k\u00fcnstlichen Daten und generiert somit einen datenschutzkonformen Datenbestand, der weiterverwendet werden darf und einen anonymisierten Gold-Standard darstellt. Sodann trainiert der Dienstleister ein statistisches Modell zur Informations-Extraktion und entwickelt einen passenden NLP-KI-Service.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_e9afb4-e5, .wp-block-kadence-advancedheading.kt-adv-heading5615_e9afb4-e5[data-kb-block=\"kb-adv-heading5615_e9afb4-e5\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_e9afb4-e5 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_e9afb4-e5[data-kb-block=\"kb-adv-heading5615_e9afb4-e5\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_e9afb4-e5 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_e9afb4-e5[data-kb-block=\"kb-adv-heading5615_e9afb4-e5\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_e9afb4-e5 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_e9afb4-e5\">Der Service und das Modell werden anschlie\u00dfend an das Auftrag gebende Unternehmen \u00fcbergeben und dort bez\u00fcglich der Verarbeitungsqualit\u00e4t von E-Mails gepr\u00fcft. Hierf\u00fcr kommt der zu Beginn gesicherte Gold-Standard zum Einsatz. Mit Hilfe verschiedener Metriken wird die Extraktionsgenauigkeit der Anwendung gegen die vorab spezifizierten Produktziele gemessen. Sollte die Qualit\u00e4t nicht ausreichend sein, erfolgt eine Evaluierung, ob das Anonymisierungsverfahren anzupassen oder der Korpus zu erweitern ist, und die Anwendung wird noch einmal \u00fcberarbeitet.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_c8b06f-78, .wp-block-kadence-advancedheading.kt-adv-heading5615_c8b06f-78[data-kb-block=\"kb-adv-heading5615_c8b06f-78\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_c8b06f-78 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_c8b06f-78[data-kb-block=\"kb-adv-heading5615_c8b06f-78\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_c8b06f-78 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_c8b06f-78[data-kb-block=\"kb-adv-heading5615_c8b06f-78\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_c8b06f-78 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_c8b06f-78\">Wenn die Verarbeitungsqualit\u00e4t alle Kriterien f\u00fcr den produktiven Einsatz erf\u00fcllt, wird die Anwendung in die vorhandenen Prozesse integriert. In regelm\u00e4\u00dfigen Abst\u00e4nden sollte kontrolliert werden, ob die Verarbeitung weiterhin problemlos funktioniert oder eine Anpassung notwendig ist.<\/p>\n<\/div><\/div>\n\n\n<style>.kadence-column5615_56d5e5-cf > .kt-inside-inner-col,.kadence-column5615_56d5e5-cf > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column5615_56d5e5-cf > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column5615_56d5e5-cf > .kt-inside-inner-col{flex-direction:column;}.kadence-column5615_56d5e5-cf > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column5615_56d5e5-cf > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column5615_56d5e5-cf{position:relative;}.kadence-column5615_56d5e5-cf, .kt-inside-inner-col > .kadence-column5615_56d5e5-cf:not(.specificity){margin-top:var(--global-kb-spacing-lg, 3rem);}@media all and (max-width: 1024px){.kadence-column5615_56d5e5-cf > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column5615_56d5e5-cf > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column5615_56d5e5-cf\"><div class=\"kt-inside-inner-col\"><style>.wp-block-kadence-advancedheading.kt-adv-heading5615_c47884-26, .wp-block-kadence-advancedheading.kt-adv-heading5615_c47884-26[data-kb-block=\"kb-adv-heading5615_c47884-26\"]{text-align:left;font-size:var(--global-kb-font-size-lg, 2rem);font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_c47884-26 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_c47884-26[data-kb-block=\"kb-adv-heading5615_c47884-26\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_c47884-26 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_c47884-26[data-kb-block=\"kb-adv-heading5615_c47884-26\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<h2 class=\"kt-adv-heading5615_c47884-26 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_c47884-26\"><strong>Alternative zur Beauftragung von Dienstleistern?<\/strong><\/h2>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_206850-51, .wp-block-kadence-advancedheading.kt-adv-heading5615_206850-51[data-kb-block=\"kb-adv-heading5615_206850-51\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_206850-51 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_206850-51[data-kb-block=\"kb-adv-heading5615_206850-51\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_206850-51 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_206850-51[data-kb-block=\"kb-adv-heading5615_206850-51\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_206850-51 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_206850-51\">Als Alternative zur Beauftragung von externen Dienstleistern, bieten sich \u201eon Premise\u201c gehostete, moderne Low-Code Plattformen an. Low-Code bedeutet hier, dass auch Laien erm\u00f6glicht wird hoch performante NLP-Modelle zu entwickeln. Open-Plattform L\u00f6sungen, wie die des FH-Aachen Startups TaggingMatters (<a href=\"https:\/\/taggingmatters.de\/\" rel=\"nofollow noopener\" target=\"_blank\">https:\/\/taggingmatters.de\/<\/a>), ber\u00fccksichtigen den Datenschutz und verbergen gleichzeitig auch die Komplexit\u00e4t der eingesetzten Frameworks. Somit m\u00fcssen Mitarbeiter in Unternehmen keine Experten f\u00fcr die umfangreichen NLP- bzw. ML-Tools, wie spaCy oder TensorFlow, und der Mathematik hinter modernen Verfahren werden, sondern k\u00f6nnen sich auf die wertsch\u00f6pfenden T\u00e4tigkeiten konzentrieren.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_905e3b-74, .wp-block-kadence-advancedheading.kt-adv-heading5615_905e3b-74[data-kb-block=\"kb-adv-heading5615_905e3b-74\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_905e3b-74 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_905e3b-74[data-kb-block=\"kb-adv-heading5615_905e3b-74\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_905e3b-74 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_905e3b-74[data-kb-block=\"kb-adv-heading5615_905e3b-74\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_905e3b-74 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_905e3b-74\">Solche Plattformen erlauben, neben dem Vorbereiten der Daten (&#8220;Tagging\u201d), die optimierte Erstellung der KI und Bereitstellung von KI-Services. Dadurch k\u00f6nnen die oben beschriebenen Iterationen, auch ohne NLP-Erfahrung, um ein Vielfaches schneller durchlaufen werden. Letzten Endes profitiert das Unternehmen von niedrigeren Entwicklungskosten und schnellerem Return-On-Invest, denn das eigentliche Ziel, die Verbesserung von Gesch\u00e4ftsprozessen, darf nicht aus den Augen verloren werden.<\/p>\n<\/div><\/div>\n\n\n<style>.kadence-column5615_fcfaac-63 > .kt-inside-inner-col,.kadence-column5615_fcfaac-63 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column5615_fcfaac-63 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column5615_fcfaac-63 > .kt-inside-inner-col{flex-direction:column;}.kadence-column5615_fcfaac-63 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column5615_fcfaac-63 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column5615_fcfaac-63{position:relative;}.kadence-column5615_fcfaac-63, .kt-inside-inner-col > .kadence-column5615_fcfaac-63:not(.specificity){margin-top:var(--global-kb-spacing-lg, 3rem);}@media all and (max-width: 1024px){.kadence-column5615_fcfaac-63 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column5615_fcfaac-63 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column5615_fcfaac-63\"><div class=\"kt-inside-inner-col\"><style>.wp-block-kadence-advancedheading.kt-adv-heading5615_9fe7c5-f9, .wp-block-kadence-advancedheading.kt-adv-heading5615_9fe7c5-f9[data-kb-block=\"kb-adv-heading5615_9fe7c5-f9\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_9fe7c5-f9 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_9fe7c5-f9[data-kb-block=\"kb-adv-heading5615_9fe7c5-f9\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_9fe7c5-f9 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_9fe7c5-f9[data-kb-block=\"kb-adv-heading5615_9fe7c5-f9\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<h2 class=\"kt-adv-heading5615_9fe7c5-f9 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_9fe7c5-f9\"><strong><strong>Zusammenfassung<\/strong><\/strong><\/h2>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_5e8193-f6, .wp-block-kadence-advancedheading.kt-adv-heading5615_5e8193-f6[data-kb-block=\"kb-adv-heading5615_5e8193-f6\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_5e8193-f6 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_5e8193-f6[data-kb-block=\"kb-adv-heading5615_5e8193-f6\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_5e8193-f6 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_5e8193-f6[data-kb-block=\"kb-adv-heading5615_5e8193-f6\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_5e8193-f6 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_5e8193-f6\">Das Vorhandensein und Versch\u00e4rfung von Datenschutzrechten erschwert die Einf\u00fchrung von NLP bei zahlreichen Unternehmen unterschiedlichster Dom\u00e4nen. Eine Anonymisierung vor Herausgabe von Daten an externe Software-Firmen oder der Einsatz einer Low-Code-Plattform kann hier Abhilfe schaffen. Ein kritischer Punkt ist die erreichbare Qualit\u00e4t der auf anonymisierten Daten trainierten Modelle und deren Messung durch das auftraggebende Unternehmen. Ein iterativer Optimierungsprozess zur Modellerstellung und -optimierung mit mehrfachem Feedback ist hierbei unumg\u00e4nglich.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_8111fd-25, .wp-block-kadence-advancedheading.kt-adv-heading5615_8111fd-25[data-kb-block=\"kb-adv-heading5615_8111fd-25\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_8111fd-25 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_8111fd-25[data-kb-block=\"kb-adv-heading5615_8111fd-25\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_8111fd-25 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_8111fd-25[data-kb-block=\"kb-adv-heading5615_8111fd-25\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_8111fd-25 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_8111fd-25\">Mit Blick auf die Zukunft werden automatische Verarbeitungen im digitalen Kontext immer wichtiger werden. Vor allem bez\u00fcglich Onlinezugangsgesetz (OZG) werden immer mehr Unternehmen daran interessiert sein, ihre Prozesse zu optimieren. Dabei wird vermehrt externe Unterst\u00fctzung notwendig sein, die mit der hier gezeigten Vorgehensskizze oder dem Einsatz von Low-Code Plattformen umsetzbar ist.<\/p>\n<\/div><\/div>\n\n\n<style>.kadence-column5615_d5ef6c-a5 > .kt-inside-inner-col,.kadence-column5615_d5ef6c-a5 > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column5615_d5ef6c-a5 > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column5615_d5ef6c-a5 > .kt-inside-inner-col{flex-direction:column;}.kadence-column5615_d5ef6c-a5 > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column5615_d5ef6c-a5 > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column5615_d5ef6c-a5{position:relative;}.kadence-column5615_d5ef6c-a5, .kt-inside-inner-col > .kadence-column5615_d5ef6c-a5:not(.specificity){margin-top:var(--global-kb-spacing-lg, 3rem);}@media all and (max-width: 1024px){.kadence-column5615_d5ef6c-a5 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column5615_d5ef6c-a5 > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column5615_d5ef6c-a5\"><div class=\"kt-inside-inner-col\"><style>.wp-block-kadence-advancedheading.kt-adv-heading5615_5fe452-35, .wp-block-kadence-advancedheading.kt-adv-heading5615_5fe452-35[data-kb-block=\"kb-adv-heading5615_5fe452-35\"]{text-align:left;font-size:var(--global-kb-font-size-lg, 2rem);font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_5fe452-35 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_5fe452-35[data-kb-block=\"kb-adv-heading5615_5fe452-35\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_5fe452-35 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_5fe452-35[data-kb-block=\"kb-adv-heading5615_5fe452-35\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<h2 class=\"kt-adv-heading5615_5fe452-35 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_5fe452-35\"><strong><strong>Autoren<\/strong><\/strong><\/h2>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_bcbbb2-0e, .wp-block-kadence-advancedheading.kt-adv-heading5615_bcbbb2-0e[data-kb-block=\"kb-adv-heading5615_bcbbb2-0e\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_bcbbb2-0e mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_bcbbb2-0e[data-kb-block=\"kb-adv-heading5615_bcbbb2-0e\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_bcbbb2-0e img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_bcbbb2-0e[data-kb-block=\"kb-adv-heading5615_bcbbb2-0e\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_bcbbb2-0e wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_bcbbb2-0e\"><strong>Prof. Dr. rer. nat. Bodo Kraft<\/strong><br>Prof. Dr. Bodo Kraft ist Gr\u00fcnder und Leiter des Labors Business Programming. Er betreibt dort seit \u00fcber zehn Jahren zusammen mit aktuell f\u00fcnf Promovierenden anwendungs-orientierte Forschung im Umfeld von Computer-Linguistik. Gemeinsame Basis der unterschiedlichen Projekte ist die Problemstellung, massenhaft anfallende, nat\u00fcrlichsprachliche Dokumente effizient und automatisiert zu verarbeiten.<br>Die erfolgreiche Anpassung der L\u00f6sungen auf die jeweilige Dom\u00e4ne ist hierbei elementar. Ein weiterer Schwerpunkt liegt auf einer agilen, qualit\u00e4tsgetriebenen Vorgehensweise zur Erstellung betrieblich verwertbarer und wartbarer Softwaresysteme.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_16ffc1-3a, .wp-block-kadence-advancedheading.kt-adv-heading5615_16ffc1-3a[data-kb-block=\"kb-adv-heading5615_16ffc1-3a\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_16ffc1-3a mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_16ffc1-3a[data-kb-block=\"kb-adv-heading5615_16ffc1-3a\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_16ffc1-3a img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_16ffc1-3a[data-kb-block=\"kb-adv-heading5615_16ffc1-3a\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_16ffc1-3a wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_16ffc1-3a\"><strong>Prof. Dr. Matthias Meinecke<\/strong> <br>Prof. Dr. Matthias Meinecke (Professor f\u00fcr Operations Management, Vorstand am Institut f\u00fcr Digitalisierung Aachen, FH Aachen) lehrt, forscht und ber\u00e4t zu Themen der Optimierung und Automatisierung von Gesch\u00e4ftsprozessen.<br>Zusammen mit Prof. Dr. Kraft ist er Coach des Start-Ups laizee.ai, welches Produkte und Services f\u00fcr die effiziente, automatisierte Verarbeitung menschlicher Sprache zur Optimierung von Unternehmensprozessen entwickelt.<\/p>\n\n\n<style>.wp-block-kadence-advancedheading.kt-adv-heading5615_92a2d4-b9, .wp-block-kadence-advancedheading.kt-adv-heading5615_92a2d4-b9[data-kb-block=\"kb-adv-heading5615_92a2d4-b9\"]{text-align:left;font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_92a2d4-b9 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_92a2d4-b9[data-kb-block=\"kb-adv-heading5615_92a2d4-b9\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_92a2d4-b9 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_92a2d4-b9[data-kb-block=\"kb-adv-heading5615_92a2d4-b9\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<p class=\"kt-adv-heading5615_92a2d4-b9 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_92a2d4-b9\"><strong>M. Sc. Ines Larissa Siebigteroth<\/strong> <br>M. Sc. Ines Larissa Siebigteroth hat an der FH Aachen und der University of Wisconsin-Milwaukee Technomathematik studiert und promoviert nun bei Prof. Dr. Bodo Kraft. Frau Siebigteroth ist Teil des Labor Business Programming. Ihr Fokus liegt auf NLP und besonders auf der datenschutzkonformen Erstellung hochwertiger Korpora zur automatisierten Verarbeitung nat\u00fcrlicher Sprache.<\/p>\n<\/div><\/div>\n\n\n<style>.kadence-column5615_dc75c8-3a > .kt-inside-inner-col,.kadence-column5615_dc75c8-3a > .kt-inside-inner-col:before{border-top-left-radius:0px;border-top-right-radius:0px;border-bottom-right-radius:0px;border-bottom-left-radius:0px;}.kadence-column5615_dc75c8-3a > .kt-inside-inner-col{column-gap:var(--global-kb-gap-sm, 1rem);}.kadence-column5615_dc75c8-3a > .kt-inside-inner-col{flex-direction:column;}.kadence-column5615_dc75c8-3a > .kt-inside-inner-col > .aligncenter{width:100%;}.kadence-column5615_dc75c8-3a > .kt-inside-inner-col:before{opacity:0.3;}.kadence-column5615_dc75c8-3a{position:relative;}.kadence-column5615_dc75c8-3a, .kt-inside-inner-col > .kadence-column5615_dc75c8-3a:not(.specificity){margin-top:var(--global-kb-spacing-lg, 3rem);}@media all and (max-width: 1024px){.kadence-column5615_dc75c8-3a > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}@media all and (max-width: 767px){.kadence-column5615_dc75c8-3a > .kt-inside-inner-col{flex-direction:column;justify-content:center;}}<\/style>\n<div class=\"wp-block-kadence-column kadence-column5615_dc75c8-3a\"><div class=\"kt-inside-inner-col\"><style>.wp-block-kadence-advancedheading.kt-adv-heading5615_3cc567-a9, .wp-block-kadence-advancedheading.kt-adv-heading5615_3cc567-a9[data-kb-block=\"kb-adv-heading5615_3cc567-a9\"]{text-align:left;font-size:var(--global-kb-font-size-lg, 2rem);font-style:normal;}.wp-block-kadence-advancedheading.kt-adv-heading5615_3cc567-a9 mark.kt-highlight, .wp-block-kadence-advancedheading.kt-adv-heading5615_3cc567-a9[data-kb-block=\"kb-adv-heading5615_3cc567-a9\"] mark.kt-highlight{font-style:normal;color:#f76a0c;-webkit-box-decoration-break:clone;box-decoration-break:clone;padding-top:0px;padding-right:0px;padding-bottom:0px;padding-left:0px;}.wp-block-kadence-advancedheading.kt-adv-heading5615_3cc567-a9 img.kb-inline-image, .wp-block-kadence-advancedheading.kt-adv-heading5615_3cc567-a9[data-kb-block=\"kb-adv-heading5615_3cc567-a9\"] img.kb-inline-image{width:150px;vertical-align:baseline;}<\/style>\n<h2 class=\"kt-adv-heading5615_3cc567-a9 wp-block-kadence-advancedheading\" data-kb-block=\"kb-adv-heading5615_3cc567-a9\"><strong><strong>Verweise<\/strong><\/strong><\/h2>\n\n\n\n<figure class=\"wp-block-table\"><table><tbody><tr><td>[1]<\/td><td>P. Kohl, O. Schmidts, L. Kl\u00f6ser, H. Werth, B. Kraft und A. Z\u00fcndorf, \u201eSTAMP 4 NLP \u2013 An Agile Framework for Rapid Quality-Driven NLP Applications Development,\u201c [Online]. Available: https:\/\/link.springer.com\/chapter\/10.1007%2F978-3-030-85347-1_12.<\/td><\/tr><tr><td>[2]<\/td><td>Datenethikkommission, \u201eEmpfehlungen der Datenethikkommission f\u00fcr die Strategie K\u00fcnstliche Intelligenz der Bundesregierung,\u201c [Online]. Available: https:\/\/www.bmjv.de\/SharedDocs\/Downloads\/DE\/Ministerium\/ForschungUndWissenschaft\/DEK_Empfehlungen.pdf?__blob=publicationFile&amp;v=2.<\/td><\/tr><tr><td>[3]<\/td><td>S. C. A. Probst Eide, \u201eDer aktuelle Entwicklungs\u00adstand von Tools zur Daten-Anonymisierung,\u201c [Online]. Available: https:\/\/www.it-finanzmagazin.de\/entwicklungsstand-daten-anonymisierung-73373\/.<\/td><\/tr><tr><td>[4]<\/td><td>D. Barth-Jones, \u201eThe &#8216;Re-Identification&#8217; of Governor William Weld&#8217;s Medical Information: A Critical Re-Examination of Health Data Identification Risks and Privacy Protections, Then and Now,\u201c [Online]. Available: https:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=2076397. [Zugriff am 15 12 2021].<\/td><\/tr><\/tbody><\/table><\/figure>\n<\/div><\/div>\n","protected":false},"excerpt":{"rendered":"<p>Nur wenige Bereiche der Informatik sind momentan so popul\u00e4r wie das maschinelle&#8230;<\/p>\n","protected":false},"author":6,"featured_media":5983,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"inline_featured_image":false,"_kad_blocks_custom_css":"","_kad_blocks_head_custom_js":"","_kad_blocks_body_custom_js":"","_kad_blocks_footer_custom_js":"","_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_kadence_starter_templates_imported_post":false,"_kad_post_transparent":"","_kad_post_title":"","_kad_post_layout":"","_kad_post_sidebar_id":"","_kad_post_content_style":"","_kad_post_vertical_padding":"","_kad_post_feature":"","_kad_post_feature_position":"","_kad_post_header":false,"_kad_post_footer":false,"_kad_post_classname":"","footnotes":""},"categories":[13],"tags":[23,24,15],"class_list":["post-5615","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-natural-language-processing","tag-ai","tag-datenschutz","tag-nlp"],"acf":[],"taxonomy_info":{"category":[{"value":13,"label":"Natural Language Processing"}],"post_tag":[{"value":23,"label":"AI"},{"value":24,"label":"DATENSCHUTZ"},{"value":15,"label":"NLP"}]},"featured_image_src_large":["https:\/\/laizee.ai\/wp-content\/uploads\/2023\/08\/NLP-Header-1-1024x511.png",1024,511,true],"author_info":{"display_name":"Bodo Kraft","author_link":"https:\/\/laizee.ai\/author\/bodo-kraft"},"comment_info":14,"category_info":[{"term_id":13,"name":"Natural Language Processing","slug":"natural-language-processing","term_group":0,"term_taxonomy_id":13,"taxonomy":"category","description":"","parent":0,"count":3,"filter":"raw","cat_ID":13,"category_count":3,"category_description":"","cat_name":"Natural Language Processing","category_nicename":"natural-language-processing","category_parent":0}],"tag_info":[{"term_id":23,"name":"AI","slug":"ai","term_group":0,"term_taxonomy_id":23,"taxonomy":"post_tag","description":"","parent":0,"count":7,"filter":"raw"},{"term_id":24,"name":"DATENSCHUTZ","slug":"datenschutz","term_group":0,"term_taxonomy_id":24,"taxonomy":"post_tag","description":"","parent":0,"count":1,"filter":"raw"},{"term_id":15,"name":"NLP","slug":"nlp","term_group":0,"term_taxonomy_id":15,"taxonomy":"post_tag","description":"","parent":0,"count":5,"filter":"raw"}],"_links":{"self":[{"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/posts\/5615","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/users\/6"}],"replies":[{"embeddable":true,"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/comments?post=5615"}],"version-history":[{"count":28,"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/posts\/5615\/revisions"}],"predecessor-version":[{"id":5804,"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/posts\/5615\/revisions\/5804"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/media\/5983"}],"wp:attachment":[{"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/media?parent=5615"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/categories?post=5615"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/laizee.ai\/wp-json\/wp\/v2\/tags?post=5615"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}