Strafrecht - Ideen und Konzepte
Rechtliche Unauffälligkeit → Strafrecht
TL;DR Risikoeinschätzung
Diese Eigenschaft ist nicht rechtssicher von Maschinen prüfbar. Indikatoren können gefunden werden, e.g. ob Waffen, Betäubungsmittel u.ä. Themen der Inhalte sind. Gewisse Tätigkeiten können aus Videos erkannt werden, um so zu erkennen, ob ein strafrechtlicher Kontext vorliegt, s. auch Persönlichkeitsrechte - Ideen und Konzepte.
Weitere Recherchen sind nötig. Erste sehr rudimentäre kleine PoC's wären möglich.
Grob geschätzter Zeitaufwand: 3 PerMo
Begriffsbestimmung
Die Grundlage für das Strafrecht bildet das [StGB](https://www.gesetze-im-internet.de/stgb/)
Im deutschen Recht ist die Veröffentlichung von Materialien mit gewissen Inhalten strafbar. Dazu gehören Verkaufsseiten für illegale Waffen, Betäubungsmittel, verschreibungspflichtige Medikamente und mehr.
Zu unterscheiden ist zwischen Strafrecht und Zivilrecht, ersteres gehört zu öffentlichem Recht. Teilweise überlappen die beiden Rechtsbereiche, sodass eine klare technische Trennung schwierig ist.
Kriterien
Die folgenden Inhalte einer Webseite wurden als strafrechtlich relevant identifiziert:
- Kinderpornografie, s. auch Persönlichkeitsrechte - Ideen und Konzepte, Jugendschutz - Ideen und Konzepte
- Verfassungsfeindliche Symbole
- Herunterspielen/Leugnung des Holocaust oder Verherrlichung von Aspekte des Nationalsozialismus
- Hetze und Diskriminierung, s. auch Persönlichkeitsrechte - Ideen und Konzepte, Jugendschutz - Ideen und Konzepte
- Ankündigung von Straftaten und Verabredung dazu
- Anbieten von Betäubungsmitteln und verschreibungspflichtigen Medikamenten
Diese Kriterien hängen mit den eingebetteten Medien und dem Kontext zusammen, e.g., Videos die über das Dritte Reich informieren sind harmlos, Videos die das Dritte Reich verherrlichen sind kritisch.
Wird bspw. ein Webshop verlinkt, auf dem Betäubungsmittel erworben werden können, so ist dies kritisch zu sehen. D.h. es muss ein Kontext des Inhaltes ggf. auch über den eigentlichen Inhalt hinaus erstellt werden. Idealerweise lassen sich Black- und Whitelists dafür finden.
Weiterführende relevante Delikte könnten sein
- Beleidigung, § 185 StGB
- Üble Nachrede, § 186 StGB
- Verleumdung (Verbreitung von falschen Tatsachenbehauptungen), § 187 StGB
- Verletzung des persönlichen Lebens- und Geheimbereichs, § 201 a StGB
Diese Delikte müssen zunächst ins technische übersetzt werden. Sentiment Analysis mit NLP ermöglicht hier erste Ansätze.
Metriken
Welcher inhaltliche Kontext liegt vor?
Wird auf Webshops verlinkt? Wenn ja, was wird dort angeboten?
Werden bestimmte Keywords verwendet? Bspw. die Namen bekannter Betäubungsmittel?
Ideen
Je nach Straftat müssen unterschiedliche Methodiken und Datensätze angewendet werden. Eine nicht finale Liste von relevanten Tatbeständen sind im weiteren beschrieben.
Verfassungsfeindliche Symbole
Grundsätzlich scheint eine Erkennung verfassungsfeindlicher Symbole in Bild und Video machbar. Dies setzt aber entsprechendes Trainingsmaterial voraus. Der Bericht des Verfassungsschutz, der rechtsextreme Symbole, Zeichen und verbotene Organisationen 2018 benennt ist hier relevant. Außerdem die Liste verbotener rechtsextremer Organisationen auf Wikipedia und ähnliche Quellen.
Herunterspielen/Leugnung des Holocaust/Aspekte des Nationalsozialismus
Inhaltlich wird dies schwer entscheidbar sein. Möglich scheint primär die Suche nach Indizien die dafür/dagegen sprechen, sodass einige Quellen als wahrscheinlich unkritisch eingestuft werden könnten oder eventuell kritisch. Solche Indizien können sein, dass eine Quelle kritische Themen behandelt wie Ausländer, Nationalsozialismus etc., verbotene Organisationen/Zeichen o.ä. benennt und ähnliches. Daraus lässt sich eine gewisse Black- und Whitelist erstellen.
Ankündigung von Straftaten und Verabredung dazu
Dies ist grundsätzlich sehr schwierig. Als Indiz könnten grundsätzlich Ansätze zur Erkennung aggressiver Sprache dienen, eventuell auch Wordlists. Eine Sentiment Analysis ist essentiell. Eine Beispieldetektion ist hier für Urdu zu finden.
Hetze/Hatespeech
Die Erkennung von Hetze ist ein aktuelles Thema aufgrund der Gesetzgebung in einigen Ländern. Einige Cloudanbieter bieten Services an, die bei der Moderation von Inhalten helfen sollen. Diese Services könnten hier zumindest während der Trainingsphase zur Vorbewertung eingesetzt werden. Nennenswert sind hier die Google Perspective Api, Microsoft Azure Moderation API und das Safety Tech Network
Außerdem gibt es Datensätze und Modelle bereits als Open Source Lösung, wie z.B. Multilingual and Multitarget Hate Speech Detection in Tweets, Hate-Alert Gruppen.
Hürden, Probleme und Grenzen
Strafrecht ist vielfältig, komplex und umfassend. Eine "schwache" KI kann dies nicht erkennen. Die Entwicklung einer entsprechenden "starken" KI kann unterstützend wirken und das Thema entsprechend auch für Laien greifbarer machen. Diese KI müsste entsprechende Kontexte erkennen und differenzieren können.
Es gibt erste grobe Ansätze für KI's, die auf rechtliche Aspekte optimiert sind, wie bspw:
- [Artificial Intelligence and Law: An Overview](https://peerj.com/articles/cs-93/)
- [Predicting judicial decisions of the European Court of Human Rights: a Natural Language Processing perspective](https://heinonline.org/HOL/LandingPage?handle=hein.journals/gslr35&div=59&id=&page=)
- [Artificial Intelligence and Music: Open Questions of Copyright Law and Engineering Praxis](https://www.mdpi.com/2076-0752/8/3/115)
- [Ethical Issues in Robo-Lawyering](https://heinonline.org/HOL/LandingPage?handle=hein.journals/hastlj70&div=6&id=&page=)
- [Evaluating Artificial Intelligence for Legal Services: Can “Soft Law” Lead to Enforceable Standards for Effectiveness?](https://ieeexplore.ieee.org/abstract/document/9639440)
Skalavorschlag
Letztlich stellt dieses Metadatum ein KO-Kriterium dar, sodass intern eine 2-stufige Skala (Unkritisch/Kritisch) angemessen erscheint und nur als unkritisch eingestufte Datensätze ausgeliefert werden. Allerdings wird dies rein maschinell nicht präzise umsetzbar sein, sodass intern eine 3-stufige Skala (Unkritisch/Unbekannt/Kritisch) sinnvoll erscheint:
- Unkritisch: Alle Inhalte als sicher Unkritisch eingestuft
- Unbekannt: Keine Inhalte als kritisch eingestuft
- Kritisch: Einige Inhalte als kritisch eingestuft