Strafrecht - Ideen und Konzepte

Strafrecht - Ideen und Konzepte

Rechtliche Unauffälligkeit → Strafrecht

TL;DR Risikoeinschätzung

Diese Eigenschaft ist nicht rechtssicher von Maschinen prüfbar. Indikatoren können gefunden werden, e.g. ob Waffen, Betäubungsmittel u.ä. Themen der Inhalte sind. Gewisse Tätigkeiten können aus Videos erkannt werden, um so zu erkennen, ob ein strafrechtlicher Kontext vorliegt, s. auch Persönlichkeitsrechte - Ideen und Konzepte.

Weitere Recherchen sind nötig. Erste sehr rudimentäre kleine PoC's wären möglich.

Grob geschätzter Zeitaufwand: 3 PerMo


Begriffsbestimmung

Die Grundlage für das Strafrecht bildet das [StGB](https://www.gesetze-im-internet.de/stgb/)

Im deutschen Recht ist die Veröffentlichung von Materialien mit gewissen Inhalten strafbar. Dazu gehören Verkaufsseiten für illegale Waffen, Betäubungsmittel, verschreibungspflichtige Medikamente und mehr.

Zu unterscheiden ist zwischen Strafrecht und Zivilrecht, ersteres gehört zu öffentlichem Recht. Teilweise überlappen die beiden Rechtsbereiche, sodass eine klare technische Trennung schwierig ist.

Kriterien

Die folgenden Inhalte einer Webseite wurden als strafrechtlich relevant identifiziert:

Diese Kriterien hängen mit den eingebetteten Medien und dem Kontext zusammen, e.g., Videos die über das Dritte Reich informieren sind harmlos, Videos die das Dritte Reich verherrlichen sind kritisch.

Wird bspw. ein Webshop verlinkt, auf dem Betäubungsmittel erworben werden können, so ist dies kritisch zu sehen. D.h. es muss ein Kontext des Inhaltes ggf. auch über den eigentlichen Inhalt hinaus erstellt werden. Idealerweise lassen sich Black- und Whitelists dafür finden.

Weiterführende relevante Delikte könnten sein

  • Beleidigung, § 185 StGB
  • Üble Nachrede, § 186 StGB
  • Verleumdung (Verbreitung von falschen Tatsachenbehauptungen), § 187 StGB
  • Verletzung des persönlichen Lebens- und Geheimbereichs, § 201 a StGB

Diese Delikte müssen zunächst ins technische übersetzt werden. Sentiment Analysis mit NLP ermöglicht hier erste Ansätze.

Metriken

Welcher inhaltliche Kontext liegt vor?

Wird auf Webshops verlinkt? Wenn ja, was wird dort angeboten?

Werden bestimmte Keywords verwendet? Bspw. die Namen bekannter Betäubungsmittel?

Ideen

Je nach Straftat müssen unterschiedliche Methodiken und Datensätze angewendet werden. Eine nicht finale Liste von relevanten Tatbeständen sind im weiteren beschrieben.

Verfassungsfeindliche Symbole

Grundsätzlich scheint eine Erkennung verfassungsfeindlicher Symbole in Bild und Video machbar. Dies setzt aber entsprechendes Trainingsmaterial voraus. Der Bericht des Verfassungsschutz, der rechtsextreme Symbole, Zeichen und verbotene Organisationen 2018 benennt ist hier relevant. Außerdem die Liste verbotener rechtsextremer Organisationen auf Wikipedia und ähnliche Quellen.

Herunterspielen/Leugnung des Holocaust/Aspekte des Nationalsozialismus

Inhaltlich wird dies schwer entscheidbar sein. Möglich scheint primär die Suche nach Indizien die dafür/dagegen sprechen, sodass einige Quellen als wahrscheinlich unkritisch eingestuft werden könnten oder eventuell kritisch. Solche Indizien können sein, dass eine Quelle kritische Themen behandelt wie Ausländer, Nationalsozialismus etc., verbotene Organisationen/Zeichen o.ä. benennt und ähnliches. Daraus lässt sich eine gewisse Black- und Whitelist erstellen.

Ankündigung von Straftaten und Verabredung dazu

Dies ist grundsätzlich sehr schwierig. Als Indiz könnten grundsätzlich Ansätze zur Erkennung aggressiver Sprache dienen, eventuell auch Wordlists. Eine Sentiment Analysis ist essentiell. Eine Beispieldetektion ist hier für Urdu zu finden.

Hetze/Hatespeech

Die Erkennung von Hetze ist ein aktuelles Thema aufgrund der Gesetzgebung in einigen Ländern. Einige Cloudanbieter bieten Services an, die bei der Moderation von Inhalten helfen sollen. Diese Services könnten hier zumindest während der Trainingsphase zur Vorbewertung eingesetzt werden. Nennenswert sind hier die Google Perspective ApiMicrosoft Azure Moderation API und das Safety Tech Network

Außerdem gibt es Datensätze und Modelle bereits als Open Source Lösung, wie z.B. Multilingual and Multitarget Hate Speech Detection in Tweets, Hate-Alert Gruppen.
 

Hürden, Probleme und Grenzen

Strafrecht ist vielfältig, komplex und umfassend. Eine "schwache" KI kann dies nicht erkennen. Die Entwicklung einer entsprechenden "starken" KI kann unterstützend wirken und das Thema entsprechend auch für Laien greifbarer machen. Diese KI müsste entsprechende Kontexte erkennen und differenzieren können.

Es gibt erste grobe Ansätze für KI's, die auf rechtliche Aspekte optimiert sind, wie bspw:

- [Artificial Intelligence and Law: An Overview](https://peerj.com/articles/cs-93/)
- [Predicting judicial decisions of the European Court of Human Rights: a Natural Language Processing perspective](https://heinonline.org/HOL/LandingPage?handle=hein.journals/gslr35&div=59&id=&page=)
- [Artificial Intelligence and Music: Open Questions of Copyright Law and Engineering Praxis](https://www.mdpi.com/2076-0752/8/3/115)
- [Ethical Issues in Robo-Lawyering](https://heinonline.org/HOL/LandingPage?handle=hein.journals/hastlj70&div=6&id=&page=)
- [Evaluating Artificial Intelligence for Legal Services: Can “Soft Law” Lead to Enforceable Standards for Effectiveness?](https://ieeexplore.ieee.org/abstract/document/9639440)

Skalavorschlag

Letztlich stellt dieses Metadatum ein KO-Kriterium dar, sodass intern eine 2-stufige Skala (Unkritisch/Kritisch) angemessen erscheint und nur als unkritisch eingestufte Datensätze ausgeliefert werden. Allerdings wird dies rein maschinell nicht präzise umsetzbar sein, sodass intern eine 3-stufige Skala (Unkritisch/Unbekannt/Kritisch) sinnvoll erscheint:

  • Unkritisch: Alle Inhalte als sicher Unkritisch eingestuft
  • Unbekannt: Keine Inhalte als kritisch eingestuft
  • Kritisch: Einige Inhalte als kritisch eingestuft