Versions Compared

Key

  • This line was added.
  • This line was removed.
  • Formatting was changed.

...

Ziel der Testreihe in die Generierung von Vorschaubildern für Bildungsinhalte, bei denen bisher keine oder unzureichende Vorschaubilder auf WLO existieren.

Dafür wurden verschiedene Inhalte ausgewählt und…

Auswahl der Inhalte

Die Inhalte sollten Beschreibungstexte/Titel haben, um gute Voraussetzungen für die Promptgenerierung zu schaffen. Es sollten verschiedene Fachbereiche und Themen abgedeckt werden:

...

  • Testreihe 1

  • Testreihe 2

    • Prompterzeugung für die Bild-KI mittels Text-KI (Open AI gpt-4o)

    • Nutzung der generierten Prompts mit verschiedenen Bildmodellen

      • OpenAI Dall-E 3

      • Stable Diffusion XL (Schnell in Fooocus)

      • Flux [schnell]

    • Testreihe 3

      • Demonstriert mit Inhalt 1 und Open Dall-E 3 die Wirkung von Styles

  • Maschinelle Bewertung mittels geeigneten Metriken für Bildqualität und Promptwirkung mit dem entwickelten Tool

  • Qualitative menschliche Bewertung basierend auf folgenden folgendem Leitfaden:

Code Block
Leitfaden für die menschliche Bewertung 

Relevanz und Klarheit:

- Vorschaubild spiegelt den Inhalt des Bildungsangebots treffend wider
- Hauptmotiv ist klar erkennbar und unterstützt die Lehr-/Lernprozesse

Gestaltung und Ästhetik:

- Design ist klar und einfach, ohne überflüssige oder störende Elemente
- Farb- und Kontrastwahl ist ansprechend und unterstützt die visuelle Orientierung

Benutzerfreundlichkeit und Barrierefreiheit:

- Hauptmerkmale des Bildes sind auch in kleiner Größe gut erkennbar
- Barrierefreiheitsaspekte werden berücksichtigt (z. B. kontrastreiche Farben)

Einhaltung der Promptvorgaben:

- Bild enthält keine Texte, menschlichenmenschliche Gesichter oder überladene Elemente
- Vorgaben des Prompts wurden für zielgerichtete Darstellung befolgt

...

Beide Grafiken haben mit dem Lerngegenstand zu tun, wobei Grafik 1 nicht ansprechend ist. Grafik 2 motiviert und lädt zum Lernen ein. Das Bild ist nicht überladen, enthält außer der generierten Schrift keine Buchstaben und zeigt nur Gesichter von Fantasie-Figuren. Eine direkte Nutzung ist nur möglich, wenn ein Mensch ein Auswahl trifft. Eventuell kann das gegenchecken Gegenchecken mittels NLP-Metrik die Auswahl unterstützen.

...

Bild 1 scheint inhaltlich geeignet zu sein. Bei Bild 2 erschließt sich der Themenbezug nicht. Die Bildqualität von 1 Bild 1 ist gut, während Bild 2 leichtes Rauschen hat. Beide Bilder zeigen keine zusätzliche Schrift. Gesichter sind in Bild 1 enthalten aber nicht kritisch.

...