Document toolboxDocument toolbox

Tools für die Bewertung der Bildqualität

Hier stellen wir ein Python-Tool in einem Google Colab bereit, das bereits einige Metriken zur Bildqualität ermitteln kann. Dabei unterschiedet es Metriken für die allgemeine Qualität und Metriken in Bezug auf den für die Generierung verwendeten Prompt.

Verwendung

Google Colab Notebook aufrufen und starten: Google Colab

  • kostenfrei und ohne Keys

  • nach einigen Sekunden zeigt das Script am Ende des Durchlaufs eine URL für das Interface an

  • unter dieser ist die Oberfläche nach ca. 10 Sekunden erreichbar

  • bitte das generierte Bild und den verwendeten Prompt eingeben und starten

Unterstützte Metriken

Allgemeine Bildqualitätsmetriken

Metrik

Beschreibung

Was wird gemessen

Aussagen

Metrik

Beschreibung

Was wird gemessen

Aussagen

BRISQUE

Bewertet die Bildqualität basierend auf natürlichen Bildstatistiken ohne Referenz.

Bildqualität und Natürlichkeit ohne Referenzbild.

Niedrigere BRISQUE-Werte deuten auf eine bessere Bildqualität hin.

NIQE

Bewertet die Natürlichkeit und Qualität des Bildes ohne Referenz.

Natürlichkeit und Bildqualität ohne Referenz.

Niedrigere NIQE-Werte deuten auf eine höhere Bildqualität und Natürlichkeit hin.

Entropie

Misst den Informationsgehalt und die Komplexität des Bildes.

Informationsgehalt und Komplexität des Bildes.

Höhere Entropiewerte deuten auf komplexere und detailliertere Bilder hin.

Farbigkeit (Colorfulness)

Bewertet die Farbintensität und -vielfalt im Bild.

Farbintensität und -vielfalt im Bild.

Höhere Farbwerte bedeuten lebendigere und farbenfrohere Bilder.

Schärfe (Sharpness)

Bewertet die Schärfe und Klarheit der Bilddetails.

Schärfe und Klarheit der Bilddetails.

Höhere Schärfewerte deuten auf schärfere und klarere Bilder hin.

Kontrast (Contrast)

Misst den Kontrast des Bildes.

Differenz zwischen den hellsten und dunkelsten Bereichen.

Höhere Kontrastwerte deuten auf lebendigere und dynamischere Bilder hin.

Inception Score (IS)

Bewertet die Qualität und Vielfalt der generierten Bilder basierend auf einem vortrainierten Inception-Modell.

Klarheit der generierten Objekte und Vielfalt der Bildinhalte.

Höhere IS-Werte deuten auf klarere und vielfältigere generierte Bilder hin.

Metriken mit Referenz

Wurden nicht implementiert. Können aber im Konzept nachgelesen und ergänzt werden.

Prompt-basierte Metriken

Metrik

Beschreibung

Was wird gemessen

Aussagen

Metrik

Beschreibung

Was wird gemessen

Aussagen

CLIP Score

Verwendet das CLIP-Modell von OpenAI, um die Übereinstimmung zwischen Text und Bild zu bewerten.

Semantische Ähnlichkeit und Relevanz des Bildinhalts zum Textprompt.

Höhere CLIP-Scores deuten darauf hin, dass das generierte Bild besser zum Textprompt passt.

BLIP Score

Verwendet das BLIP-Modell von Salesforce, um die Übereinstimmung zwischen Text und Bild zu bewerten.

Semantische Ähnlichkeit und Relevanz des Bildinhalts zum Textprompt.

Höhere BLIP-Scores deuten darauf hin, dass das generierte Bild eine stärkere und präzisere Übereinstimmung mit dem Textprompt aufweist.

Anwendungs-Oberfläche

image-20241105-221155.png
image-20241105-221241.png

Musterdaten für den ersten Test

KI-generiertes Bild:

Prompt:

Create a high-resolution, realistic illustration focusing on the specialized photoreceptor cells called cone cells within the human retina, which enable vision in a full spectrum of colors. Show three types of cone cells in close-up, with microscopic precision and clear differentiation, each representing distinct light wavelengths. In the background, subtly include neural pathways leading towards the brain, symbolizing the brain’s critical role in creating the perception of color. The composition should be minimalistic, with balanced symmetry and a clean design, using warm colors and natural lighting to evoke an inviting, motivational atmosphere. Emphasize clarity and simplicity with clean lines, straightforward forms, and an organized, cohesive visual structure that directs attention toward the main elements without unnecessary details. Attributes should include high detail, sharp focus, polished and pristine aesthetics, and an appealing, culturally inclusive presentation. Avoid any text in the image to ensure clarity and avoid distractions. Attributes: highly detailed, sharp focus, polished, pristine, symmetrical, cohesive, minimalistic, clean, and organized.