Tools für die Bewertung der Bildqualität
Hier stellen wir ein Python-Tool in einem Google Colab bereit, das bereits einige Metriken zur Bildqualität ermitteln kann. Dabei unterschiedet es Metriken für die allgemeine Qualität und Metriken in Bezug auf den für die Generierung verwendeten Prompt.
Verwendung
Google Colab Notebook aufrufen und starten: https://colab.research.google.com/drive/1D_jquJWyqZ7OA_jrgTJNBMzpQEyqnTsg?usp=sharing
kostenfrei und ohne Keys
nach einigen Sekunden zeigt das Script am Ende des Durchlaufs eine URL für das Interface an
unter dieser ist die Oberfläche nach ca. 10 Sekunden erreichbar
bitte das generierte Bild und den verwendeten Prompt eingeben und starten
Unterstützte Metriken
Allgemeine Bildqualitätsmetriken
Metrik | Beschreibung | Was wird gemessen | Aussagen |
---|---|---|---|
BRISQUE | Bewertet die Bildqualität basierend auf natürlichen Bildstatistiken ohne Referenz. | Bildqualität und Natürlichkeit ohne Referenzbild. | Niedrigere BRISQUE-Werte deuten auf eine bessere Bildqualität hin. |
NIQE | Bewertet die Natürlichkeit und Qualität des Bildes ohne Referenz. | Natürlichkeit und Bildqualität ohne Referenz. | Niedrigere NIQE-Werte deuten auf eine höhere Bildqualität und Natürlichkeit hin. |
Entropie | Misst den Informationsgehalt und die Komplexität des Bildes. | Informationsgehalt und Komplexität des Bildes. | Höhere Entropiewerte deuten auf komplexere und detailliertere Bilder hin. |
Farbigkeit (Colorfulness) | Bewertet die Farbintensität und -vielfalt im Bild. | Farbintensität und -vielfalt im Bild. | Höhere Farbwerte bedeuten lebendigere und farbenfrohere Bilder. |
Schärfe (Sharpness) | Bewertet die Schärfe und Klarheit der Bilddetails. | Schärfe und Klarheit der Bilddetails. | Höhere Schärfewerte deuten auf schärfere und klarere Bilder hin. |
Kontrast (Contrast) | Misst den Kontrast des Bildes. | Differenz zwischen den hellsten und dunkelsten Bereichen. | Höhere Kontrastwerte deuten auf lebendigere und dynamischere Bilder hin. |
Inception Score (IS) | Bewertet die Qualität und Vielfalt der generierten Bilder basierend auf einem vortrainierten Inception-Modell. | Klarheit der generierten Objekte und Vielfalt der Bildinhalte. | Höhere IS-Werte deuten auf klarere und vielfältigere generierte Bilder hin. |
Metriken mit Referenz
Wurden nicht implementiert. Können aber im Konzept nachgelesen und ergänzt werden.
Prompt-basierte Metriken
Metrik | Beschreibung | Was wird gemessen | Aussagen |
---|---|---|---|
CLIP Score | Verwendet das CLIP-Modell von OpenAI, um die Übereinstimmung zwischen Text und Bild zu bewerten. | Semantische Ähnlichkeit und Relevanz des Bildinhalts zum Textprompt. | Höhere CLIP-Scores deuten darauf hin, dass das generierte Bild besser zum Textprompt passt. |
BLIP Score | Verwendet das BLIP-Modell von Salesforce, um die Übereinstimmung zwischen Text und Bild zu bewerten. | Semantische Ähnlichkeit und Relevanz des Bildinhalts zum Textprompt. | Höhere BLIP-Scores deuten darauf hin, dass das generierte Bild eine stärkere und präzisere Übereinstimmung mit dem Textprompt aufweist. |
Anwendungs-Oberfläche
Musterdaten für den ersten Test
KI-generiertes Bild:
Prompt:
Create a high-resolution, realistic illustration focusing on the specialized photoreceptor cells called cone cells within the human retina, which enable vision in a full spectrum of colors. Show three types of cone cells in close-up, with microscopic precision and clear differentiation, each representing distinct light wavelengths. In the background, subtly include neural pathways leading towards the brain, symbolizing the brain’s critical role in creating the perception of color. The composition should be minimalistic, with balanced symmetry and a clean design, using warm colors and natural lighting to evoke an inviting, motivational atmosphere. Emphasize clarity and simplicity with clean lines, straightforward forms, and an organized, cohesive visual structure that directs attention toward the main elements without unnecessary details. Attributes should include high detail, sharp focus, polished and pristine aesthetics, and an appealing, culturally inclusive presentation. Avoid any text in the image to ensure clarity and avoid distractions. Attributes: highly detailed, sharp focus, polished, pristine, symmetrical, cohesive, minimalistic, clean, and organized.