Hier stellen wir ein Python-Tool in einem Google Colab bereit, das bereits einige Metriken zur Bildqualität ermitteln kann. Dabei unterschiedet es Metriken für die allgemeine Qualität und Metriken in Bezug auf den für die Generierung verwendeten Prompt.
Verwendung
Google Colab Notebook aufrufen und starten: https://colab.research.google.com/drive/1D_jquJWyqZ7OA_jrgTJNBMzpQEyqnTsg?usp=sharing
kostenfrei und ohne Keys
nach einigen Sekunden zeigt das Script am Ende des Durchlaufs eine URL für das Interface an
unter dieser ist die Oberfläche nach ca. 10 Sekunden erreichbar
bitte das generierte Bild und den verwendeten Prompt eingeben und starten
Unterstützte Metriken
Allgemeine Bildqualitätsmetriken
Diese Metriken bewerten die Qualität der Bilder unabhängig von einem spezifischen Referenzbild.
BRISQUE (Blind/Referenceless Image Spatial Quality Evaluator)
Was wird gemessen: Bildqualität und Natürlichkeit basierend auf natürlichen Bildstatistiken ohne Referenzbild.
Aussagen: Niedrigere BRISQUE-Werte deuten auf eine bessere Bildqualität hin.
NIQE (Naturalness Image Quality Evaluator)
Was wird gemessen: Natürlichkeit und wahrgenommene Qualität des Bildes ohne Referenz.
Aussagen: Niedrigere NIQE-Werte deuten auf eine höhere Bildqualität und Natürlichkeit hin.
Entropie
Was wird gemessen: Informationsgehalt und Komplexität des Bildes.
Aussagen: Höhere Entropiewerte deuten auf komplexere und detailliertere Bilder hin.
Farbigkeit (Colorfulness)
Was wird gemessen: Farbintensität und -vielfalt im Bild.
Aussagen: Höhere Farbwerte bedeuten lebendigere und farbenfrohere Bilder.
Schärfe (Sharpness)
Was wird gemessen: Schärfe und Klarheit der Bilddetails.
Aussagen: Höhere Schärfewerte deuten auf schärfere und klarere Bilder hin.
Kontrast (Contrast)
Was wird gemessen: Differenz zwischen den hellsten und dunkelsten Bereichen des Bildes.
Aussagen: Höhere Kontrastwerte deuten auf lebendigere und dynamischere Bilder hin.
Inception Score (IS)
Was wird gemessen: Qualität und Vielfalt der generierten Bilder basierend auf den Vorhersagen eines vortrainierten Inception-Modells.
Aussagen: Höhere IS-Werte deuten auf klarere und vielfältigere generierte Bilder hin.
Prompt-basierte Metriken
Diese Metriken bewerten, wie gut das generierte Bild den Vorgaben des Textprompts entspricht.
CLIP Score
Was wird gemessen: Semantische Ähnlichkeit und Relevanz des Bildinhalts zum eingegebenen Textprompt unter Verwendung des CLIP-Modells von OpenAI.
Aussagen: Höhere CLIP-Scores deuten darauf hin, dass das generierte Bild besser zum Textprompt passt.
BLIP Score
Was wird gemessen: Semantische Ähnlichkeit und Relevanz des Bildinhalts zum eingegebenen Textprompt unter Verwendung des BLIP-Modells von Salesforce.
Aussagen: Höhere BLIP-Scores deuten darauf hin, dass das generierte Bild eine stärkere und präzisere Übereinstimmung mit dem Textprompt aufweist.
Bildmetriken in Bezug auf Referenzbilder
Diese Metriken wurden bisher nicht integriert, können aber ergänzt werden. Siehe: Konzeptseite.
Anwendungs-Oberfläche
Musterdaten für den ersten Test
KI-generiertes Bild:
Prompt:
Create a high-resolution, realistic illustration focusing on the specialized photoreceptor cells called cone cells within the human retina, which enable vision in a full spectrum of colors. Show three types of cone cells in close-up, with microscopic precision and clear differentiation, each representing distinct light wavelengths. In the background, subtly include neural pathways leading towards the brain, symbolizing the brain’s critical role in creating the perception of color. The composition should be minimalistic, with balanced symmetry and a clean design, using warm colors and natural lighting to evoke an inviting, motivational atmosphere. Emphasize clarity and simplicity with clean lines, straightforward forms, and an organized, cohesive visual structure that directs attention toward the main elements without unnecessary details. Attributes should include high detail, sharp focus, polished and pristine aesthetics, and an appealing, culturally inclusive presentation. Avoid any text in the image to ensure clarity and avoid distractions. Attributes: highly detailed, sharp focus, polished, pristine, symmetrical, cohesive, minimalistic, clean, and organized.