KI beurteilt Bilder

„In der heutigen digitalen Ära, in der jeder Fotografierende eine leistungsstarke Kamera besitzt und SocialMedia-Plattformen mit atemberaubenden Bildern gefüllt sind, stellt sich oft die Frage: „Wie können wir sicherstellen, dass unsere Fotos ästhetisch ansprechend sind?“

Simpel. Ankucken.

Das Zitat oben stammt von einer Pressemitteilung von Excire, die damit einen Wettbewerb initiiert haben, um die Leute zu animieren, Fotos bei ihnen hochzuladen und von ihrer KI bewerten zu lassen. Das läuft noch bis zum 31.7.2023. Und ja, natürlich ist der Text gegendert. Interessanterweise sind es die Nutzungsbedingungen nicht. Da wird ganz unkorrekt nicht von „Nutzenden“ oder „Nutzer:innen“ gesprochen, sondern angesprochen ist der „Nutzer“. Warum das denn? „Nutzer:innen“ haben eben in Rechtstexten nichts verloren – sie sind nicht definiert. Aber das nur nebenbei. Und natürlich räumst Du alle Rechte auf immer ein und kriegst sie auch nicht wieder zurück. (Inwiefern das überhaupt mit deutschem Urheberrecht vereinbar ist, das genau dies nicht vorsieht, dürften Anwälte klären. ) Meine Empfehlung: Finger weg davon. (Und ja, ich habe parallel Excire angeschrieben und ihnen gesagt, was ich davon halte.)

Die KI-Bewertung gerade von Excire offenbart ein prinzipielles Problem. Wer Excire schon mal probiert hat, wird festgestellt haben, dass die Excire-Bildelement-Erkennung verblüffend ist. Einerseits, weil eben Dinge wie Frösche erkannt werden, aber andererseits halt alles, wo ein Fels drauf ist, sofort ein „Berg“ ist.

Erkannt wurde: Augen geschlossen, Erwachsener, Farbenfroh, Frontalansicht, Gesicht, Gruppe, Person, Sonnenbrille, Weiblich, Zwei Gesichter.

Stellenweise hat Excire überhaupt keinen Plan, um was es gehen könnte:

Erkannt wurde lediglich: Sepia-Töne

Beim Titelbild wird die weibliche Person erkannt, und dann noch Baum, Holz, Natur, Pflanze, Wald. Wirklich wichtig wäre die Schaukel. Die fehlt. Laut Erkennung steht da eine lächelnde Frau im Wald. Frontansicht. Da findet Excire noch ein Foto:

Dass es da um Raffball geht, also überhaupt um Sport, erkennt Excire natürlich nicht.

Und nun soll diese KI, die überhaupt nicht „weiß“ was auf dem Bild ist, das Bild bewerten? Wer jemals im Gymnasium Kunst hatte, der weiß, dass man erstmal ne ganze Zeit damit gedrillt wurde, Bilder zu beschreiben. Was ist da überhaupt drauf? Mann, was fanden wir das damals öde. Sah doch jeder, was da drauf war. Ja nun – aber jemand, der nicht „sieht“ was da drauf ist, kann eben auch keine Beurteilung abgeben. Da werden dann technische Kriterien angewandt – Kontrast- und Helligkeitsverteilungen. Der Effekt: Unter den derzeitigen Top20 des Wettbewerbs sind ein ganzer Schwung KI-generierter Bilder. Klar, die KI findet geil, was sie geil findet.

Man könnte nun sagen „Lass die doch machen, das ist eh alles Blödsinn“. Aber genau das ist das Problem. Es gibt Deppen, die sind tatsächlich der Meinung, sie könnten durch den Einsatz von KI teure Menschen ersetzen. Redakteure und Journalisten werden gerade hundertstückweise gefeuert. Stockfotografie ist im freien Fall. In Zukunft beurteilen KIs ob Fotos in Agenturen genommen werden und irgendwann legt KI fest, ob Bilder einen gewissen Qualitätsstandard haben, damit sie überhaupt irgendwo hochgeladen werden können. Großer Vorteil: Man kann die ganzen Leute feuern, die das derzeit auf Social Media im Nachhinein machen. Dieses Irgendwann ist nicht in 20 Jahren, sondern morgen oder übermorgen. Wenn nicht gestern. Wenn die Zensoren arbeitslos werden, weil die KI das automatisch und viel schneller macht, dann sind wir echt wo angekommen. Und das wird dann nicht mehr Zensur genannt, sondern „Qualitätssicherung“. Dein Foto beleidigt nicht Herrn Scholz, sondern es hat einfach nicht ausreichend Qualität, damit die KI das durchlässt. Mach bessere Fotos, dann werden die auch veröffentlicht.

Macht schlechtere Fotos.

7 Replies to “KI beurteilt Bilder”

  1. „elektrisches Blau“. „Farbe“. „lebendig“.“ Umgebung“. „Natur“. … wer sucht sowas ? Und btw – wer kommt von sich aus auf „elektrisches Blau“ ?
    „Baum“. „Frau“.
    Wenn die Ergebnisse „elektrisches Blau“ angezeigt werden, wer will sich dann durch den ganzen Haufen wühlen ? LIchtbogen, Blitz, Schweisser, schweissen, Blaulicht, Disse, Zappelhalle, fiese fashion show, Kornblume, Acker, Feldrand, Getreide …
    „Bild“. 1 Komma 5 Milliarden Ergebnisse in 0,00025 Sekunden. „Mehr anzeigen … “

    Ich bleib erst einmal altmodisch und verschlagworte meinen Kram in groben Zügen beim Import und die Feinheiten direkt im Anschluss. Bringt dann auch die Treffer, die inhaltlich im Bild tatsächlich von Interesse sind. Oder Holzweg und ich nicht modern genug ? Oder gar nichts kapiert von der Büchse der Pandora ?

    1. Ja, so geht das. Aber ich habe geschlampert und muss jetzt 700.000 Bilder nachverschlagworten. Für mein letztes Buch brauchte ich zwei Bilder von Wasserfällen. Selber verschlagwortet: 30. Excire: 4087. Natürlich etwa 30% Fehltreffer dabei. Aber aus den restlichen 3000 Bildern habe ich dann was passendes gefunden.

      1. aïe ! Knappe dreiviertel Mio, das ist ein Haufen … da ist der Blechkasper mit Sicherheit hilfreich.
        Was bin ich froh, dass ich mich seit einer gefühlten Ewigkeit gerne auch mal widerwillig mosernd und fluchend und knurrend durchquäle durch den Mist. Foto geht noch, ein scharfer Blick, tippeln. Filmschnipsel sind jeeeeedes Mal ein richtiger Angang. Aber a warm welcome in hell, wenn da prokrastiniert und geschludert wird.

        Zum Bilder und deren Inhalt beschreiben in der Penne :
        „I see no more than you, but I have trained myself to notice what I see.“ – Sherlock Holmes, The Adventure of the Blanched Soldier

  2. Letzten Endes sollen die Bilder doch von Menschen rezipiert werden. Wenn wir nur noch Bilder gezeigt bekommen, die “die KI” schön findet, auch wenn wir Menschen ihnen nichts abgewinnen können, dann ist es an uns, den *Leuten*, die “die KI” zur Bildauswahl einsetzen, zu sagen, was wir davon halten – und ggf. mit den Füßen (und unserem Geld) abzustimmen. Wenn wir uns das aus Trägheit oder Geiz gefallen lassen, dann verdienen wir das, was wir kriegen.

    Auf der anderen Seite: Den Menschen ist es vermutlich schnurzegal, ob ein Zeitungsartikel, ein Songtext oder ein Drehbuch von “der KI” geschrieben wurde, solange er/es *gut* ist. Das ist, in die Zukunft gedacht, sicherlich doof für Journalisten, Songtexter oder Drehbuchautoren, aber im Moment sind wir noch lange nicht so weit. Und was machen heute eigentlich alle die Leute, die früher Hufschmied geworden wären?

    1. „Den Menschen ist es vermutlich schnurzegal, ob ein Zeitungsartikel, ein Songtext
      oder ein Drehbuch von “der KI” geschrieben wurde, solange er/es *gut* ist.“

      Spätestens seit „Jim Pandzko“ wissen wir, dass es tatsächlich schnurzegal ist.
      Bei „Jim Pandzko“ wurde der Songtext von einer AI (Affenintelligenz) geschrieben:

      https://www.youtube.com/watch?v=nFfu2xDJyVs (ab Minute 16:25)

  3. „Stockfotografie ist im freien Fall. In Zukunft beurteilen KIs ob Fotos in Agenturen genommen werden und irgendwann legt KI fest, ob Bilder einen gewissen Qualitätsstandard haben, damit sie überhaupt irgendwo hochgeladen werden können.“
    Ja, das ist heute schon so. Auf 500px habe ich immer wieder mal Bilder lizenziert, auch exklusiv, und den ein oder anderen Dollar damit verdient. Seit ein paar Monaten wird bereits beim Hochladen das Bild inspiziert (von einer KI) und die sagt einem dann gleich „das ist nix“ oder „vielleicht wird es angenommen“. Bei letzterem geht das dann (vermutlich) doch noch zu einem Menschen.

  4. Die öffentlich zugänglichen Tools werden rasant immer besser. Hier ein Beispiel:
    Das Bild zeigt eine Gruppe von Personen auf einer Bühne, die offensichtlich als Mitglieder der berühmten Rockband KISS verkleidet sind. Sie tragen auffällige Kostüme und Makeup, das typisch für KISS ist: weißes Gesicht mit schwarzen Markierungen. Hier sind die Details:

    – **Person links**: Diese Person spielt eine Gitarre und trägt ein schwarzes Lederoutfit mit silbernen Details und hohen Plateaustiefeln. Das Gesicht ist weiß geschminkt mit schwarzem Stern um das rechte Auge, ähnlich wie Paul Stanley.
    – **Person in der Mitte**: Diese Person trägt ein enges schwarzes Lederoutfit mit Nieten und hochhackigen Stiefeln. Das Makeup ähnelt dem von Paul Stanley oder einem anderen KISS-Mitglied.
    – **Person rechts**: Diese Person trägt ein eng anliegendes, körperbetontes Outfit, das bemalt ist, als wäre es KISS-Kleidung. Sie trägt hochhackige Schuhe und hat orangefarbenes Haar. Das Makeup ähnelt dem von Gene Simmons, einschließlich des schwarzen Makeups um die Augen und den Lippen.

    **Schlagworte**: KISS, Rockband, Kostüme, Makeup, Bühne, Konzert, Performance, Plateaustiefel, Rockmusik, Verkleidung.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert