Pomelli ist eine „künstliche Intelligenz“ von Google, die „Content“ für die eigene Marke baut. Derzeit noch nicht in Deutschland verfügbar, aber ich nehme an, das Zeug kommt irgendwann. Man füttert dem die eigene Website, (man lässt ihn also die vermeintlich eigene Website komplett einlesen) und dann kann man mit der eigenen CI Insta-Stories bauen lassen und dergleichen.

Neu ist jetzt das Modul „Photoshoot“ – übrigens nicht „Photoshooting“, denn Shooting ist was anderes – bei dem man simpel ein Produkt mit dem Handy knipst und das Foto dann hochlädt. Die Software stellt das Produkt frei und dann kann man angeben, welche Fotos man damit haben möchte. Fotos mit Model, Fotos mit Produkt in einem Regal, Fotos einfach nur vor weißem Hintergrund. Oder eben ein animiertes Foto als Insta-Reel. Ein paar Mausklicks und fertig.

Hier hat sich einer mal drangemacht:

Was fällt mir auf? Die Farbe passt nicht. Die Tomatensauce ist auf einmal nicht mehr hellrot, sondern dunkelrot. Das kann ziiiiemlich in die Hose gehen. Kunden sind bisweilen ziemlich nissig, was die Farbe ihrer Produkte angeht.

Das andere Problem: die Größenverhältnisse stimmen nicht. Das Teil sieht auf den generierten Fotos nicht nach 600ml, sondern nach einem eineinhalb Kilo Familieneimer aus. Da wenn der arme Endkunde das Teil bestellt und denkt, das reicht ne Woche – dann ist die Enttäuschung vorprogrammiert.

Wenn nun der Chef der Tomatensaucenklitsche sich, um die Kohle für den Fotografen und das Model zu sparen, selber hinsetzt und vor sich hinpromptet – dann ist das vielleicht ne lustige Freizeitbeschäftigung, aber irgendwann kotzt den Menschen das an. Und dann ruft er den Fotografen an und sagt „Mach. So dass das passt.“ Denn natürlich hat er bei jedem Produkt immer wieder das gleiche Problem. Größer, kleiner, Beschriftungen passen nicht oder die Anwendung ist halt nicht so ganz zum Produkt passend.

Ich habe selbst mal Käse fotografiert und da muss man probieren und dann überlegen, was passt da dazu? Wie bringe ich den Geschmack dieses Käses fotografisch rüber? In dem Fall oben ist das eine simple Tomatensauce, die etwas Merlot enthält. Zutaten: „Tomato Puree (Water, Tomato Paste), Diced Tomatoes in Juice [Diced Tomatoes, Tomato Juice, Calcium Chloride (Firming Aid), Citric Acid], Wine, Onions, Sugar, Olive Oil, Salt, Garlic, Spices.“ Merlot ist übrigens mittlerweile die am zweithäufigsten angebaute Weinsorte.

Sieht man in den Fotos der KI, dass das Zeug nach Merlot schmeckt? Ich würde sagen – nö. Ketschup-Werbung.

So beeindruckend das alles auf den ersten Blick ist: es sieht eben immer nach KI aus – und man sieht auf den ersten Blick: da will jemand sparen und verkauft seine Kunden für dumm. Und nein, ich will jetzt auf keinen Fall behaupten, dass das Bertolli macht. Im Gegenteil, ich bin der Meinung, Bertolli beauftragt tatsächlich noch echte Fotografen...

Meine Wette läuft. Die KI wird die Menschheit nicht ausrotten. Die Menschheit wird der galoppierenden Dummheit von KI mit der Zeit überdrüssig werden.

Zum Titelbild: das ist mittlerweile 17 Jahre alt. Das war die E-3 mit dem 14-54. Blende 8. Hintergrund und Untergrund wurden vom Kunden vorgegeben. Und das Zeug sollte so aussehen, wie beim Kunden in der Käsetheke. Die Abbildung war im Katalog 6×4,5cm. Schärfentiefe sekundär.

20 Replies to “Pomelli”

  1. Hallo
    Ich finde es einfach nur erschreckend, mein Sohn sehr KI kritisch füttert das Ding mit ein paar Worten und es generiert Bilder die schon ziemlich gut sind, für unkritische Geister ist der Fake oft nicht zu erkennen.
    Manchmal wünschte ich mir Fotojornalisten müssten wieder mit Film arbeiten auch wenn die Nachricht eine Stunde länger braucht um um die Welt zu gehen aber der Zug ist wohl abgefahren.
    Ich experimentiere derzeit mit Instax Mini Film, nicht Hybrid fotografiert, die Qualität ist grottig die Ausschussquote hoch das Material für mich als EM Rentner teuer.
    Es kommen aber Einzelbilder ohne Pixel raus die ehrlich sind, kann man dann per WhatsApp verschicken nicht jeder Fortschritt ist gut, CP ist klasse auch bei OM System aber nur solange sie hilft die Wirklichkeit abzubilden Manipulationen sollten sichtbar bleiben.
    Gruß
    Hartmut

    1. @hartmut, mir geht es ähnlich. Habe mittlerweile meine alten Sx70 und SLR680 reaktiviert. Macht mit den neuen Polaroidfilmen wirklich Spaß und die bekannten Manipulationen mit dem Film sind auch möglich. Und alles sind Unikate.
      Anmerkung am Rande: Die 600Filme passen auch in die SX70, deren Filme immer lange Lieferfristen haben. Man muss halt nur unterzeichnen, weil SX70 auf niedrige ISO eingestellt ist.
      Gruss Bernd

    2. Ja, man kann Bilder machen. Und die Bilder werden immer besser werden. Die Menschen werden nur noch fünf Finger an den Händen haben und Models und Schauspieler werden irgendwann überflüssig werden, weil man den ganzen Mist aus dem Computer kriegt. (Immer vorausgesetzt, die KI macht nicht zwischendrin pleite.)
      Ich habe gerade mal versucht, ein Bild des Grolandhauses in Nürnberg zu bekommen. Die KI hat mich auf Wikipedia verwiesen und mir angeboten, eine KI-Rekonstruktion zu machen. Hat sie dann gemacht. Was rauskam, hat mit dem Grolandhaus nicht mal entfernt was zu tun gehabt, sondern sah mehr wie eine schlechte Version des Dürerhauses aus.
      Und das wäre jetzt nicht mal Hexerei gewesen, weil es einen schönen Kartonbausatz in Farbe gibt, den ChatGPT nur nachempfinden hätte müssen.
      Die KI kann bunte Bilder. Sie kann generischen Mist abliefern. Sie kann problemlos Phantasiewelten erzeugen, die Aufmerksamkeit erregen. Sie kann nicht die Wirklichkeit abbilden, weil sie das. selbst wenn sie könnte, gar nicht darf. Und deshalb wird sie scheitern.

      1. Ich bin mir nicht mehr so sicher… Je länger ich (v.a. in Softwareentwicklung und Systemadministration) eine der kostenpflichtigen Optionen zur Unterstützung einsetze, umsomehr sehe ich, was ich Kollegen nicht glauben wollte, dass es in der Fehlerträchtigkeit und der Brauchbarkeit der Ergebnisse einen deutlichen Unterschied zwischen den freien Versionen für den plebs und den kostenpflichtigen (selbst in der untersten Preiskategorie) gibt, und dass das Zeug immer besser wird. Und das gilt, fürchte ich, nicht mehr nur für IT-affine Anwendungen. In Sachen Nürnberg hab ich zum Beispiel diese KI-Visualisierungen gefunden: https://www.stadtbild-deutschland.org/forum/index.php?thread/10624-n%C3%BCrnberg-ki-visualisierungen/ Ein gutes Drittel gescrollt gibt’s auch das Grolandhaus…

        1. Ja, und genau da sieht man das Problem. Die KI verwendet reale Fotos, die man ihr freundlicherweise vorsetzt und verwurstet die dann. (Im Fall des Grolandhauses hier: https://artsandculture.google.com/asset/nuremberg-former-house-groland-paniersplatz-20/oAE_sFV3x4mbjA?hl=de) Dabei wird das Straßenschild gespiegelt und unleserlich gemacht, Beschriftungen gehen den Bach runter, Lichtverläufe werden verhaut und das Fenster im zweiten Stock, das keine Läden hat, lackiert die KI kurzerhand schwarz. Richtig lustig wird es dann, wenn tatsächlich Intelligenz gefragt ist. „Mach mir einen Blick aus dem Fenster im ersten Stock“. Da müsste man wissen, was da gegenüber stand. Kann man rauskriegen. Aber die KI denkt sich dann „mache ich halt eine Sicht über Nürnberg draus.“ Nur stimmt die halt nicht, weil man aus dem ersten Stock vor allem die beiden gegenüberliegenden Schulen gesehen hat. Diese KI-Ergebnisse sind auf den ersten Blick beeindruckend – aber auf den zweiten Blick halt leider vollständig wertlos. Im Gegenteil. Sie behaupten Dinge, die eben einfach falsch sind. Die KI malt Pinguine nach Grönland. Hübsche Pinguine. Keine Frage. Aber halt in Grönland.

  2. Wir müssen halt lernen Bildern zu misstrauen weil die Ki immer besser wird, eigentlich schade.
    Bildfakes gab es schon immer aber es war nie so einfach und da es so Echt aussieht werden die Menschen es erstmal glauben vor allen wenn sie das Echte nicht kennen und das kann halt fatale Folgen haben.
    Wenns nur um Kunst geht ist mir ja noch Wurscht wenn jemand gefakte Fotos für zu viel Geld ersteigert aber für Nachrichten ist es einfach gefährlich.
    Gruß
    Hartmut

    1. Da gebe ich Dir absolut recht. Meine Hoffnung ist, dass Medien, die Fakes einsetzen, mit der Zeit ihren Ruf nachhaltig ruinieren und irrelevant werden. Man kann das ja bereits seit Jahren bewundern: Die Einschaltquoten sinken, die Auflagen sinken. Gerade gecheckt: zur PrimeTime 20 Uhr sitzen gerade noch 25 Millionen Bürger zwischen 3 und scheintot vor der Glotze. Sprich: knapp 60 Millionen geht der ganze Fernsehkack am Hintern vorbei. Für die Tagesschau, das Pflichtprogramm des deutschen Bürgers, interessieren sich noch 7,7%. https://www.dwdl.de/zahlenzentrale/
      Funfact: Curling, aka Typen in bunten Klamotten hetscheln mit Schrubbern über ne Eisfläche, hat 5,6 Prozent der Bundesbürger interessiert.

      1. Sonntag 22.2.:
        Tagesschau 26,1 %
        Tagesthemen 15,3%
        Heute-journal 16,8%
        Berlin direkt 15,9%
        Also ich bin nicht so pessimistisch …
        lg Reinhard (noch einer)

        1. Glaube nie einer Statistik…
          Diese Prozentzahlen sind halt nicht die Prozente der Gesamtbevölkerung, sondern die Prozente der Zuschauer. Direkt daneben stehen die Zuschauerzahlen. Und wenn Du das auf die 83 Millionen umrechnest, die eigentlich „Beitrag“ zahlen, dann stellst Du fest, dass das ein Programm für irrelevante Minderheiten ist. „Berlin direkt“ kucken gerade mal 3,3% der Bundesbürger. 96,7% nicht. Lineares Fernsehen ist schlicht „Out“. Ohne die Zwangsgebühren würde der Laden mangels Nachfrage sofort zusammenbrechen. Prozentzahlen sind halt immer so ein Problem. Unsere Regierung ist von 22,19 Millionen Menschen gewählt worden. Das sind 26,7% der Bevölkerung, 36,67% der Wahlberechtigten und 44,07% der gültigen Stimmen. Und siehe da, sie haben eine Mehrheit im Bundestag. Prozentzahlen sind etwas zauberhaftes.

      2. Da trifft es sich doch gut, dass das ZDF am Sonntag vor einer Woche zur besten Sendezeit ein KI-Video im Heute-Journal verwendet hat. Einfach nur peinlich!

  3. Gesamtbevölkerung ist nicht gleich „Zuschauer“. Kleinkinder zählen da beispielsweise dazu. Außerdem zahlen nicht Personen, sondern Haushalte den Rundfunkbeitrag, also nicht 83 Millionen, sondern ungefähr 47 Millionen. „Prozentzahlen sind immer ein Problem “ (Zitat R.W.) ist korrekt und wenn man von diesen ein wenig wegschaut, dann stimmt das, was im Blogpost oben steht durchaus. Zumindest ungefähr.

    1. Die Zahlen der Zuschauer sind aber „Personen“ und nicht „Haushalte“. Bei der Ermittlung der Quoten wird nämlich nicht der Haushalt als eine Person gesehen, sondern es wird erfasst, wie viele Personen in diesem Haushalt vor der Flimmerkiste sitzen. Die Kinder unter 3 habe ich jetzt mal bösartigerweise in die Zuschauer reingerechnet. Man kann die rausrechnen, muss dann aber die ganzen Geflüchteten mit reinrechnen. Und dann gleicht es sich wieder aus.
      BTW: Das Zitat ist falsch. Wenn Du zitierst, dann bitte korrekt: „Prozentzahlen sind [..] immer [..] ein Problem.“

  4. Wenn ich in der Frage nicht pessimistischer wäre (https://pen-and-tell.de/2026/02/pomelli/#comment-36207), würde ich vielleicht sagen, irgendwann werden die ganzen schlechten KI-Erzeugnisse eh nur noch von KIs konsumiert, die damit immer schneller umso schlechter werden, und dann können wir uns wieder um die schönen und richtigen Dinge kümmern und z.B. als erstes das Internet den KIs überlassen und ein neues für uns aufmachen…

  5. ich habe erst mal 3-4 Videos von dem Typ gebraucht bis ich auf den Trichter kam das da was komisch ist.
    Der hier ist komplett incl. der Musik generiert und hat schon ne große Fangemeinde
    https://www.youtube.com/watch?v=PUt64aNqrDw

    Ich denke richtig doof wird es wenn sie uns die Weltpolitik KI-generieren,
    wer weiß denn schon ob der Donald noch „real“ ist
    ich habe da schon lange meine Zweifel ob der Intelligenz ……… egal welcher 🙂

    1. „Der“ ist eines der wenigen Beispiele, wo ich denke, dass wir mit KI besser dran wären – schlimmer kann man den Job ja kaum noch machen…..

      Andy
      impessimismusmodus

      1. Wäre mal einen Test wert. Frage mal über eine Woche die KI Deines geringsten Misstrauens, was zu bestimmten Themen zu tun ist und vergleiche das mit dem, was die Person treibt, die diese Entscheidung zu treffen hätte.

  6. Wahnsinn!
    Der spielt zwar nicht das was man hört aber wenn man bedenkt das es Musikproduktionen mit realen Menschen gibt, Die mit Gitarre zu sehen sind ohne das überhaupt Gitarren im Stück vorkommen dann ist das gut gemachter Fake.
    Man darf sich verar…. fühlen.
    Gruß
    Hartmut

    1. KI: sinnloser Text, Mainstream-Musik. Musiker, die irgendwas spielen. Video ohne Story.
      Ja. Gut gemacht. Besser als sehr viel anderer Müll, der da draußen rumfliegt.
      Aber es bleibt Müll. Und ich denke, wir sollten uns überlegen, warum sich Zeug millionenfach verkauft, das NOCH schlechter ist.

Antworte auf den Kommentar von Andy Antwort abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert