Petronas Tower und KI-Bewerber

Schon lange kein Artikel über KI mehr hier im Blog? Ändern wir. Als Bebilderung habe ich hier die Bilder gewählt, von denen Excire der Meinung ist, sie wären in Malaysia, Kuala Lumpur gemacht. Das sei der Petronas Tower. Tatsächlich sind das ja zwei Türme, also “Towers”, aber seien wir mal nicht so pingelig. Beim Titelbild hat er tatsächlich zwei Türme erkannt. Die Skyline außen rum ist eher nicht so ganz passend, die Türme sind zu niedrig, sie sind auf dem falschen Kontinent, aber immerhin, zwei Türme. Alle Fotos in diesem Blogpost wurden von Excire als “Petronas Tower” erkannt.

Dubai, Emaar-Gebäude. Im Hintergrund der Burj Khalifa. Fotograf: Mario Brand.

Ich war nie in Kuala Lumpur und habe nicht ein einziges Foto von dort. Die Fotos aus Dubai haben sogar korrekte GPS-Koordinaten drin, aber ein Abgleich der Bilddaten mit den EXIFs ist natürlich der “KI” nicht möglich. Wie auch, dazu hätten die Trainingsdaten ja auch GPS haben müssen und Plausibilität ist jetzt ja bekanntermaßen nicht die Stärke von KI.

Nochmal Dubai. Das Emaar-Gebäude von Burj Khalifa aus. Foto: Mario Brand

Womit wir beim zweiten Thema sind: KI-Bewerber. Ein amerikanisches Startup, das auf automatisierte Code-Überprüfung spezialisiert ist – also ein Startup, das auf fremde Software-Sourcen eine KI loslässt, die kucken soll, ob das safe ist und dafür ne Rechnung stellt – hatte in der letzten Zeit zwei Bewerber, die – welche unglaubliche Frechheit – beim Online-Interview einen KI-Filter über ihrem Bild hatten. Also nicht nur der Hintergrund wurde verändert, sondern auch das Gesicht. Die fachliche Qualität der Bewerber stand außer Frage, der Lebenslauf ist in beiden Fällen wohl falsch, weil ein Pole kein Polnisch kann und ein Serbe kein Serbisch. Es geht also nicht drum, dass hier ein komplett künstlicher KI-Charakter eine Bewerbung abgegeben habt, sondern eine echte Person ihr Aussehen und ihren Lebenslauf manipuliert hat. (Ich habe mir sagen lassen, damit kann man es woanders ganz nach oben schaffen…)

Kaktus Towers in Esbjerg.

Das wäre eigentlich nicht aufgefallen, denn der Job war ein “Remote”-Arbeitsplatz. Und da ja gefaketer Hintergrund und glattgebügelte Haut durch die Handys mittlerweile völlig normal sind, kommt da auch niemandem irgendwas komisch vor. Wenn ich Video-Anrufe vor meinem FolyFos-Hintergrund mache, dann werde ich regelmäßig gefragt, ob das Backdrop echt sei.

Nun gibt dieses Startup den genialen Tipp, doch einfach mit der Hand vor dem Gesicht zu wedeln, weil das die KI nicht könne, da würde der Filter aufgeben und der böse Faker auffliegen. Da frage ich mich dann ernsthaft … Schon vor Jahren haben TikToker die neuen Filter von TikTok demonstriert, bei denen genau dieser Trick nicht mehr funktioniert hat. Die Chinesen können das schon seit “geraumer Zeit”. Vielleicht sollten die Amis nicht immer die asiatische Technik verbieten, dann würde ihnen auch auffallen, wie weit hinten dran sie gerade sind.

Das Verwaltungsgebäude der Nürnberger Versicherung, auch genannt die “Nürnberger Bratwurst”

Wenn ich mir DeepSeek ansehe, das mit einem lächerlich winzigen Bruchteil von OpenAi die gleichen Ergebnisse liefern kann, dann würde mich interessieren, wo die chinesische KI mittlerweile tatsächlich ist. Gibt es in China eine Software wie Excire – nur in richtig gut? Wird die bei uns nur deshalb nicht vertrieben, weil das Zeug OpenSource ist und es niemand für nötig hält, das zu übersetzen? Es gibt 1,4 Mrd. Chinesen. knapp eine Milliarde davon sprechen Mandarin. Ein lokaler Dialekt ist “Wu”, das vor allem in der Gegend von Shanghai gesprochen wird. Von 80 Millionen Chinesen. Es ist also weit lukrativer und einfacher, eine Software von Mandarin in Wu zu übersetzen, als in Deutsch.

Shanghai. Foto: Vögele

Dazu kommt, dass die Unterschiede von Mandarin und Wu im Wesentlichen phonetischer Natur sind, die wenigen lexikalischen Abweichungen sind kein größeres Problem.

Und ja, kein Irrtum, auch die ganz typische, wahrscheinlich eine Milliarde mal fotografierte Ansicht von Shanghai ist “Petronas Tower”. Die anderen Schlagwörter sind Architektur, Gebäude, Reisen, Sehenswürdigkeit, Stadt, Turm und “ungesättigt”. Ein kurzer Klick auf “Stadt” bringt mir 8760 Städtebilder, das “relevanteste” ist ein einsames Flugzeug auf einem völlig leeren Rollfeld . Das erste Bild, das keinen leeren Flughafen zeigt, Nummer 19, ist ein Bild eines Ladens eines chinesischen Andenkenhändlers. Dann kommen Yachthäfen und ein Weihnachtsbazar in einem Gemeindehaus auf dem Land. Auf Platz 23 tatsächlich eine nächtliche Straße in Köln dann wieder Flughafen und auf Platz 30 der schiefe Turm von Pisa. Der wird, o Wunder, von Excire erkannt.

Kreisverkehr in Rednitzhembach, Mittelfranken. Auch das hier: Petronas Tower

Aber zu früh gefreut. Von 14 Bildern des “schiefen Turms” waren nur vier in Pisa. Der Rest waren entweder keine Türme oder nicht schief oder beides. Und schon gleich gar nicht in der Toskana.

Das hier ist ein Bildschirmfoto – also tatsächlich ein abfotografierter Bildschirm einer Kamera. Auch hier haben wir den Patronas Tower. Deutlich erkennbar.

Ich habe ja, um das Excire-Buch schreiben zu können, alle Schlagwörter, die ich in Excire 2024 hatte, in meine Bilder geschrieben – damit ich die dann auf dem anderen PC mit Excire 2025 auslesen konnte. War ein Fehler, denn jetzt steht in jedem einzelnen Bild in den IPTC-Tags blühender Unsinn drin. Das kann man natürlich so keinem Kunden geben, der lacht sich einen Ast. Also muss ich alle Excire-Schlagwörter löschen und das Ergebnis dann wieder in die Bilder schreiben. Denn selbst wenn Excire mal Treffer drin hat – man muss ja jedes einzelne Bild kontrollieren, ob da kein Dummfug drinsteht.

Ein paar Probleme dabei: man kann nicht mehrere Schlagwörter markieren und in allen Bildern löschen. Man kann also nur immer ein einzelnes Schlagwort löschen. Hat man mehr als 10.000 Bilder aufgerufen, werden die Schlagwörter nicht angezeigt, also kann man sie auch nicht löschen. Wenn ich also 100.000 “Frontansichten” habe, die ich aufrufen kann, dann muss ich jeweils immer unter 10.000 Stück markieren und dann einzeln das Stichwort löschen.

Aber das Stichwort kann man doch brauchen? Ja, man könnte. Wenn es zumindest 99% Trefferquote hätte. Aber es gibt so viele False negativ und False positiv, dass es witzlos ist, damit in Kombinationen mit anderen Stichwörtern zu suchen, die ebenfalls falsch sind. Und eine Suchabfrage, die 100.000 Bilder als Ergebnis hat, ist von Haus aus schon albern.

Hier habe ich ein Miniplanetarium, mit dem man einen Sternenhimmel an die Zimmerdecke projizieren kann, an eine schwarze Wand gerichtet und laufen lassen. Die Ähnlichkeit mit den Petronas Towers ist verblüffend.

Also: Die AI-Textsuche von Excire ist eine brauchbare Sache, die automatische Verschlagwortung mehr so semi und wenn man auf die Idee kommt, diese Metadaten in die Bilder zu schreiben, ein “Pain in the Ass”. Man lasse es bleiben.

Und wenn man VideoCalls macht, sollte man darauf bestehen, dass alle Filter abgeschaltet werden. Inklusive dem Fake-Hintergrund. Ansonsten darf man sich nicht wundern, wenn man seltsame Überraschungen erlebt.

One Reply to “Petronas Tower und KI-Bewerber”

  1. Brauchbar funktionierende KI (bei der ich das I auch wirklich als Intelligenz auslegen kann) werde ich wohl nicht mehr erleben, fürchte ich (ich werde dieses Jahr 59). Schon vor 30 Jahren wurde daran gearbeitet und die Ergebnisse sind nun zwar bunter oder gesprächiger oder beides, aber m.E. nicht besser.

Leave a Reply

Your email address will not be published. Required fields are marked *