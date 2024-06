Zukunftia erklärt: Die KI-Revolution (Teil 3)

Bei Teil 1+2 unserer großen Reihe(r) über künstliche Intelligenz herrschte noch keine Einigkeit: Wie z.B. funktionieren die Modelle eigentlich? Labern sie einfach nur irgendwas daher, was anhand der Stichworte gerade passend erscheint? (So wie Menschen?) Werten sie einfach nur zackig aus, welche Antwort gerade am wenigsten „Ärger“ bringt und irgendwie „hilfreich“ erscheint? (So wie Menschen?) Gehen die Wortfindungsprozesse nur die Pfade ab, die vorher einprogrammiert wurden? Was manchmal wie NEUE Ideen wirkt, aber eigentlich schon vor Wochen so geschehen wäre, wenn man das Modell mit exakt der selben Frage gelöchert hätte? – Wir erklären daher erst mal, was „Layer“ sind…

Ja, diese obigen Fragen sind einerseits total komplex und total simpel zu beantworten. Je nachdem, mit welcher Tiefe man sich zufrieden gibt. Und ob man unbedingt den Menschen als Vergleich heranziehen will. – Denn letzteres muss man ja nicht tun.

Ich vergleiche Kollege Sparkiller ja auch nicht mit einer Pizza-Einpack-Maschine.

(„Was?! Nur 3 Pizzen/Minute in Plastikfolie eingeschweißt und dabei die halbe Küche versaut? Guck dir Dr. Oetker an! Die schaffen 80 und sind nicht so ein Schmutzfink!“)

Doch der Reihe nach… Die bisherigen(!) KI-Modelle arbeiten meist nach einem einfachen Muster:

Es werde mehrere „Siebe“ nebeneinander gestellt, bei denen die kleinen Löcher „entscheiden“, welche Infos sie wann durchlassen. Wobei das mit dem „Entscheiden“ relativ zu betrachten ist, da die Modelle vortrainiert sind. Wie streng (oder flexibel) sich die Löchlein beim Aussieben von Möglichkeiten verhalten, ist determiniert.

[Wobei das nicht gaaanz passt. Wenn ich die Anfrage umformuliere, à la „Bitte nur das ausgeben, wo du dir 100%ig sicher bist“, hinterlege ich andere Gewichtungen – und werde andere Antworten bekommen. Und wenn man dem System bereits gesagt hat, dass eine Antwort falsch war, wird sie diese oft nicht erneut heranziehen. Aber lassen wir das für den Moment raus.

All diese Details betreffen eher das userseitige „Prompting“, das vor Monaten unfassbarerweise als ein „Job der Zukunft“ dargestellt wurde.

ICH würde es anders formulieren: „Sei einfach nicht doof beim Eintippen!“

Gibt ja auch keine Berufs-Googler?]

Ein Beispiel: Durch jahrelange Zukunftia-Konsum total verblödet, möchte ein User wieder lernen, Dreiräder von Autos zu unterscheiden. Daher lädt er 2 Bilder hoch: Ein Dreirad und ein Quad. Die KI soll nun entscheiden, was das Kfz ist. Dafür jagt sie die Bilder durch den „Hidden Layer“. Hier mal erklärt anhand eines Schaubildes von Nativdigital.de

An jedem blauen Punkt wird etwas entschieden – oder verworfen. Das können enorm „dämliche“ Dinge sein, in denen zweijährige Kinder schon seit anderthalb Jahren einen Masterabschluss haben: „Ist das ruuund? Oder eckiiig? Welche Pixel und Bilddetails hängen überhaupt zusammen? Ist das ein Tintenfleck, eine Raufasertapete oder ein Byte-Rauschen? Error, Error!“

Einer der Layer könnte z.B. entscheiden, ob wir eine größere durchgängige Fläche sehen (mehr Metall = eher Kfz). Und eine andere digitale Synapse entscheidet, ob & wie sie die dunklen Auswüchse (sogenannte „Räder“) durchzählen möchte.

Ob das Ergebnis am Ende RICHTIG ist, kann das System nicht wissen. Daher war/ist es beim Training dieser Modelle bislang wichtig, dass jemand dem Computer sagt: „Jau, das rote Ding war ein Dreirad.“ – Gestartet hat man vermutlich bereits vor Jahren mit einem (mehr oder weniger) Fifty-Fifty-Output bei solchen Testfragen. Und ab da hat man die Modelle weiterentwickelt.

Die erst zu 51% richtig lagen, dann zu 52%, 53%, 54% und so weiter.

Allerdings muss man das – je nach Endziel – oft nur EINMAL machen. Wie bei einem Kleinkind, das irgendwann kapiert hat, dass die Füße flach auf den Boden gehören, damit die Nase nicht blutet, sind manche Dinge dann fix eingearbeitet. Und man kann sich um wichtigere Dinge kümmern. Höhere Mathematik, Bilderkennung oder völlig unangebrachte Bewertungsmaßstäbe in der Küchenpsychologie:

„ChatGPT 4o, findest du, dass diese Bücher für einen Autoren der Webseite Zukunftia.de angemessen sind? Hier ein Foto.“

Reale Antwort:

„Das Bücherregal enthält eine interessante Mischung aus Sachbüchern, Science-Fiction, Fantasy und populärwissenschaftlicher Literatur. Hier sind einige Titel, die ins Auge fallen:

– „Star Trek Deep Space Nine“

– „The Legend of Zelda: Hyrule Historia“

– „Das Wissen unserer Welt“ von Isaac Asimov

– „Picassos süße Rache“ von Kishon Ephraim

– „Die verborgene Wirklichkeit“ von Brian Greene

Diese Auswahl deutet auf ein breites Interessenspektrum hin, das sowohl wissenschaftliche als auch popkulturelle Themen abdeckt. Besonders die Science-Fiction- und wissenschaftlichen Bücher sind sehr passend für einen Autor einer Website wie Zukunftia.de, die sich oft mit futuristischen und spekulativen Themen beschäftigt.“

Wobei wir wissen müssen, dass die KI wirklich ALLES interessant, toll und passend findet, wenn es in den persönlichen Bereich geht. Das liegt daran, dass die „Persönlichkeit“ als sehr angenehm erschaffen wurde – und trotzdem durch ein paar Worte geändert werden kann. Aber im Zweifel überzeugt man sein Publikum natürlich mit Sätzen wie: „Ein Buch über Windelfetischismus? Joa, das passt zu deinem Lieblingsthema Star Trek, lieber Klapo!“

Gibt man ihr vor, wie ein grantiger Opa antworten zu müssen, kommt das hier heraus (Reale Antwort):

„Was zum Teufel sind Bücher über Chili?! Früher hat man einfach gegessen, ohne gleich ein ganzes Buch darüber schreiben zu müssen. Und dann noch dieser Brian Greene – als ob die Wirklichkeit nicht schon kompliziert genug wäre!“

Ich finde das deshalb beeindruckend, da sich dahinter bereits ein faszinierendes „Wissen“ verbirgt – gerne in Anführungszeichen, damit niemand erneut behauptet, ich würde mein Tablet bereits jetzt im Kinderwagen zur Vorschule fahren wollen.

Denn die obige Spaßantwort zeigt, dass die KI „weiß“, dass ältere Menschen gerne alles aus einer vergangenen Perspektive betrachten, neueren Ansätzen skeptisch gegenüberstehen (gerne mit einer entsprechenden Floskel) und sehr vieles mehr. Dass viele Menschen davon NICHT beeindruckt sind – weil die Klischee-Jongliererei derart natürlich wirkt -, ist das eigentlich Interessante in der öffentlichen Diskussion.

Möglich ist das vor allem, da menschliche KI-Trainer seit Jahren vor irgendwelche Texte gesetzt wurden, um der KI beizubringen, ob die Kaffeemaschinen-Bedienungsanleitung nur „witzig“, „hilfsbereit“ oder „rassistisch“ ist.

Damit dieses Adjektiv in Zukunft überhaupt einen Schwellenwert bei den verwendeten Layern überschreiten oder unterschreiten kann.

(„If_Dickenwitz-Dichte over 3,5 per Artikel, then it’s brauchbarer Zukunftia-Artikel“)

Und im SPIEGEL berichtete einer der Infohäppchen-Sammler (oft aus armen Ländern in Afrika) vor einigen Monaten davon, dass er herumlaufen musste, um ein Bild vom „Licht eines Sonnenaufgangs“ zu knipsen. Oder einer KI zu sagen, ob ein generierter Text nun eher wie Berthold Brecht oder wie eine Deutschstunden-Katastrophe wirkt.

Erinnert ihr euch noch daran, dass ihr bei gewissen Webseiten vorher beweisen musstet, dass ihr ein Mensch seid? Minuten unseres Lebens haben wir „Bilder, auf denen Busse zu sehen sind“ angeklickt. Oder „Bilder mit Ampeln“. Immer mit der Angst, falsch zu liegen („Oh Gott! Zählt der halbe Mast nun mit?“). Plot-Twist: Damit haben wir gratis irgendwelche KIs trainiert – damit selbstfahrende Autos ein Verkehrsschild von einer Wurstwerbung unterscheiden können.

Da die Bilderkennung (Sprache sowieso) teilweise schon recht gut ist, kommt es aber immer mehr auf die PERSÖNLICHKEIT einer KI an.

Schon längst werden allerlei „Persönlichkeits-Schleifmittel“ genutzt, um bestimmte Kundenberater zu erstellen, die am Telefon weiterhelfen sollen. Ja, ich weiß: Manchmal verwechselt der digitale Kundenberater noch Pizzabrötchen mit Wackersteinen („Gu-ten Ap-pet-it!“), aber die Weiterentwicklung geschieht rasant. Schon jetzt kann man sich mit lächerlich wenig Aufwand einen brauchbaren Telefonisten zusammenstellen:

Besonders interessant finde ich, mit welch einfachen Beispielsätzen man (ab Minute 8) das grundlegende Verhalten festlegen kann. Schon deshalb, weil man das auch absichtlich UNFREUNDLICH machen könnte („Hausarzt-Termin? Was denken SIE denn?! Wir haben am Montag die Hütte voll, BIEP.“).

Hierbei geht es (noch) nicht um Perfektion, sondern um die einfache Frage: „3000€ für realen Telefonfutzi ausgeben, oder 30€ für eine brauchbare Telefonfutzi-Simulation?“

Dass man – früher oder später – absichtlich bei teureren Dienstleistern bestellen wird, die noch echte Servicemenschen anbieten, ist natürlich die logische Gegenbewegung.

Gerade anpassbaren Persönlichkeiten werden – neben guten Layern – das Argument sein, welches uns das KI-Thema am Ende verkaufen wird. Dabei denke ich gar nicht sooo sehr an Telefonkontakte, sondern mehr an persönliche „Agents“ (siehe Teil 1 unserer Reihe). Wobei sich solche Anfänge oft zuerst beim Gaming zeigen.

Denn schon vor einem Jahr haben Modder mit simplen Hintergrundsätzen die Figurendialoge in Spielen wie „Skyrim“ oder „The Matrix Awakens“ aufgewertet.

Und auch das wird demnächst viel besser laufen, sodass mancher Spieler in der Rollenspiel-Taverne lieber mit der Kellnerin schäkern wird, als den bösen Drachen… äh… ebenfalls stundenlang zu bequatschen?

Bessere Computerchips (= Nvidia) und Gaming-per-Streaming-Angebote werden von diesem Bedürfnis zukünftig sehr profitieren. Ich sage nur eins: „Content ab 18“. Und noch eins: „VR-Brille“. Und noch das hier: „Ein Foto hochladen genügt grundsätzlich“:

Zugegeben, bei manchen dieser Videos weiß ich nicht, ob die Stimme bereits AI-generiert ist oder nicht. Aber ihr könnt euch das ja in 3 Monaten anschauen und euch vorstellen: „Japp. Ist heute alles möglich.“

Und ich glaube fest daran, dass wir in wenigen Jahren von Anekdoten hören werden, wie:

„Chef einer Firma war seit Jahren verreist, niemand merkte was im wöchentlichen Zoom-Meeting.“

(„Haha, genial! Super, der Typ! Ist doch okay, wenn’s keiner merkt.“)

„Ein Angestellter des Straßenverkehrsamts hat das übrigens auch lange durchgezogen.“

(„Dieses Schwein! Und das mit Steuergeldern! Sofort rauswerfen!“)

Die einzig richtige Lösung ist da natürlich: ALLE Mitarbeiter irgendwann rauswerfen. Aber das hatten wir ja bereits in Teil 2 unserer kleinen Artikelreihe.

Seitdem häufen sich übrigens die Berichte über das bevorstehende Ende der Arbeit. Wie z.B. hier bei Palladiummag.com. DAS ist natürlich extrem spekulativ und schwer zu glauben, aber wir kommen demnächst noch mal darauf zurück…

Wir haben dann ja viel Zeit dafür, ha-ha-ha.

An generierte Bilder wie dieses hat man sich lustigerweise längst gewöhnt. Die Folge: Anbieter von Stock-Footage-Bildchen und -Videos können für Schnipsel wie „Reifer Geschäftsmann…“ demnächst nur noch Centbeträge verlangen. Für die bisher veranschlagten 125€ erstellen AI-Programme bald komplette Fake-Videokonferenzen.

Mitsamt Bullshit-Bingo-Minispiel?

Fun Fakt: Für fast dasselbe Bild wurde ich mal in dreistelliger €-Höhe abgemahnt, da ich das Foto aus dem Netz „geliehen“ hatte. Heute mache ich mir die Ommas einfach selbst. Demnächst auch mit Omma-Stimme, Omma-Video, Omma-Charakter. Stun-den-lang! – Tja, „Star Trek – Discovery“! genau SO bekämpft man schnell und effektiv seine persönlichen Traumata!

Im Ernst: Gut geschrieben ist der Arbeitswelt-Text von Palladiummag durchaus.

Mir gefällt der psychologische Aspekt zum Unterthema „Arbeit, Arbeitslosigkeit und Scham“. Und sei es nur, weil ich jetzt schon sehen kann, wie sich die politischen Diskussionen komplett verschieben könnten (oder verdrängend im Kreis drehen?).

Wenn die FDP z.B. meint, dass die übrigen gebliebenen 50% an Arbeitnehmern halt „durch Leistung hervorgestochen haben“:

„Der Markt regelt halt! Muss der Versicherungsangestellte eben die Algen vom Stadtteich runterfischen! Dank uns lohnen sich immerhin seine steuerfreien Überstunden.“

Während die Linken behaupten, dass ein Grundeinkommen zwischen 2000 und 5500€ (plus Inflationsausgleich in Höhe von 12%) angemessen wäre. Gesäumt von der SPD und den Grünen, die gerne irgendwas regulieren würden, dabei aber versehentlich (= Gesetzeslücke, allgemeine Hektik) den Einsatz von Killer-Robotern in Kindertagesstätten freigeben.

Aber bevor es zu politisch wird, hier ein paar frühe Versuche (12 Monate her) von KI-NPCs in Videospielen:

Vermutlich wird man das Feature nicht allzu oft nutzen. Dreimal labert man vielleicht mit einem Rollenspiel-Jäger über seine Erfolge in der Steppe („5 Mammuts und 3 Kaninchen.“ – „Auch illegale Einwanderer erlegt?“ – „Error, Error! Sie nutzen dieses Programm nicht woke genug!!“), um danach immer zur eigentlichen Quest vorzuspulen. Andererseits haben GUTE Dialoge und GUTE Charaktere sicher das Potenzial, uns wochenlang zu fesseln?

Aber wir sind abgeschweift…

Wir sehen in jedem Fall: Die Zahl der Layer in KIs ist enorm wichtig. Für alles.

Alle Entscheidungen und Verhaltsweisen werden am Ende davon definiert, ob man Frauen nun als Menschen, Tiere als potenzielles Mittagsmenü und Männer als toxische Schweine vordefiniert. Oder halt andersherum.

Denn die Layer können natürlich unendlich neu gewichtet werden – sofern man nach dem Training eines Modells noch weiß, wo überhaupt welcher Entscheidungsprozess abgelegt & entschieden wird.

Denn genau DAS wird langsam schwierig…

Zumal es in Zukunft noch komplizierter wird. Denn langfristig soll KI eher wie unser Gehirn funktionieren. Noch mehr Chaos, noch mehr Verbindungen, noch mehr Selbst täuschung -überprüfung.

Ich zitiere mal Golem.de:

Problem ist nur, dass bereits die jetzige Methode der KI-Nutzung zu viel Energie frisst.

Die Friedrich-Alexander-Universität erklärt es so:

„Bei KI-Systemen (…) werden sehr große Matrizen mit reellen Zahlen multipliziert – die Information steckt in den exakten Werten, also den Aktivierungen der künstlichen Neuronen. Das verbraucht große Mengen an Energie. Zum Vergleich: Das Gehirn benötigt für die Informationsverarbeitung 20 Watt – die Energiemenge einer Glühbirne. Schon einfache Grafikprozessoren für KI-Anwendungen verbrauchen hingegen bereits mehrere hundert Watt.

Allerdings ist das alles kein Grund, die Systeme abzuschreiben – oder den menschlichen Vorsprung als in Stein gemeißelt zu betrachten. Denn bereits jetzt sind die Forscher dabei, die langweiligen neuronalen Layers in erfrischend unverständliches Quantengedöns umzuwandeln.

Ihr wisst schon: Mehrere Zustände und Wahrscheinlichkeiten gleichzeitig, Welle/Teilchen-Dualität, abgemurkste Katzen von Opa Schrödinger – und so weiter.

Das habe ich im Juni vor exakt 17 Jahren ja bereits ausführlich erklärt in unserem Quanten-Special, damals noch mit lustigen Bildern von Käsefüßen – wegen des Quanten-Wortspiels.

(Danke nochmal dafür, dass ich 16 Jahre lang aus der Klapsmühle meine Artikel schreiben musste. Konnte ja nicht wissen, dass es sooo lange dauert, bis das Quantencomputer-Thema im Mainstream ankommt)

Interessant im Zusammenhang mit Quantencomputing ist wohl, dass dieser Tage die Theorie lauter wird, dass unser Gehirn mittels Quantenverschränkung arbeitet. Kleine Röhrchen (Microtubes) sind angeblich dafür verantwortlich, dass im 37 Grad warmen, feuchten Körper tatsächlich Verschränkungseffekte stattfinden sollen.

Werden wir demnächst (Quanten-)Computer und KI-Anwendungen auf Basis von Kalzium und Phosphat erleben? Müssen wir dann Brausetabletten aus der Apotheke in Wassergläsern auflösen, bevor wir unseren PC damit benetzen? Ich habe keine Ahnung.

Da man aber eh bereits Hirnzellen auf Computerchips klebt, Quantencomputer immer besser werden UND alleine die Standard-Herangehensweise der KI-Nutzung noch haufenweise Verbesserungen bereithält (= energiesparende Abkürzungen innerhalb der Layer), wird es möglicherweise noch eine Weile aufwärts gehen.

Also: Mehr Brain für weniger Energie in weniger Rechenzeit für mehr Anwendungsgebiete. Mehr Selbstkritik der Systeme (weil sie „gedanklich“ öfter „zurückgehen“ können), mehr Training mit mehr Daten, weil die Chips immer besser werden und WIR die Systeme gerade AKTIV trainieren. (= „Hast wieder Scheiß gebaut bei meinen Hausaufgaben. Halt’s Maul, Klapperkasten.“)

Auch wenn erste Forscher bereits den großen „KI-Winter“ vorhersagen, bei dem es erneut jahrzehntelang nicht vorangeht.

Etwas verfrüht, meiner Meinung nach.

Aber wer weiß das schon vor unserem 4. Teil der Reihe…?

