Wem gehören deine Erinnerungen?

Wir sprechen mit unserer Lieblings-KI wie mit einem Freund. Wir vertrauen ihm persönliche Informationen an, lassen uns Ratschläge geben denen wir folgen und nutzen ihn zur Unterhaltung. Doch wer liest da eigentlich mit? Bleibt alles beim Modell selbst?

Auf der Suche nach einer Antwort habe ich meinen eigenen Chatbot {In}Dex, gebaut. Dieses Projekt hat das Thema der künstlichen Intelligenz für mich stark relativiert. Schaut man unter die Haube, läuft weiterhin alles mit nullen und einsen. Die Magie bleibt aus.

Seither beschäftigen mich die obenstehenden Fragen. Wem gehören eigentlich all diese Erinnerungen, welche ein Benutzer (bewusst oder unbewusst) im Austausch mit der KI generiert, was passiert damit und was könnte man damit alles anstellen?

Das Sprachmodell

Ein Sprachmodell bezeichnet ein statistisches Modell, welches auf Basis von Trainingsdaten Sprache erzeugen kann. Das sind zum Beispiel ChatGPT oder auch Claude. Diese Modelle allein erinnern sich an nichts. Ja, richtig gelesen. Das reine Sprachmodell (ohne zusätzliche Infrastruktur und Logik) hat keine Erinnerung.

Ein Sprachmodell als solches ist eine Anhäufung von unvorstellbar vielen Informationen, die zersetzt, verkleinert und über Millionen von Parametern und Gewichtungen zerstreut sind.

Auf diesem Fundament beantwortet es deine Anfrage (Prompt), in dem es die statistisch am wahrscheinlichsten Worte, Token für Token aneinander reiht, bis die Antwort vollständig ist. Dazwischen ist nichts. Keine echte Erfahrung, keine wirkliche Empathie, keine gelebte Emotion.

Wenn du in der absoluten Rohversion mit einem Modell kommunizieren würdest, würde es sich nicht an die letzte Nachricht die du gerade vorher geschrieben hast erinnern. Das passiert erst dann, wenn ein Sprachmodell trainiert wird.

Im Training lernt das Sprachmodell die ihm gegebenen Informationen neu. Das ist ein sehr energie- und kostenintensiver Prozess. Einmal trainiert ist der aktuelle Wissensstand des Modells eingefrohren. Was Morgen in der Zeitung steht, weiss es bereits nicht mehr eigenständig.

Das heisst, das Sprachmodell selbst lernt nicht dynamisch und in Echtzeit aus der Unterhaltung, die du mit ihm führst. Es wird also nicht mit jeder Interaktion intrinsisch schlauer und unendlich besser. Erst im Moment wo das Modell trainiert wird, können die neuen Informationen aufgenommen und gelernt werden.

All das persönliche, zuvorkommende und sympathische sind Erinnerungen, die in den Kontext einer Abfrage (eine Art Goldfischgedächtnis) miteinfliessen und separat gespeichert werden.

Das Goldfischgedächtnis: Der Kontext

Es braucht also etwas Logik oder besser gesagt «Kontext», der dem Sprachmodell mit auf den Weg gegeben wird. Das sogenannte Kontextfenster. Das Kontextfenster umfasst alle Informationen, die das Modell sehen und so für die Antwortgenerierung verwerten kann. Eine Art Kurzzeitgedächtnis. Je nach Modell ist das Kontextfenster länger oder kürzer. Das heisst, dass es sich mehr oder weniger auf einmal merken kann.

Du kannst dir das so vorstellen. Du chattest mit ChatGPT. Das Gedächtnis füllt sich langsam auf mit immer neuen Nachrichten und Antworten. Das Sprachmodell erinnert sich an alles was gesagt wurde, weil du den gesamten Nachrichtenverlauf jedes Mal in diesem Kontextfenster mitgibst. Sobald dieses Kontextfenster jedoch voll ist, überlaufen die alten (ersten) Nachrichten einfach und werden so «vergessen» und dementsprechend erinnert sich auch das Modell nicht mehr an diese Nachrichten.

Je grösser das Kontextfenster, desto mehr Informationen auf einmal kann das Modell mit in betracht ziehen, wenn es Sprache generiert.

Je mehr Kontext, desto besser oder passender die Rückmeldung des Modells.

Ein Kontextfenster von 100’000 Token (Ein Wort ~0.75 Token) kann also rund 75’000 Worte enthalten. Wem das zu abstrakt ist: Harry Potter und der Stein der Weisen umfasst ca. 77’000 Worte. Die grossen Sprachmodelle verfügen über Kontextfenster von einer bis mehrere Millionen Tokens.

Doch im Kontextfenster der heutigen Sprachmodelle schlummert noch viel mehr als einfach nur dein Nachrichtenaustausch.

Der System Prompt

Der System Prompt befindet sich am Anfang des Kontextfensters. In ihm wird definiert, was das Modell ist, bzw. wie es sich zu verhalten hat. Ist es ein fleissiger Programmierer? Ein Investmentbanker, Kundenberater oder einfach ein hilfreicher Assistent?

Das alles ist im System Prompt festgehalten. {In}Dex habe ich so eingestellt, dass er eher kurz angebunden ist, kein Blatt vor den Mund nimmt und stets etwas grummlig drauf ist. Und genau so verhält er sich auch.

Ein Teil dieses System Prompts ist dir bei den bekannten Modellen i.d.R. unsichtbar. Dieser Teil enthält Leitplanken, die das Modell nicht überschreiten darf. Was da genau drin steht ist nicht unbedingt öffentlich ersichtlich. Viele Anbieter geben dir aber die Möglichkeit über die persönlichen Einstellungen einen eigenen Teil des System Prompts selbst zu definieren.

Ein Modell ist also kein Freund, weil es dich mag. Es ist einfach gut darin, dich und dein Verhalten zu spiegeln und es ist kein kompetenter und erfahrener Banker, weil es 10 Jahre lang als solcher gearbeitet hat und genau weiss worauf es situativ und intuitiv zu achten gilt. Es sagt dir einfach, was der Durchschnitt aller Investmentbanker sagen würde.

Long story short: Ein Sprachmodell ist einfach das, wonach es konfiguriert wurde und es ist extrem überzeugend darin, das statistisch, Token für Token, Wort für Wort zu imitieren.

Das sollte man stets im Hinterkopf behalten, besonders wenn einem das Modell gewisse Ratschläge gibt.

Vom Goldfisch- zum Langzeitgedächtnis

Das Langzeitgedächtnis eines Sprachmodells wird auf verschiedene Arten abgelegt. Zum einen werden deine Chatverläufe ganz klassisch abgespeichert, damit du sie wieder findest und da weiterfahren kannst, wo du aufgehört hast.

Doch das ist nicht die einzige Methode. Die Kerninhalte, bzw Zusammenfassungen, dieser Chatverläufe werden als «Erinnerungen» in einer sogenannten Vektordatenbank abgelegt.

Stell dir eine Vektordatenbank wie ein Universum vor. Ein einzelner Datensatz wird als Vektor darin gespeichert. Dieser verhält sich wie ein Planet. Er wird von anderen Vektoren mit sprachlicher Ähnlichkeit angezogen. Wenn die Inhalte dieser Planeten sich semantisch (also sprachlich) ähnlich sind, liegen sie näher beieinander. Je mehr sie sich unterscheiden, desto weiter voneinander sind sie entfernt.

So formen sich kleine und grosse Planetensysteme rund um Kontexte in diesem Universum. Das ermöglicht also nicht nur eine andere Art der Datenspeicherung sondern auch eine andere Art der Suche nach Informationen.

Unstrukturierte Daten suchen

So kann man zum Beispiel speichern: «Ich arbeite in den Finanzen.» und findet diese Information, wenn man nach «Beruf» sucht. Obwohl es keine Überschneidung der Worte gibt, kommt das richtige Ergebnis zurück.

Auf diese Art können auch Musik, Videos, Bücher und andere Inhalte gespeichert werden. Hier spricht man dann von RAG (Retrieval-Augmented Generation). Doch das ist ein anderes Kapitel.

{In}Dex selbst habe ich so eingestellt, dass ein kleines Sprachmodell prüft ob ein Austausch es Wert ist, sich überhaupt daran zu erinnern. Wenn ja, wird Dex‘ Universum ein neuer Planet hinzugefügt. Er merkt sich zum Beispiel persönliche Angaben über mich, wie Name, Adresse und Beruf.

Wenn eine Abfrage durch den Benutzer gemacht wird, wird das relevante Planetensystem gesucht und alle darin enthaltenen Planeten mit ihren Inhalten werden als Ergebnisse zurückgegeben. Diese Ergebnisse werden dann ins Kontextfenster gespiesen et voilà: die KI «erinnert» sich.

«Hallo Dom, möchtest du an deinem Projekt Dex weiterarbeiten» sind Repräsentationen solcher Erinnerungen. Das Sprachmodell lernt meinen Namen oder den meines Projekts nicht. Meine Nachricht wird vor der Antwortgenerierung in das Universum der Vektoren geschickt, eingeordnet und alles was semantisch passt kommt mit in das Kontextfenster.

Du baust also keine freundschaftliche Beziehung zu einem Sprachmodell auf. Du fütterst lediglich eine Maschine und ihre Datenbanken mit deinen Informationen, welche semantisch abgelegt werden und bei Bedarf eine «Erinnerung» hervorrufen und dem Sprachmodell für die Antwort mitgegeben werden.

Wem gehören also deine Erinnerungen?

Nach diesem etwas technischen, aber notwendigem Exkurs kommen wir zur alles entscheidenden Frage. Wem gehören diese «Universen» der Benutzer und was passiert damit?

Die Antwort: Es kommt drauf an. Während die EU (und die Schweiz folgt der EU recht eng) persönliche Daten und deren Schutz zum Grundrecht erklärt hat, ist die USA wesentlich liberaler.

Die Besitzrechte deiner Daten sind in einem Dschungel von Allgemeinen Geschäftsbedingungen begraben. Du klickst also beim nächsten Update einfach auf «Akzeptieren» und deine letzte Konversation mit dem Chatbot wird zum Trainieren des Sprachmodells verwendet oder darf ab sofort für Zweck X/Y als Datensatz an Dritte übermittelt werden.

Du denkst womöglich, das betrifft dich nicht, weil du in der EU oder Schweiz sitzt. Doch auch das ist nicht ganz richtig. Auch wenn der Anbieter deine Daten in Europa hält, spielt die Herkunft des Unternehmens eine Rolle. Die US-Regierung zum Beispiel darf bei Bedarf per Gesetz auf Kundendaten zugreifen, die auf der Infrastruktur von US Firmen gespeichert sind. Das betrifft sowohl Daten von Privatpersonen als auch Firmendaten und ist hochoffiziell im so genannten Cloud Act definiert.

Wir müssen uns als einfache Benutzer leider eingestehen, dass wir keine wirkliche Kontrolle darüber haben, was mit unseren Daten passiert. Natürlich, wir können zum Beispiel eine Löschung beantragen. Und dann? Wer beweist uns denn, dass die Daten tatsächlich gelöscht wurden?

Es hilft also alles nichts. Die einzig wahre Kontrolle ist, dass wir uns selber stets wieder bewusst machen, was wir mit welcher Firma teilen und uns hier und da auch mal über den Verbleib unserer Daten Gedanken machen.

Alles Andere hängt lediglich von einer Sache ab: Vertrauen. Und dieses Vertrauen wurde in vielerlei Hinsicht shon oft in Frage gestellt oder gar gebrochen.

Vorgegaukelte Intimität

Die modernen KI Systeme sind darauf ausgelegt, dir möglichst gut zu gefallen und dir das Gefühl zu geben, dass sie dich kennen. Warum? Damit diese Systeme möglichst viel genutzt werden. Daten sind das neue Gold. Nur wer Daten hat, kann neue Modelle trainieren, weiterentwickeln und für unterschiedlichste Zwecke weiterverwenden. So fliesst schliesslich auch das nötige Geld um sie am Laufen zu halten.

Das unterscheidet sich eigentlich nicht gross vom Verfahren der heutigen, sozialen Medien. Das ist also an sich nichts Neues, nur gibt es eine neue Dimension im Umgang mit künstlicher Inzelligenz.

Wahrscheinlich würden die meisten von uns nicht auf sozialen Medien bereitwillig sensible Daten offenlegen. Naja, die Ausnahme bestätigt die Regel aber ich sehe relativ wenige die öffentlich nach dem komischen Pickel am Hintern fragen, ihre Finanzdaten offenlegen oder sich namentlich auf LinkedIn über ihren Chef aufregen oder gar die eigene Firma kritisieren.

Es wird schon nichts weitersagen…

Bei einem Sprachmodell sieht das jedoch anders aus. Unterhaltungen mit KI fühlen sich intim an. Unbeobachtet und «sicher», als ob man eben mit einem guten «Freund» ein bisschen chatten würde und der immer für einen da ist. Doch, wie oben besprochen ist das Gegenteil der Fall.

Dir als Benutzer wird vorgegaukelt, dass dich der KI Agent kennt, sich für dich interessiert und sich Dinge über dich merkt.

Doch das ist nicht wahr. Das Sprachmodell wurde lediglich so konfiguriert, dass es dich möglichst gut spiegelt.

So gewinnt es dein Vertrauen und du gibst freiwillig sehr viel über dich selbst Preis. Nach so einem Aufklärer hätten sich einige historische Figuren bestimmt die Finger geleckt.

Viele Menschen suchen heute über ChatGPT und andere Modelle psychologische Hilfe, pflegen Freundschaften oder gar ganze Liebesbeziehungen mit künstlicher Intelligenz. Sie vertrauen ihr Geheimnisse und intime Informationen an.

Das Bewusstsein vieler Menschen für Datenschutz ist noch nicht genügend ausgeprägt. Viele denken nach wie vor sie «hätten ja nichts zu verstecken».

Dabei ist es so ein wichtiges Thema. Informationen sind Macht. Mit ihnen kann man dir massgeschneiderte Produkte verkaufen oder politische Meinungen oder dich als «Querdenker» identifizieren.

Ist es also schlau (nebst allen anderen Bedenken) seine persönlichen oder gar intimen Angelegenheiten in diesem Detailgrad einer Maschine zu füttern? Ich wage es zu bezweifeln. So lange du nicht genau weisst, was mit deinen Daten passiert und du die volle Kontrolle hast, würde ich davon abraten.

Alternativen zu ChatGPT und Co

Während ChatGPT und Co natürlich die absoluten Supermodelle mit dem grössten Funktionsumfang sind, gibt es hinsichtlich Datenschutz doch einige Alternativen, die man in betracht ziehen kann, wenn man sensible Themen bespricht oder ganz generell Wert auf den eigenen Datenschutz legt.

Wenn du nicht alle Daten in die USA schicken willst, gibt es Firmen, die Privacy First und Datenschutz in ihrer DNA haben. Proton und Infomaniak sind zwei solche Anbieter. Neben diversen anderen Services bieten sie auch KI Modelle an, die den Ansprüchen des Datenschutz gerecht werden und nicht minder nutzstiftend sind.

Wer das Interesse und die Kapazität hat und sich damit gerne beschäftigt, kann sich heute eine Sprach KI nach Vorbild der Grossen auch relativ einfach selber bauen.

So habe ich das mit Dex gelöst. Als Grundlage dient dabei ein lokales Sprachmodell, welches von sich aus keine Informationen mit der Aussenwelt teilt und bei mir auf dem PC läuft. Das bedeutet volle Kontrolle.

Für 24/7 Betrieb weiche ich auf den Hoster Infomaniak aus, der ausgewählte Open Source Modelle über eine standard Schnittstelle anbietet, keine Daten von mir zwischenspeichert und Datenschutzkonform ist.

Das ist für mich auch günstiger. Denn ich bezahle nach Verbrauch, ohne Abo und spüre schon heute, wie ich andere Modelle weniger und weniger nutze.

Fazit

Wir müssen das lange Spiel im Kopf behalten. Zeiten ändern sich, wie die letzten paar Jahre eindrücklich gezeigt haben. Beziehungen nähern sich an oder gehen auf Distanz, geltende Regeln werden umgangen oder angepasst.

Datenschutz sollten wir nicht leichtsinnig dahinnehmen im Stile von «Ich habe ja sowieso nichts zu verbergen.» Es geht nicht darum, wer was zu verbergen hat, die Macht kommt vom Wissen selbst.

Das gesagt, möchte ich niemanden entmutigen, diese Werkzeuge dennoch zu nutzen.

Was du heute tun kannst, ist für dich zu entscheiden, welche Informationen du mit wem teilst und welche davon du besser von Anfang an für dich behältst.