Posted in

Äpfel und Birnen: Aufräumen im KI-Dschungel

Artikel: Volker Strauß | Bilder von KI-Artikeln sind meistens sehr geistlos und generisch. So richtig vorstellen, wie eine KI aussieht, können auch LinkedIn KI-Expert:innen nicht [Foto: DALL·E 3]

Kaum ein Unternehmen oder ein:e LinkedIn-Schwurbler:in brüstet sich nicht mit KI-Expertise und viele Deutsche sind Sonntags nicht mehr Fußballtrainer:in oder Wirtschaftsminister:in sondern KI-Spezialist:in. Aber nicht überall wo KI draufsteht ist auch KI drin. Wir geben euch eine kleine Einführung in die Welt der KI.

Von Äpfeln und Birnen

Um zu verstehen, was KI sein soll, müssen wir zunächst den Unterschied zwischen klassischen und datengetriebenen Informationssystemen darstellen.

Ein klassisches Informationssystem geht nach einem festgelegten Regelsatz vor, einem sogenannten Algorithmus. Das Formulieren dieser Regelungen bezeichnet man als programmieren. Das funktioniert dann, wenn wir die Regeln vorab kennen. So können wir zum Beispiel Daten in einer Liste sortieren oder suchen.

Was ist aber, wenn wir diese Regeln nicht kennen?

Wie können wir beispielsweise Äpfel von Birnen unterscheiden? Für uns ist das natürlich kein Problem, aber was genau unterscheidet denn einen Apfel von einer Birne? Was sind hier die Regeln? Also ein Apfel ist rot, rund und hat meistens einen Stiel. Eine Birne ist gelb, oval (man sagt auch birnenförmig) und hat auch einen Stiel. Diese Eigenschaften könnte man vielleicht mit einem Algorithmus abbilden. Aber gibt es nicht auch gelbe Äpfel? Oder runde Birnen? Und was ist, wenn der Stiel fehlt? Hier wird das ganze schon komplizierter. 

Ein KI-System kann uns dabei helfen, Regeln für diese Klassifizierung aufzustellen, die wir mit einem einfachen Algorithmus nicht formulieren können. Wir brauchen Algorithmen, die Regeln in Daten erkennen, die der Mensch nicht beschreiben kann. Diese Systeme nennt man dann „datengetrieben“.

KI-Begriff

Was genau meinen wir denn jetzt, wenn wir von KI sprechen? Das ist gar nicht so einfach. In den letzten Jahren ist KI vor allem zu einem Modewort geworden. Die Verwendung des Begriffs soll vor allem die Zukunftsgewandtheit und Innovationskraft der Anbieter:innen oder das Mindset des AI experts oder wie auch immer sich selbsternannte LinkedIn-Entrepreneure heutzutage nennen, ausdrücken. Manchmal scheint es so, als drücke die Verwendung des KI-Begriffes mehr Unwissenheit als alles andere aus.

KI steht für Künstliche Intelligenz. Im technischen Sinne beschreibt KI Maschinen, die rational handeln oder denken. Das Tech-Unternehmen Microsoft versteht unter KI „Technologien, die menschliche Fähigkeiten im Sehen, Hören, Analysieren, Entscheiden und Handeln ergänzen und stärken“ (Kronies, 2020). Neben diesen technisch-fokussierten Definitionen kann KI auch als interdisziplinäres Forschungsfeld zwischen Kognitionswissenschaft, Informatik und Naturwissenschaft gesehen werden. 

Es gibt also nicht die eine Definition von KI. Und auch die Überladung mit Erwartungen sowie die inflationäre Verwendung helfen nicht gerade dabei, die Trennschärfe zu erhöhen. Der US-amerikanische Philosoph John Searle schlägt die Unterscheidung zwischen einer starken und schwachen KI vor.Der Begriff starke KI beschreibt ein theoretisches Konzept, das eine Maschine beschreibt, die menschenähnliches Verstehen, Bewusstsein und kognitive Fähigkeiten besitzt. Eine solche starke KI existiert bislang nicht.Eine schwache KI erkennt beispielsweise Muster in Daten, kann Vorhersagen treffen oder menschliches Denken simulieren. In den Bereich der schwachen KI fällt beispielsweise auch das „Maschinelle Lernen“ (Machine Learning / ML), mittels dessen man eine solche schwache KI umsetzen kann. Sprachmodelle wie ChatGPT oder Claude sind auch dem Machine Learning zuzuordnen.

Machine Learning wird meistens in drei Methoden unterteilt: supervised (überwachtes), unsupervised (unüberwachtes), und reinforcement (bestärkendes) Learning.
Beim überwachten Lernen bekommt ein Programm Trainingsdaten (sog. Features) mit korrekten Ergebnissen (sog. Labels). Das Programm kann dann auf Grundlage dieser Daten Vorhersagen treffen. Beispiele hierfür sind Regression, also die Vorhersage numerischer Werte und Klassifikation (Objekterkennung) wie beispielsweise das Erkennen von Spam-Mails.
Beim unüberwachten Lernen liegen dem Programm keine Labels, also keine korrekten Ergebnisse vor. Der Fokus hier liegt auf der Strukturerkennung. Beispielsweise können so im Bereich der Marktforschung Kund:innen in Segmente aufgeteilt werden, die mit herkömmlichen Algorithmen nur schwer zu identifizieren wären.
Beim bestärkenden Lernen geht es um die Entwicklung von Strategien zur Problemlösung. Ein Algorithmus lernt, eine bestimmte Aktion durchzuführen, um die größtmögliche Belohnung in einer gegebenen Umgebung zu erzielen. Ein bekanntes Beispiel sind hier Algorithmen zur Strategiefindung in Spielen wie Schach, Go oder auch StarCraft.Wichtig zu erwähnen ist, dass heutzutage viele Programme eine Mischung dieser Methoden anwenden und sich nicht auf eine festlegen (vgl. Géron, 2019).

Ein Large Language Model (LLM) wie beispielsweise OpenAIs GPT4, basiert auf sogenannten neuronalen Netzen (auch künstliche neuronale Netze), welche wiederum die zuvor beschriebenen Lernverfahren des Machine Learnings verwenden. Solche Netze sind natürlichen neuronalen Netzen, wie sie im Nervensystem von Lebewesen vorkommen, nachempfunden und bestehen aus künstlichen Neuronen. Der grundlegende Gedanke ist, dass künstliche Neuronen Impulse dann weiterleiten, wenn ein bestimmter Schwellenwert (sog. threshold) überschritten wird. Dieser wird mittels einer sogenannten Aktivierungsfunktion (activation function) errechnet.
Ein neuronales Netz besteht meistens aus einer Eingabeschicht (input layer), einer Ausgabeschicht (output layer) und dazwischen können sich Zwischenschichten befinden (hidden layer). In seinem Einführungsband Künstliche Intelligenz zur Einführung verwendet Sebastian Rosengrün die Entscheidung ins Kino zu gehen, um den grundlegenden Aufbau darzulegen (Rosengrün, 2021).

Einfaches Neuronales Netz in Anlehnung an Rosengrün (2021)

In diesem, an Rosengrün angelehnten Beispiel, geht es um die Frage, ob eine Person morgen ins Freibad gehen soll oder nicht. Jeder dieser vier Faktoren hat eine Gewichtung und kann entweder wahr (1) oder falsch (0) sein. Liegt der addierte Wert dieser Gewichtungen (0 x -8 + 0 x 4 + 6 + 0 x -6 = 6) über 5, wird der Impuls weitergeleitet, die Person geht also morgen ins Freibad. Das ist dann das sog. Output-Layer, die vier Input-Faktoren stellen die Eingabeschicht dar. Solche Netze sind meist deutlich komplexer und größer und können mittels den zuvor beschriebenen Lernverfahren erstellt und verbessert werden. Das Beispiel vermittelt aber den grundlegenden Gedanken.

Zurück zu den Äpfeln

Wie können wir jetzt Äpfeln mit Birnen vergleichen? Hier empfiehlt sich das überwachte Lernen. Wir zeigen dem Modell Bilder von Äpfel und Birnen, wobei jedes Beispiel korrekt als entweder Apfel oder Birne gekennzeichnet ist (Das sind dann unsere Trainingsdaten oder Features). Das Modell lernt dann Muster zu erkennen, die typisch für die Frucht sind – wie Farbe, Form. Größe und Textur. Aber auch subtile Merkmale, die ein herkömmlicher Algorithmus nicht erfassen kann, werden erlernt. Mit genügend Trainingsdaten kann unser Modell dann unbekannte Bilder von Äpfel oder Birnen analysieren und vorhersagen, ob es sich um einen Apfel oder eine Birne handelt.

In einem sind sich aber echte KI-Expert:innen und LinkedIn-Wannabees einig: KI wird unsere Gesellschaft und unser Arbeitsleben radikal verändern. Gerade deswegen ist es wichtig zu verstehen, wie die Technologie funktioniert und was sie für uns und unsere Gesellschaft bedeutet. So können Chancen und Risiken abgewogen werden.