Künstliche Intelligenz und Maschinelles Lernen

Ich glaube viele Menscvhen vertun sich, was „künstliche Intelligenz“ und „maschinelles Lernen“ angeht. Bereits das Wort ist eine Fehlbezeichnung bzw. ein Werbewort. Zwar werden auch die entsprechenden Vorlesungen in der Wirtschaftsinformatik gerne mal so bezeichnet, als direkte Übersetzung aus dem Englischen, aber es gibt im Deutschen bereits ein viel besseres Wort für das, was man in dem Feld baut: Schätzer.

Wenn man Künstliche Intelligenz (KI) oder Maschinelles lernen (ML) betreibt, baut man künstliche Schätzer bzw. maschinelle Schätzer. Die können dann beim OCR (Zeichenerkennung) schätzen, wie gut ein Haufen von Pixeln zu einem Buchstaben oder einer Zahl passen. Die können dann schätzen, wie gut ein Bild einer Gurke zu einer bestimmten Kategorie nach Gurkenverordnung passt. Die können dann schätzen, wie gut ein Pixel plus Umgebung in einem Bild zur Kategorie „Straße“ und „Fahrstreifenmarkierung“ gehört, das heißt, wohin das Auto fahren kann Wer glaubt, Künstliche Intelligenz oder Maschinelles Lernen hätte etwas mit Intelligenz zu tun, ist leider einigen Leuten aus Forschung und Industrie auf den Leim gegangen, die ihren nächsten Lehrstuhl ergattern wollen oder Forschungs- und Investorengelder akquirieren wollen. Das Feld hat nichts mit Intelligenz, sondern mit Schätzern zu tun. Wir Menschen haben zumindest:

  • Wissen
  • einen Planer

und beide Dinge verändern sich über die Zeit.

Frag mal einen Chatbot die Fragen „Wie alt bist du?“ und „In welchem Jahr wurdest du geboren?“. Bei Chatbots ohne Wissensrepräsentation im Hintergrund kommen widersprüchliche Antworten raus.

Wir Menschen denken immerhin auch nach kausalen Grundsätzen. Genau das wird in der Künstlichen Intelligenz beziehungsweise im Maschinellen Lernen heutzutage nicht erbracht, denn es gibt in der Regel keine Wissensrepräsentation. Logisches Schlussfolgern nach dem Motto „wenn A, dann B“ kommt da nicht vor – es sei denn, man hardcoded das in den Quelltext („wenn Roboter vor eine Wand fährt, dann drehe nach rechts“) oder programmiert einen Planer für exakt eine Aufgabe. Der Planer ist aber auch nichts anderes als hartkodiertes Verhalten („nehme das Glas auf, fahre zum Tisch, stelle das Glas ab, gehe zum Kühlschrank, nehme die Milch auf, fahre zum Tisch, schütte die Milch ins Glas“), ohne zu lernen. Insbesondere die Dinge beim RoboCup@Home sind zu einem sehr hohen Anteil hardcoded.

Angenommen man will heutzutage Zeichenerkennung mit Neuronalen Netzen betreiben, zum Beispiel ein Bild mit geschriebenen Zahlen in eine Textdatei übersetzen. Wenn man jetzt annimmt, ein Neuronales Netz mit mehreren Zwischenebenen berechnet in jeder Zwischenebene so etwas wie

1.1 Erkennung, ob um einem Pixel herum eine Linie beginnt (Eckpunkterkennung)
1.2 Erkennung, ob um einem Pixel herum eine Linie durchgeht (Kantenerkennung)
2.1 Erkennung, ob um einen Pixel herum ein Bogen besteht
2.2 Erkennung, ob um einen Pixel herum ein Kreis besteht
3.1 Erkennung, ob um einen Pixel herum ein Bogen über einem anderen Bogen besteht
3.2 Erkennung, ob um einen Pixel herum ein Bogen über einem Kreis besteht
3.3 Erkennung, ob um einen Pixel herum ein Kreis über einem Bogen besteht
3.4 Erkennung, ob um einen Pixel herum ein Kreis über einem anderen Kreis besteht
4. Erkennung, welche Zahl um einen Pixel herum liegt

vorliegt, liegt man falsch. Neuronale Netze, auch tiefe neuronale Netze, bauen zwar hierarchisch übereinander auf, aber in jeder Schicht steckt eigentlich nur Kauderwelsch drin, der am Ende, in der Ausgabeschicht des Neuronalen Netzen – warum auch immer! – das richtige Ergebnis liefert.

Dahingegen kann ein Mensch immer begründen, warum eine bestimmte Zahl an einer bestimmten Stelle vorliegt. Er kann sich ad-hoc einen Plan/ein System überlegen, wie er Zahlen versteht, nach dem Motto:

4. Da ist eine Sechs, weil:
3. Da ein Bogen und ein Kreis übereinander sind. weil:
2.1 Da ein Bogen oben ist, weil:
1.1 Oben eine Linie beginnt
1.2 Oben links eine Linie durchgeht
2.2 Da ein Kreis unten ist, weil:
1.1 Nirgendwo eine Linie beginnt
1.2 Unten links, unten, unten rechts und in der Mitte eine Linie durchgeht

Also hierarchisch heruntergebrochen und aufgrund von Wissen (wie Zahlen als Schriftzeichen aufgebaut sind) logisch geschlossen. Da wurde jetzt auch höchstens auf der niedersten Ebene (Eckpunkterkennung, Kantenerkennung) geschätzt. Solche Pläne/Systeme kann sich der Mensch ad-hoc erschaffen, bei der Maschine sind sie fest verdrahtet vom Menschen reinprogrammiert.

Dass ein Mensch sich zusätzlich natürlich schnelle Schätzer bauen kann, die bei einem kurzen Anblick einer geschriebenen Zahl diese verstehen können, steht außer Frage – sozusagen als Abkürzung. Aber gerade für neue oder komplexe Sachverhalte ist obiges ad-hoc Erschaffen von Systemen notwendig.

Für das ad-hoc Erschaffen solcher Systeme durch eine Maschine gibt es heutzutage leider noch nicht einmal einen Ansatz.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s