Hannes Bajohr/Markus Krajewski: „Quellcodekritik“

Print Friendly, PDF & Email

Der Untertitel dieses für IT-ferne Leser kryptisch anmutenden Titels lautet „Zur Philologie von Algorithmen“. Der mutet zwar auch nicht gerade selbsterklärend an, trifft aber den Inhalt dieses Buches eher. Denn um Quellcode und dessen – wie auch immer geartete – Kritik geht es nur im ersten Teil. Der größere Teil des Buches beschäftigt sich mit künstlicher Intelligenz (KI) und dort vor allem mit der Behandlung natürlicher Sprachen.

Da das Buch in erster Linie von Geisteswissenschaftlern für ihresgleichen geschrieben ist, steht am Beginn ein längerer Essay des „digitalen Autors“ Mark C. Marino mit dem Titel „Critical Code Studies. Ein Manifest“, in dem der Autor den Begriff des Quellcodes erklärt und an einfachen Beispielen erläutert. Quellcode ist der Dialekt, in dem Programmierer dem Computer die Anweisungen erteilen und der einer natürlichen Sprache zumindest ähnelt. Dieser Text muss jedoch erst durch spezielle Software in die binäre Form übersetzt werden, die der Computer verarbeiten kann. Der Quellcode selbst wiederum besteht aus den eigentlichen Anweisungen und Kommentaren, die der Programmierer für menschliche Interpreten seines Programms verfasst. Der Autor sieht die Aufgabe der Geisteswissenschaften darin, Quellcode wie auch Kommentare zu analysieren und nach ästhetischen, ethischen und gesellschaftspolitischen Kriterien zu bewerten. Der Essay befasst sich eingehend mit verschiedenen Aspekten des Quellcodes bis hin zu „digitaler Literatur“, löst aber die selbst gestellten kritischen Anforderungen nicht ein. Auch Beispiele für ethisch inkorrekten Quellcode bietet er nicht. Das ist auch nicht verwunderlich, da man höchstens den Zweck eines im Quellcode codierten Algorithmus aus dieser Perspektive kritisieren kann, nicht aber die Umsetzung. Dort geht es nur um fachliche Korrektheit und Effizienz. Natürlich kann der Kommentar durchaus anstößige – etwa rassistische – Passagen enthalten, doch auch dafür gibt Marino keine Beispiele. Es bleibt der unangenehme Geruch eines intellektuellen Kolonialismus, der die „alte Welt“ der Geisteswissenschaft in die neue Welt der Digitalisierung ausziehen lässt, um die dortigen intellektuellen Rohstoffe auszubeuten und gleichzeitig den Bewohnern mit missionarischem Eifer die Bibel der korrekten Lebensführung aufzudrängen.

Der anschließende Essay über die „Kulturtechnik Programmieren. Quellcode kritisieren“ erklärt an drei einfachen Beispielen die Art der Programmierung in höheren Sprachen, doch neben der durchaus gelungenen Einführung in diese Technologie vermisst man die angekündigte Quellcodekritik. Was will man an einem Programm für die Berechnung der Fibonacci-Zahlen auch (ethisch) kritisieren? Und auch die anderen beiden Beispiele – Bewegungen von Himmelkörpern und Erzeugung von Zufallszahlen – bieten wenig Anlass zu kritischer Betrachtung, will man nicht das mengenmäßige Verhältnis von Code und Kommentar als ein grundsätzliches Problem begreifen.

Aufschlussreich ist dagegen der Beitrag von Till Heilmann, der über die statistische Zerlegung des Pascal-Quellcodes von Photoshop 1.0 berichtet. Ohne Kenntnis der Programmiersprache, nur mit Hilfe einfacher Shell-Prozeduren, reduzierte das Team den Code soweit, dass Variable, Funktionen und sogar die Vererbungsbäume der importierten Klassenbibliothek erkennbar sind. Auf diese Weise erhält auch ein Software-Laie einen ersten Eindruck von der Funktionsweise des Quellcodes.

Dagegen geht der Bericht über das KI-gestützte Entwicklungswerkzeugs „Copilot“ – der Name sagt alles – derart ins softwaretechnische Detail, dass ein profundes Verständnis ohne fachliches Vorwissen unmöglich erscheint. Wenn dabei noch die Frage der Subjektivierung behandelt wird, ohne diesen Begriff herzuleiten, navigiert der Leser in diesem anspruchsvollen, vieles voraussetzenden Beitrag nahezu hilflos zwischen abwägenden und spekulativen Kritikpunkten hin und her.

Der zweite Teil beschäftigt sich dann in mehreren Beiträgen intensiv mit der Verarbeitung natürlicher Sprachen, hauptsächlich am Beispiel von Googles Suchmaschinen, die bei der Eingabe von Anfragen möglichst schnell das nächste Wort aus den bereits eingegebenen ermitteln müssen. Dazu werden die einschlägigen Systeme – etwa BERT (Bidirectional Encoder Representation from Transformers) – an großen Textmengen trainiert. Diese Texte müssen natürlich aktuell und inhaltsreich sein, um wirklich Nutzen zu bringen. Und hier setzt die Kritik zu Recht ein. Man hatte bei Google die „social media“-Plattform Reddit als Trainingsdaten herangezogen und das Sprachtool daran geschult, musste aber bald feststellen, dass die dort ausgetauschten Nachrichten rassistische und sexistische Äußerungen nicht vernachlässigbaren Umfangs enthielten, was sich schnell in den Antworten der Suchmaschinen widerspiegelte. Mehrere Google-Mitarbeiter verfassten daraufhin einen Bericht, der die Auswahl der Trainingsdaten kritisierte und auch die Forderung nach Berücksichtigung marginalisierter Gruppen stellte. Dabei gingen sie soweit, den Energieverbrauch als ursächlich für den Klimawandel und dessen Auswirkungen auf betroffene Regionen wie die Malediven oder den Sudan zu brandmarken und sogar die Fokussierung auf englischsprachige Textdaten als „hegemonial“ und damit ausgrenzend gegenüber kleineren Sprachgruppen – wie etwa indigene Völker – zu brandmarken. Dieser Beitrag bildet inhaltlich das Herzstück des zweiten Teils, währende andere sich auf technische Aspekte konzentrieren, durchaus von hoher Kompetenz zeugen, jedoch fast nur noch Experten des jeweiligen Fachgebiets verständlich sind.

Letzteres stellt das wesentliche Problem dieser Essay-Sammlung dar. Zwar von Geisteswissenschaftlern und offensichtlich für solche geschrieben, bereiten einige Texte selbst IT-Fachleuten Probleme, soweit sie sich (noch) nicht mit dem jeweiligen Thema intensiver beschäftigt haben. Und da diese Beiträge ohne Erklärung der fachlichen Grundlagen gleich relativ hoch in ihr jeweiliges Thema einsteigen, kämpft der ungeschulte Leser mit einer Flut von Fachbegriffen, für deren Erklärung noch nicht einmal am Ende ein erklärendes Register zur Verfügung steht. Was beim „Quellcode“-Teil recht gut gelungen ist, vermisst man hier schmerzlich.

Die deutschsprachigen Autoren und Übersetzer setzen das Gendern konsequent bis an den Rand der Unlesbarkeit um. Nicht nur personale Substantive erhalten den Zusatz „:innen“, sondern der Leser sieht sich auch mit Kombinationen wie „eine:r“ oder „der:die“ konfrontiert, und bei „Benutzer:innenoberfläche“ sind auch zusammengesetzte Worte nicht mehr sicher. Das muss man mögen….

Das Buch ist im August-Verlag erschienen, umfasst 331 Seiten und kostet als Taschenbuch 20 Euro.

Frank Raudszus

No comments yet.

Schreibe einen Kommentar