Data Worker
Die harte Arbeit der menschlichen KI-Trainer

Sie heißen Data Worker, Click Worker oder Micro Worker - und sie füttern die Künstliche Intelligenz mit Daten. Erst dieses menschliche Training macht die KI intelligent. Doch viele von ihnen arbeiten unter prekären, teils traumatisierenden Bedingungen.

04.07.2024
    Rechte Hand an einer Computermaus vor einer Computertastatur
    Viele der Data Worker sind im globalen Süden beschäftigt, etwa in Kenia, Uganda, Brasilien oder auf den Philippinen (picture alliance / photothek / Ute Grabowsky / PhotothekMediaLab)

    Inhalt

    Was machen Data Worker?

    Data Worker sind im Wesentlichen die menschliche Intelligenz hinter der künstlichen Intelligenz. Ihre Hauptaufgabe besteht darin, die KI zu trainieren und mit relevanten Informationen zu versorgen. Sie bringen der KI durch Anweisungen und Einspeisung von Daten bei, die Welt aus menschlicher Perspektive zu sehen. Darüber hinaus helfen sie der KI, diese Daten richtig zu interpretieren und menschenähnliche Entscheidungen und Einschätzungen zu treffen.
    Data Worker sind grob in vier verschiedenen Bereichen der Datenerfassung und -verarbeitung tätig: Daten labeln und interpretieren, indem sie beispielsweise für Amazon Luftaufnahmen analysieren und markieren, wo Drohnen Pakete ablegen können - in einer Auffahrt statt auf dem Dach und nicht auf einem Hund, der als solcher erstmal gekennzeichnet werden muss. Dies hilft KI-Systemen, Muster zu erkennen und Aktionen zu automatisieren.
    Ein weiterer Bereich umfasst das Generieren und Kategorisieren von Daten, wobei Data Worker auch selbst Inhalte wie Texte oder Bilder erstellen können, um Datensätze zu erweitern. Aufgaben können dann zum Beispiel sein, etwas vorzulesen oder ein Foto zu machen und hochzuladen.
    Ein dritter Bereich ist das Bewerten der Leistung von KI-Systemen, indem Data Worker Feedback zu deren Antworten geben und deren Sprach- oder Verhaltensmuster verbessern. Sie könne dem System zum Beispiel sagen, dass eine Antwort unpassend war, sich die KI im Ton vergriffen hat oder eine andere Sprachwahl nutzen soll.
    Ein vierter Aufgabenbereich ist die Simulation von KI-Verhalten: Data Worker werden dafür angestellt, um so zu tun, als wären sie eine KI. Das nutzen beispielsweise Firmen, die ihren Kunden erklären, dass sie gewisse Aufgaben per KI automatisiert haben - statt zuzugeben, dass ihre Kunden von prekarisierten Arbeitenden in den Philippinen betreut werden.

    Wie viele Data Worker gibt es und wo sind meisten beschäftigt?

    Es ist schwierig, genaue Zahlen zu nennen, weil große Unternehmen wie OpenAI, Meta, Google, Amazon und andere nicht offenlegen, wie viele Data Worker sie beschäftigen. Die Industrie ist insgesamt wenig transparent, besonders weil viele Data Worker über Subunternehmen oder externe Plattformen angestellt werden. Offizielle Statistiken gibt es nicht, aber nach Schätzungen der World Bank sind weltweit zwischen 154 und 435 Millionen Menschen in dieser Rolle tätig.
    Viele der Data Worker sind im globalen Süden beschäftigt, zum Beispiel in Ländern wie Brasilien, den Philippinen, Indien, Venezuela, Kenia - China ist ein Markt für sich. Afrikanische Länder wie Ruanda und Ghana positionieren sich zunehmend als Tech-Hubs, wobei Kenia als Vorreiter gilt, der bereits früh große Tech-Jobs übernommen hat.
    Dennoch sind die USA führend, aufgrund eines spezifischen Arbeitsmodells, das sich dort entwickelt hat. Plattformen wie Amazon Mechanical Turk ermöglichen es, menschliche Arbeitskraft für das Erledigen von kleinen, digitalisierbaren Aufgaben einzusetzen. Diese Aufgaben reichen von Sprachaufnahmen bis hin zum Erstellen von Fake-Bewertungen und werden oft als "Micro-Jobs" bezeichnet.
    Die Anforderungen an die Data Workers werden zudem immer höher. Laut Soziologin Milagros Michelli gab es früher keine Bewerbungsvoraussetzungen. Inzwischen werden zumindest in einigen Bereichen aber immer mehr Abschlüsse gefordert und Studierende oder Menschen mit künstlerischem Hintergrund eingesetzt, die die KI mit kreativen Daten füttern sollen.

    Unter welchen Bedingungen arbeiten Data Worker?

    Viele Data Worker haben Verträge mit Schweigepflicht unterschrieben und trauen sich daher nicht, darüber zu reden. Erst langsam werden erste Berichte öffentlich, etwa im "Time"-Magazin, und es erste Klagen von Betroffenen gibt, zum Beispiel gegen das US-Unternehmen Sama und den Facebook-Mutterkonzern Meta.
    So gibt es offenbar sehr strenge Zielvorgabe für die Arbeitenden. Wenn diese nicht erreichen werden, müssen die Arbeitenden bleiben, bis sie sie geschafft haben. Jeder Klick muss sitzen. Gefordert ist also eine hohe Konzentrationsleistung über mindestens acht Stunden hinweg in Schichten - Tag und Nacht.
    Mindestlöhne gibt es keine - weil viele Data Worker auf selbstständiger Basis arbeiten. Die Bezahlung beim Data-Unternehmen Sama, das hauptsächlich in Kenia und Uganda arbeiten lässt, liegt zwischen 1,32 Dollar und 2 Dollar pro Stunde, wie bei einer Klage bekannt wurde.
    In Kenia und anderen afrikanischen Ländern werden digitale Arbeitskräfte oft unter prekären Bedingungen beschäftigt, insbesondere als Content-Moderatoren. Diese Mitarbeiter bewerben sich für Datenanalysten-Positionen. Oftmals finden sie sich dann aber in Jobs wieder, in denen sie gewalttätige und verstörende Inhalte ansehen und entsprechend kennzeichnen müssen - damit die KI sie nicht verwendet. Solche traumatisierenden Arbeitsbedingungen wurden durch Gerichtsverfahren in Kenia öffentlich.
    Im benachbarten Uganda betreibt das gleiche Subunternehmen, das in Kenia verklagt wurde, ein KI-Trainingszentrum. Hier trainieren Arbeiter KI-Systeme, die in verschiedenen Branchen eingesetzt werden, von der Landwirtschaft bis zur Automobilindustrie. Die Arbeitsumgebung ist oft düster und die Bezahlung gering, obwohl sie über dem Mindestlohn liegt. Sama, das Unternehmen hinter diesen Projekten, nutzt die niedrigen Löhne und die englischen Sprachkenntnisse der Ugander aus, um diese arbeitsintensiven Aufgaben auszulagern.

    Wertvolle Datenarbeit für die KI-Unternehmen

    Dabei handelt es sich um essenzielle Arbeit - ohne die Data Worker wäre die Künstliche Intelligenz gar nicht intelligent, sagt Milagros Miceli, Forscherin bei DARE, dem Distributed AI Research Institute:

    Für mich ist es wichtig, zu betonen, dass ihre Arbeit sehr, sehr wichtig ist und gar nicht klein ist im Sinne von Micro! Und auch nicht nur eine Frage von ein paar Klicks - sondern wirklich eine wichtige und auch mühsame Arbeit.

    Der Markt für generative Künstliche Intelligenz steht laut Statista vor einem erheblichen Wachstum, das von 67 Milliarden US-Dollar im Jahr 2023 auf über 1,3 Billionen US-Dollar im Jahr 2032 ansteigen soll. Diese Entwicklung ist hauptsächlich auf die rapide Verbreitung von generativen KI-Anwendungen wie Gemini, ChatGPT und Midjourney in den vergangenen Jahren zurückzuführen.
    Bakendiagramm mit den Daten zum Umsatz mit generativer künstlicher Intelligenz bis 2032: Es wird erwartet, dass der Markt für generative Künstliche Intelligenz (KI) erheblich ansteigen wird, und zwar von 67 Milliarden US-Dollar im Jahr 2023 auf mehr als 1,3 Billionen US-Dollar im Jahr 2032
    Umsatz mit generativer Künstlicher Intelligenz bis 2032 (in Milliarden US-Dollar) (Statista/Bloomberg)
    Es werden also ständig neue Daten benötigt, und Menschen müssen Maschinen trainieren, sagt auch Techexpertin Nanjira Sambuli. "Die Nachfrage nimmt zu, gerade im Bereich generativer KI."

    Wie könnte KI-Training fair werden?

    Die stark wachsende KI-Branche bietet auch Chancen für den Arbeitsmarkt. Data Work macht schon jetzt bis zu 12 Prozent der weltweiten Erwerbsbevölkerung aus und ist eine wachsende Einkommensquelle für Millionen. Die Nachfrage steigt in Entwicklungsländern schneller als in Industrieländern. Data Work bietet Arbeitsmöglichkeiten für Jugendliche, Frauen und gering qualifizierte Arbeitnehmer.
    Dennoch müssen diese Jobs sicher und sinnvoll sein, sagt Techexpertin Nanjira Sambuli. "Es braucht psychologische Unterstützung. Es braucht Richtlinien und Vereinbarungen, die für diese Arbeitsplätze gelten müssen."
    Vereinzelt bekommen es kleinere Unternehmen gut hin, eine ethisch faire KI zu betreiben - die großen Player nicht. Beim Outsourcing von Arbeit in andere Länder sollte nicht nur der Profit im Vordergrund stehen, sondern auch die Expertise der dortigen Arbeitskräfte berücksichtigt und entsprechend entlohnt werden.

    Erste Gewerkschaften werden gegründet

    Denn oft sind Data Worker ungeschützt durch Arbeitsvorschriften, haben unsichere Einkommensquellen und wenig rechtliche Absicherung. Erste Gewerkschaften in diesem Bereich entstehen gerade. Eine ethisch faire Gestaltung erfordert klare rechtliche Rahmenbedingungen, transparente Bezahlung und Schutz vor Diskriminierung.
    Eine generelle Auslagerung von Data Work in Länder, wo es höhere gesetzliche Standards gibt, hält Soziologin und Informatikerin Michelli keineswegs für einen Ausweg. Ihr berichten Data Worker, dass sie die Arbeit gern machen, aber fair bezahlt und besser behandelt werden wollen. Der Job reiche, um davon zu leben, daher seien sie auch dankbar dafür.

    og