künstliche Intelligenz: wir trainieren sie täglich gratis und unbewusst

künstliche Intelligenz: wir trainieren sie täglich gratis und unbewusst

Wir alle helfen Google und anderen Konzernen dabei, ihre Software weiter zu entwickeln und zu verbessern. Dies machen wir nicht nur,…

Mehr Lesen

Wir alle helfen Google und anderen Konzernen dabei, ihre Software weiter zu entwickeln und zu verbessern. Dies machen wir nicht nur, indem wir ihnen unsere Daten zur Verfügung stellen sondern wir trainieren – manchmal sehr unbewusst – auch ihre Algorithmen für künstliche Intelligenz. Wie wir das tun und was es mit künstlicher Intelligenz auf sich hat, greifen wir in diesem Blog-Artikel auf.

Menschen als Software-Erweiterung

An der re:publica 2018 habe ich mir ein Referat von Sebastian Schmieg mit dem Thema „Menschen als Software-Erweiterungen“ angeschaut. Schmieg setzte in diesem Referat zunächst einen Fokus auf die Analyse von Plattformen wie fiverr.com, auf denen Menschen ihre Dienstleistungen anbieten. Auf diesen Plattformen kann man sich ab einem Startpreis von 5 USD ein Logo designen lassen, sein Video von einem nativen Sprecher vertonen oder ganze Webseiten erstellen lassen. Schmieg zeigte relativ ausführlich, wie sich Menschen auf diesen Plattformen hocharbeiten, um wie bei Google ganz oben in den Suchresultaten zu landen. Dies geschieht zum Teil auch, indem einerseits sehr günstige Preise geboten werden, andererseits erzählte Schmieg von ganzen Netzwerken von Sub-Contractorn, die für die jeweiligen „Hersteller“ arbeiten. Unter dem Motto „Masse statt Klasse“ wird damit eine unglaubliche Flut an Angeboten im Netz platziert. Viele der Anbieter stammen aus Entwicklungsländern mit sehr tiefem Lohnniveau. Ich habe solche Angebote noch nie selbst ausprobiert, in der Praxis dürfte aber gerade bei den sehr günstigen Angeboten auch Probleme in der Kommunikation und vermutlich auch bei der Qualität gängig sein.

Fiverr: Logo-Design zum Discounter-Preis

Fiverr: Logo-Design zum Discounter-Preis

Im zweiten Teil seines Referates ging es dann um das Thema künstliche Intelligenz und wie wir Internet-Nutzer täglich kostenlose Arbeit in diesem Bereich leisten.

Was ist eigentlich künstliche Intelligenz?

Um meine weiteren Ausführungen zum eigentlichen Thema dieses Blog-Beitrages zu verstehen, muss man zunächst einmal wissen, was künstliche Intelligenz genau ist. Künstliche Intelligenz wird in der Praxis oft mit KI abgekürzt, zum Teil wird auch zur englischen Abkürzung von Artifical Intelligence (AI) zurückgegriffen.

Zunächst einmal ist der Begriff der künstlichen Intelligenz etwas irreführend, da man oft vom Menschen als intelligentem Wesen ausgeht und versucht, dies auf Computer zu adaptieren. Ein Mensch kann aufgrund seiner Erfahrungen aus der Vergangenheit mögliche Ereignisse bzw. Ergebnisse in der Zukunft ableiten. Greift ein Kleinkind eine heisse Herdplatte an, merkt es, dass dies Schmerzen verursacht. Das Kind ist relativ schnell in der Lage, daraus abzuleiten, dass auch eine andere Herdplatte heiss sein kann und dementsprechend Schmerzen verursachen kann. Schnell wird das Kind auch lernen, heisse Gegenstände intuitiv zu erahnen. Das Kind wird ein Gefühl dafür entwickeln, welche Gegenstände potenziell heiss sein können: Metallgeländer, Motorhauben, usw. Das Ziel der künstlichen Intelligenz ist es, dass Computer – ähnlich dem Menschen – aus Beispielen Fähigkeiten erlernen können. Im Gegensatz zu klassischer Software-Entwicklung, bei der man dem Computer einen Lösungsweg vorgibt, lässt man bei KI jedoch den Computer einen eigenen Lösungsweg entwickeln. Das heisst in der Praxis, dass man ihm Basisinformationen vorgibt ihn eine Lösung finden lässt und danach bei falschen Resultaten nicht den Lösungsweg des Computers korrigiert sondern ihm nur die richtige Lösung mitteilt. Der Computer beginnt dann wieder von vorne und wiederholt seine Suche nach dem Lösungsweg so oft, bis ihm der Mensch bestätigt, dass er nun richtig liegt.

Schauen wir uns das an einem Beispiel an: Der Computer soll lernen, auf Bildern Hunde und Katzen zu erkennen. Dazu sind folgende Schritte nötig:

  1. Der Computer erhält eine grosse Auswahl an Fotos von Hunden und Katzen, wild gemischt
  2. Der Computer errechnet einen Lösungsvorschlag. Zu jedem Bild sagt er, ob er einen Hund oder eine Katze sieht.
  3. Im ersten Durchgang wird der Computer eine sehr hohe Fehlerquote haben. Ein Mensch sagt ihm jetzt zu jedem seiner Resultate, ob er richtig oder falsch gelegen hat.
  4. Die Schritte 1-3 werden beliebig oft wiederholt, bis der Computer die gewünschte Treffsicherheit erlangt hat (was je nach Komplexität des Themas tausende von Iterationen bedeuten kann)

In der Theorie wird zwischen starker und schwacher künstlicher Intelligenz entschieden. Eine starke künstliche Intelligenz entspricht den Fähigkeiten des Menschen, das heisst, eine starke künstliche Intelligenz wäre in der Lage verschiedene Themengebiete miteinander zu verknüpfen, wie das der Mensch auch kann. Ein Mensch kann beispielsweise herleiten, was eine zerschlagene Fensterscheibe bei einer Grossbank in Zürich mit dem Besuch eines amerikanischen Präsidenten in Davos zu tun hat. Davon ist ein Computer weit entfernt. KI bei Computern beschränkt sich heute darauf, dass ein Computersystem in einem Themengebiet intelligente Ansätze aufzeigt. Ein System, das auf die Erkennung von Bildern spezialisiert ist, kann also heute keine Spracherkennung und umgekehrt.

Wir trainieren die künstliche Intelligenz von Google

Nun zum eigentlichen Hauptthema dieses Artikels: Im zweiten Teil seines Referats ging Sebastian Schmieg auf einen sehr interessanten Aspekt ein, der mir bis anhin nicht bewusst war. Es ging darum, wie wir als Internet-Nutzer fast täglich Gratis-Arbeit für Internet-Konzerne leisten, ohne, dass wir uns dessen bewusst sind. Dass Unternehmen wie Google unsere Gmail-Daten anonymisiert auswerten, dürfte den meisten von uns bekannt sein. Dass wir aber aktiv ihre KI-Algorithmen trainieren, wissen vermutlich nur die wenigsten.

Sebastian Schmieg hat sich die Entwicklung von Captchas im Verlauf der letzten Jahrzehnte näher angeschaut. Die ersten Captchas waren ganz einfach gehalten: es waren Bilder mit Zahlen- und Buchstabenkombinationen. Durch das Erkennen der richtigen Kombination „bewies“ der Mensch einer Webseite, dass er kein Computer ist.

Simples Captcha: reine Erkennung von Text und Zahlen

Simples Captcha: reine Erkennung von Text und Zahlen

Soweit so gut. Das Captcha war damals Mittel zum Zweck. Für Menschen manchmal vielleicht etwas lästig, es erfüllte jedoch den Zweck, dass Formularübermittlungen nur durch Menschen gestartet werden konnten. Technisch war das Captcha nichts anderes als eine sehr simple Datenbank, die ein Bild mit einer „richtigen“ Antwort verknüpfte.

Einige Jahre später kamen plötzlich Captchas mit zwei Wörtern auf. Und hier begann die Tendenz, dass Software-Entwickler damit begannen, uns Internetnutzer für sie arbeiten zu lassen. Viele dieser Captchas aus zwei Wörtern waren nämlich so aufgebaut, dass nur eines der beiden Worte korrekt eingetippt werden musste. Das zweite Wort diente dem Software-Entwickler, seine Maschine zu trainieren. Zwar war dieses Vorgehen mutmasslich noch weit weg von KI, es legte jedoch die Basis dazu, dass Software-Anbieter den Nutzer für sich arbeiten lassen.

Und dann kam Google und führte das reCaptcha ein…

reCaptcha – das Captcha, das die KI von Google trainiert

Die von Google zur Verfügung gestellten Captchas sind Ihnen als Internetnutzer sicherlich auch schon aufgefallen. Es gibt zwei Versionen davon bzw. zwei Stufen der Authentifizierung. Die erste Stufe ist das simple Anklicken eines Kästchens „I’m not a robot“. Google analysiert dabei, wie der Nutzer den Mauszeiger auf dem Bildschirm bewegt und ob dies einer natürlichen Bewegung entspricht. Viel wichtiger für Google ist aber der zweite Teil. Dabei muss der Nutzer ein „Bilderrätsel“ lösen. Beispielsweise soll er alle Quadrate anklicken, auf denen ein Auto, ein Fahrrad, eine Strassenmarkierung oder wie auf dem Bild unten ein Strassenschild zu sehen ist.

reCaptcha: Der Nutzer trainiert die Maschine.

reCaptcha: Der Nutzer trainiert die Maschine.

Und damit leisten wir nun tagtäglich Gratisarbeit für Google. Wir trainieren ihre künstliche Intelligenz, ohne dass die meisten von uns sich dessen bewusst sind. Und Google macht daraus übrigens nicht einmal ein Geheimnis. Auf der Webseite, auf der Google das reCaptcha bewirbt, wird das Trainieren der eigenen KI sogar als einer der grossen Vorteile beworben:

reCaptcha: trainiere die künstliche Intelligenz von Google

reCaptcha: trainiere die künstliche Intelligenz von Google

Nicht nur Google lässt uns arbeiten

Es ist natürlich nicht nur Google, das uns Internetnutzer kostenlos für sich arbeiten lässt. Andere Plattformen stehen dem in nichts nach und es gibt auch Beispiele aus der Schweiz und Europa. Amazon und Digitec lassen uns fleissig Rezensionen zu ihren Produkten schreiben. Zalando fragt uns bei Rücksendungen, welche Grösse wir „jemandem mit gleicher Schuhgrösse“ eher empfehlen. Die Migros lässt uns über unsere Lieblingsprodukte abstimmen. Und wir als Nutzer tun diese Arbeit bereitwillig, ohne gross über den Wert dieser Arbeit nachzudenken.

Ihr eigenes Projekt mit künstlicher Intelligenz

Das Thema künstliche Intelligenz hat durchaus Zukunftspotenziale. Neben Google arbeiten fast alle grossen Player an Software-Lösungen, die auf KI basieren. Sei es SAP mit Leonardo, IBM mit Watson oder auch Microsoft. Sie alle bieten API’s, mit denen man schon heute eine vielzahl an KI-Lösungen umsetzen kann. Gerne beraten wir Sie in einem persönlichen Gespräch.

 

Das vollständige Referat von Sebastian Schmieg kann man sich übrigens auf YouTube anschauen:

Pascal Müller

Digital Business Consultant

Pascal Müller absolvierte eine Lehre als Mediamatiker und eine Weiterbildung zum Diplomierten Marketingmanager HF. Im Jahr 2017 erweiterte er sein Wissen im Rahmen des CAS Disruptive Technologien, im Jahr 2019 mit dem CAS Digital Risk Management. Zudem besitzt er die Google Ads Zertifizierung. Nach der Lehre hat er mehrere Jahre berufliche Erfahrung im Bereich des Innovationsmanagements gesammelt und leitete unter anderem mehrere technische Innovationsprojekte bei der PostAuto Schweiz AG.
Als Schnittstelle zwischen Marketing und Technik begleitet Pascal Müller die Kunden von Swiss Smart Media bei der Erarbeitung von Anforderungen an ihre Software-Lösung und leitet Projekte als Projektleiter und führt auf Seite der Kunden als ProductOwner.
Er verfolgt die technische Entwicklung im Bereich der App- und Webtechnologien und gehört meistens zu den First Movern.

Mehr