Google plant, alle Online-Inhalte für KI-Zwecke zu nutzen.

In einer Aktualisierung der Datenschutzrichtlinie deutet Google an, dass das gesamte öffentliche Internet für seine KI-Projekte genutzt wird.
KI-Künstliche-Intelligenz-Deep-Learning-Web-Internet-Technologie-Roboter-Google-Bard-News
Designed by Freepik

Vor kurzem entdeckte entdeckte Gizmodo, dass Google seine Datenschutzrichtlinie aktualisiert hat, um anzukündigen, dass seine verschiedenen KI-Dienste wie Bard und Cloud AI möglicherweise mit öffentlichen Daten trainiert werden, die das Unternehmen im Internet gesammelt hat.

In der am Wochenende aktualisierten Datenschutzrichtlinie wird nun ausdrücklich darauf hingewiesen, dass sich das Unternehmen das Recht vorbehält, nahezu alles, was Nutzer online posten, für die Entwicklung seiner KI-Tools zu extrahieren.

Screenshot-Google-Datenschutzerklärung-KI-Künstliche-Intelligenz
Google´s aktualisierte Datenschutzrichtlinie. Quelle: Google

„Google nutzt Informationen, um unsere Dienste zu verbessern und neue Produkte, Funktionen und Technologien zu entwickeln, die unseren Nutzern und der Öffentlichkeit zugute kommen“, heißt es in der neuen Google-Richtlinie . „Wir nutzen beispielsweise öffentlich verfügbare Informationen, um die KI-Modelle von Google zu trainieren und Produkte und Funktionen wie Google Translate, Bard und Cloud AI-Funktionen zu entwickeln.“

Aus dem Änderungsverlauf der Richtlinie ist zu erkennen, dass das Update zusätzliche Hinweise darüber enthält, welche Dienste anhand der gesammelten Daten trainiert werden. Beispielsweise heißt es in dem Dokument nun, dass die Informationen für „KI-Modelle“ statt für „Sprachmodelle“ verwendet werden können, was Google mehr Freiheit gibt, Systeme neben LLMs auf Ihren öffentlichen Daten zu trainieren und zu erstellen.

In der überarbeiteten Richtlinie wird festgelegt, dass Google „öffentlich verfügbare Informationen“ für das Training seiner KI-Produkte verwendet. Es bleibt jedoch unklar, wie das Unternehmen verhindern wird, dass urheberrechtlich geschütztes Material in diesen Datensatz gelangt oder ob es überhaupt Maßnahmen diesbezüglich ergreift. Viele öffentlich zugängliche Websites haben Richtlinien, die das Sammeln von Daten oder Web Scraping zur Schulung großer Sprachmodelle und anderer KI-Toolsets untersagen.

Es bleibt abzuwarten, wie sich dieser Ansatz auf verschiedene globale Vorschriften wie die DSGVO auswirken wird, die Menschen vor dem Missbrauch ihrer Daten ohne ihre ausdrückliche Zustimmung schützen sollen. Von großem Interesse wird dabei auch sein, ob und wie Google die Vorgaben dieser Datenschutzgesetze umsetzen wird.

Die Verbindung dieser Gesetze mit dem steigenden Wettbewerb auf dem Markt hat dazu geführt, dass Hersteller populärer generativer KI-Systeme wie GPT-4 von OpenAI äußerst vorsichtig sind, wenn es darum geht, die Herkunft ihrer Trainingsdaten offenzulegen. Die Frage, ob ihre Modelle Social-Media-Beiträge oder urheberrechtlich geschützte Werke von Künstlern enthalten, wird von den Autoren sorgfältig geprüft.

Entdecke weitere interessante Inhalte: 

WordPress Cookie Plugin von Real Cookie Banner