ifun.de — Apple News seit 2001. 39 647 Artikel

"Nur frei zugängliche Webinhalte"

Applebot: Apples Webcrawler sammelt Daten für KI-Training

Artikel auf Mastodon teilen.
14 Kommentare 14

Auch wenn Apple bei der Integration von künstlicher Intelligenz maßgeblich auf die Integration von externen Lösungen setzt – zum Start haben wir ja die Ankündigung der Zusammenarbeit mit OpenAI gesehen – arbeitet der iPhone-Hersteller arbeitet parallel dazu auch daran, eigene Grundlagenmodelle zu erstellen. Ein wichtiges Standbein ist hier die automatisierte Indizierung von Webinhalten. Die Hauptrolle hierbei spielt der seither schon zur Unterstützung von Funktionen wie Siri oder Spotlight-Vorschlägen eingesetzte Webcrawler „Applebot“.

Appel Intelligence

Apple hat die Funktionsbeschreibung des Applebot nun dementsprechend erweitert und weist darauf hin, dass der Webcrawler jetzt auch verwendet wird, um die Inhalte von Webseiten zu erfassen, um sie anschließend zum Trainieren von Apples KI-Grundlagenmodellen verwenden zu können. Darauf basieren dann unter anderem die mit „Apple Intelligence“ neu vorgestellten KI-Funktionen zukünftiger Produkte und Betriebssysteme.

Rechtliche Basis zumindest diskutabel

Die rechtliche Basis hierfür kann man zumindest als diskutabel betrachten. Während Apple einen Teil des zur Erstellung der Grundlagenmodelle für generative KI-Funktionen genutzten Datenbestands laut eigenen Aussagen von Drittanbietern lizenziert hat, ist bei den vom Applebot erfassten Daten lediglich die Rede davon, dass es sich hier um im Internet öffentlich zugängliche Informationen handelt.

Damit setzt sich Apple in gleicher Weise zwischen zwei Stühle, wie es Google mit der Anzeige von Suchergebnissen auf Nachrichtenseiten getan hat. Auch andere KI-Anbieter sahen sich mit dem Vorwurf konfrontiert, dass man die Tatsache, dass ein Webinhalt frei zugänglich ist, nicht damit gleichzusetzen kann, dass die dort verfügbaren Informationen auch ohne Einschränkungen weiterverwendet werden dürfen. Ganz besonders dürfte hier eine Rolle spielen, dass es sich bei Apples KI-Angeboten durchaus auch um eine kommerzielle Verwendung handelt.

User-agent: Applebot-Extended
Disallow: /private/

Betreiber von Webseiten, die mit einer solchen Nutzung nicht einverstanden sind, müssen ihrerseits aktiv werden und entsprechende Anweisungen für die Webcrawler im Quellcode ihrer Seiten hinterlegen. Apple hat seine Informationen zum Applebot entsprechend ergänzt und bietet hier alternativ zu einem generellen Indizierungsverbot nun auch die Möglichkeit ein, lediglich die automatische Datenerfassung für KI-Trainings zu untersagen. Diese läuft bei Apple als „Applebot-Extended“ und lässt sich durch einen entsprechenden Zusatz in der Datei „robots.txt“ verhindern.

13. Juni 2024 um 16:58 Uhr von Chris Fehler gefunden?


    Zum Absenden des Formulars muss Google reCAPTCHA geladen werden.
    Google reCAPTCHA Datenschutzerklärung

    Google reCAPTCHA laden

    14 Kommentare bisher. Dieser Unterhaltung fehlt Deine Stimme.
  • Der 1. Satz ist inhaltlich falsch: „Auch wenn Apple bei der Integration von künstlicher Intelligenz maßgeblich auf die Integration von externen Lösungen setzt“

    Apple hat ein 3-stufiges Apple Intelligence Konzept:
    1. lokal per Apple SLM
    2. per Privat Cloud auf Apple M-Prozessoren basierenden Servern per Apple LLM
    3. nach ausdrücklicher Bestätigung des Users Weiterleitung der Anfrage an Chat GPT (anonym solange der kostenlose Chat GPT Dienst über Apple genutzt wird)

  • Der erste Schritt zur Suchmaschine. Sollte Apple die rausbringen wird die Google Aktie abschmieren.

    • John Applespeed

      Höchstens einen kleinen Knick. Die meisten Nutzer der Welt sind immer noch Microsoft und Android Nutzer und deren Affinität wird wohl möglich weiterhin Google oder anderen statt Apple gelten.
      Zudem braucht es Zeit.
      Apple müsste sich hier erst etablieren und einen großen Mehrwert bieten und das dauert

    • Die Erweiterung der Konfigurationsmöglichkeiten für den seit einigen Jahren aktiven Applebots ist kein Schritt zur Suchmaschine. Da gehts nur um die zusätzliche Verwendung zum trainieren der KI Modelle, die mit dieser Erweiterung unterbunden werden kann.

    • So, wie ich das beurteile, fokussiert sich Apple Intelligence schwerpunktmäßig auf lokale Informationen / Aktionen der Apple-Geräte.
      Die Nutzung als freier Suchmaschinen-Ersatz wird derzeit am ehesten über die Integration von Chat GPT realisiert … und ich wette darauf, dass kurzfristig auch andere alternative LLM, insbes. von Google (und spezielle für den chin. Markt), eingebunden werden können.

      Somit muss sich Google diesbezüglich keine Sorgen machen!

  • @Chris: Muss das nicht:

    User-agent: Applebot-Extended
    Disallow: *

    lauten, um das ganze Angebot auszuschließen?

  • Redet mit. Seid nett zueinander!

    Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

    ifun.de ist das dienstälteste europäische Onlineportal rund um Apples Lifestyle-Produkte.
    Wir informieren täglich über Aktuelles und Interessantes aus der Welt rund um iPad, iPod, Mac und sonstige Dinge, die uns gefallen.
    Insgesamt haben wir 39647 Artikel in den vergangenen 8493 Tagen veröffentlicht. Und es werden täglich mehr.
    ifun.de — Love it or leave it   ·   Copyright © 2025 aketo GmbH   ·   Impressum   ·   Cookie Einstellungen   ·   Datenschutz   ·   Safari-Push aketo GmbH Powered by SysEleven