#aitrainingdataset — Public Fediverse posts on home.social

Dwóch autorów oskarża Apple o nielegalne szkolenie AI na pirackich książkach

Dwóch autorów, Grady Hendrix i Jennifer Robertson, wniosło pozew zbiorowy przeciwko Apple w północnej Kalifornii, donosi Reuters.

Twierdzą, że Apple użyło pirackiego zestawu danych Books3, zawierającego ich publikacje, do trenowania modeli językowych OpenELM i prawdopodobnie także Foundation Language Models.

Pozew żąda m.in.:

uznania sprawy za pozew zbiorowy,
odszkodowań i zwrotów strat,
zakazu dalszego używania nielegalnych materiałów,
zniszczenia wszystkich modeli i zestawów treningowych wykorzystujących pirackie książki,
zwrotu kosztów prawnych.

Z pozwu:

Ale Apple buduje część nowego przedsięwzięcia przy użyciu Books3, zbioru danych pirackich książek chronionych prawem autorskim, który zawiera opublikowane dzieła Powodów i Klasy. Apple wykorzystało Books3 do szkolenia swoich modeli językowych OpenELM. Apple prawdopodobnie trenowało również swoje modele językowe Foundation przy użyciu tego samego pirackiego zbioru danych.

Sprawa przypomina wcześniejsze procesy: Anthropic zapłacił 1,5 mld USD w podobnym przypadku, podczas gdy Meta wygrała w sądzie, bo użycie książek uznano za fair use.

Potężny cios dla branży AI. Anthropic zapłaci 1,5 mld dolarów i zniszczy dane z pirackich książek

#AITrainingDataset #AppleAI #AppleIntelligence #Books3Dataset #FoundationLanguageModels #OpenELM #pirackieKsiążkiAI #pozewZbiorowyApple #prawaAutorskie #sprawySądoweAI