home.social

#aitrainingdataset — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #aitrainingdataset, aggregated by home.social.

  1. Dwóch autorów oskarża Apple o nielegalne szkolenie AI na pirackich książkach

    Dwóch autorów, Grady Hendrix i Jennifer Robertson, wniosło pozew zbiorowy przeciwko Apple w północnej Kalifornii, donosi Reuters.

    Twierdzą, że Apple użyło pirackiego zestawu danych Books3, zawierającego ich publikacje, do trenowania modeli językowych OpenELM i prawdopodobnie także Foundation Language Models.

    Pozew żąda m.in.:

    • uznania sprawy za pozew zbiorowy,
    • odszkodowań i zwrotów strat,
    • zakazu dalszego używania nielegalnych materiałów,
    • zniszczenia wszystkich modeli i zestawów treningowych wykorzystujących pirackie książki,
    • zwrotu kosztów prawnych.

    Z pozwu:

    Ale Apple buduje część nowego przedsięwzięcia przy użyciu Books3, zbioru danych pirackich książek chronionych prawem autorskim, który zawiera opublikowane dzieła Powodów i Klasy. Apple wykorzystało Books3 do szkolenia swoich modeli językowych OpenELM. Apple prawdopodobnie trenowało również swoje modele językowe Foundation przy użyciu tego samego pirackiego zbioru danych.

    Sprawa przypomina wcześniejsze procesy: Anthropic zapłacił 1,5 mld USD w podobnym przypadku, podczas gdy Meta wygrała w sądzie, bo użycie książek uznano za fair use.

    Potężny cios dla branży AI. Anthropic zapłaci 1,5 mld dolarów i zniszczy dane z pirackich książek

    #AITrainingDataset #AppleAI #AppleIntelligence #Books3Dataset #FoundationLanguageModels #OpenELM #pirackieKsiążkiAI #pozewZbiorowyApple #prawaAutorskie #sprawySądoweAI