home.social

#trainingsdaten — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #trainingsdaten, aggregated by home.social.

  1. #Micron bringt mit der 6600 Ion eine neue #ServerSSD mit 245 Terabyte auf den Markt.

    Die auf QLC basierende #SSD erreicht bis zu 13,7 GByte pro Sekunde beim Lesen und ist für hohe Datendichte in #Rechenzentren ausgelegt.

    Laut Hersteller sind bis zu 177 Petabyte pro Rack möglich. Ziel sind Anwendungen wie #Trainingsdaten für #KI-Modelle. Gegenüber #Festplatten sinken #Energiebedarf und Platzbedarf deutlich.

    heise.de/news/177-Petabyte-pro

    #Datenspeicher #artificialintelligence

  2. #Steady-#Klimacrew

    Wer bezahlt #Künstler, wenn KI-Modelle urheberrechtlich geschützte Inhalte reproduzieren?

    Durch die bisherige Praxis, Werke der #Krativbranche kostenlos als #Trainingsdaten zu verwenden, steht viel auf dem Spiel – für Künstler, #Verlage und die gesamte Content-Industrie. #OpenAI landete in #Deutschland vor Gericht und es gibt ein erstes Urteil.

    tino-eberl.de/missbrauch-kuens

    #Urheberrecht #Gerichtsurteil #Medienrecht #KIethik #ContentCreator #GenAI

  3. #Steady-#Klimacrew

    #Urheberrechtsinhaber vs. #KIFirmen.

    Der #Konflikt um #Trainingsdaten generativer KI-Modelle ist seit langem angespannt. #Künstler, #Autoren und #Verwertungsgesellschaften klagen weltweit gegen die Nutzung geschützter #Werke ohne Zustimmung.

    Ihr Argument: KI-Training ist weder „wissenschaftliche Forschung“ noch „fair use“. Für viele #Betroffene steht die #Existenz auf dem Spiel.

    tino-eberl.de/missbrauch-kuens

    #KIMissbrauch #Retröt

  4. Wie KI Datenfirmen die Maschine füttern
    Während alle über Rechenzentren sprechen, entsteht im Schatten eine neue KI-Infrastruktur: Datenfirmen, die Arbeitskräfte und Fachwissen in Trainingsdaten verwandeln. Und genau dort fließt derzeit viel Geld.

    Der Markt wächst ra
    apfeltalk.de/magazin/news/wie-
    #Feature #KI #News #Arbeitsmarkt #DataLabeling #HandshakeAI #KI #Mercor #Rechenzentren #RLHF #ScaleAI #Startups #SurgeAI #Trainingsdaten

  5. Jörg Müller @praesolgka@bawü.social ·

    @echo_pbreyer

    Die freie und kostenlose Verfügbarkeit von #Urteilen ist tatsächlich ein wichtiger Aspekt der #Transparenz staatlichen Handelns, hier der #Justiz. Dass bislang eher wenig #Entscheidungen veröffentlicht werden, hat aber nichts mit Heimlichtuerei oder #Geheimjustiz zu tun. Vielmehr gibt es dafür v.a. zwei Gründe, die aber aktuell an Relevanz verlieren:

    1. Bislang war die #Anonymisierung #personenbezogener Daten in Urteilen sehr aufwändig, weil von Hand vorzunehmen. In Kürze werden KI-Tools hierfür marktreif sein. Dann reduziert sich der händische Aufwand darauf, zu kontrollieren, ob auch alle relevanten Daten anonymisiert wurden.

    2. Bislang haben #Richter*innen Urteile v.a. dann veröffentlicht, wenn darin "juritische Neuigkeiten" enthalten waren, also eine Änderung der #Rechtsprechung, erstmalige Auslegung neuer Normen u.ä. In Zeiten von KI werden Urteile aber auch als #Trainingsdaten interessant und für eine quantitative Auswertung. Von daher entwickelt die Justiz auch selbst ein größeres und in der Zielrichtung neues Interesse an steigenden Veröffentlichungsquoten.

    Super wäre es, wenn damit auch ein Wandel in der Urteilssprache einhergehen könnte. Denn wenn Urteile auch für Nicht-Jurist*innen verständlich werden, ist das noch einmal ein wichtiger Beitrag zur Transparenz.

  6. Hinter Anwendungen künstlicher Intelligenz stecken oft Sprachmodelle. Wie diese funktionieren und welche Tücken sie mit sich bringen, erläutert Hans-Peter Stricker. Eine Rezension

    Was künstliche Intelligenz mit Hilfe von Sprachmodellen leistet und wo sie dabei an Grenzen stößt, erklärt Hans-Peter Stricker. Eine Rezension (Rezension zu Sprachmodelle verstehen von Hans-Peter Stricker)#KünstlicheIntelligenz #Sprachmodell #LargeLanguageModels #KI #AI #GPT #ChatGPT #neuronal #Netze #BigData #Transformer #Prompt #Trainingsdaten #ITTech #Kultur #Mathematik #PsychologieHirnforschung
    »Sprachmodelle verstehen«: Wenn aus Daten Sprache wird

  7. Die bay. Aufsichtsbehörde hat eine Info zur Sensibilisierung im Umgang mit #Bildern im #Internet veröffentlicht.

    Der Titel "Fotos veröffentlichen = KI trainieren?" ist vielleicht etwas reißerisch, aber leider wahr!

    Empfehlungen lauten:
    💡 Bewusster Verzicht;
    💡 Entfernen von Bild-Metadaten;
    💡 Datenschutzeinstellungen und Bewusstsein;
    💡 Überprüfen und Löschen;
    💡 ungenutzte Accounts löschen

    #KI #KünstlicheIntelligenz #Trainingsdaten
    #Metadaten #Foto #Selfies

    datenschutz-bayern.de/datensch

  8. Wenn #Kreative ihr geistiges Eigentum von den #Trainingsdaten diverser KI-Modelle ausschliessen wollen, wird das Vorhaben schnell zu einer nervigen Lebensaufgabe. In meinem ersten Blog-Beitrag zu diesem Thema erfährst du, wie du den #GPTBot von #OpenAI (DALL-E) von deiner #Website oder Teilen der Site aussperren und wie du mit Hilfe des Opt-out-Formulares von OpenAI Werke aus den Trainingsdaten "entfernen" kannst.
    #KI #AI #kuenstler #designer #fotografen #kreative #kunst
    teufelswerk.net/kuenstler-desi

  9. #PodcastTipp

    SWR2 Wissen
    Clickworker – ausgebeutet für Künstliche Intelligenz
    Von Christian Kretschmer

    "Künstliche Intelligenz ist eine Frage des Trainings. Damit eine KI lernt, ein Auto zu erkennen oder Emotionen in einem Gesicht zu lesen, muss sie trainiert werden. Das ist zu einem großen Teil mühsame Handarbeit, die KI-Unternehmen in Billiglohnländer auslagern."

    swr.li/clickworker-ki

    #Clickworker #Crowdworking #GigEconomy #HumanInTheLoop #Podcast #Ausbeutung #Billiglohn #Überwachung #KI #AI #Trainingsdaten #ChatGPT #Kenia #Kolumbien #Sama #OpenAI #Cloudfactory #Appen