home.social

#reallysimplelicensing — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #reallysimplelicensing, aggregated by home.social.

  1. A quick thing you can do if you want to restrict or limit #LLM training on your content - or the opposite, allow it under specific conditions (e.g. attribution).

    1. Create /license.xml
    2. Add License: https://krvtz.net/license.xml line to your /robots.txt

    Sample license.xml banning any LLM learning:

    <rsl xmlns="https://rslstandard.org/rsl">
      <content url="/">
        <license>
          <prohibits type="usage">ai-train ai-input</prohibits>
        </license>
      </content>
    </rsl>
    

    Sample license.xml allowing LLM learning on CC-BY attribution basis:

    <rsl xmlns="https://rslstandard.org/rsl">
      <content url="/">
        <license>
          <permits type="usage">all</permits>
          <payment type="attribution">
            <standard>https://creativecommons.org/licenses/by/4.0/</standard>
          </payment>
        </license>
      </content>
    </rsl>
    

    Live example: https://krvtz.net/robots.txt

    Full standard: https://rslstandard.org/guide/getting-started

    #AI #MachineLearning #RSL #ReallySimpleLicensing

  2. This need to get adopted industry wide.

    RSL: a license for your web site, get AI scrapers to pay you or stop scraping.

    rslcollective.org

  3. 生成AIが巡回するたび報酬が発生? 無断クローラー対策の決定版となる標準規格が誕生【やじうまWatch】 - INTERNET Watch
    internet.watch.impress.co.jp/d

    『「Really Simple Licensing(RSL)」は、 生成AIのトレーニングデータを収集するクローラーに対する利用条件をウェブパブリッシャーが設定できるというもので、ウェブサイトの「robots.txt」ファイルに追記するだけで利用できる。これを用いれば、生成AIのクローラーがコンテンツを巡回するごとに支払うべき料金といったライセンスも設定できることから、AIスクレイピングによってクリエイターは報酬を得やすくなる』

    『すでにReddit、Yahoo、Quora、Mediumなどの大手が賛同を表明』

    #ReallySimpleLicensing #RSL #GenerativeAI