home.social

Search

1000 results for “lma”

  1. lmao...

    your "#pope" has #testicles.

    ...what could i possibly learn from him i cant learn for myself?

    *can his testicles produce an entire thriving planet on command of his #american voice alone?*

  2. LMAO
    THING1 just walked in:

    ME: did you hear?

    T1: and he went to #Villanova

    ME: …

    T1: 🗣 #Knicks IN FOUR!

    ME: AAAAAAAAAAH! fuck, yeah!

    #PopeLeoXIV #NBA #basketball

  3. 🧠 Il paper “The Leaderboard Illusion” (MIT e Stanford) mette in luce alcune distorsioni nella piattaforma #LMArena.
    👉 I dettagli e la risposta di LMArena: linkedin.com/posts/alessiopoma

    ___ 

    ✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: bit.ly/newsletter-alessiopomar 

    #AI #GenAI #GenerativeAI #IntelligenzaArtificiale #LLM

  4. От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM

    Как фильтры стиля и настроения меняют рейтинг LM Arena Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами. Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control , который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента. Что такое LM Arena и зачем она нужна Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench). На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.

    habr.com/ru/companies/bitrix/a

    #lmarena #нейросети #openai #языковые_модели #chatgpt #внедрение_ai #ds #выбор_модели

  5. От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM

    Как фильтры стиля и настроения меняют рейтинг LM Arena Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами. Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control , который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента. Что такое LM Arena и зачем она нужна Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench). На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.

    habr.com/ru/companies/bitrix/a

    #lmarena #нейросети #openai #языковые_модели #chatgpt #внедрение_ai #ds #выбор_модели

  6. От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM

    Как фильтры стиля и настроения меняют рейтинг LM Arena Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами. Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control , который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента. Что такое LM Arena и зачем она нужна Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench). На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.

    habr.com/ru/companies/bitrix/a

    #lmarena #нейросети #openai #языковые_модели #chatgpt #внедрение_ai #ds #выбор_модели

  7. lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.

    lol

  8. lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.

    lol

  9. lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.

    lol

  10. lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.

    lol

  11. lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.

    lol

  12. LMAO, Tesla owners have been saying all week that the reports of Cybertrucks rapidly disassembling themselves on the highway are fake news.

    Turns out Cybertrucks are infact falling apart because the GLUE that holds the stainless steel panels in place can't survive winter temps 🫠.

    Can't imagine any other car owners defending the car maker for their $100k+ ride falling the fuck apart every winter.

    techcrunch.com/2025/03/20/tesl

    #tesla #cybertruck #recall #RUD #elonmusk #winter

  13. LMAO. @Documentally just shared this in his recent newsletter and it’s hilarious. #DumbAndDumber

  14. #historiadigital @zotero 🖥️📝

    @bioinformacion
    #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación
    #BIOliteratura #PE203625 #Zotero #Bioliteratura #EnseñanzaBiología

    🗓️Fecha: 03/03/2025

    @bioinformacion #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación

    Actividades🖍️
    -Proyecto PAPIME

    ▶️Inicio: 7:00
    ⏸Pausa: 10:00
    ▶️Reanudo:
    ⏹Termino:

    EQUIPO⚽️
    1. @lma 2. @israelmv 3. @paulinacc 4. @keniamunoz

  15. #historiadigital @zotero 🖥️📝

    @bioinformacion
    #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación
    #BIOliteratura #PE203625 #Zotero #Bioliteratura #EnseñanzaBiología

    🗓️Fecha: 03/03/2025

    @bioinformacion #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación

    Actividades🖍️
    -Proyecto PAPIME

    ▶️Inicio: 7:00
    ⏸Pausa: 10:00
    ▶️Reanudo:
    ⏹Termino:

    EQUIPO⚽️
    1. @lma 2. @israelmv 3. @paulinacc 4. @keniamunoz

  16. lmaoooo, LeBron just left the court while still in the game #ItsOver 😂

  17. LMAO Asian Boss.... "We're very excited to bring an episode from a country that's rarely covered internationally"

    Also Asian Boss: *posts a vox pop about Singapore* hahahahahahha

    youtube.com/watch?v=s9RPswOtSU

    #Malaysia #Singapore #tootSEA #MYtoots (cari gaduh content king)

  18. LMAO in the end credits, Medusa, Pegasus, the Kraken et al are listed as “The Myths, as themselves”. that is amazing.

    they really don’t make movies like these anymore. lofi special effects are the best.

    #movies #LizaIsWatching #ClashOfTheTitans

  19. !Hola a todos!😀
    Ya estoy trabajando

    @bioinformacion
    #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación
    #BIOliteratura #PE203625

    Actividades🖍️
    -Inicio del proyecto PAPIME

    Fecha: 10/02/2025

    @bioinformacion
    #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación

    Actividades:
    -PAPIME

    ▶️Inicio: 8:00
    ⏸Pausa: 12:38
    ▶️Reanudo:
    ⏹Termino: 21:30

    EQUIPO⚽️
    1. @lma
    2. @israelmv
    3. @keniamunoz
    4. @martingb147
    5. @paulinacc

  20. !Hola a todos!😀
    Ya estoy trabajando

    @bioinformacion
    #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación
    #BIOliteratura #PE203625

    Actividades🖍️
    -Inicio del proyecto PAPIME

    Fecha: 10/02/2025

    @bioinformacion
    #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación

    Actividades:
    -PAPIME

    ▶️Inicio: 8:00
    ⏸Pausa: 12:38
    ▶️Reanudo:
    ⏹Termino: 21:30

    EQUIPO⚽️
    1. @lma
    2. @israelmv
    3. @keniamunoz
    4. @martingb147
    5. @paulinacc

  21. @bioinformacion
    #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación
    #BIOliteratura #PE203625

    Actividades🖍️
    -Inicio del proyecto PAPIME

    EQUIPO⚽️
    1. @lma
    2. @mineromerop
    3. @paulinacc
    4. @moyhp30
    5. @israelmv

  22. @bioinformacion
    #LABioinformacionEnLinea
    Laboratorio Virtual BIOinformación
    #BIOliteratura #PE203625

    Actividades🖍️
    -Inicio del proyecto PAPIME

    EQUIPO⚽️
    1. @lma
    2. @mineromerop
    3. @paulinacc
    4. @moyhp30
    5. @israelmv

  23. CW: fedi meta, dansup, nlnet

    lmao so instead of responding to criticism, dan here is just handwaving it away with "well nlnet likes me so i have nothing to do here, definitely not apologize to the people i called Russian state actors"

    also, "we need more contributors, not drama" is fucking RICH after the bullshit he pulled on hazel.

    god, what a pretentious prick.

    github.com/dansup-open-letter/

    #dansup #pixelfed #loops #sup #nlnet