Search
1000 results for “lma”
-
LMArena Gets $100M at $600M Valuation for AI Model Testing
#AI #LMArena #AIFunding #ChatbotArena #AIBenchmarks #UCBerkeley
https://winbuzzer.com/2025/05/21/lmarena-gets-100m-at-600m-valuation-for-ai-model-testing-xcxwbn/
-
LMArena Gets $100M at $600M Valuation for AI Model Testing
#AI #LMArena #AIFunding #ChatbotArena #AIBenchmarks #UCBerkeley
https://winbuzzer.com/2025/05/21/lmarena-gets-100m-at-600m-valuation-for-ai-model-testing-xcxwbn/
-
lmao...
your "#pope" has #testicles.
...what could i possibly learn from him i cant learn for myself?
*can his testicles produce an entire thriving planet on command of his #american voice alone?*
-
LMAO
THING1 just walked in:ME: did you hear?
T1: and he went to #Villanova
ME: …
T1: 🗣 #Knicks IN FOUR!
ME: AAAAAAAAAAH! fuck, yeah!
-
🧠 Il paper “The Leaderboard Illusion” (MIT e Stanford) mette in luce alcune distorsioni nella piattaforma #LMArena.
👉 I dettagli e la risposta di LMArena: https://www.linkedin.com/posts/alessiopomaro_lmarena-ai-ai-activity-7325037650006949888-lZ2i___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro
-
От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM
Как фильтры стиля и настроения меняют рейтинг LM Arena Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами. Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control , который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента. Что такое LM Arena и зачем она нужна Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench). На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.
https://habr.com/ru/companies/bitrix/articles/904092/
#lmarena #нейросети #openai #языковые_модели #chatgpt #внедрение_ai #ds #выбор_модели
-
От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM
Как фильтры стиля и настроения меняют рейтинг LM Arena Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами. Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control , который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента. Что такое LM Arena и зачем она нужна Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench). На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.
https://habr.com/ru/companies/bitrix/articles/904092/
#lmarena #нейросети #openai #языковые_модели #chatgpt #внедрение_ai #ds #выбор_модели
-
От улыбки рейтинг наш светлей: Как фильтры стиля и настроения меняют рейтинг LLM
Как фильтры стиля и настроения меняют рейтинг LM Arena Привет, Хабр! Я Сергей, в Битрикс24 отвечаю за то, чтобы под капотом Copilot крутилась правильная LLM — та, что действительно помогает пользователю, а не просто разбрасывается смайликами. Выбирая лучшие языковые модели, люди далеко не всегда руководствуются точностью ответов. Иногда внимание пользователей привлекает красивое оформление или эмоциональный стиль, а не фактическая польза. На LM Arena это стало особенно заметно в последнее время и заставило команду платформы изучить, как именно эмоции и оформление влияют на рейтинг моделей. Команда площадки решила отделить форму от содержания и запустила фильтр Sentiment Control , который «вычитает» эмоции и украшательства из итогового балла. Ниже — коротко о том, как они вычислили этот «эмо-чит» и почему это важно всем, кто выбирает модель для продукта, клиентской поддержки или внутреннего ассистента. Что такое LM Arena и зачем она нужна Сейчас существует много способов измерить качество языковых моделей. Есть метрики, которые оценивают знание фактов (MMLU), способность к обобщённому рассуждению (ARC‑AGI), умение решать задачи в игровой среде (VideoGameBench) и даже подсчитывают, сколько долларов модель могла бы заработать на реальных биржах фриланса (GigBench). На этом фоне появилась LM Arena — платформа, где пользователи вслепую сравнивают ответы разных моделей и выбирают лучший. Чем больше побед у модели, тем выше её рейтинг. Это похоже на шахматы или киберспорт, где тоже используется рейтинговая система Elo.
https://habr.com/ru/companies/bitrix/articles/904092/
#lmarena #нейросети #openai #языковые_модели #chatgpt #внедрение_ai #ds #выбор_модели
-
lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.
lol
-
lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.
lol
-
lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.
lol
-
lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.
lol
-
lmao. the latest #FO76 update has a dungeon that I can't complete because the movement keys are disabled when I'm in there.
lol
-
LMAO, Tesla owners have been saying all week that the reports of Cybertrucks rapidly disassembling themselves on the highway are fake news.
Turns out Cybertrucks are infact falling apart because the GLUE that holds the stainless steel panels in place can't survive winter temps 🫠.
Can't imagine any other car owners defending the car maker for their $100k+ ride falling the fuck apart every winter.
https://techcrunch.com/2025/03/20/tesla-recalls-cybertrucks-for-exterior-panels-that-fall-off/
-
@lma 2. @israelmv 3. @paulinacc 4. @keniamunoz 5. @jahm110517 6. @mineromerop 7. @Jinny_Harriet_Sweetpea
-
LMAO. @Documentally just shared this in his recent newsletter and it’s hilarious. #DumbAndDumber
-
@LMac1970
The Bream's dead mate. It's,
God save the King Cod. -
#historiadigital @zotero 🖥️📝
@bioinformacion
#LABioinformacionEnLinea
Laboratorio Virtual BIOinformación
#BIOliteratura #PE203625 #Zotero #Bioliteratura #EnseñanzaBiología🗓️Fecha: 03/03/2025
@bioinformacion #LABioinformacionEnLinea
Laboratorio Virtual BIOinformaciónActividades🖍️
-Proyecto PAPIME▶️Inicio: 7:00
⏸Pausa: 10:00
▶️Reanudo:
⏹Termino:EQUIPO⚽️
1. @lma 2. @israelmv 3. @paulinacc 4. @keniamunoz -
#historiadigital @zotero 🖥️📝
@bioinformacion
#LABioinformacionEnLinea
Laboratorio Virtual BIOinformación
#BIOliteratura #PE203625 #Zotero #Bioliteratura #EnseñanzaBiología🗓️Fecha: 03/03/2025
@bioinformacion #LABioinformacionEnLinea
Laboratorio Virtual BIOinformaciónActividades🖍️
-Proyecto PAPIME▶️Inicio: 7:00
⏸Pausa: 10:00
▶️Reanudo:
⏹Termino:EQUIPO⚽️
1. @lma 2. @israelmv 3. @paulinacc 4. @keniamunoz -
lmaoooo, LeBron just left the court while still in the game #ItsOver 😂
-
LMAO Asian Boss.... "We're very excited to bring an episode from a country that's rarely covered internationally"
Also Asian Boss: *posts a vox pop about Singapore* hahahahahahha
https://www.youtube.com/watch?v=s9RPswOtSUc
#Malaysia #Singapore #tootSEA #MYtoots (cari gaduh content king)
-
LMAO in the end credits, Medusa, Pegasus, the Kraken et al are listed as “The Myths, as themselves”. that is amazing.
they really don’t make movies like these anymore. lofi special effects are the best.
-
Show me how you draw men! Here they are!! #LMAB #TurAnt #art #digitalart #traditionalart #oc #OCSky
RE: https://bsky.app/profile/did:plc:67sas5xttkw4ytf2clxduflo/post/3lia2zxkodc2y -
!Hola a todos!😀
Ya estoy trabajando@bioinformacion
#LABioinformacionEnLinea
Laboratorio Virtual BIOinformación
#BIOliteratura #PE203625Actividades🖍️
-Inicio del proyecto PAPIMEFecha: 10/02/2025
@bioinformacion
#LABioinformacionEnLinea
Laboratorio Virtual BIOinformaciónActividades:
-PAPIME▶️Inicio: 8:00
⏸Pausa: 12:38
▶️Reanudo:
⏹Termino: 21:30EQUIPO⚽️
1. @lma
2. @israelmv
3. @keniamunoz
4. @martingb147
5. @paulinacc -
!Hola a todos!😀
Ya estoy trabajando@bioinformacion
#LABioinformacionEnLinea
Laboratorio Virtual BIOinformación
#BIOliteratura #PE203625Actividades🖍️
-Inicio del proyecto PAPIMEFecha: 10/02/2025
@bioinformacion
#LABioinformacionEnLinea
Laboratorio Virtual BIOinformaciónActividades:
-PAPIME▶️Inicio: 8:00
⏸Pausa: 12:38
▶️Reanudo:
⏹Termino: 21:30EQUIPO⚽️
1. @lma
2. @israelmv
3. @keniamunoz
4. @martingb147
5. @paulinacc -
@bioinformacion
#LABioinformacionEnLinea
Laboratorio Virtual BIOinformación
#BIOliteratura #PE203625Actividades🖍️
-Inicio del proyecto PAPIMEEQUIPO⚽️
1. @lma
2. @mineromerop
3. @paulinacc
4. @moyhp30
5. @israelmv -
@bioinformacion
#LABioinformacionEnLinea
Laboratorio Virtual BIOinformación
#BIOliteratura #PE203625Actividades🖍️
-Inicio del proyecto PAPIMEEQUIPO⚽️
1. @lma
2. @mineromerop
3. @paulinacc
4. @moyhp30
5. @israelmv -
CW: fedi meta, dansup, nlnet
lmao so instead of responding to criticism, dan here is just handwaving it away with "well nlnet likes me so i have nothing to do here, definitely not apologize to the people i called Russian state actors"
also, "we need more contributors, not drama" is fucking RICH after the bullshit he pulled on hazel.
god, what a pretentious prick.
https://github.com/dansup-open-letter/dansup-open-letter.github.io/issues/28