home.social

#openweights — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #openweights, aggregated by home.social.

  1. Absolutely TRUE!!!

    "If a credible Western open frontier player does not emerge, the consequences cascade quickly.

    This is the inverse of the early Internet wave. In the 2000s and 2010s, Western companies — Google, Facebook, Amazon, Apple, Microsoft — dominated globally while China carved out its own walled garden. The AI version flips that dynamic on its head. Without a credible Western open frontier player, the only open models capable of running entire economies are made in China. If U.S. policy further restricts Chinese open-weight access on national-security grounds, the U.S. ends up with two or three closed Cathedrals serving the U.S. market — and the rest of the world picks the AI stack that is free, capable, self-hostable, and not embargoed. Europe, Africa, Southeast Asia, Latin America, India, the Middle East. Roughly six billion people. Chinese open models become the global default by 2030, and the United States ends up technologically isolated from the majority of the world’s AI users. We would have done it to ourselves.

    Watch what happens to AI infrastructure over the next twenty-four months. And watch Washington just as carefully.

    Open source is no longer just how good software gets built. It is how dominant incumbents get neutralized, how trillion-dollar industries shift their power structure, and how the next generation of strategic moats gets dug — by the companies smart enough to dig them in the open."

    p3institute.substack.com/p/fro

    #OpenSource #FLOSS #China #AI #USA #GenerativeAI #OpenWeights #LLMs

  2. Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем

    В телеграме завирусился пост: якобы кто-то “дообучил Qwen 3.5 до уровня Claude 4.6 Opus и убрал цензуру через Heretic”. Я открыл карточку модели на HuggingFace и провёл вечер, разбираясь, что под капотом. Спойлер: там много интересной техники, но к Claude эта модель имеет такое же отношение, как кроссовки “Adibas” к Adidas. Разбираю distillation, depth upscaling и abliteration без маркетинговой обёртки.

    habr.com/ru/articles/1032324/

    #LLM #Qwen #abliteration #файнтюн #HuggingFace #distillation #intepretability #openweights

  3. Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем

    В телеграме завирусился пост: якобы кто-то “дообучил Qwen 3.5 до уровня Claude 4.6 Opus и убрал цензуру через Heretic”. Я открыл карточку модели на HuggingFace и провёл вечер, разбираясь, что под капотом. Спойлер: там много интересной техники, но к Claude эта модель имеет такое же отношение, как кроссовки “Adibas” к Adidas. Разбираю distillation, depth upscaling и abliteration без маркетинговой обёртки.

    habr.com/ru/articles/1032324/

    #LLM #Qwen #abliteration #файнтюн #HuggingFace #distillation #intepretability #openweights

  4. Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем

    В телеграме завирусился пост: якобы кто-то “дообучил Qwen 3.5 до уровня Claude 4.6 Opus и убрал цензуру через Heretic”. Я открыл карточку модели на HuggingFace и провёл вечер, разбираясь, что под капотом. Спойлер: там много интересной техники, но к Claude эта модель имеет такое же отношение, как кроссовки “Adibas” к Adidas. Разбираю distillation, depth upscaling и abliteration без маркетинговой обёртки.

    habr.com/ru/articles/1032324/

    #LLM #Qwen #abliteration #файнтюн #HuggingFace #distillation #intepretability #openweights

  5. Разбираю «Qwen3.5-21B-Claude-4.6-Opus-Heretic-Uncensored»: что на самом деле внутри файнтюна с громким именем

    В телеграме завирусился пост: якобы кто-то “дообучил Qwen 3.5 до уровня Claude 4.6 Opus и убрал цензуру через Heretic”. Я открыл карточку модели на HuggingFace и провёл вечер, разбираясь, что под капотом. Спойлер: там много интересной техники, но к Claude эта модель имеет такое же отношение, как кроссовки “Adibas” к Adidas. Разбираю distillation, depth upscaling и abliteration без маркетинговой обёртки.

    habr.com/ru/articles/1032324/

    #LLM #Qwen #abliteration #файнтюн #HuggingFace #distillation #intepretability #openweights

  6. Mistral AI veröffentlicht Mistral Medium 3.5 mit 128 Milliarden Parametern, 256.000 Token Kontext und asynchronen Remote Agents für Coding-Aufgaben.

    Das Modell läuft auf vier GPUs und ist On-Premise hostbar. Open Weights stehen unter einer modifizierten MIT-Lizenz bereit. In Benchmarks wie SWE-Bench Verified (77,6%) übertrifft es Claude Sonnet 4.5.

    #Mistral #LLM #OpenWeights #MistralAI #AIGeneratedImage

    all-ai.de/news/news26top/mistr

  7. Mistral AI veröffentlicht Mistral Medium 3.5 mit 128 Milliarden Parametern, 256.000 Token Kontext und asynchronen Remote Agents für Coding-Aufgaben.

    Das Modell läuft auf vier GPUs und ist On-Premise hostbar. Open Weights stehen unter einer modifizierten MIT-Lizenz bereit. In Benchmarks wie SWE-Bench Verified (77,6%) übertrifft es Claude Sonnet 4.5.

    #Mistral #LLM #OpenWeights #MistralAI #AIGeneratedImage

    all-ai.de/news/news26top/mistr

  8. Mistral AI veröffentlicht Mistral Medium 3.5 mit 128 Milliarden Parametern, 256.000 Token Kontext und asynchronen Remote Agents für Coding-Aufgaben.

    Das Modell läuft auf vier GPUs und ist On-Premise hostbar. Open Weights stehen unter einer modifizierten MIT-Lizenz bereit. In Benchmarks wie SWE-Bench Verified (77,6%) übertrifft es Claude Sonnet 4.5.

    #Mistral #LLM #OpenWeights #MistralAI #AIGeneratedImage

    all-ai.de/news/news26top/mistr

  9. Mistral AI veröffentlicht Mistral Medium 3.5 mit 128 Milliarden Parametern, 256.000 Token Kontext und asynchronen Remote Agents für Coding-Aufgaben.

    Das Modell läuft auf vier GPUs und ist On-Premise hostbar. Open Weights stehen unter einer modifizierten MIT-Lizenz bereit. In Benchmarks wie SWE-Bench Verified (77,6%) übertrifft es Claude Sonnet 4.5.

    #Mistral #LLM #OpenWeights #MistralAI #AIGeneratedImage

    all-ai.de/news/news26top/mistr

  10. Mistral AI veröffentlicht Mistral Medium 3.5 mit 128 Milliarden Parametern, 256.000 Token Kontext und asynchronen Remote Agents für Coding-Aufgaben.

    Das Modell läuft auf vier GPUs und ist On-Premise hostbar. Open Weights stehen unter einer modifizierten MIT-Lizenz bereit. In Benchmarks wie SWE-Bench Verified (77,6%) übertrifft es Claude Sonnet 4.5.

    #Mistral #LLM #OpenWeights #MistralAI #AIGeneratedImage

    all-ai.de/news/news26top/mistr

  11. Moonshot AI veröffentlicht das Open-Weights-Modell Kimi K2.6, das im Intelligence Index Platz vier belegt. Die Mixture-of-Experts-Architektur mit einer Billion Parameter und 256.000 Token Kontext erlaubt autonomes Long-Horizon Coding über 13 Stunden. Bis zu 300 Sub-Agenten arbeiten parallel.

    #KimiK26 #MoonshotAI #OpenWeights #LLM #News
    all-ai.de/news/news26top/kimi-

  12. Moonshot AI veröffentlicht das Open-Weights-Modell Kimi K2.6, das im Intelligence Index Platz vier belegt. Die Mixture-of-Experts-Architektur mit einer Billion Parameter und 256.000 Token Kontext erlaubt autonomes Long-Horizon Coding über 13 Stunden. Bis zu 300 Sub-Agenten arbeiten parallel.

    #KimiK26 #MoonshotAI #OpenWeights #LLM #News
    all-ai.de/news/news26top/kimi-

  13. Moonshot AI veröffentlicht das Open-Weights-Modell Kimi K2.6, das im Intelligence Index Platz vier belegt. Die Mixture-of-Experts-Architektur mit einer Billion Parameter und 256.000 Token Kontext erlaubt autonomes Long-Horizon Coding über 13 Stunden. Bis zu 300 Sub-Agenten arbeiten parallel.

    #KimiK26 #MoonshotAI #OpenWeights #LLM #News
    all-ai.de/news/news26top/kimi-

  14. Moonshot AI veröffentlicht das Open-Weights-Modell Kimi K2.6, das im Intelligence Index Platz vier belegt. Die Mixture-of-Experts-Architektur mit einer Billion Parameter und 256.000 Token Kontext erlaubt autonomes Long-Horizon Coding über 13 Stunden. Bis zu 300 Sub-Agenten arbeiten parallel.

    #KimiK26 #MoonshotAI #OpenWeights #LLM #News
    all-ai.de/news/news26top/kimi-

  15. Moonshot AI veröffentlicht das Open-Weights-Modell Kimi K2.6, das im Intelligence Index Platz vier belegt. Die Mixture-of-Experts-Architektur mit einer Billion Parameter und 256.000 Token Kontext erlaubt autonomes Long-Horizon Coding über 13 Stunden. Bis zu 300 Sub-Agenten arbeiten parallel.

    #KimiK26 #MoonshotAI #OpenWeights #LLM #News
    all-ai.de/news/news26top/kimi-

  16. "Leading models are now “nearly indistinguishable” from each other when it comes to performance, the Stanford HAI report notes. Open-weight models are more competitive than ever, but they are converging.

    As capability is no longer a “clear differentiator,” competitive pressure is shifting toward cost, reliability, and real-world usefulness.

    Frontier labs are disclosing less information about their models, evaluation methods are quickly losing relevance, and independent testing can’t always corroborate developer-reported metrics.

    As Stanford HAI points out: “The most capable systems are now the least transparent.”

    Training code, parameter counts, dataset sizes, and durations are often being withheld — by firms including OpenAI, Anthropic and Google. And transparency is declining more broadly: In 2025, 80 out of 95 models were released without corresponding training code, while only four made their code fully open source.

    Further, after rising between 2023 and 2024, scores on the Foundation Model Transparency Index — which ranks major foundation developers on 100 transparency indicators — have since dropped. The average score is now 40, representing a 17 point decrease.

    “Major gaps persist in disclosure around training data, compute resources, and post-deployment impact,” according to the report."

    venturebeat.com/security/front

    #AI #GenerativeAI #LLMs #OpenWeights #OpenSource #Transparency #Hallucinations

  17. Alibaba veröffentlicht mit Qwen3.6-35B-A3B ein neues Mixture-of-Experts-Modell als Open Weights.

    Von 35 Milliarden Parametern werden nur drei Milliarden pro Anfrage aktiviert. In Benchmarks wie SWE-bench Verified (73,4 Punkte) und RefCOCO (92,0 Punkte) übertrifft es größere dichte Modelle. Die Integration erfolgt über Hugging Face oder die Alibaba Cloud Model Studio API.

    #Alibaba #Qwen #LLM #OpenWeights #News
    all-ai.de/news/news26/qwen-3b-

  18. Got a transatlantic flight today so I'm going to play around with running Gemma4' 26b model locally through Claude Code. If it works, this could be very fun and interesting... I'll keep you posted.

    #AI #OpenWeights

  19. Google Research veröffentlicht mit Simula ein neues Framework zur Generierung synthetischer Trainingsdaten durch Reasoning.

    Der vierstufige Prozess kommt ohne menschliche Startdaten aus und erzeugt hierarchische Taxonomien. Tests mit bis zu 512.000 Datenpunkten zeigen Leistungssteigerungen, das System wird bereits für ShieldGemma und Spam-Erkennung genutzt.

    #Google #Simula #LLM #OpenWeights #News
    all-ai.de/news/beitrage2026/go

  20. Baidu veröffentlicht das Text-zu-Bild-Modell ERNIE-Image als Open-Weights-Architektur mit acht Milliarden Parametern. Das System fokussiert sich auf fehlerfreies Text-Rendering und komplexe Layout-Strukturen.

    Die Basisversion benötigt 50 Generierungsschritte, die Turbo-Variante acht. Der Betrieb erfordert lokal 24 Gigabyte VRAM. Ein Prompt Enhancer ist integriert.

    #Baidu #ERNIEImage #OpenWeights #LLM #News
    all-ai.de/news/news26top/ernie

  21. RT @ArtificialAnlys: Sub-32B Open-Weights-Modelle bieten nun Intelligenz auf GPT-5-Niveau, wobei Qwen3.5 27B (Reasoning) mit 42 Punkten GPT-5 (medium) erreicht und Gemma 4 31B (Reasoning) mit 39 Punkten GPT-5 (low) auf dem Artificial Analysis Intelligence Index erreicht. @AlibabaQwen's Qwen3.5 und @GoogleDeepMind's Gemma 4 sind die beiden kürzlich veröffentlichten Open-Weights-Modellfamilien, die die Sub-32B-Gesamtparameter-Modellklasse vorantreiben. Beide sind in verschiedenen Größen mit Reasoning- und Non-Reasoning-Varianten verfügbar und bieten nativen multimodalen Input. Zusammen repräsentieren sie den Stand der Technik der Open-Weights-Intelligenz bei dieser Parameteranzahl. Qwen3.5 27B erreicht eine höhere absolute Intelligenz auf dem Artificial Analysis Intelligence Index, während Gemma 4 31B token-effizienter ist. Obwohl diese Sub-32B-Modelle nun Intelligenz auf GPT-5-Niveau erreichen, unterscheidet sich die Zusammensetzung dieser Intelligenz. Beide Open-Weights-Modelle hinken im Vergleich zu GPT-5-Varianten bei Faktenwissen und der Vermeidung von Halluzinationen deutlich hinterher: AA-Omniscience-Werte von -42 (Qwen3.5 27B) und -45 (Gemma 4 31B) gegenüber -10 für GPT-5 (medium) und -10 für GPT-5 (low). Fortschritte haben die Open-Weights-Modelle vor allem bei der agentischen Leistung und dem kritischen Denken gemacht: Qwen3.5 27B übertrifft GPT-5 (medium) auf dem Artificial Analysis Agentic Index deutlich mit 55 gegenüber 46, und Gemma 4 31B führt bei TerminalBench Hard (36 % vs. 27 %) und HLE (23 % vs. 18 %) gegenüber GPT-5 (low). Sowohl Qwen3.5 27B als auch Gemma 4 31B passen in BF16…

    mehr auf Arint.info

    #ArtificialIntelligence #KI #LLM #MachineLearning #OpenWeights #arint_info

    https://x.com/ArtificialAnlys/status/2043929874537296026#m

  22. Black Forest Labs hat den FLUX.2 Small Decoder veröffentlicht, der Entwicklern eine 1,4-fache Steigerung bei Speicherplatz- und Recheneffizienz bietet.

    Das Modell halbiert die Parameterzahl auf 28 Millionen durch Reduktion der Kanalbreiten. Es steht unter Apache 2.0 Lizenz bei Hugging Face bereit und integriert sich nahtlos in bestehende Workflows der FLUX.2-Familie.

    #BlackForestLabs #FLUX #OpenWeights #GenerativeAI #News
    all-ai.de/news/news26/flux-sma

  23. Black Forest Labs hat den FLUX.2 Small Decoder veröffentlicht, der Entwicklern eine 1,4-fache Steigerung bei Speicherplatz- und Recheneffizienz bietet.

    Das Modell halbiert die Parameterzahl auf 28 Millionen durch Reduktion der Kanalbreiten. Es steht unter Apache 2.0 Lizenz bei Hugging Face bereit und integriert sich nahtlos in bestehende Workflows der FLUX.2-Familie.

    #BlackForestLabs #FLUX #OpenWeights #GenerativeAI #News
    all-ai.de/news/news26/flux-sma

  24. Black Forest Labs hat den FLUX.2 Small Decoder veröffentlicht, der Entwicklern eine 1,4-fache Steigerung bei Speicherplatz- und Recheneffizienz bietet.

    Das Modell halbiert die Parameterzahl auf 28 Millionen durch Reduktion der Kanalbreiten. Es steht unter Apache 2.0 Lizenz bei Hugging Face bereit und integriert sich nahtlos in bestehende Workflows der FLUX.2-Familie.

    #BlackForestLabs #FLUX #OpenWeights #GenerativeAI #News
    all-ai.de/news/news26/flux-sma

  25. Black Forest Labs hat den FLUX.2 Small Decoder veröffentlicht, der Entwicklern eine 1,4-fache Steigerung bei Speicherplatz- und Recheneffizienz bietet.

    Das Modell halbiert die Parameterzahl auf 28 Millionen durch Reduktion der Kanalbreiten. Es steht unter Apache 2.0 Lizenz bei Hugging Face bereit und integriert sich nahtlos in bestehende Workflows der FLUX.2-Familie.

    #BlackForestLabs #FLUX #OpenWeights #GenerativeAI #News
    all-ai.de/news/news26/flux-sma

  26. Black Forest Labs hat den FLUX.2 Small Decoder veröffentlicht, der Entwicklern eine 1,4-fache Steigerung bei Speicherplatz- und Recheneffizienz bietet.

    Das Modell halbiert die Parameterzahl auf 28 Millionen durch Reduktion der Kanalbreiten. Es steht unter Apache 2.0 Lizenz bei Hugging Face bereit und integriert sich nahtlos in bestehende Workflows der FLUX.2-Familie.

    #BlackForestLabs #FLUX #OpenWeights #GenerativeAI #News
    all-ai.de/news/news26/flux-sma

  27. Zhipu AI veröffentlicht GLM-5.1, ein Modell für Long-Horizon Programmieraufgaben.

    Es erzielt 58,4 Punkte im SWE-Bench Pro und 68,7 im CyberGym, bleibt im Terminal-Bench 2.0 jedoch hinter Konkurrenten zurück. Die Gewichte stehen unter MIT-Lizenz bereit, optimiert für vLLM und SGLang.

    #GLM5 #OpenWeights #LLM #HuggingFace #News
    all-ai.de/news/news26top/glm-5

  28. Zhipu AI veröffentlicht GLM-5.1, ein Modell für Long-Horizon Programmieraufgaben.

    Es erzielt 58,4 Punkte im SWE-Bench Pro und 68,7 im CyberGym, bleibt im Terminal-Bench 2.0 jedoch hinter Konkurrenten zurück. Die Gewichte stehen unter MIT-Lizenz bereit, optimiert für vLLM und SGLang.

    #GLM5 #OpenWeights #LLM #HuggingFace #News
    all-ai.de/news/news26top/glm-5

  29. Zhipu AI veröffentlicht GLM-5.1, ein Modell für Long-Horizon Programmieraufgaben.

    Es erzielt 58,4 Punkte im SWE-Bench Pro und 68,7 im CyberGym, bleibt im Terminal-Bench 2.0 jedoch hinter Konkurrenten zurück. Die Gewichte stehen unter MIT-Lizenz bereit, optimiert für vLLM und SGLang.

    #GLM5 #OpenWeights #LLM #HuggingFace #News
    all-ai.de/news/news26top/glm-5

  30. Zhipu AI veröffentlicht GLM-5.1, ein Modell für Long-Horizon Programmieraufgaben.

    Es erzielt 58,4 Punkte im SWE-Bench Pro und 68,7 im CyberGym, bleibt im Terminal-Bench 2.0 jedoch hinter Konkurrenten zurück. Die Gewichte stehen unter MIT-Lizenz bereit, optimiert für vLLM und SGLang.

    #GLM5 #OpenWeights #LLM #HuggingFace #News
    all-ai.de/news/news26top/glm-5

  31. Zhipu AI veröffentlicht GLM-5.1, ein Modell für Long-Horizon Programmieraufgaben.

    Es erzielt 58,4 Punkte im SWE-Bench Pro und 68,7 im CyberGym, bleibt im Terminal-Bench 2.0 jedoch hinter Konkurrenten zurück. Die Gewichte stehen unter MIT-Lizenz bereit, optimiert für vLLM und SGLang.

    #GLM5 #OpenWeights #LLM #HuggingFace #News
    all-ai.de/news/news26top/glm-5

  32. Cohere veröffentlicht mit Transcribe ein neues Sprachmodell mit zwei Milliarden Parametern unter Apache 2.0.

    Die Conformer-basierte Architektur erreicht einen Durchsatz von 525 RTFx bei einer Wortfehlerrate von 5.42. Damit übertrifft das Modell Alternativen wie OpenAI Whisper Large v3 signifikant bei Durchsatz und Präzision.

    #Cohere #LLM #OpenWeights #MachineLearning #News
    all-ai.de/news/news26top/coher

  33. 🎤🎙️ Behold, the latest marvel: an open-weights #TTS model so realistic, it's like having a conversation with your fridge 🤖. Yet another GitHub project where the buzzwords outweigh the substance—because who needs meaningful human dialogue when AI can babble for us? 🙄 #InnovationOrIllusion
    github.com/nari-labs/dia #OpenWeights #AIConversation #TechBuzz #GitHubProjects #HackerNews #ngated

  34. Sam Altman, pioneering the art of #anticipation, masterfully delays the open weights model release while simultaneously reminding us our browser is an ancient relic best suited for museum display. 🤖🔧 Switch browsers, but keep waiting, because #patience is the new innovation. ⏳😂
    twitter.com/sama/status/194383 #SamAltman #BrowserInnovation #OpenWeights #HackerNews #ngated

  35. 🎤🎙️ Behold, the latest marvel: an open-weights #TTS model so realistic, it's like having a conversation with your fridge 🤖. Yet another GitHub project where the buzzwords outweigh the substance—because who needs meaningful human dialogue when AI can babble for us? 🙄 #InnovationOrIllusion
    github.com/nari-labs/dia #OpenWeights #AIConversation #TechBuzz #GitHubProjects #HackerNews #ngated

  36. 🎤🎙️ Behold, the latest marvel: an open-weights #TTS model so realistic, it's like having a conversation with your fridge 🤖. Yet another GitHub project where the buzzwords outweigh the substance—because who needs meaningful human dialogue when AI can babble for us? 🙄 #InnovationOrIllusion
    github.com/nari-labs/dia #OpenWeights #AIConversation #TechBuzz #GitHubProjects #HackerNews #ngated

  37. 🎤🎙️ Behold, the latest marvel: an open-weights #TTS model so realistic, it's like having a conversation with your fridge 🤖. Yet another GitHub project where the buzzwords outweigh the substance—because who needs meaningful human dialogue when AI can babble for us? 🙄 #InnovationOrIllusion
    github.com/nari-labs/dia #OpenWeights #AIConversation #TechBuzz #GitHubProjects #HackerNews #ngated

  38. "Open" LLM models are almost never Open Source.

    They are "Open Weights." This means the company allows you to run the model, but you have no right to see how it was made or what data it was trained on.

    We need to stop letting companies redefine "Open Source" to mean "available for download." Words have meanings.

    If a company claims they are open source but plans to "someday" release the code, or hides the training data, they are a poser. This is "Open Washing." They are co-opting the term to earn the community's goodwill for marketing without actually respecting the four freedoms.

    #NoAI #FOSS #OpenSource #GNULinux #GNU #Linux #Privacy #OpenWashing #OpenWeights #OpenWashing #NotOpenSource #TechEthics #FreeSoftware #Fediverse #AIHype #Enshittification #DigitalSovereignty

  39. Only just recently had some time to read the Kimi K2.5 technical report , an impressive open weights model (it's not fully opensource), the distance towards large paid proprietary foundation models is becoming very small.
    github.com/MoonshotAI/Kimi-K2.
    It also feels that way in use:
    kimi.com/chat
    #AI #openweights #models #KimiK25 #China

  40. New open weights model Kimi K2.5
    "self-directed agent swarm paradigm" ,
    "For complex tasks, Kimi K2.5 can self-direct an agent swarm with up to 100 sub-agents, executing parallel workflows across up to 1,500 tool calls. Compared with a single-agent setup, this reduces execution time by up to 4.5x. The agent swarm is automatically created and orchestrated by Kimi K2.5 without any predefined subagents or workflow."
    simonwillison.net/2026/Jan/27/
    #KimiK25 #openweights #AI