home.social

#glm — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #glm, aggregated by home.social.

  1. New week, more slides: Run LLMs Locally

    Now including wllama to run GGUF models inside your browser!

    wllama uses llama.cpp, WebAssembly and WebGPU, bringing a completely new experience of LLMs into the web.
    It has no 4 GB limitation and is faster than Transformers.js.

    I also added translations using the HY-MT model from Tencent.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #wllama #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp #webassembly

  2. New week, more slides: Run LLMs Locally

    Now including wllama to run GGUF models inside your browser!

    wllama uses llama.cpp, WebAssembly and WebGPU, bringing a completely new experience of LLMs into the web.
    It has no 4 GB limitation and is faster than Transformers.js.

    I also added translations using the HY-MT model from Tencent.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #wllama #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp #webassembly

  3. New week, more slides: Run LLMs Locally

    Now including wllama to run GGUF models inside your browser!

    wllama uses llama.cpp, WebAssembly and WebGPU, bringing a completely new experience of LLMs into the web.
    It has no 4 GB limitation and is faster than Transformers.js.

    I also added translations using the HY-MT model from Tencent.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #wllama #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp #webassembly

  4. New week, more slides: Run LLMs Locally

    Now including wllama to run GGUF models inside your browser!

    wllama uses llama.cpp, WebAssembly and WebGPU, bringing a completely new experience of LLMs into the web.
    It has no 4 GB limitation and is faster than Transformers.js.

    I also added translations using the HY-MT model from Tencent.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #wllama #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp #webassembly

  5. New week, more slides: Run LLMs Locally

    Now including wllama to run GGUF models inside your browser!

    wllama uses llama.cpp, WebAssembly and WebGPU, bringing a completely new experience of LLMs into the web.
    It has no 4 GB limitation and is faster than Transformers.js.

    I also added translations using the HY-MT model from Tencent.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #wllama #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp #webassembly

  6. New week, new slides: Run LLMs Locally

    Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-ASR is now working directly with Llama.cpp and included in the slides.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp

  7. New week, new slides: Run LLMs Locally

    Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-ASR is now working directly with Llama.cpp and included in the slides.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp

  8. New week, new slides: Run LLMs Locally

    Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-ASR is now working directly with Llama.cpp and included in the slides.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp

  9. New week, new slides: Run LLMs Locally

    Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-ASR is now working directly with Llama.cpp and included in the slides.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp

  10. New week, new slides: Run LLMs Locally

    Now including multi-token prediction using Qwen3.6 35B-A3B with Nextn quantization. Also speech recognition using Qwen-3-ASR is now working directly with Llama.cpp and included in the slides.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode #mtp

  11. Moving away from expensive frontier models ( #OpenAI, #Claude, #Gemini) to build a custom #openweight AI setup. My current workflow orchestrates #kimi k2.6, #deepSeek v4, and #glm using Oh My OpenAgent as base.

    Read about my setup here: richardorilla.website/seting_u

    #development #aidev

  12. Moving away from expensive frontier models ( #OpenAI, #Claude, #Gemini) to build a custom #openweight AI setup. My current workflow orchestrates #kimi k2.6, #deepSeek v4, and #glm using Oh My OpenAgent as base.

    Read about my setup here: richardorilla.website/seting_u

    #development #aidev

  13. Moving away from expensive frontier models ( #OpenAI, #Claude, #Gemini) to build a custom #openweight AI setup. My current workflow orchestrates #kimi k2.6, #deepSeek v4, and #glm using Oh My OpenAgent as base.

    Read about my setup here: richardorilla.website/seting_u

    #development #aidev

  14. Moving away from expensive frontier models ( #OpenAI, #Claude, #Gemini) to build a custom #openweight AI setup. My current workflow orchestrates #kimi k2.6, #deepSeek v4, and #glm using Oh My OpenAgent as base.

    Read about my setup here: richardorilla.website/seting_u

    #development #aidev

  15. Moving away from expensive frontier models ( #OpenAI, #Claude, #Gemini) to build a custom #openweight AI setup. My current workflow orchestrates #kimi k2.6, #deepSeek v4, and #glm using Oh My OpenAgent as base.

    Read about my setup here: richardorilla.website/seting_u

    #development #aidev

  16. So, the next one thing! "Dima stand 🧍‍♂️" (codeberg.org/xolatgames/Dima-s) now uses Assimp as a library for parsing 3D model files (instead of the parser that I was wrote by my own), and even Bullet Physics SDK for creation some 3D physic.

    #cpp #cplusplus #cmake #assimp #bullet3 #bullet #3d #3dgame #simulator #codeberg #opensource #codelite #linux #stb #stb_image #blender #blender3d #gimp #gimp3 #glfw #glfw3 #opengl #glm

  17. So, the next one thing! "Dima stand 🧍‍♂️" (codeberg.org/xolatgames/Dima-s) now uses Assimp as a library for parsing 3D model files (instead of the parser that I was wrote by my own), and even Bullet Physics SDK for creation some 3D physic.

    #cpp #cplusplus #cmake #assimp #bullet3 #bullet #3d #3dgame #simulator #codeberg #opensource #codelite #linux #stb #stb_image #blender #blender3d #gimp #gimp3 #glfw #glfw3 #opengl #glm

  18. I have been quite impressed with the performance of Z-AI GLM 5.1 model, it will never replace a obviously, but it as work through some complex logic and edge cases producing a stable solution, it still makes weird decisions regarding methods/functions introducing too much complexity at times, but for scaffolding solutions and working through features it makes a good impression so far.

  19. I have been quite impressed with the performance of Z-AI GLM 5.1 model, it will never replace a #developer obviously, but it as work through some complex logic and edge cases producing a stable solution, it still makes weird decisions regarding methods/functions introducing too much complexity at times, but for scaffolding solutions and working through features it makes a good impression so far. #AI #GLM

  20. I have been quite impressed with the performance of Z-AI GLM 5.1 model, it will never replace a #developer obviously, but it as work through some complex logic and edge cases producing a stable solution, it still makes weird decisions regarding methods/functions introducing too much complexity at times, but for scaffolding solutions and working through features it makes a good impression so far. #AI #GLM

  21. I have been quite impressed with the performance of Z-AI GLM 5.1 model, it will never replace a #developer obviously, but it as work through some complex logic and edge cases producing a stable solution, it still makes weird decisions regarding methods/functions introducing too much complexity at times, but for scaffolding solutions and working through features it makes a good impression so far. #AI #GLM

  22. I have been quite impressed with the performance of Z-AI GLM 5.1 model, it will never replace a #developer obviously, but it as work through some complex logic and edge cases producing a stable solution, it still makes weird decisions regarding methods/functions introducing too much complexity at times, but for scaffolding solutions and working through features it makes a good impression so far. #AI #GLM

  23. I just modified the kanmug plugin for Joplin so that it uses the new custom editor. The plan was created by Claude-opus-4.7, and it was programmed by GLM-5.1.
    It actually worked right out of the box, without me having to make any manual changes.
    Really impressive!
    I’ll test the plugin for a few days and then ask the maintainer if they’d like to accept AI-generated features.

    #joplin #kanmug #ai #glm #claude #opus

  24. I just modified the kanmug plugin for Joplin so that it uses the new custom editor. The plan was created by Claude-opus-4.7, and it was programmed by GLM-5.1.
    It actually worked right out of the box, without me having to make any manual changes.
    Really impressive!
    I’ll test the plugin for a few days and then ask the maintainer if they’d like to accept AI-generated features.

    #joplin #kanmug #ai #glm #claude #opus

  25. I just modified the kanmug plugin for Joplin so that it uses the new custom editor. The plan was created by Claude-opus-4.7, and it was programmed by GLM-5.1.
    It actually worked right out of the box, without me having to make any manual changes.
    Really impressive!
    I’ll test the plugin for a few days and then ask the maintainer if they’d like to accept AI-generated features.

    #joplin #kanmug #ai #glm #claude #opus

  26. I just modified the kanmug plugin for Joplin so that it uses the new custom editor. The plan was created by Claude-opus-4.7, and it was programmed by GLM-5.1.
    It actually worked right out of the box, without me having to make any manual changes.
    Really impressive!
    I’ll test the plugin for a few days and then ask the maintainer if they’d like to accept AI-generated features.

    #joplin #kanmug #ai #glm #claude #opus

  27. I just modified the kanmug plugin for Joplin so that it uses the new custom editor. The plan was created by Claude-opus-4.7, and it was programmed by GLM-5.1.
    It actually worked right out of the box, without me having to make any manual changes.
    Really impressive!
    I’ll test the plugin for a few days and then ask the maintainer if they’d like to accept AI-generated features.

    #joplin #kanmug #ai #glm #claude #opus

  28. New week, small update: Run LLMs Locally

    Now with a new setup for OpenCode with Qwen 3.6 and Gemma 4, including permissions and thinking variants.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode

  29. New week, small update: Run LLMs Locally

    Now with a new setup for OpenCode with Qwen 3.6 and Gemma 4, including permissions and thinking variants.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode

  30. New week, small update: Run LLMs Locally

    Now with a new setup for OpenCode with Qwen 3.6 and Gemma 4, including permissions and thinking variants.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode

  31. New week, small update: Run LLMs Locally

    Now with a new setup for OpenCode with Qwen 3.6 and Gemma 4, including permissions and thinking variants.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode

  32. New week, small update: Run LLMs Locally

    Now with a new setup for OpenCode with Qwen 3.6 and Gemma 4, including permissions and thinking variants.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #qwen3 #glm #localai #gemma4 #webgpu #opencode

  33. New week, more slides: Run LLMs Locally

    Now with LFM 2 and new slides for using Transformers.js with WebGPU for Privacy Filter, Function Calling and Embeddings, running completely in your browser.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  34. New week, more slides: Run LLMs Locally

    Now with LFM 2 and new slides for using Transformers.js with WebGPU for Privacy Filter, Function Calling and Embeddings, running completely in your browser.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  35. New week, more slides: Run LLMs Locally

    Now with LFM 2 and new slides for using Transformers.js with WebGPU for Privacy Filter, Function Calling and Embeddings, running completely in your browser.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  36. New week, more slides: Run LLMs Locally

    Now with LFM 2 and new slides for using Transformers.js with WebGPU for Privacy Filter, Function Calling and Embeddings, running completely in your browser.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  37. New week, more slides: Run LLMs Locally

    Now with LFM 2 and new slides for using Transformers.js with WebGPU for Privacy Filter, Function Calling and Embeddings, running completely in your browser.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  38. New week, new slides: Run LLMs Locally

    Now including Nemotron 3 Nano Omni from Nvidia, Llama.cpp built-in tools and new slides about using Transformers.js with WebGPU for Image Recognition and OCR.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  39. New week, new slides: Run LLMs Locally

    Now including Nemotron 3 Nano Omni from Nvidia, Llama.cpp built-in tools and new slides about using Transformers.js with WebGPU for Image Recognition and OCR.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  40. New week, new slides: Run LLMs Locally

    Now including Nemotron 3 Nano Omni from Nvidia, Llama.cpp built-in tools and new slides about using Transformers.js with WebGPU for Image Recognition and OCR.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  41. New week, new slides: Run LLMs Locally

    Now including Nemotron 3 Nano Omni from Nvidia, Llama.cpp built-in tools and new slides about using Transformers.js with WebGPU for Image Recognition and OCR.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  42. New week, new slides: Run LLMs Locally

    Now including Nemotron 3 Nano Omni from Nvidia, Llama.cpp built-in tools and new slides about using Transformers.js with WebGPU for Image Recognition and OCR.

    codeberg.org/thbley/talks/raw/

    #ai #llm #llamacpp #stablediffusion #gptoss #qwen3 #glm #localai #gemma4 #nemotron #webgpu

  43. [Перевод] Как научить кодинг-модели не переписывать код заново

    Не надо переписывать то, что не поломано Код к этому посту доступен на Github . Кодинг при помощи ИИ стал нормой; мы всё больше позволяем моделям наподобие Cursor, GitHub Copilot, Claude Code и Codex вмешиваться в наш код. Если вы в прошлом пользовались каким-то из этих инструментов, то, вероятно, сталкивались с чем-то подобным: вы просите модель устранить простой баг (допустим, ошибку смещения на единицу или не тот оператор). Модель устраняет баг, но половина функции оказывается переписанной. Появляется новая вспомогательная функция. Совершенно логичное имя переменной меняется на другое. Добавляется новая валидация ввода. И diff из-за этого становится огромным. Я называю это проблемой избыточной редактуры : модели склонны переписывать код, не нуждающийся в переписывании. На самом деле, это важнее, чем может показаться. При разработке узким местом всегда становится ревью кода: ревьюерам нужно понять, что и почему поменялось, а также безопасно ли изменение. Модель, переписывающая целые функции, пусть даже корректно, существенно усложняет эту работу, потому что код теперь выглядит совершенно иначе. В своём посте я исследую эту проблему: имеют ли современные LLM склонность к избыточной редактуре и можем ли мы обучить модели редактировать код в должной мере?

    habr.com/ru/articles/1027096/

    #кодингагенты #иипомощники #qwen #gpt_5 #claude_opus_46 #gemini #glm #kimi #deepseek

  44. [Перевод] Как научить кодинг-модели не переписывать код заново

    Не надо переписывать то, что не поломано Код к этому посту доступен на Github . Кодинг при помощи ИИ стал нормой; мы всё больше позволяем моделям наподобие Cursor, GitHub Copilot, Claude Code и Codex вмешиваться в наш код. Если вы в прошлом пользовались каким-то из этих инструментов, то, вероятно, сталкивались с чем-то подобным: вы просите модель устранить простой баг (допустим, ошибку смещения на единицу или не тот оператор). Модель устраняет баг, но половина функции оказывается переписанной. Появляется новая вспомогательная функция. Совершенно логичное имя переменной меняется на другое. Добавляется новая валидация ввода. И diff из-за этого становится огромным. Я называю это проблемой избыточной редактуры : модели склонны переписывать код, не нуждающийся в переписывании. На самом деле, это важнее, чем может показаться. При разработке узким местом всегда становится ревью кода: ревьюерам нужно понять, что и почему поменялось, а также безопасно ли изменение. Модель, переписывающая целые функции, пусть даже корректно, существенно усложняет эту работу, потому что код теперь выглядит совершенно иначе. В своём посте я исследую эту проблему: имеют ли современные LLM склонность к избыточной редактуре и можем ли мы обучить модели редактировать код в должной мере?

    habr.com/ru/articles/1027096/

    #кодингагенты #иипомощники #qwen #gpt_5 #claude_opus_46 #gemini #glm #kimi #deepseek

  45. [Перевод] Как научить кодинг-модели не переписывать код заново

    Не надо переписывать то, что не поломано Код к этому посту доступен на Github . Кодинг при помощи ИИ стал нормой; мы всё больше позволяем моделям наподобие Cursor, GitHub Copilot, Claude Code и Codex вмешиваться в наш код. Если вы в прошлом пользовались каким-то из этих инструментов, то, вероятно, сталкивались с чем-то подобным: вы просите модель устранить простой баг (допустим, ошибку смещения на единицу или не тот оператор). Модель устраняет баг, но половина функции оказывается переписанной. Появляется новая вспомогательная функция. Совершенно логичное имя переменной меняется на другое. Добавляется новая валидация ввода. И diff из-за этого становится огромным. Я называю это проблемой избыточной редактуры : модели склонны переписывать код, не нуждающийся в переписывании. На самом деле, это важнее, чем может показаться. При разработке узким местом всегда становится ревью кода: ревьюерам нужно понять, что и почему поменялось, а также безопасно ли изменение. Модель, переписывающая целые функции, пусть даже корректно, существенно усложняет эту работу, потому что код теперь выглядит совершенно иначе. В своём посте я исследую эту проблему: имеют ли современные LLM склонность к избыточной редактуре и можем ли мы обучить модели редактировать код в должной мере?

    habr.com/ru/articles/1027096/

    #кодингагенты #иипомощники #qwen #gpt_5 #claude_opus_46 #gemini #glm #kimi #deepseek

  46. [Перевод] Как научить кодинг-модели не переписывать код заново

    Не надо переписывать то, что не поломано Код к этому посту доступен на Github . Кодинг при помощи ИИ стал нормой; мы всё больше позволяем моделям наподобие Cursor, GitHub Copilot, Claude Code и Codex вмешиваться в наш код. Если вы в прошлом пользовались каким-то из этих инструментов, то, вероятно, сталкивались с чем-то подобным: вы просите модель устранить простой баг (допустим, ошибку смещения на единицу или не тот оператор). Модель устраняет баг, но половина функции оказывается переписанной. Появляется новая вспомогательная функция. Совершенно логичное имя переменной меняется на другое. Добавляется новая валидация ввода. И diff из-за этого становится огромным. Я называю это проблемой избыточной редактуры : модели склонны переписывать код, не нуждающийся в переписывании. На самом деле, это важнее, чем может показаться. При разработке узким местом всегда становится ревью кода: ревьюерам нужно понять, что и почему поменялось, а также безопасно ли изменение. Модель, переписывающая целые функции, пусть даже корректно, существенно усложняет эту работу, потому что код теперь выглядит совершенно иначе. В своём посте я исследую эту проблему: имеют ли современные LLM склонность к избыточной редактуре и можем ли мы обучить модели редактировать код в должной мере?

    habr.com/ru/articles/1027096/

    #кодингагенты #иипомощники #qwen #gpt_5 #claude_opus_46 #gemini #glm #kimi #deepseek

  47. [Перевод] Как научить кодинг-модели не переписывать код заново Не надо переписывать то, что не поломано Код ...

    #кодинг-агенты #ии-помощники #qwen #gpt #5 #claude #opus #4.6 #gemini #glm #kimi

    Origin | Interest | Match
  48. GLM 5.1 vs. DeepSeek V3.2: сравниваем топовые китайские модели В Veai мы регулярно тестируем и сравниваем модели, которы...

    #агент #для #разработчиков #AI-агент #бенчмарк #LLM #GLM #5.1 #DeepSeek #V3.2 #сравнение

    Origin | Interest | Match