#gemma — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #gemma, aggregated by home.social.
-
「Android Studio」のAIは“支援”から“委任”へ ~「Google I/O 2026」が転換点に/エージェントモードを発展、あらゆるAIモデルに対応して開発を加速
https://forest.watch.impress.co.jp/docs/news/2112481.html#forest_watch_impress #Android_Studio #Google #Google_I_O #Gemini #Gemma #genai #AIコーディング #AIエージェント #プログラミング #Android
-
「Android Studio」のAIは“支援”から“委任”へ ~「Google I/O 2026」が転換点に/エージェントモードを発展、あらゆるAIモデルに対応して開発を加速
https://forest.watch.impress.co.jp/docs/news/2112481.html#forest_watch_impress #Android_Studio #Google #Google_I_O #Gemini #Gemma #genai #AIコーディング #AIエージェント #プログラミング #Android
-
「Android Studio」のAIは“支援”から“委任”へ ~「Google I/O 2026」が転換点に/エージェントモードを発展、あらゆるAIモデルに対応して開発を加速
https://forest.watch.impress.co.jp/docs/news/2112481.html#forest_watch_impress #Android_Studio #Google #Google_I_O #Gemini #Gemma #genai #AIコーディング #AIエージェント #プログラミング #Android
-
From Cloud Dependence to Device Intelligence: How Gemma 4 is Reshaping Local AI This is a submission for the Gemma 4 Challenge: Write About Gemma 4 There is a quiet revolution happening in artifici...
#devchallenge #gemmachallenge #gemma
Origin | Interest | Match -
https://www.europesays.com/it/497170/ Lunedì 18 maggio – Uomini e donne Le puntate | Witty TV – wittytv.it #18Maggio #barbara #ciro #corteggiatori #Entertainment #esterne #frequentazione #gemma #gianni #Intrattenimento #IT #Italia #Italy #luana #marco #MariaDeFilippi #massimo #parterre #puntata #redazione #tina #tronista #tronisti #TronoClassico #TronoOver #tv #UominiEDonne #witty
-
I have 1 small and 1 bigger hope for Google IO: an update to Notebook LM to let you play / pause from your headphones + set a sleep timer and commitments to continue their great work on Gemma.
What are you hoping for?
https://io.google/2026/register
#AI #googleio #notebooklm #gemma -
Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B
Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.
https://habr.com/ru/articles/1036448/
#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge
-
Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B
Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.
https://habr.com/ru/articles/1036448/
#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge
-
Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B
Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.
https://habr.com/ru/articles/1036448/
#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge
-
Прогнал семь LLM через свой русский спортивный бенчмарк. Базовой моделью всё равно оставляю Gemma 4 31B
Прогнали семь LLM через свой русский спортивный бенчмарк. Топовые модели closed-source выигрывают 1.5-1.7 балла. Базовой моделью всё равно остаётся Gemma 4 31B — рассказываю почему.
https://habr.com/ru/articles/1036448/
#llm #бенчмарк #gemma #qwen #openrouter #русский_язык #dora #sft #спорт #llmjudge
-
RT @leopardracer: DAS SCHLAUESTE LOKALE KI-SETUP IM JAHR 2026 KOSTET 200 DOLLAR. ÜBER DAS SPRICHT KEINER
mehr auf Arint.info
#DualGPU #Gemma #Grafikkarten #KIKosten #KISetup #LokaleKI #arint_info
-
RT @stevibe: Parameter-Scaling ist gerade bei mir abgestürzt. Ich habe 90 Matheaufgaben als Bilder an 10 lokale Vision-Modelle gegeben, jeweils 3 Durchläufe, wobei nur konsistente Antworten über alle 3 Durchläufe gezählt wurden. Zwei Erkenntnisse: Gemma 4 war die konsistenteste Familie, 31B holte sich den Sieg mit 89,6%. Doch Qwen 3.5 4B lag nur zwei Antworten dahinter. Ein 4B-Modell. Auf Platz 2 von 10. Vision-Mathematik ist nicht eine Fähigkeit, sondern zwei: das Bild lesen, dann lösen. Die eigentliche Lektion für alle, die lokal arbeiten: klein ≠ schwach. Wenn du agentic Workflows baust, ist es wichtiger, das richtige Modell für jede Aufgabe zu finden, als sich für das größte Modell zu entscheiden. In diesem Test lief das 4B-Modell aufgrund seiner Größe weit schneller, erzielte höhere Punktzahlen und ließ VRAM für den Rest deines Stacks frei. Vollständige Ergebnisse: 🥇 Gemma 4 31B — 242/270 (89,6%) 🥈 Qwen 3.5 4B — 240/270 (88,9%) 🥉 Gemma 4 E4B — 222/270 (82,2%) 🥉 Qwen 3.6 27B — 222/270 (82,2%) 5. Gemma 4 26B A4B — 216/270 (80,0%) 6. Qwen 3.5 2B — 201/270 (74,4%) 7. Gemma 4 E2B — 192/270 (71,1%) 8. Qwen 3.6 35B A3B — 192/270 (71,1%) 9. Qwen 3.5 9B — 168/270 (62,2%) 10. Qwen 3.5 0.8B — 45/270 (16,7%) Alle GGUF + mmproj, Unsloth's Q6KXL Quantisierung. Video
mehr auf Arint.info
#AI #Gemma #LocalLLM #MachineLearning #Qwen #VisionModels #arint_info
-
RT @stevibe: Parameter-Scaling ist gerade bei mir abgestürzt. Ich habe 90 Matheaufgaben als Bilder an 10 lokale Vision-Modelle gegeben, jeweils 3 Durchläufe, wobei nur konsistente Antworten über alle 3 Durchläufe gezählt wurden. Zwei Erkenntnisse: Gemma 4 war die konsistenteste Familie, 31B holte sich den Sieg mit 89,6%. Doch Qwen 3.5 4B lag nur zwei Antworten dahinter. Ein 4B-Modell. Auf Platz 2 von 10. Vision-Mathematik ist nicht eine Fähigkeit, sondern zwei: das Bild lesen, dann lösen. Die eigentliche Lektion für alle, die lokal arbeiten: klein ≠ schwach. Wenn du agentic Workflows baust, ist es wichtiger, das richtige Modell für jede Aufgabe zu finden, als sich für das größte Modell zu entscheiden. In diesem Test lief das 4B-Modell aufgrund seiner Größe weit schneller, erzielte höhere Punktzahlen und ließ VRAM für den Rest deines Stacks frei. Vollständige Ergebnisse: 🥇 Gemma 4 31B — 242/270 (89,6%) 🥈 Qwen 3.5 4B — 240/270 (88,9%) 🥉 Gemma 4 E4B — 222/270 (82,2%) 🥉 Qwen 3.6 27B — 222/270 (82,2%) 5. Gemma 4 26B A4B — 216/270 (80,0%) 6. Qwen 3.5 2B — 201/270 (74,4%) 7. Gemma 4 E2B — 192/270 (71,1%) 8. Qwen 3.6 35B A3B — 192/270 (71,1%) 9. Qwen 3.5 9B — 168/270 (62,2%) 10. Qwen 3.5 0.8B — 45/270 (16,7%) Alle GGUF + mmproj, Unsloth's Q6KXL Quantisierung. Video
mehr auf Arint.info
#AI #Gemma #LocalLLM #MachineLearning #Qwen #VisionModels #arint_info
-
RT @stevibe: Parameter-Scaling ist gerade bei mir abgestürzt. Ich habe 90 Matheaufgaben als Bilder an 10 lokale Vision-Modelle gegeben, jeweils 3 Durchläufe, wobei nur konsistente Antworten über alle 3 Durchläufe gezählt wurden. Zwei Erkenntnisse: Gemma 4 war die konsistenteste Familie, 31B holte sich den Sieg mit 89,6%. Doch Qwen 3.5 4B lag nur zwei Antworten dahinter. Ein 4B-Modell. Auf Platz 2 von 10. Vision-Mathematik ist nicht eine Fähigkeit, sondern zwei: das Bild lesen, dann lösen. Die eigentliche Lektion für alle, die lokal arbeiten: klein ≠ schwach. Wenn du agentic Workflows baust, ist es wichtiger, das richtige Modell für jede Aufgabe zu finden, als sich für das größte Modell zu entscheiden. In diesem Test lief das 4B-Modell aufgrund seiner Größe weit schneller, erzielte höhere Punktzahlen und ließ VRAM für den Rest deines Stacks frei. Vollständige Ergebnisse: 🥇 Gemma 4 31B — 242/270 (89,6%) 🥈 Qwen 3.5 4B — 240/270 (88,9%) 🥉 Gemma 4 E4B — 222/270 (82,2%) 🥉 Qwen 3.6 27B — 222/270 (82,2%) 5. Gemma 4 26B A4B — 216/270 (80,0%) 6. Qwen 3.5 2B — 201/270 (74,4%) 7. Gemma 4 E2B — 192/270 (71,1%) 8. Qwen 3.6 35B A3B — 192/270 (71,1%) 9. Qwen 3.5 9B — 168/270 (62,2%) 10. Qwen 3.5 0.8B — 45/270 (16,7%) Alle GGUF + mmproj, Unsloth's Q6KXL Quantisierung. Video
mehr auf Arint.info
#AI #Gemma #LocalLLM #MachineLearning #Qwen #VisionModels #arint_info
-
RT @stevibe: Parameter-Scaling ist gerade bei mir abgestürzt. Ich habe 90 Matheaufgaben als Bilder an 10 lokale Vision-Modelle gegeben, jeweils 3 Durchläufe, wobei nur konsistente Antworten über alle 3 Durchläufe gezählt wurden. Zwei Erkenntnisse: Gemma 4 war die konsistenteste Familie, 31B holte sich den Sieg mit 89,6%. Doch Qwen 3.5 4B lag nur zwei Antworten dahinter. Ein 4B-Modell. Auf Platz 2 von 10. Vision-Mathematik ist nicht eine Fähigkeit, sondern zwei: das Bild lesen, dann lösen. Die eigentliche Lektion für alle, die lokal arbeiten: klein ≠ schwach. Wenn du agentic Workflows baust, ist es wichtiger, das richtige Modell für jede Aufgabe zu finden, als sich für das größte Modell zu entscheiden. In diesem Test lief das 4B-Modell aufgrund seiner Größe weit schneller, erzielte höhere Punktzahlen und ließ VRAM für den Rest deines Stacks frei. Vollständige Ergebnisse: 🥇 Gemma 4 31B — 242/270 (89,6%) 🥈 Qwen 3.5 4B — 240/270 (88,9%) 🥉 Gemma 4 E4B — 222/270 (82,2%) 🥉 Qwen 3.6 27B — 222/270 (82,2%) 5. Gemma 4 26B A4B — 216/270 (80,0%) 6. Qwen 3.5 2B — 201/270 (74,4%) 7. Gemma 4 E2B — 192/270 (71,1%) 8. Qwen 3.6 35B A3B — 192/270 (71,1%) 9. Qwen 3.5 9B — 168/270 (62,2%) 10. Qwen 3.5 0.8B — 45/270 (16,7%) Alle GGUF + mmproj, Unsloth's Q6KXL Quantisierung. Video
mehr auf Arint.info
#AI #Gemma #LocalLLM #MachineLearning #Qwen #VisionModels #arint_info
-
RT @stevibe: Parameter-Scaling ist gerade bei mir abgestürzt. Ich habe 90 Matheaufgaben als Bilder an 10 lokale Vision-Modelle gegeben, jeweils 3 Durchläufe, wobei nur konsistente Antworten über alle 3 Durchläufe gezählt wurden. Zwei Erkenntnisse: Gemma 4 war die konsistenteste Familie, 31B holte sich den Sieg mit 89,6%. Doch Qwen 3.5 4B lag nur zwei Antworten dahinter. Ein 4B-Modell. Auf Platz 2 von 10. Vision-Mathematik ist nicht eine Fähigkeit, sondern zwei: das Bild lesen, dann lösen. Die eigentliche Lektion für alle, die lokal arbeiten: klein ≠ schwach. Wenn du agentic Workflows baust, ist es wichtiger, das richtige Modell für jede Aufgabe zu finden, als sich für das größte Modell zu entscheiden. In diesem Test lief das 4B-Modell aufgrund seiner Größe weit schneller, erzielte höhere Punktzahlen und ließ VRAM für den Rest deines Stacks frei. Vollständige Ergebnisse: 🥇 Gemma 4 31B — 242/270 (89,6%) 🥈 Qwen 3.5 4B — 240/270 (88,9%) 🥉 Gemma 4 E4B — 222/270 (82,2%) 🥉 Qwen 3.6 27B — 222/270 (82,2%) 5. Gemma 4 26B A4B — 216/270 (80,0%) 6. Qwen 3.5 2B — 201/270 (74,4%) 7. Gemma 4 E2B — 192/270 (71,1%) 8. Qwen 3.6 35B A3B — 192/270 (71,1%) 9. Qwen 3.5 9B — 168/270 (62,2%) 10. Qwen 3.5 0.8B — 45/270 (16,7%) Alle GGUF + mmproj, Unsloth's Q6KXL Quantisierung. Video
mehr auf Arint.info
#AI #Gemma #LocalLLM #MachineLearning #Qwen #VisionModels #arint_info
-
RT @stevibe: Parameter-Scaling ist gerade bei mir zusammengebrochen. Ich habe 90 Matheaufgaben als Bilder an 10 lokale Vision-Modelle gegeben, jeweils 3 Durchläufe pro Modell, wobei nur konsistente Antworten über alle 3 Durchläufe gezählt wurden. Zwei Erkenntnisse: Gemma 4 war die konsistenteste Familie, 31B holte sich den Titel mit 89,6%. Doch Qwen 3.5 4B lag nur 2 Antworten dahinter. Ein 4B-Modell. Auf Platz 2 von 10. Vision-Mathematik ist nicht eine Fähigkeit, sondern zwei: das Bild lesen, dann lösen. Die eigentliche Lektion für alle, die lokal arbeiten: klein ≠ schwach. Wenn du agentic Workflows aufbaust, ist es wichtiger, das richtige Modell für jede Aufgabe zu finden, als zum größten Modell zu greifen. In diesem Test lief das 4B-Modell aufgrund seiner Größe weit schneller, erzielte höhere Scores und ließ VRAM für den Rest deines Stacks frei. Vollständige Ergebnisse: 🥇 Gemma 4 31B — 242/270 (89,6%) 🥈 Qwen 3.5 4B — 240/270 (88,9%) 🥉 Gemma 4 E4B — 222/270 (82,2%) 🥉 Qwen 3.6 27B — 222/270 (82,2%) 5. Gemma 4 26B A4B — 216/270 (80,0%) 6. Qwen 3.5 2B — 201/270 (74,4%) 7. Gemma 4 E2B — 192/270 (71,1%) 8. Qwen 3.6 35B A3B — 192/270 (71,1%) 9. Qwen 3.5 9B — 168/270 (62,2%) 10. Qwen 3.5 0.8B — 45/270 (16,7%) Alle GGUF + mmproj, Unsloth's Q6KXL Quantisierung. Video
mehr auf Arint.info
#Gemma #LLM #LocalAI #MachineLearning #Qwen #VisionModels #arint_info
-
Surviving 7 days in the wilderness...
Verdict: Pretty damn decent local LLM
-
Surviving 7 days in the wilderness...
Verdict: Pretty damn decent local LLM
-
Surviving 7 days in the wilderness...
Verdict: Pretty damn decent local LLM
-
You are on a remote trail, your knee is swollen.
No cell coverage...Pretty decent advice...
3/4
-
You are on a remote trail, your knee is swollen.
No cell coverage...Pretty decent advice...
3/4
-
You are on a remote trail, your knee is swollen.
No cell coverage...Pretty decent advice...
3/4
-
Set fon offline,airplane mode so there is no cheating.
First prompt, how to deploy an NginX docker build proxy;
Not one, but 3 different .yml
I wouldn't bet my life on it, but close enough to get it going.But let's give it something practical...
-
Set fon offline,airplane mode so there is no cheating.
First prompt, how to deploy an NginX docker build proxy;
Not one, but 3 different .yml
I wouldn't bet my life on it, but close enough to get it going.But let's give it something practical...
-
Set fon offline,airplane mode so there is no cheating.
First prompt, how to deploy an NginX docker build proxy;
Not one, but 3 different .yml
I wouldn't bet my life on it, but close enough to get it going.But let's give it something practical...
-
I've just played with the Google android local #LLM,
Gemma-4-E4B, its the same model that the wood folk were losing their chips over a few days ago.First, its important to understand it is a fully local model.
No internet connectivity is necessary.How to use it:
1. Download Edge gallery from Play Store
2. Go to models and pick Gemma-4-E4BYou may want to do it on WiFi as its 3.5 GB.
Then just run it via Edge gallery.
No #datacentre
No gas turbines
No rivers for coolingOn a aging 8 Core cell, with 32GB of ram and a GPU it runs very well speed wise.
Its "only" 4 billion parameters, so how good is it?
1/4
-
I've just played with the Google android local #LLM,
Gemma-4-E4B, its the same model that the wood folk were losing their chips over a few days ago.First, its important to understand it is a fully local model.
No internet connectivity is necessary.How to use it:
1. Download Edge gallery from Play Store
2. Go to models and pick Gemma-4-E4BYou may want to do it on WiFi as its 3.5 GB.
Then just run it via Edge gallery.
No #datacentre
No gas turbines
No rivers for coolingOn a aging 8 Core cell, with 32GB of ram and a GPU it runs very well speed wise.
Its "only" 4 billion parameters, so how good is it?
1/4
-
I've just played with the Google android local #LLM,
Gemma-4-E4B, its the same model that the wood folk were losing their chips over a few days ago.First, its important to understand it is a fully local model.
No internet connectivity is necessary.How to use it:
1. Download Edge gallery from Play Store
2. Go to models and pick Gemma-4-E4BYou may want to do it on WiFi as its 3.5 GB.
Then just run it via Edge gallery.
No #datacentre
No gas turbines
No rivers for coolingOn a aging 8 Core cell, with 32GB of ram and a GPU it runs very well speed wise.
Its "only" 4 billion parameters, so how good is it?
1/4
-
Automation and Measurement: Inside Gemini Scribe 4.8.0
I recently wrapped up the development cycle for Gemini Scribe 4.8.0. Looking back at the ~99 pull requests merged over the last month, the sheer volume of changes is significant. Not only are we shipping major features, but I’m also seeing a steady uptick in contributions from collaborators, an increase in issues filed by the community, and much more activity in our discussion group. Beyond the changelog and community growth, two structural narratives define this release: automation and measurement.
As I discussed in the evolution of Gemini Scribe, the goal has always been to move beyond a simple chat interface. With 4.8.0, we are taking a massive step toward making the agent a true background worker in your vault.
Here is a look at the architecture, the code, and what this release means for the future of our agentic workflows.
The Push for Automation
For a long time, running a complex agent task meant staring at a blocking UI. If you asked the agent to perform deep research or generate an image, you waited.
To solve this, we introduced a unified background execution lane. The new
BackgroundTaskManagerallows tools likeDeepResearchToolandGenerateImageToolto accept abackground: trueparameter. The agent submits the task, receives an ID immediately, and returns to its turn. You can monitor these tasks in the new Gemini Activity modal, which consolidates background tasks and RAG indexing status into one view.But unblocking the UI was only half the battle. We wanted to lay the groundwork for an agent that operates in the background. While true autonomy is a spectrum, the first step is moving away from the chat box and into scheduled, asynchronous workflows.
The Scheduled Task Engine
The marquee feature of 4.8.0 is the full task scheduling system. You can now define a task as a markdown file, and the plugin will run it on a cadence as a headless agent session, writing the output back to the vault.
To make this work, we built a
ScheduledTaskManagerwith a 60-second tick loop. Tasks are stored in[state-folder]/Scheduled-Tasks/with a sidecar JSON file for state. The headlessScheduledTaskRunnermirrors the standardAgentViewToolsbut auto-approves all tool calls.We also expanded the schedule grammar. Originally,
dailymeant “every 24 hours from creation,” which surprised users. Now, you can specifydaily@HH:MMandweekly@HH:MM:DAYS, so you can finally tell the agent to run “every weekday at 4:30 PM.”We also handle missed runs gracefully. On startup, any task with
runIfMissed: truethat missed its window surfaces in aCatchUpModal.Right now, this is essentially a highly intelligent cron job. You are still explicitly telling the agent when to run. But this scheduling engine is the foundational infrastructure for what comes next. In the next release, we are introducing Obsidian lifecycle hooks. Instead of just running on a timer, the agent will be able to react to events, triggering workflows when you create a new file, save a note, or modify a project board. That is where we cross the threshold into true ambient AI.
How I Use This in Practice
To give you an idea of what this unlocks, I currently rely on a few specific scheduled workflows:
The Daily Setup: Every afternoon, a scheduled skill runs to prepare my vault for the following day. It looks up my calendar, creates my daily note if it doesn’t exist, and seeds it with my upcoming meetings. It goes a step further by creating individual meeting note entries and building out context notes for the people I’ll be meeting with. When I walk into the office the next morning, my daily note is already prepped and ready to go.
Automated Blog Drafts: I also use this to automate my content pipeline. I have a scheduled skill that monitors my Readwise syncs and automatically generates drafts for my “Reading List” blog posts. Instead of manually curating and formatting these, the agent handles the heavy lifting in the background, leaving me to just review and polish the draft.
If you are worried about the agent running amok in your vault while you aren’t looking, there are several ways to mitigate this. You can limit the tools the agent has access to. If you don’t want it overwriting files, you can simply restrict its write access. Additionally, the agent’s response from any scheduled task is always saved in the
Scheduled-Tasks/Runsfile, giving you a complete audit log of what the agent had to say during the session.In my case, I’m automating skills that I’ve been running manually for a while now, and I run my agent in a mode where I let it write and edit files day-to-day. You should set up your tasks to match your own comfort level. You can read more about how to configure this in the Scheduled Tasks Documentation.
Extracting the Agent Loop
To support headless scheduled tasks, I had to refactor how the agent executes tools. Previously, the tool-execution loop was tightly coupled to the UI in
AgentViewTools.I extracted this logic into a UI-agnostic
AgentLoopclass.AgentViewToolsshrank from 386 lines down to 187, becoming a thin adapter overAgentLoopwith specific hooks (onToolBatchStart,onToolCallStart, etc.).// Conceptual extraction of the AgentLoop export class AgentLoop { constructor(private engine: ToolExecutionEngine) {} async execute(turn: AgentTurn) { // Iterative tool execution, removing the recursive stack-depth ceiling while (this.hasPendingToolCalls(turn)) { // Loop detection, batching, and execution logic lives here } } }This extraction immediately paid dividends, catching bugs that a duplicate headless runner had introduced, and eliminating a recursive stack-depth ceiling on deep tool chains. More importantly, it means scheduled tasks, evals, and the UI all share the exact same execution engine.
Local Models with Ollama and Gemma 4
First-class local-model support is here. By leveraging the
ModelApiseam, chat, summarization, rewrite, and agent tool-calling all work against a local Ollama server. You can use any model from Ollama that supports tool calling, though I have personally only tested this extensively with Gemma 4.In my local evaluation harness, Gemma 4 performed exceptionally well. It is incredibly capable, fast, and handles the agent loop with a level of reliability that makes local-only agentic workflows genuinely viable.
The way I use this right now is as an offline fallback: when I don’t have an internet connection, I switch to Gemma 4 and just keep working. Obviously, running offline means I don’t have access to online-dependent tools like Google Search, Deep Research, or Image Generation. But for synthesizing notes, organizing projects, or drafting content securely, it is incredibly powerful.
In the future, we will be refining the system to allow you to pick the model you want on a per-function basis. This means you’ll be able to route sensitive, local text processing to an offline model while still leveraging cloud models for heavy-lifting tasks like Deep Research or Image Generation when you are connected.
Moving from Guessing to Measuring
As the agent loop gets more complex (handling runaway loop aborts and budget constraints) we can no longer rely on “vibes” to know if a change improved the system.
To solve this, I built a new CLI-driven eval harness (
npm run eval) that drives a live Obsidian instance. It captures turns, tool calls, token usage, cache ratios, and cost. Crucially, it measures reliability. By passing--repeat=N, the harness repeats each task to surface flakiness, reporting apass^kmetric. We can now test multi-hop retrieval and loop-trap cyclic references programmatically, ensuring the agent bails cleanly instead of spinning forever.Right now, the focus for 4.8.0 was getting this infrastructure in place and establishing the beginnings of our eval set. Having the harness is the first step; the next step is building out a robust suite of test cases that reflect real-world vault interactions.
I would love to see contributions from the community for the evals themselves! If you have complex agentic workflows or edge cases you want to ensure remain stable, please submit them. In the next release, we will start publishing the actual eval results and benchmarks directly in the repo so we can transparently track the agent’s performance over time.
What’s Next?
What does this implementation tell us about the future of software engineering and personal knowledge management?
We are seeing a clear shift toward ambient AI. The chat interface is a great starting point, but the true value of an agentic system is its ability to operate asynchronously. While the scheduling engine in 4.8.0 acts as a highly capable cron job, it lays the groundwork for the event-driven lifecycle hooks coming in the next release.
By combining the
AgentLoopextraction with asynchronous execution, Gemini Scribe is no longer just a tool you use; it is becoming a system that reacts and works alongside you. When you can rely on a background orchestrator to run your housekeeping routines (like updating changelogs or triaging issues) while you eat dinner, the vault becomes a living, breathing entity. The agent becomes a true extension of your workflow, utilizing the built-in skills we’ve developed entirely in the background.Gemini Scribe 4.8.0 is a massive architectural leap forward. The code is cleaner, the tests are faster (thanks to a Vitest migration), and the agent is more autonomous than ever.
If you want to dive into the specifics or try out the new scheduling grammar, check out the updated documentation on scheduled tasks.
Let me know what automated tasks you end up building. I’m already finding new ways to let the agent do the heavy lifting while I focus on the work that matters.
#Agents #AI #Gemini #Gemma #Obsidian #Productivity -
How to Replace Siri with a Free Local Model
Explain the difference between local AI and cloud AI in simple terms
#LocalAI is processed on your device, keeping all data private.
#CloudAI is processed on a server and requires internet access.https://app.therundown.ai/guides/how-to-replace-siri-with-a-free-local-model
-
How to Replace Siri with a Free Local Model
Explain the difference between local AI and cloud AI in simple terms
#LocalAI is processed on your device, keeping all data private.
#CloudAI is processed on a server and requires internet access.https://app.therundown.ai/guides/how-to-replace-siri-with-a-free-local-model
-
How to Replace Siri with a Free Local Model
Explain the difference between local AI and cloud AI in simple terms
#LocalAI is processed on your device, keeping all data private.
#CloudAI is processed on a server and requires internet access.https://app.therundown.ai/guides/how-to-replace-siri-with-a-free-local-model
-
How to Replace Siri with a Free Local Model
Explain the difference between local AI and cloud AI in simple terms
#LocalAI is processed on your device, keeping all data private.
#CloudAI is processed on a server and requires internet access.https://app.therundown.ai/guides/how-to-replace-siri-with-a-free-local-model
-
How to Replace Siri with a Free Local Model
Explain the difference between local AI and cloud AI in simple terms
#LocalAI is processed on your device, keeping all data private.
#CloudAI is processed on a server and requires internet access.https://app.therundown.ai/guides/how-to-replace-siri-with-a-free-local-model
-
🧠 Google ha introdotto una tecnologia che permette di accelerare l’inferenza dei modelli #Gemma 4 fino a 3x senza compromettere qualità, accuratezza o capacità di ragionamento.
👉 I dettagli: https://www.linkedin.com/posts/alessiopomaro_gemma-llm-nvidia-activity-7458033392748519424-WGiy___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro -
-
Как Gemma и LangGraph написали законопроект победившего биопанка
Для специального бенчмарка мне потребовался нормативно-правовой документ с научной терминологией, перекрестными ссылками и набором сложных для векторизации имён. По традиции для подобных задач я использую тексты в жанре Киберпанк. Сразу вспомнил о «Манифесте Киберпанка» (слишком коротком для моей задачи) и Предложении 653 из «Видоизмененного углерода», у которого в реальности вообще нет текста. Делать подобный текст руками долго и довольно странно. В итоге решил совместить, опробовать агентную архитектуру для подготовки корпоративной «нетленки» и проверить, на что способна локальная модель в плане юридических и околонаучных текстов.
https://habr.com/ru/articles/1030684/
#text_generation #ollama #gemma #киберпанк #будущее #langgraph #agentic_ai #legal_ai
-
Как Gemma и LangGraph написали законопроект победившего биопанка
Для специального бенчмарка мне потребовался нормативно-правовой документ с научной терминологией, перекрестными ссылками и набором сложных для векторизации имён. По традиции для подобных задач я использую тексты в жанре Киберпанк. Сразу вспомнил о «Манифесте Киберпанка» (слишком коротком для моей задачи) и Предложении 653 из «Видоизмененного углерода», у которого в реальности вообще нет текста. Делать подобный текст руками долго и довольно странно. В итоге решил совместить, опробовать агентную архитектуру для подготовки корпоративной «нетленки» и проверить, на что способна локальная модель в плане юридических и околонаучных текстов.
https://habr.com/ru/articles/1030684/
#text_generation #ollama #gemma #киберпанк #будущее #langgraph #agentic_ai #legal_ai
-
Как Gemma и LangGraph написали законопроект победившего биопанка
Для специального бенчмарка мне потребовался нормативно-правовой документ с научной терминологией, перекрестными ссылками и набором сложных для векторизации имён. По традиции для подобных задач я использую тексты в жанре Киберпанк. Сразу вспомнил о «Манифесте Киберпанка» (слишком коротком для моей задачи) и Предложении 653 из «Видоизмененного углерода», у которого в реальности вообще нет текста. Делать подобный текст руками долго и довольно странно. В итоге решил совместить, опробовать агентную архитектуру для подготовки корпоративной «нетленки» и проверить, на что способна локальная модель в плане юридических и околонаучных текстов.
https://habr.com/ru/articles/1030684/
#text_generation #ollama #gemma #киберпанк #будущее #langgraph #agentic_ai #legal_ai
-
Как Gemma и LangGraph написали законопроект победившего биопанка
Для специального бенчмарка мне потребовался нормативно-правовой документ с научной терминологией, перекрестными ссылками и набором сложных для векторизации имён. По традиции для подобных задач я использую тексты в жанре Киберпанк. Сразу вспомнил о «Манифесте Киберпанка» (слишком коротком для моей задачи) и Предложении 653 из «Видоизмененного углерода», у которого в реальности вообще нет текста. Делать подобный текст руками долго и довольно странно. В итоге решил совместить, опробовать агентную архитектуру для подготовки корпоративной «нетленки» и проверить, на что способна локальная модель в плане юридических и околонаучных текстов.
https://habr.com/ru/articles/1030684/
#text_generation #ollama #gemma #киберпанк #будущее #langgraph #agentic_ai #legal_ai
-
Ich glaube, ich habe mit Gemma-4-26b-a4b das ideale Modell für den #MacMini gefunden. Bester Kompromiss aus Geschwindigkeit und Reife. Falls jemand einen noch besseren Vorschlag hat, gerne her damit.
-
Один разработчик, ноль строк кода — как я построил AI-систему, не умея программировать
20 000 строк кода. 9 Python-модулей. 8 JavaScript-файлов. 11 HTML-оверлеев для стримов. 16 таблиц в базе данных. 678 коллекций в базе знаний с почти 11 тысячами embeddings. Десктоп-приложение с установщиком, которое можно скачать с сайта. Telegram-бот с памятью на 30 дней. Twitch-бот с викторинами, модерацией и системой заказа музыки через YouTube. Я не написал ни одной строчки. Ни одной.
-
Один разработчик, ноль строк кода — как я построил AI-систему, не умея программировать
20 000 строк кода. 9 Python-модулей. 8 JavaScript-файлов. 11 HTML-оверлеев для стримов. 16 таблиц в базе данных. 678 коллекций в базе знаний с почти 11 тысячами embeddings. Десктоп-приложение с установщиком, которое можно скачать с сайта. Telegram-бот с памятью на 30 дней. Twitch-бот с викторинами, модерацией и системой заказа музыки через YouTube. Я не написал ни одной строчки. Ни одной.
-
Один разработчик, ноль строк кода — как я построил AI-систему, не умея программировать
20 000 строк кода. 9 Python-модулей. 8 JavaScript-файлов. 11 HTML-оверлеев для стримов. 16 таблиц в базе данных. 678 коллекций в базе знаний с почти 11 тысячами embeddings. Десктоп-приложение с установщиком, которое можно скачать с сайта. Telegram-бот с памятью на 30 дней. Twitch-бот с викторинами, модерацией и системой заказа музыки через YouTube. Я не написал ни одной строчки. Ни одной.
-
Один разработчик, ноль строк кода — как я построил AI-систему, не умея программировать
20 000 строк кода. 9 Python-модулей. 8 JavaScript-файлов. 11 HTML-оверлеев для стримов. 16 таблиц в базе данных. 678 коллекций в базе знаний с почти 11 тысячами embeddings. Десктоп-приложение с установщиком, которое можно скачать с сайта. Telegram-бот с памятью на 30 дней. Twitch-бот с викторинами, модерацией и системой заказа музыки через YouTube. Я не написал ни одной строчки. Ни одной.
-
- Job Postings For Software Engineers Are Rising? (US context, hard to read): https://www.citadelsecurities.com/news-and-insights/2026-global-intelligence-crisis/
- Gemma 4 Good Hackathon in progress: https://www.kaggle.com/competitions/gemma-4-good-hackathon/
- Bad Anthropic: HERMES.md in commit triggers higher billing: https://github.com/anthropics/claude-code/issues/53262
-
- Job Postings For Software Engineers Are Rising? (US context, hard to read): https://www.citadelsecurities.com/news-and-insights/2026-global-intelligence-crisis/
- Gemma 4 Good Hackathon in progress: https://www.kaggle.com/competitions/gemma-4-good-hackathon/
- Bad Anthropic: HERMES.md in commit triggers higher billing: https://github.com/anthropics/claude-code/issues/53262