#llm — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #llm, aggregated by home.social.
-
The AI Gold Rush Is Eating Its Own - ByteHaven - Where I ramble about bytes https://blog.ppb1701.com/the-ai-gold-rush-is-eating-its-own #Wikipedia #AI #LLM
-
The Economics of AI Don’t Add Up
Money talks. Bullshit walks. Bubbles pop, and the world just keeps on burning while the big wheels just keep on turning. Pick a vibe. Pick a cliché. Pick a metaphor. Pick and mangle a song lyric. Just don’t try to pick a winner in the big AI race when it comes to dollars and cents. Or sense. The racers are running in circles, burning the planet and dollars trying to figure out how to keep things on a track no one has figured out quite yet.
Hint: It’s a circle, jerks.
From the beginning the hype about Artificial Intelligence has felt like it’s all about the vibes. So many vibes. I define “the beginning” as when OpenAI took the wraps off of ChatGPT and kick started the race. Maybe they should have just done a Kickstarter.
Those were heady days. I remember everyone thinking ChatGPT would replace Google. Now we’re at the point where Google is trying to replace itself.
Today, chatbots are replacing human connections, and all sorts of crustaceans are being installed on computers, causing some havoc in the hardware markets along the way. Things have now progressed to a point that folks are vibe coding up a storm, now that it seems more doable. And it’s interesting to see and hear some who were initially skeptical about the broad scope of AI now embracing it. For what it’s worth, the current vibe feels to me like AI is heading into its GUI phase of computing, only you need a keyboard or a microphone instead of a mouse to get around on a screen or without one.
And yet, when it comes to the money game, the vibe feels like the math behind all those 0’s and 1’s might not add up.
Corporations are starting to scale back usage now that the bills are coming in. Microsoft and other tech companies are pulling plugs, in most cases for third party access among the employees they haven’t let go. At the same time there’s whispers that AI costs are beginning to exceed the costs of human employees. Corporations are starting to adjust because the beans they are counting don’t look like they will add up and no one has vibe coded an accounting app yet to project when, of if they will.
Consumers are looking at that $20 month subscription cost and backing off while trying to choose which, if any, of the constantly updating models that still promise inaccuracy will give them the best monthly bang for a double sawbuck. To make the math sting even more, Google, OpenAI, Claude, etc… are tossing around $100 a month (and higher) plans for the latest and supposedly best features that make $20 a month feel like a poor man’s vibe.
There’s a technology intersection that has always been on the roadmap for computing technology since the dawn of the personal computer. To an extent, enterprise computing always subsidized consumer technology. The vibes I’m sensing hint that roadmap may be changing, and it won’t just affect the costs of using AI, computer memory, and chip production. It potentially may filter into every facet of life from medical bills, to insurance premiums, to any wholesale or retail concern that might employ AI. Don’t think for a minute that any company is going to simply eat the rising costs of AI usage, or cut back prices should using it somehow actually produce savings from cutting employees.
Call me when you hear the first company touting that they are cutting costs due to AI. Trust me, I won’t be waiting by the phone.
If a vibe has a bottom line, here’s how I see this one. We’re heading into a moment where what we think of as computing and the Internet is going to run on two diverging tracks. It’s becoming obvious that whether someone is running any of the AI robots on their own device or somewhere on the Internet that the costs are more than anyone could have predicted, or thought might become sustainable.
The $20 a month marker was a big hint early on. We were all used to the Internet come on of getting in free, being swamped with ads, and then having to eventually subscribe so our data could be collected. That $20 a month heralded a change, but only at the point of entry.
Given that we all know that advertising is coming to AI, we’re escaping the orbit that we’ve been in for quite some time that most of the Internet was free but required a level of tolerance for advertising. I’m guessing that those who can only afford the $20 a month price tag with ads will think back on the ways we’ve complained about the streaming entertainment services and their ad proliferation as quaint by comparison.
The Circle
That $20 entry fee will rise. So will the more expensive options. I’m actually surprised we haven’t see that already. The fact that AI has to continually train itself to remain relevant means it’s going to continue to need new computing cycles to consume whatever is generated in the future, whether by humans or robots. I don’t think you can build enough data centers on the surface of this planet, under the sea, or in space to afford the churn and burn. That’s the circle. In the end it’s a real estate play that yields only cul-de-sacs.
Take a look at this article from Simon Willison. Unlike my pessimistic vibe on this, Willison seems to think Anthropic and OpenAI have found their product-market fit. He’s spending $200 a month ($100 to each) and considers that a bargain since his usage of the two generated $2,180 change in token use for a month. That math certianly adds up as a good deal in the current moment. Until you consider that at some point the difference between what he’s paying and what he’s using is going to have to be put on somebody’s balance sheet in some way. These companies can’t run at a loss forever.
It’s a good piece by Willison that informs quite a bit on this discussion and worth your time, because I think that’s what the discussion is going to inevitably come down to. Set aside all of the debates about accuracy, copyright, and environmental issues. Set aside the rising consumer backlash. Bottom lines are where everything sinks to eventually.
I admire and am grateful for folks like Willison, Federico Viticci, and others who are exploring this frontier and think we should be paying attention to their efforts and learn from them. Viticci has crafted a few interesting bits of software of late and spent some coin in doing so. I’m enjoying reading about his efforts.
I may be wrong, but it feels like we might be headed to a point that to use some software in the future, we’re going to need one of these ever changing and increasingly expensive AI engines on our computers to run some of the software that will be generated in the future. That will certainly come with a price tag. If, actually in my opinion when that happens, it will become another border defined by costs, dividing users between those who can afford the entry fee, and those who can’t.
It will also affect far more than our computing lives.
(Image from Viktoria_P on Shutterstock)
You can also find more of my writings on a variety of topics on Medium at this link, including in the publications Ellemeno and Rome. I can also be found on social media under my name as above. This site does not use affilate links.
#ai #ArtificialIntelligence #ArtificialIntellignece #chatgpt #llm #Tech #technology -
> Because something new is possible, something that will increase wealth and power, those who have the capacity to bring it into being will. The statement of inevitability is a statement of the strong: we can do this and will do this […]
>
> When people on the Left attach themselves to the inevitability fetish, they are echoing the will and desire of the strong. -
> Because something new is possible, something that will increase wealth and power, those who have the capacity to bring it into being will. The statement of inevitability is a statement of the strong: we can do this and will do this […]
>
> When people on the Left attach themselves to the inevitability fetish, they are echoing the will and desire of the strong. -
The AI we want: magic machine that can automatically make decisions for what to eat and cook it for you.
The AI we get: the mirror from the sleeping beauty in chat form
-
How would you implement the ReAct pattern in Ruby?
Here is one way to implement the THOUGHT -> ACTION -> OBSERVATION -> loop.
Anthropic SDK + Faraday + JSON-schema tool defs. Claude Sonnet 4 at temperature 0.0 runs deterministic agents across web_search, image_search, save_to_file.
-
How would you implement the ReAct pattern in Ruby?
Here is one way to implement the THOUGHT -> ACTION -> OBSERVATION -> loop.
Anthropic SDK + Faraday + JSON-schema tool defs. Claude Sonnet 4 at temperature 0.0 runs deterministic agents across web_search, image_search, save_to_file.
-
How would you implement the ReAct pattern in Ruby?
Here is one way to implement the THOUGHT -> ACTION -> OBSERVATION -> loop.
Anthropic SDK + Faraday + JSON-schema tool defs. Claude Sonnet 4 at temperature 0.0 runs deterministic agents across web_search, image_search, save_to_file.
-
How would you implement the ReAct pattern in Ruby?
Here is one way to implement the THOUGHT -> ACTION -> OBSERVATION -> loop.
Anthropic SDK + Faraday + JSON-schema tool defs. Claude Sonnet 4 at temperature 0.0 runs deterministic agents across web_search, image_search, save_to_file.
-
Gemini-3.5-flash догнал GPT-5.5 на 97/S и в 2.5× дешевле. Но главное — китайцы выигрывают по цене и качеству
Месяц назад я писал про парадокс DeepSeek V4 Pro — модель проиграла собственному Flash и Qwen 3.6 Plus трёхнедельной давности. Сегодня прогнал свежий battle на пяти моделях — два американских флагмана и три китайских — и расклад снова поменялся. Главное: Gemini-3.5-flash взял 97/S, тот же балл, что у GPT-5.5, и в 2.5 раза дешевле. Google впервые на моём тесте встал рядом с OpenAI на длинном русском контенте. Tencent Hy3-preview даёт A-tier за $0.0017 за вызов — в 134 раза дешевле GPT-5.5. DeepSeek V4 Pro я прогнал третий раз — качество стоит на месте (87), но цена упала в 5.4× и она снова в зоне полезного. Qwen 3.7 Max упорно вставляет китайские иероглифы в русский текст — регрессия относительно собственной 3.6, где этой проблемы не было. По дороге заметил, что наша формула cost_per_call жила полгода с приближением, которое занижало стоимость на 50–140%. Починили — теперь берём реальные токены из OpenRouter response.usage . И отдельно — почему при такой скорости релизов модель в продукте стоит держать заменяемой, а не зашитой в код намертво.
https://habr.com/ru/articles/1040770/
#LLM #Gemini #gpt5 #DeepSeek #Qwen #Tencent #Benchmarks #AI #OpenRouter #Russian_NLP
-
AI and Compliance: The Most Boring Billion-Dollar Opportunity Nobody Is Talking About
The US compliance sector is massive, expanding rapidly, and heavily strained. It represents over $40 billion in annual labor spend with more than 400,000 officers. Despite ballooning teams, compliance work has remained stubbornly manual, bureaucratic, and paper-based (“schlep work”), leading to high employee churn (>20%) and massive backlogs (e.g., TD Bank’s $3B fine over a 70,000-alert backlog).
Here’s a weird data point:
Over the last 20 years, the fastest-growing occupation in the US was manicurists and pedicurists.Right behind it?
Compliance Officers.Not AI engineers. Not data scientists. Compliance officers.
That says something important about where the real work has been hiding.The Problem Nobody Wanted to Solve
Compliance is painful. Bureaucratic. Paper-heavy. Repetitive.
Every dollar that moves through a business — payroll, taxes, payments, customer communications — is subject to some regulation somewhere.
More people didn’t fix it.
More tools didn’t fix it.
The work remained stubbornly, embarrassingly manual.That’s the graveyard startups have been afraid to enter for decades.
So why is right now different?The Threshold Has Shifted
There’s a thing that happens with technology that doesn’t get talked about enough:
Sometimes the market for something done very well is 100x the market for something done just okay.Compliance is exactly that.
A 90% accurate product is still 100% wrong when you’re underwriting a mortgage or filing a suspicious activity report.OCR has existed for 30 years. It was never good enough to trust with compliance work. Vision Language Models (VLMs) are. They understand context. They make fewer errors. They can read a 400-page regulatory PDF and reason over it.
That’s not an incremental improvement.
That’s crossing a threshold.
And once you cross it, enterprises can’t sign contracts fast enough.Three Places AI Is Actually Winning Here
The compliance function is built from three ingredients:
- Regulation — rules, policies, and the endless translation between them
- Software — GRC platforms, screening tools, brittle automations to connect it all
- People — clicking between systems, copying data, filling out forms
AI is now attacking all three.
1. Turn Regulation Into Code
Right now, a new rule lands as a PDF.
Someone has to read it. Interpret it. Translate it into internal policy. Monitor it for changes. Update the team.That cycle takes quarters.
AI can convert a 400-page regulatory document into a structured, auto-updating, machine-readable set of obligations — in minutes.
Monitoring becomes continuous.
A regulatory change propagates across the organization in hours, not months.2. Replace the Legacy Systems
Most compliance infrastructure predates the cloud.
The integration layer between these systems isn’t software.
It’s a person.
Copying. Pasting. Clicking.
That person is now the biggest obstacle to AI adoption.You can’t layer AI on top of systems that were designed for humans to operate manually. The data is siloed. Rules are hardcoded. Workflows run in batches.
Example: Company X is replacing its one of the dominant transaction monitoring platforms. Their SAR (Suspicious Activity Report) agent automates 60–100 fields per entity, pulling from multiple systems. What used to take 30+ minutes per report now takes under a minute.
3. Augment the People Doing the Work
Not every company can rip and replace.
Not yet.But you can put agents on top of what exists.
Computer-use agents can navigate legacy software the way a human does.
Log in.
Pull data.
Cross-reference.
Write the report. Without waiting for an API or a six-month integration project.Why Enterprises Are Finally Buying
For years, the compliance function didn’t buy software.
Too risky.
Too painful to migrate.
Too much institutional knowledge baked into the manual process.That calculus has flipped.
Now the risk of not modernizing outweighs the risk of change.Faster KYC means faster onboarding — which means less drop-off and more revenue.
Better AML monitoring means fewer false positives — which means fewer good customers getting flagged.
Quicker marketing reviews mean your content actually reaches customers before the window closes.Compliance used to be a cost center.
It’s becoming a competitive advantage.The Bottom Line
This is one of those moments where the obvious opportunity is hiding behind a reputation for being boring.
400,000 compliance officers.
$40 billion in annual labor.
Backlogs stretching back years.
Fines in the billions when things go wrong.And the technology just crossed the threshold from “good enough to pilot” to “good enough to trust.”
The winning companies here will do all three: turn regulation into code, own the new system of record, and run a fleet of agents on top.
That’s not a compliance story.
That’s a platform story. That’s why you might want to talk with us at: EspressoLabsRate this:
#AgenticAI #Compliance #entrepreneurship #LLM #startups -
Анатомия Claude Code. Первичный анализ и наполнение контекста
Каждый, кто программирует с агентами (Claude Code, Codex и т.д.), знает: перед тем как приступить к задаче, агент исследует проект. Это кажется логичным, естественным и закономерным, ведь люди делают так же. Обычно говорят: «агент наполняет контекст». Для агента такой контекст должен содержать не только полезные сведения, но и не включать лишних, которые могут оказать влияние на конечный результат. Но добиться этого не так-то просто, поскольку: - задача определена в общем виде (кто знает, что имел в виду автор) - пути исследования не детерминированы (в общем виде не используется специфика фреймворка) - используются базовые инструменты (read, grep, cat, find) В итоге при первичном исследовании легко столкнуться с ситуацией, когда основной контекст заполнен сведениями, слабо относящимися к исходной задаче. В Anthropic быстро осознали эту проблему и вынесли всю описанную работу в Explore sub-agent. В результате основной agent ставит задачу промптом, Explore выбирает путь исследования, а результат формирует в виде отчета. Проблему чистоты основного контекста они, конечно, решили. Но что с качеством такого анализа? Наблюдая за работой Explore и видя, как агент, используя «примитивные» инструменты, в агонии пытаясь отыскать недостающее или, наоборот, пропускает важные сведения о проекте, невольно ловишь себя на мысли: «Как так вышло, что последние 10 лет развития индустрии инструментов прошли мимо agent?» А может, это человечество свернуло не туда?
https://habr.com/ru/companies/haulmont/articles/1040274/
#claudecode #aiагенты #llm #promptengineering #mcp #spring #springboot #java #developer_tools
-
AI jobs apocalypse canceled.
OpenAI CEO Sam Altman backtracks on his prediction about the job market.
https://time.com/article/2026/05/26/sam-altman-ai-job-losses-openAI-/
-
🚨 New Article - AI Can Mention the Oppressed and Still Strip Them of Agency
Focusing on Palestine, Iran, and platform moderation, it defines responsibility loss as the measurable weakening of grammatical traceability between harm and responsible agency.
🔗https://app.hackernoon.com/mobile/6a0b1298e3fb338333ad92d1
#LLM #MedicalNLP #LegalTech #MedTech #AIethics #AIgovernance #cryptoreg
#healthcare #ArtificialIntelligence #NLP #aifutures #lawstodon
#tech #agustinvstartari #linguistics #ai #LRM -
🚨 New Article - AI Can Mention the Oppressed and Still Strip Them of Agency
Focusing on Palestine, Iran, and platform moderation, it defines responsibility loss as the measurable weakening of grammatical traceability between harm and responsible agency.
🔗https://app.hackernoon.com/mobile/6a0b1298e3fb338333ad92d1
#LLM #MedicalNLP #LegalTech #MedTech #AIethics #AIgovernance #cryptoreg
#healthcare #ArtificialIntelligence #NLP #aifutures #lawstodon
#tech #agustinvstartari #linguistics #ai #LRM -
🚨 New Article - AI Can Mention the Oppressed and Still Strip Them of Agency
Focusing on Palestine, Iran, and platform moderation, it defines responsibility loss as the measurable weakening of grammatical traceability between harm and responsible agency.
🔗https://app.hackernoon.com/mobile/6a0b1298e3fb338333ad92d1
#LLM #MedicalNLP #LegalTech #MedTech #AIethics #AIgovernance #cryptoreg
#healthcare #ArtificialIntelligence #NLP #aifutures #lawstodon
#tech #agustinvstartari #linguistics #ai #LRM -
🚨 New Article - AI Can Mention the Oppressed and Still Strip Them of Agency
Focusing on Palestine, Iran, and platform moderation, it defines responsibility loss as the measurable weakening of grammatical traceability between harm and responsible agency.
🔗https://app.hackernoon.com/mobile/6a0b1298e3fb338333ad92d1
#LLM #MedicalNLP #LegalTech #MedTech #AIethics #AIgovernance #cryptoreg
#healthcare #ArtificialIntelligence #NLP #aifutures #lawstodon
#tech #agustinvstartari #linguistics #ai #LRM -
🚨 New Article - AI Can Mention the Oppressed and Still Strip Them of Agency
Focusing on Palestine, Iran, and platform moderation, it defines responsibility loss as the measurable weakening of grammatical traceability between harm and responsible agency.
🔗https://app.hackernoon.com/mobile/6a0b1298e3fb338333ad92d1
#LLM #MedicalNLP #LegalTech #MedTech #AIethics #AIgovernance #cryptoreg
#healthcare #ArtificialIntelligence #NLP #aifutures #lawstodon
#tech #agustinvstartari #linguistics #ai #LRM -
SaaS умирает? Я сравнил 8 публикаций Q1 2026 с тем, что вижу внутри Kaiten
Последние месяцы я вижу одну и ту же мысль: SaaS умирает, AI-агенты забирают работу из интерфейсов, а компании перестают платить за пользовательские лицензии. На первый взгляд кажется, что так и есть. Если агент может сам прочитать CRM, создать задачу, разобрать заявку, сходить в API и принести руководителю готовый статус, зачем держать десятки людей в системе? Пусть машина сама делает работу, а человек только проверяет. Но когда смотришь на это изнутри SaaS-продукта, картина выглядит по-другому. Я работаю в Kaiten — мы делаем платформу для задач, проектов, документов, заявок и процессов. То есть находимся ровно в той модели, которую сейчас принято хоронить. Последний год показал, что хоронить рано. Но и делать вид, что ничего не меняется, уже странно.
https://habr.com/ru/companies/kaiten/articles/1040650/
#SaaS #AIагенты #LLM #корпоративный_софт #автоматизация #управление_проектами #рабочие_процессы #продуктовая_разработка #B2B_SaaS #AI_в_бизнесе
-
🧠 #ElevenLabs presenta il nuovo modello per la generazione di tracce musicali: Music V2.
👉 I dettagli: https://www.linkedin.com/posts/alessiopomaro_elevenlabs-ai-ai-ugcPost-7465719888259756032-Myou/___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro -
🧠 #ElevenLabs presenta il nuovo modello per la generazione di tracce musicali: Music V2.
👉 I dettagli: https://www.linkedin.com/posts/alessiopomaro_elevenlabs-ai-ai-ugcPost-7465719888259756032-Myou/___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro -
🧠 #ElevenLabs presenta il nuovo modello per la generazione di tracce musicali: Music V2.
👉 I dettagli: https://www.linkedin.com/posts/alessiopomaro_elevenlabs-ai-ai-ugcPost-7465719888259756032-Myou/___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro -
🧠 #ElevenLabs presenta il nuovo modello per la generazione di tracce musicali: Music V2.
👉 I dettagli: https://www.linkedin.com/posts/alessiopomaro_elevenlabs-ai-ai-ugcPost-7465719888259756032-Myou/___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro -
🧠 #ElevenLabs presenta il nuovo modello per la generazione di tracce musicali: Music V2.
👉 I dettagli: https://www.linkedin.com/posts/alessiopomaro_elevenlabs-ai-ai-ugcPost-7465719888259756032-Myou/___
✉️ 𝗦𝗲 𝘃𝘂𝗼𝗶 𝗿𝗶𝗺𝗮𝗻𝗲𝗿𝗲 𝗮𝗴𝗴𝗶𝗼𝗿𝗻𝗮𝘁𝗼/𝗮 𝘀𝘂 𝗾𝘂𝗲𝘀𝘁𝗲 𝘁𝗲𝗺𝗮𝘁𝗶𝗰𝗵𝗲, 𝗶𝘀𝗰𝗿𝗶𝘃𝗶𝘁𝗶 𝗮𝗹𝗹𝗮 𝗺𝗶𝗮 𝗻𝗲𝘄𝘀𝗹𝗲𝘁𝘁𝗲𝗿: https://bit.ly/newsletter-alessiopomaro -
Everybody talks about logos, but replacing Mistral's 'Le Chat' with 'Vibe' had to be done by the management hit with a boring ray of sorts.
https://mistral.ai/news/vibe-agent/ -
HR-бот на базе RAG: архитектура корпоративной базы знаний для ресторанного холдинга
В ресторанном холдинге была внедрена система HR-бота на базе ИИ, которая работает поверх корпоративной базы знаний, учитывает роль сотрудника и предоставляет ответы со ссылками на актуальные документы. Основная задача проекта — заменить разрозненные FAQ, Wiki, документы и чаты единым интерфейсом доступа к корпоративным знаниям. Сотрудник может задать вопрос в свободной форме и получить ответ с учётом своей должности, прав доступа и актуальной версии документа.
https://habr.com/ru/articles/1040000/
#rag #hr_tech #корпоративная_база_знаний #aiбот #llm #postgresql #notion #rolebased_access_control #knowledge_management #ai_automation
-
Интеграция LLM в корпоративные приложения
Интеграция LLM повышает эффективность, автоматизирует рабочие процессы и улучшает качество принимаемых решений, но успех зависит от стратегии, исполнения и соответствия бизнес-целям.
До недавнего времени многие рассматривали большие языковые модели (БЛМ) в основном как игрушки...
#DST #DSTGlobal #ДСТ #ДСТГлобал #Интеграция #LLM #корпоративныеприложения #искусственныйинтеллект #RAG #языковыемодели
Источник: https://dstglobal.ru/club/1237-integracija-llm-v-korporativnye-prilozhenija
-
Закрытый контур + локальная LLM: как мы запустили AI-агента без интернета
Полтора года назад мы запустили AI-ассистента внутри «Первой Формы», чтобы он помогал сотрудникам компании выполнять рабочие процессы. Сегодня он отвечает на вопросы по регламентам, ищет документы, подсказывает по задачам, даже запускает проверку контрагентов и формирует КП. Всё это работает через большую языковую модель, а точнее — через набор моделей, потому что разные задачи требуют разного подхода: для быстрой классификации входящего запроса нужна одна, для развёрнутой генерации ответа — другая, для работы с длинным контекстом — третья. Модели живут в облаке, и это даёт свободу выбора. Инструменты, которыми агент пользуется, тоже ходят в интернет: поиск по документации обращается к облачным моделям векторизации текста, проверка контрагентов — к внешним сервисам вроде Контур.Фокуса и так далее. Агент обновляется из GitLab, CI/CD развозит изменения по стендам автоматически, мониторинг стекается в один дашборд. Нас это устраивало. Недавно заказчик из промышленного сектора обратился к нам с задачей: «У нас закрытый контур, интернета нет и доступа к облачным API — тоже. Единственное, что у нас есть — это сервер с локальной моделью и наша внутренняя инфраструктура. Хотим такого же ассистента, как у вас». В статье рассказываем, как мы с этим справились. Спойлер: не без приключений.
https://habr.com/ru/companies/1forma/articles/1040438/
#ai #llm #enterprise #ai_agent #bpm #автоматизация #автоматизация_процессов #onpremise #lowcode
-
Закрытый контур + локальная LLM: как мы запустили AI-агента без интернета
Полтора года назад мы запустили AI-ассистента внутри «Первой Формы», чтобы он помогал сотрудникам компании выполнять рабочие процессы. Сегодня он отвечает на вопросы по регламентам, ищет документы, подсказывает по задачам, даже запускает проверку контрагентов и формирует КП. Всё это работает через большую языковую модель, а точнее — через набор моделей, потому что разные задачи требуют разного подхода: для быстрой классификации входящего запроса нужна одна, для развёрнутой генерации ответа — другая, для работы с длинным контекстом — третья. Модели живут в облаке, и это даёт свободу выбора. Инструменты, которыми агент пользуется, тоже ходят в интернет: поиск по документации обращается к облачным моделям векторизации текста, проверка контрагентов — к внешним сервисам вроде Контур.Фокуса и так далее. Агент обновляется из GitLab, CI/CD развозит изменения по стендам автоматически, мониторинг стекается в один дашборд. Нас это устраивало. Недавно заказчик из промышленного сектора обратился к нам с задачей: «У нас закрытый контур, интернета нет и доступа к облачным API — тоже. Единственное, что у нас есть — это сервер с локальной моделью и наша внутренняя инфраструктура. Хотим такого же ассистента, как у вас». В статье рассказываем, как мы с этим справились. Спойлер: не без приключений.
https://habr.com/ru/companies/1forma/articles/1040438/
#ai #llm #enterprise #ai_agent #bpm #автоматизация #автоматизация_процессов #onpremise #lowcode
-
Закрытый контур + локальная LLM: как мы запустили AI-агента без интернета
Полтора года назад мы запустили AI-ассистента внутри «Первой Формы», чтобы он помогал сотрудникам компании выполнять рабочие процессы. Сегодня он отвечает на вопросы по регламентам, ищет документы, подсказывает по задачам, даже запускает проверку контрагентов и формирует КП. Всё это работает через большую языковую модель, а точнее — через набор моделей, потому что разные задачи требуют разного подхода: для быстрой классификации входящего запроса нужна одна, для развёрнутой генерации ответа — другая, для работы с длинным контекстом — третья. Модели живут в облаке, и это даёт свободу выбора. Инструменты, которыми агент пользуется, тоже ходят в интернет: поиск по документации обращается к облачным моделям векторизации текста, проверка контрагентов — к внешним сервисам вроде Контур.Фокуса и так далее. Агент обновляется из GitLab, CI/CD развозит изменения по стендам автоматически, мониторинг стекается в один дашборд. Нас это устраивало. Недавно заказчик из промышленного сектора обратился к нам с задачей: «У нас закрытый контур, интернета нет и доступа к облачным API — тоже. Единственное, что у нас есть — это сервер с локальной моделью и наша внутренняя инфраструктура. Хотим такого же ассистента, как у вас». В статье рассказываем, как мы с этим справились. Спойлер: не без приключений.
https://habr.com/ru/companies/1forma/articles/1040438/
#ai #llm #enterprise #ai_agent #bpm #автоматизация #автоматизация_процессов #onpremise #lowcode
-
Закрытый контур + локальная LLM: как мы запустили AI-агента без интернета
Полтора года назад мы запустили AI-ассистента внутри «Первой Формы», чтобы он помогал сотрудникам компании выполнять рабочие процессы. Сегодня он отвечает на вопросы по регламентам, ищет документы, подсказывает по задачам, даже запускает проверку контрагентов и формирует КП. Всё это работает через большую языковую модель, а точнее — через набор моделей, потому что разные задачи требуют разного подхода: для быстрой классификации входящего запроса нужна одна, для развёрнутой генерации ответа — другая, для работы с длинным контекстом — третья. Модели живут в облаке, и это даёт свободу выбора. Инструменты, которыми агент пользуется, тоже ходят в интернет: поиск по документации обращается к облачным моделям векторизации текста, проверка контрагентов — к внешним сервисам вроде Контур.Фокуса и так далее. Агент обновляется из GitLab, CI/CD развозит изменения по стендам автоматически, мониторинг стекается в один дашборд. Нас это устраивало. Недавно заказчик из промышленного сектора обратился к нам с задачей: «У нас закрытый контур, интернета нет и доступа к облачным API — тоже. Единственное, что у нас есть — это сервер с локальной моделью и наша внутренняя инфраструктура. Хотим такого же ассистента, как у вас». В статье рассказываем, как мы с этим справились. Спойлер: не без приключений.
https://habr.com/ru/companies/1forma/articles/1040438/
#ai #llm #enterprise #ai_agent #bpm #автоматизация #автоматизация_процессов #onpremise #lowcode
-
🔥 Hot take: The best AI engineers in 2026 are not ML researchers — they're Full-Stack devs who understand data pipelines, APIs, and UX.
You don't need a PhD. You need:
✅ Strong TypeScript
✅ Understanding of embeddings
✅ API design skills
✅ Good prompting intuitionThe stack wins the war.
-
🔥 Hot take: The best AI engineers in 2026 are not ML researchers — they're Full-Stack devs who understand data pipelines, APIs, and UX.
You don't need a PhD. You need:
✅ Strong TypeScript
✅ Understanding of embeddings
✅ API design skills
✅ Good prompting intuitionThe stack wins the war.
-
Пишем Java-скрипт, который собирает проект в один файл для контекста в чат DeepSeek или другие LLM
У нейросетей есть ограничение на количество символов в чате или на число запросов. И бывает так, что лимит уже закончился, а разработка проекта — нет. Тогда приходится открывать новый чат и заново напоминать контекст: что за проект, какая структура, какие файлы важны, где уже были изменения. Обычно это сводится к ручному копированию кода, а это долго и неудобно. Отдельная проблема — DeepSeek не всегда понимает ссылки на репозиторий и не смотрит код по ним так, как хотелось бы. Зато если дать ему сам контекст кода текстом, он включает его в анализ.
https://habr.com/ru/articles/1040420/
#DeepSeek #LLM #Java #контекст #developer_tools #автоматизация #ChatGPT