#jsonl — Public Fediverse posts
Live and recent posts from across the Fediverse tagged #jsonl, aggregated by home.social.
-
Как я перестал бояться и полюбил MCP или Зачем я написал 4 MCP‑сервера и протокол для их связи
Привет! Вы знаете как это бывает — начинаешь делать одну штуку, а потом просыпаешься через неделю и понимаешь, что написал четыре MCP‑сервера, подключил к ним шедулер, собрал автоматический конвеер для трёх Telegram‑каналов и изобрёл собственную спецификацию для связывания всего этого добра. Классика. Для тех кто не в теме: MCP (Model Context Protocol) — это протокол, через который AI‑ассистенты типа Claude подключаются к внешним сервисам и работают с ними напрямую. По сути это «руки» для нейросетей. Подключил MCP — и ИИ сам ходит в Telegram, ищет лучшие картинки с промптами на Civitai, управляет рекламой в Яндекс.Директе и делает кучу всего полезного. Без костылей, без скриптов‑прослоек, напрямую. В этой статье расскажу почему готовые MCP‑серверы меня не устроили, какие задачи я сейчас решаю с помощью своих, и зачем мне пришлось изобрести целый протокол чтобы эти серверы начали видеть друг друга.
https://habr.com/ru/articles/1019652/
#MCP #Model_Context_Protocol #TRAIL #Claude #AIагенты #автоматизация #оркестрация #нейросети #playwright #JSONL
-
Как я перестал бояться и полюбил MCP или Зачем я написал 4 MCP‑сервера и протокол для их связи
Привет! Вы знаете как это бывает — начинаешь делать одну штуку, а потом просыпаешься через неделю и понимаешь, что написал четыре MCP‑сервера, подключил к ним шедулер, собрал автоматический конвеер для трёх Telegram‑каналов и изобрёл собственную спецификацию для связывания всего этого добра. Классика. Для тех кто не в теме: MCP (Model Context Protocol) — это протокол, через который AI‑ассистенты типа Claude подключаются к внешним сервисам и работают с ними напрямую. По сути это «руки» для нейросетей. Подключил MCP — и ИИ сам ходит в Telegram, ищет лучшие картинки с промптами на Civitai, управляет рекламой в Яндекс.Директе и делает кучу всего полезного. Без костылей, без скриптов‑прослоек, напрямую. В этой статье расскажу почему готовые MCP‑серверы меня не устроили, какие задачи я сейчас решаю с помощью своих, и зачем мне пришлось изобрести целый протокол чтобы эти серверы начали видеть друг друга.
https://habr.com/ru/articles/1019652/
#MCP #Model_Context_Protocol #TRAIL #Claude #AIагенты #автоматизация #оркестрация #нейросети #playwright #JSONL
-
Как я перестал бояться и полюбил MCP или Зачем я написал 4 MCP‑сервера и протокол для их связи
Привет! Вы знаете как это бывает — начинаешь делать одну штуку, а потом просыпаешься через неделю и понимаешь, что написал четыре MCP‑сервера, подключил к ним шедулер, собрал автоматический конвеер для трёх Telegram‑каналов и изобрёл собственную спецификацию для связывания всего этого добра. Классика. Для тех кто не в теме: MCP (Model Context Protocol) — это протокол, через который AI‑ассистенты типа Claude подключаются к внешним сервисам и работают с ними напрямую. По сути это «руки» для нейросетей. Подключил MCP — и ИИ сам ходит в Telegram, ищет лучшие картинки с промптами на Civitai, управляет рекламой в Яндекс.Директе и делает кучу всего полезного. Без костылей, без скриптов‑прослоек, напрямую. В этой статье расскажу почему готовые MCP‑серверы меня не устроили, какие задачи я сейчас решаю с помощью своих, и зачем мне пришлось изобрести целый протокол чтобы эти серверы начали видеть друг друга.
https://habr.com/ru/articles/1019652/
#MCP #Model_Context_Protocol #TRAIL #Claude #AIагенты #автоматизация #оркестрация #нейросети #playwright #JSONL
-
Как я перестал бояться и полюбил MCP или Зачем я написал 4 MCP‑сервера и протокол для их связи
Привет! Вы знаете как это бывает — начинаешь делать одну штуку, а потом просыпаешься через неделю и понимаешь, что написал четыре MCP‑сервера, подключил к ним шедулер, собрал автоматический конвеер для трёх Telegram‑каналов и изобрёл собственную спецификацию для связывания всего этого добра. Классика. Для тех кто не в теме: MCP (Model Context Protocol) — это протокол, через который AI‑ассистенты типа Claude подключаются к внешним сервисам и работают с ними напрямую. По сути это «руки» для нейросетей. Подключил MCP — и ИИ сам ходит в Telegram, ищет лучшие картинки с промптами на Civitai, управляет рекламой в Яндекс.Директе и делает кучу всего полезного. Без костылей, без скриптов‑прослоек, напрямую. В этой статье расскажу почему готовые MCP‑серверы меня не устроили, какие задачи я сейчас решаю с помощью своих, и зачем мне пришлось изобрести целый протокол чтобы эти серверы начали видеть друг друга.
https://habr.com/ru/articles/1019652/
#MCP #Model_Context_Protocol #TRAIL #Claude #AIагенты #автоматизация #оркестрация #нейросети #playwright #JSONL
-
JSONL y su Importancia en el Man…
El formato JSONL (JSON Lines) es una variante del formato JSON que permite almacenar grandes volúmenes de datos en un archivo, donde cada línea representa un objeto JSON.
https://norvik.tech/news/analisis-jsonl-formato-linea-por-linea-datasets-ai
#Technology #Jsonl #Datasets #Ai #ManejoDeDatos #NorvikTech #DesarrolloSoftware #TechInnovation
-
✨Oh, great! Another revolutionary tool to dig through your digital trash can, aka ~/.claude sessions, to unearth files you probably didn't even want to keep. 🚀 Because nothing says "efficient" like #JSONL transcripts and a #GitHub repo that's as useful as a screen door on a submarine. 🐙🔍
https://github.com/hjtenklooster/claude-file-recovery #digitaltools #innovation #techhumor #dataorganization #HackerNews #ngated -
#成年後見制度 の闇をGPTデータに加えるため、#OpenAi にフォードバックを送った。#jsonl #ChatGPT
https://chatgpt.com/share/68c87bef-9528-800b-ae36-b8c1a1ee9671
-
🔍 So, you've built a tool to analyze your own coding insecurities, but disguised it as a #JSONL file inspector? 😂 Bravo! 🚀 Meanwhile, #GitHub is still trying to convince you that #AI will fix your spaghetti code. 🍝🤖
https://github.com/ryoppippi/ccusage #codinginsecurities #spaghettiCode #developerhumor #HackerNews #ngated -
Ccusage: A CLI tool for analyzing Claude Code usage from local JSONL files
https://github.com/ryoppippi/ccusage
#HackerNews #Ccusage #CLI #tool #JSONL #analysis #ClaudeCode #techtools
-
Ccusage: A CLI tool for analyzing Claude Code usage from local JSONL files
https://github.com/ryoppippi/ccusage
#HackerNews #Ccusage #CLI #tool #JSONL #analysis #ClaudeCode #techtools
-
Ccusage: A CLI tool for analyzing Claude Code usage from local JSONL files
https://github.com/ryoppippi/ccusage
#HackerNews #Ccusage #CLI #tool #JSONL #analysis #ClaudeCode #techtools
-
Ccusage: A CLI tool for analyzing Claude Code usage from local JSONL files
https://github.com/ryoppippi/ccusage
#HackerNews #Ccusage #CLI #tool #JSONL #analysis #ClaudeCode #techtools
-
Ccusage: A CLI tool for analyzing Claude Code usage from local JSONL files
https://github.com/ryoppippi/ccusage
#HackerNews #Ccusage #CLI #tool #JSONL #analysis #ClaudeCode #techtools
-
Prepping data for AI feels a bit like meal prep…
Except your dinner is a .jsonl file and your customer is a llama. 🐪I’m learning the ropes of AI training, starting with how to turn raw .txt into structured data for LLMs.
🎥 How to Feed Your Llama is live:
https://www.youtube.com/watch?v=YB9cVyjV9Bo#AI #LLM #JSONL #FineTuning #Python #LearningInPublic #LLaMA #Mistral
-
The #wasm build of #sqlite opens up great new possibilities in the #browser, especially when coupled with the Origin Private File System (#opfs). I've used it to implement importing huge #csv or #jsonl #datasets right in the browser. Import, validate, search, edit, close the browser and continue tomorrow, stream the database (with on-the-fly compression!) to the server when ready – it's all possible!
Another interesting use case I came across today: use it in #golang to get rid of #cgo!
[1/2]
-
Fed up with calculating dataset splits (e.g. train, validation, test, dev, silly, etc) for multiple classes to make sure they're balanced? Me too.
I built a tool to help me:
https://sbrl.github.io/research-smflooding/dataset-split-calculator.html
Put 1 integer value per line.
It even spits out shell commands to cut lines-based files (e.g. jsonl, csv, etc) into separate files!
May write a proper blog post soon!
#AI #DataScience #BigData #Automation #JSONL #CSV #Bash / #Shell #Scripts #AreAwesome
-
Q: Can I fine-tune #ChatGPT using #SPARQL such that it basically becomes a #SmartAgent capable of querying across the massive #LODCloud #KnowledgeGraph, using natural language?
Yes!
Read: https://community.openlinksw.com/t/howto-chat-gpt-and-dbpedia-sparql-query-generation-from-natural-language-prompts/3823 -- which covers a basic example using #DBpedia (#Wikidata content in machine-computable and queryable form).
#SemanticWeb #LinkedData #JSONL #RDF #LLMs #DBpedia #VirtuosoRDBMS #JSONL
-
TIL about https://jsonlines.org/ , a newline-delimited JSON format that _jq_ understands as input. Looks much better than CSV for when you need a line-oriented structured text format.
#json #jq #jsonl -
I never bothered with optimizing the parsing of #jsonl #ndjson files because in most cases it was an one off task before I put the data into a database or parquet file. But the files got bigger and waiting 20 minutes for the data to load made me reconsider my decision. So tried some different approaches.
Tested with a 1.7 GB file of 300 k Tweets.
jsonlines.reader: 17.2 seconds 100%
orjson: 6.49 seconds 37%
msgspec: 3.06 seconds 17%I like how orjson cuts the time by two thirds without the need to change anything else. Just use it as a drop in replacement and you are good.
msgspec is twice as fast as orjson or six times as fast as jsonlines if you define the schema of the data that you want. For Tweets that's okay, as I can reuse the schema many times. With data that is used only once, I prefer orjson.
Memory usage was nearly identical across the different solutions. Probably because they all parse the data per line. I restarted the kernel each time to get comparable numbers.
Load time for all 23 million Tweets in the dataset was reduced from 25 to 4 minutes.
This blogposts was useful to me: https://pythonspeed.com/articles/faster-python-json-parsing/ #Python #DataEngineering