home.social

#opensource_llm — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #opensource_llm, aggregated by home.social.

  1. Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

    За последний год я изучил десятки российских ИИ-стартапов на площадках Brainbox и Product Radar. Параллельно строил собственную AI-платформу, так что смотрю на рынок не как инвестор, а как инженер с 20-летним опытом в разработке. Картина неутешительная: большинство проектов, которые собирают деньги, будут мертвы через 2-3 года. И причины чисто технические.

    habr.com/ru/articles/1008142/

    #ИИстартапы #инвестиции_в_ИИ #opensource_LLM #DeepSeek #Qwen #архитектура_ИИагентов #суверенный_ИИ #импортозамещение #OpenAI_API_зависимость #LLMроутер

  2. [Перевод] Я vs. машина

    Прошёл примерно год с тех пор, как я начал активно использовать Claude Code для разработки, и, как я уже писал , это существенно изменило мои рабочие процессы. Продуктивность действительно выросла — но в основном по ощущениям, а они у меня примерно такие же надёжные, как мои эстимейты (то есть никакие, и лучше не станут). Так что я решил, что пора проверить своё чутьё абсолютно научно пуленепробиваемым способом (со статистически высокозначимой контрольной группой из меня , себя и моей собственной персоны ).

    habr.com/ru/articles/1000556/

    #claude_code #ииагенты #LLM #вайбкодинг #автоматизация_разработки #сравнение_моделей #opensource_LLM #codex #kimi

  3. Делай Bench: мой опыт слепого human-evalбенчмарка нейросетей для юристов

    Привет и с Новым годом, Хабр! Меня зовут Екатерина, я практикующий юрист, исследую эффективное применение нейросетей в юридических задачах. В декабре ушедшего года я провела необычный для себя и российского LegalTech-рынка эксперимент: с помощью одиннадцати коллег-оценщиков организовала небольшоенезависимое слепое сравнение пяти нейросетевых сервисов. В этой публикации хочу рассказать о вызовах human-eval бенчмарка в домене, где зачастую нет единственно правильных ответов, интересных выводах исследования, полученной мной обратной связи и дальнейших планах.

    habr.com/ru/articles/983640/

    #сезон_ии_в_разработке #бенчмарк #rag #llm #opensource_llm

  4. Maybe there will even be bad hot takes on the intersection of /#LLM and 😈 😬 😄


  5. Устойчивость к кибератакам российских больших языковых моделей с открытым исходным кодом

    Маленькая ремарка С появлением больших языковых моделей обществу был брошен вызов. Первые проблемы, с которыми пришлось столкнуться в области LLM, были связаны с тем, что

    habr.com/ru/companies/isp_ras/

    #Opensource_LLM #Multimodal_LLM #Attacks_on_LLM #Alignment_LLM #Adversarial_attacks #Backdoor_attacks #Trusted_AI_Research_Center_ISP_RAS