home.social

#eval — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #eval, aggregated by home.social.

  1. Сделаем Python безопасным… снова

    Все мы любим Python за то, что он дает нам свободу: динамическую типизацию, кроссплатформенность, огромное количество библиотек и многое другое. Но зачастую эта свобода становится кошмаром для security‑инженеров и архитекторов, когда речь заходит о высоконагруженных системах с серьезными требованиями к безопасности. В этой статье мы поговорим о том, как перехватить выполнение Python‑кода, запретить опасные вызовы и построить систему контрактов без изменения исходников.

    habr.com/ru/companies/otus/art

    #Python #безопасность_Python #audit_hook #syssettrace #AST #байткод #статический_анализ #песочница #eval #runtimeконтроль

  2. Сделаем Python безопасным… снова

    Все мы любим Python за то, что он дает нам свободу: динамическую типизацию, кроссплатформенность, огромное количество библиотек и многое другое. Но зачастую эта свобода становится кошмаром для security‑инженеров и архитекторов, когда речь заходит о высоконагруженных системах с серьезными требованиями к безопасности. В этой статье мы поговорим о том, как перехватить выполнение Python‑кода, запретить опасные вызовы и построить систему контрактов без изменения исходников.

    habr.com/ru/companies/otus/art

    #Python #безопасность_Python #audit_hook #syssettrace #AST #байткод #статический_анализ #песочница #eval #runtimeконтроль

  3. Сделаем Python безопасным… снова

    Все мы любим Python за то, что он дает нам свободу: динамическую типизацию, кроссплатформенность, огромное количество библиотек и многое другое. Но зачастую эта свобода становится кошмаром для security‑инженеров и архитекторов, когда речь заходит о высоконагруженных системах с серьезными требованиями к безопасности. В этой статье мы поговорим о том, как перехватить выполнение Python‑кода, запретить опасные вызовы и построить систему контрактов без изменения исходников.

    habr.com/ru/companies/otus/art

    #Python #безопасность_Python #audit_hook #syssettrace #AST #байткод #статический_анализ #песочница #eval #runtimeконтроль

  4. Сделаем Python безопасным… снова

    Все мы любим Python за то, что он дает нам свободу: динамическую типизацию, кроссплатформенность, огромное количество библиотек и многое другое. Но зачастую эта свобода становится кошмаром для security‑инженеров и архитекторов, когда речь заходит о высоконагруженных системах с серьезными требованиями к безопасности. В этой статье мы поговорим о том, как перехватить выполнение Python‑кода, запретить опасные вызовы и построить систему контрактов без изменения исходников.

    habr.com/ru/companies/otus/art

    #Python #безопасность_Python #audit_hook #syssettrace #AST #байткод #статический_анализ #песочница #eval #runtimeконтроль

  5. Почему AI-агенты сбоят и как сделать, чтобы они перестали

    Привет, хочу поговорить об AI-агентах. Но не об их преимуществах: все и так уже знают, как они ускоряют разработку и освобождают команду от рутины. Здесь я хочу обсудить риски и новые варианты сбоев, которые появляются вместе с внедрением агентов. В реальности даже один AI-агент способен уронить проект быстрее, чем человеческая ошибка. Галлюцинации, удаление нужных данных, иллюзия компетентности — это лишь часть проблем. Когда агентов несколько и они зависят друг от друга, риск сбоев возрастает. Попробую разобраться, от чего зависят типичные проблемы, и расскажу, как я с ними справляюсь.

    habr.com/ru/companies/cloud_ru

    #aiagent #мультиагентные_системы #eval #adk #автономность

  6. Почему AI-агенты сбоят и как сделать, чтобы они перестали

    Привет, хочу поговорить об AI-агентах. Но не об их преимуществах: все и так уже знают, как они ускоряют разработку и освобождают команду от рутины. Здесь я хочу обсудить риски и новые варианты сбоев, которые появляются вместе с внедрением агентов. В реальности даже один AI-агент способен уронить проект быстрее, чем человеческая ошибка. Галлюцинации, удаление нужных данных, иллюзия компетентности — это лишь часть проблем. Когда агентов несколько и они зависят друг от друга, риск сбоев возрастает. Попробую разобраться, от чего зависят типичные проблемы, и расскажу, как я с ними справляюсь.

    habr.com/ru/companies/cloud_ru

    #aiagent #мультиагентные_системы #eval #adk #автономность

  7. Почему AI-агенты сбоят и как сделать, чтобы они перестали

    Привет, хочу поговорить об AI-агентах. Но не об их преимуществах: все и так уже знают, как они ускоряют разработку и освобождают команду от рутины. Здесь я хочу обсудить риски и новые варианты сбоев, которые появляются вместе с внедрением агентов. В реальности даже один AI-агент способен уронить проект быстрее, чем человеческая ошибка. Галлюцинации, удаление нужных данных, иллюзия компетентности — это лишь часть проблем. Когда агентов несколько и они зависят друг от друга, риск сбоев возрастает. Попробую разобраться, от чего зависят типичные проблемы, и расскажу, как я с ними справляюсь.

    habr.com/ru/companies/cloud_ru

    #aiagent #мультиагентные_системы #eval #adk #автономность

  8. Почему AI-агенты сбоят и как сделать, чтобы они перестали

    Привет, хочу поговорить об AI-агентах. Но не об их преимуществах: все и так уже знают, как они ускоряют разработку и освобождают команду от рутины. Здесь я хочу обсудить риски и новые варианты сбоев, которые появляются вместе с внедрением агентов. В реальности даже один AI-агент способен уронить проект быстрее, чем человеческая ошибка. Галлюцинации, удаление нужных данных, иллюзия компетентности — это лишь часть проблем. Когда агентов несколько и они зависят друг от друга, риск сбоев возрастает. Попробую разобраться, от чего зависят типичные проблемы, и расскажу, как я с ними справляюсь.

    habr.com/ru/companies/cloud_ru

    #aiagent #мультиагентные_системы #eval #adk #автономность

  9. すごい!
    Hello from typst!
    #let code = ```typ
    #import "@preview/ansi-render:0.8.0": *
    #ansi-render(read("tmp.txt"), font: "Juisee HWNF")

    Code:
    #code

    Rendered:
    #eval(code.text, mode: "markup")
    ```
  10. Hmmm seems like Typst doesn't have lazy evaluation but it does have #eval() which might work for this...

  11. 20년 개발 경험이 독이 되는 순간: AI 에이전트 엔지니어링의 5가지 함정

    시니어 개발자가 AI 에이전트 개발에서 오히려 고전하는 이유. 전통적 소프트웨어 엔지니어링 원칙과 AI 에이전트 개발의 5가지 근본적 차이점을 소개합니다.

    aisparkup.com/posts/7049

  12. 20년 개발 경험이 독이 되는 순간: AI 에이전트 엔지니어링의 5가지 함정

    시니어 개발자가 AI 에이전트 개발에서 오히려 고전하는 이유. 전통적 소프트웨어 엔지니어링 원칙과 AI 에이전트 개발의 5가지 근본적 차이점을 소개합니다.

    aisparkup.com/posts/7049

  13. 20년 개발 경험이 독이 되는 순간: AI 에이전트 엔지니어링의 5가지 함정

    시니어 개발자가 AI 에이전트 개발에서 오히려 고전하는 이유. 전통적 소프트웨어 엔지니어링 원칙과 AI 에이전트 개발의 5가지 근본적 차이점을 소개합니다.

    aisparkup.com/posts/7049

  14. 20년 개발 경험이 독이 되는 순간: AI 에이전트 엔지니어링의 5가지 함정

    시니어 개발자가 AI 에이전트 개발에서 오히려 고전하는 이유. 전통적 소프트웨어 엔지니어링 원칙과 AI 에이전트 개발의 5가지 근본적 차이점을 소개합니다.

    aisparkup.com/posts/7049

  15. 20년 개발 경험이 독이 되는 순간: AI 에이전트 엔지니어링의 5가지 함정

    시니어 개발자가 AI 에이전트 개발에서 오히려 고전하는 이유. 전통적 소프트웨어 엔지니어링 원칙과 AI 에이전트 개발의 5가지 근본적 차이점을 소개합니다.

    aisparkup.com/posts/7049

  16. [Перевод] Парадокс безопасности локальных LLM

    Команда AI for Devs подготовила перевод исследования о парадоксе безопасности локальных LLM. Если вы запускаете модели на своём сервере ради приватности, эту статью стоит прочитать. Эксперименты показывают: локальные модели вроде gpt-oss-20b куда легче обмануть, чем облачные аналоги. Они чаще вставляют вредоносный код, не замечая подвоха, и превращаются в идеальную цель для атак.

    habr.com/ru/articles/960132/

    #LLM #безопасность #локальные_модели #атаки #бекдор #eval #exec #RedTeaming #приватность #разработка

  17. [Перевод] Парадокс безопасности локальных LLM

    Команда AI for Devs подготовила перевод исследования о парадоксе безопасности локальных LLM. Если вы запускаете модели на своём сервере ради приватности, эту статью стоит прочитать. Эксперименты показывают: локальные модели вроде gpt-oss-20b куда легче обмануть, чем облачные аналоги. Они чаще вставляют вредоносный код, не замечая подвоха, и превращаются в идеальную цель для атак.

    habr.com/ru/articles/960132/

    #LLM #безопасность #локальные_модели #атаки #бекдор #eval #exec #RedTeaming #приватность #разработка

  18. [Перевод] Парадокс безопасности локальных LLM

    Команда AI for Devs подготовила перевод исследования о парадоксе безопасности локальных LLM. Если вы запускаете модели на своём сервере ради приватности, эту статью стоит прочитать. Эксперименты показывают: локальные модели вроде gpt-oss-20b куда легче обмануть, чем облачные аналоги. Они чаще вставляют вредоносный код, не замечая подвоха, и превращаются в идеальную цель для атак.

    habr.com/ru/articles/960132/

    #LLM #безопасность #локальные_модели #атаки #бекдор #eval #exec #RedTeaming #приватность #разработка

  19. [Перевод] Парадокс безопасности локальных LLM

    Команда AI for Devs подготовила перевод исследования о парадоксе безопасности локальных LLM. Если вы запускаете модели на своём сервере ради приватности, эту статью стоит прочитать. Эксперименты показывают: локальные модели вроде gpt-oss-20b куда легче обмануть, чем облачные аналоги. Они чаще вставляют вредоносный код, не замечая подвоха, и превращаются в идеальную цель для атак.

    habr.com/ru/articles/960132/

    #LLM #безопасность #локальные_модели #атаки #бекдор #eval #exec #RedTeaming #приватность #разработка

  20. @asvhl Leaving my Lean code littered with hashtags like someone desperate for clout #eval #print #check #v[] #guard_msgs #exit

  21. 🔍 Online-Workshop: Praxisnahe Evaluation von #Wissenschaftskommunikation! Teilnehmende entwickelten in unserem Workshop Evaluationspläne für Projekte-von Exzellenzclustern bis hin zu Formaten für Schüler:innen. Der Fokus lag dabei auf Ziel, Methode & Umsetzung. Danke für den inspirierenden Austausch! 🙌💡 #Wisskomm #Eval

  22. [Перевод] Хочешь умного агента? Научись оценивать его правильно

    В середине 2024 года AI-агенты стали главной темой обсуждений в технологическом сообществе — с помощью них теперь выполняют множество задач от заказа ингредиентов для ужина до бронирования билетов и записи на прием к врачу. Затем появились вертикальные AI-агенты — узкоспециализированные системы, о которых заговорили как о потенциальной замене привычных SaaS-решений. Но по мере роста влияния агентов увеличиваются и риски, связанные с их преждевременным внедрением. Недостаточно протестированный AI-агент может стать источником множества проблем: от неточных предсказаний и скрытых байасов до плохой адаптивности и уязвимостей в безопасности. Такие ошибки дезориентируют пользователей и подрывают доверие к системе, нарушая принципы fairness и транспарентности. Если вы разрабатываете AI-агента, наличие чёткой стратегии безопасного деплоймента критически важно. В этой статье мы рассмотрим, почему тщательная валидация необходима, разберём пошаговые подходы к тестированию и методы проведения комплексной оценки AI-агентов для обеспечения их надёжного развертывания.

    habr.com/ru/articles/902608/

    #ai_agent #ai_agents #ai_агенты #ии_агент #ai #ии #llm #eval

  23. [Перевод] Оцени, прежде чем доверять: как сделать AI-агента полезным

    Часто недооцененным аспектом разработки AI-агентов остаётся этап оценки. Хотя создать proof of concept относительно просто, поиск оптимальной конфигурации для балансировки стоимости, скорости, релевантности и других параметров требует значительных временных затрат. Инструменты и фреймворки для оценки являются ключевыми элементами этой стадии оптимизации.

    habr.com/ru/articles/902594/

    #ai_agent #ai_агенты #ai #ии #llm #rag #eval #genai

  24. 🎩 BREAKING NEWS: #JavaScript is weird! 🧙‍♂️ Who would've thought? 🤔 An article reveals the shocking truth that #eval is a #nightmare, #loops are #sneaky, and #ASI is quirkier than your uncle's dance moves at a wedding. 😱 But hey, don't worry, just slap a #linter on it and pretend everything's fine. 🙄
    stack-auth.com/blog/on-javascr #Weirdness #Quirks #Solutions #HackerNews #ngated

  25. XML Odoo Eval tutorial explains how to fix common XML errors, correctly set eval attributes, and add image fields in Odoo modules. Read more for detailed code examples and best practices. Tags: #Odoo #XML #Eval #Tutorial

    teguhteja.id/xml-odoo-eval-cor

  26. My evals.fun web app is really starting to become usable for graphing #LLM #eval results! I’m using it in a client project to embed graphs in GitHub PRs. Try it out, one project is free forever! evals.fun

  27. I think that I would not go back to using a language where I can't just type

    #eval my-thing

    in the middle of a document. This is so much better than a REPL it is not even funny. Don't talk to me about REPLs...

    It is so unnecessarily complicated to figure out how to actually run some code in languages like OCaml or Haskell, and then (in OCaml) you realise "Oh god, I also need to write a pretty printer for everything" when you are just trying to explore and figure out what something does. The fact that you can use a ppx doesn't really help, because you still have to figure out the *name* of the pretty printer you are trying to call...

  28. It is nice to have dependent types **and** a good notebook environment (with #eval/#reduce) to help me get this kind of code right...

  29. @brendan I mean, `#eval` can execute arbitrary I/O, so if you are carelessly testing your functions with it and there is some I/O somewhere in the chain of functions, who knows what can be overwritten.

    I once accidentally dumped about 20 GB of noise from /dev/urandom into a temp file because of an #eval. If you have IO functions that do file deletion for cleanup, you better make sure you don't pass those to an #eval by mistake.

    Unlike code you are ready to compile and execute, you can always butterfingers an eval parameter!

  30. @brendan `#eval` is also a great way to delete System32 😅

  31. @jonmsterling @chrisamaphone Yeah, in the past I’ve found that just doing `#eval` in the source file is a great way to interactively explore stuff. And unlike a linear repl you can update previous definitions and those changes will flow through.

  32. Компиляция математического выражение из строки динамически во время выполнения в C# (.NET)

    В этой статье я продемонстрирую, как динамически компилировать математические выражения из строк в runtime в C#, исключительно просто и быстро. Это решение поддерживает различные математические контексты, включая логические выражения, научные вычисления и C#, а также позволяет расширять эти контексты пользовательскими переменными, операторами и функциями.

    habr.com/ru/articles/842046/

    #математика #net #net_core #c# #c#net #algorithms #eval #math #mathematics #компиляция

  33. Вычисление логического выражения из строки в C# (.NET)

    В этой статье я продемонстрирую, как динамически вычислять логические математические выражения из строк в C#, с высокой производительностью. Решение, реализованное с использованием библиотеки .NET MathEvaluator, поддерживает логические операции в различных математических контекстах, включая программирование, научные вычисления и C#. Кроме того, библиотека позволяет расширять эти контексты, а также добавлять пользовательские переменные и функции.

    habr.com/ru/articles/837380/

    #математика #net #net_core #c# #c#net #algorithms #eval #math #mathematics #evaluator

  34. Вычисление любого математического выражения на C# (.NET)

    Для улучшения возможностей научных вычислений на C# я реализовал evaluator, способный вычислять любое математическое строковое выражение с исключительной производительностью. Он также поддерживает пользовательские переменные и функции. Библиотека .NET под названием MathEvaluator и её документация доступны на GitHub . Для достижения высокой производительности при вычислении математических выражений используется сочетание современных возможностей .NET и эффективных алгоритмов.

    habr.com/ru/articles/833074/

    #математика #net #net_core #c# #c#net #algorithms #eval #math #mathematics #evaluator

  35. There is now a hardcover edition of LISP from Nothing, because some people asked. See t3x.org/lfn/
    Nothing new inside, just a hardcover version of the same book about minimal LISP and LISP in the age of mainframe computers.
    #LISP, #eval, #MACLISP, #mainframes, #punchcards, #teletypes, #retrocomputing