home.social

#pgd_attack — Public Fediverse posts

Live and recent posts from across the Fediverse tagged #pgd_attack, aggregated by home.social.

  1. Обзор уязвимостей для LLM. Часть 2. Защита

    В первой части статьи мы разобрали, что такое безопасность в контексте нейросетей, и чем safety отличается от security. Во второй части посмотрим, как защищаться от этих и других видов уязвимостей. Привет, Хабр! Меня зовут Евгений Кокуйкин и я — руководитель AI-продуктов в Raft. Запускаю лабораторию AI Security в AI Talent Hub/ИТМО.

    habr.com/ru/companies/oleg-bun

    #языковые_модели #промпты #промптинъекции #owasp #защита_от_уязвимостей #jailbreak #chat_gpt #llmattack #мультимодальные_модели #PGD_Attack