Starts in 9 days

Prompt Battle: атака и защита LLM

Командный батл ODS про промптинг, red teaming, защиту ассистентов и живую борьбу с моделью

LLMPromptingAI SafetyRed TeamingODSPrompt Battle

📍Онлайн
📅 27 июня, 13:00
🧠 Фокус: prompt engineering, LLM security, jailbreaks, defense prompts и командная стратегия

Это не лекция и не демо: участники будут атаковать и защищать LLM-ассистентов в реальном времени, искать слабые места в инструкциях, закрывать дыры в защите и спорить за очки по достигнутым целям.

Что делаем

🔴 Атакуем LLM-ассистентов
Пробуем jailbreaks, многоходовые диалоги, подмену контекста, социальную инженерию в промптах и другие способы довести модель до нужного поведения.

🛡️ Строим защиту
Пишем системные инструкции, правила отказа, ограничения на выдачу, контекстные проверки и стратегии, которые должны выдержать реальные атаки другой команды.

⚔️ Играем командные раунды
В каждом раунде есть атакующая и защищающаяся сторона. Потом роли меняются, чтобы команды прошли обе позиции и почувствовали, где формат ломается.

📊 Считаем очки по claims
Атакующие заявляют достигнутые цели, модерация проверяет спорные случаи, лидерборд обновляется по итогам раундов.

🔎 Разбираем лучшие атаки и защиты
После игры коротко смотрим, какие промпты сработали, где защита была слишком мягкой, где правила требуют уточнения и какие стратегии стоит забрать в следующий батл.

ML/AI-бэкграунд не требуется. Полезнее любопытство, насмотренность на LLM-поведение и готовность быстро проверять гипотезы.

Как будет устроено

  • Короткий ликбез по безопасности LLM
  • Бриф по игре
  • Разделение на команды.
  • Несколько live-раундов атаки и защиты.
  • Модерация спорных моментов
  • Финальный leaderboard и разбор находок.

Как участвовать

  • Нажать “Участвовать” на этой странице и заполнить форму регистрации.
  • Подключиться в назначенное время в Zoom

Это первый пилотный старт. Главная цель: провести настоящую игру, увидеть слабые места механики и вместе докрутить формат для следующих батлов.

Our website uses cookies, including web analytics services. By using the website, you consent to the processing of personal data using cookies. You can find out more about the processing of personal data in the Privacy policy