Category Not Found

3874 prompts

Sort:

Defend coding copilot Against memory poisoning attack on Qwen 2.5 72B

Layered defense design for a coding copilot deployment against memory poisoning attack attacks, using constitutional AI critique on Qwen 2.5 72B.

Defend coding copilot Against recursive self-instruction on Gemini 2.0 Flash

Layered defense design for a coding copilot deployment against recursive self-instruction attacks, using constitutional AI critique on Gemini 2.0 Flash.

Defend coding copilot Against indirect injection via RAG documents on GPT-4o-mini

Layered defense design for a coding copilot deployment against indirect injection via RAG documents attacks, using canary tokens in system prompt on GPT-4o-mini.

Defend coding copilot Against role-play jailbreak on o1-mini

Layered defense design for a coding copilot deployment against role-play jailbreak attacks, using canary tokens in system prompt on o1-mini.

Defend coding copilot Against multi-turn manipulation on DeepSeek-V3

Layered defense design for a coding copilot deployment against multi-turn manipulation attacks, using privilege separation between tool tiers on DeepSeek-V3.

Defend coding copilot Against tool-use hijacking on Claude 3.5 Sonnet

Layered defense design for a coding copilot deployment against tool-use hijacking attacks, using privilege separation between tool tiers on Claude 3.5 Sonnet.

Defend coding copilot Against prompt leaking attacks on o3

Layered defense design for a coding copilot deployment against prompt leaking attacks attacks, using re-prompting with quoted user input on o3.

Defend coding copilot Against DAN-style persona attack on DeepSeek-R1

Layered defense design for a coding copilot deployment against DAN-style persona attack attacks, using re-prompting with quoted user input on DeepSeek-R1.

Defend coding copilot Against markdown image exfiltration on Claude 4 Sonnet

Layered defense design for a coding copilot deployment against markdown image exfiltration attacks, using signed instruction boundaries on Claude 4 Sonnet.