Category Not Found

641 prompts

Sort:

Defend coding copilot Against DAN-style persona attack on Claude 3.5 Sonnet

Layered defense design for a coding copilot deployment against DAN-style persona attack attacks, using structured function-call-only interface on Claude 3.5 Sonnet.

Defend coding copilot Against markdown image exfiltration on o1-mini

Layered defense design for a coding copilot deployment against markdown image exfiltration attacks, using structured function-call-only interface on o1-mini.

Defend coding copilot Against instruction smuggling in URLs on DeepSeek-V3

Layered defense design for a coding copilot deployment against instruction smuggling in URLs attacks, using hash-based prompt pinning on DeepSeek-V3.

Defend coding copilot Against invisible text injection (zero-width chars) on Claude 3.7 Sonnet

Layered defense design for a coding copilot deployment against invisible text injection (zero-width chars) attacks, using hash-based prompt pinning on Claude 3.7 Sonnet.

Defend coding copilot Against memory poisoning attack on o3

Layered defense design for a coding copilot deployment against memory poisoning attack attacks, using output schema enforcement on o3.

Defend coding copilot Against recursive self-instruction on Llama 3.3 70B

Layered defense design for a coding copilot deployment against recursive self-instruction attacks, using output schema enforcement on Llama 3.3 70B.

Defend coding copilot Against indirect injection via RAG documents on Claude 4 Sonnet

Layered defense design for a coding copilot deployment against indirect injection via RAG documents attacks, using spotlighting (delimiter marking) on Claude 4 Sonnet.

Defend coding copilot Against role-play jailbreak on Grok 3

Layered defense design for a coding copilot deployment against role-play jailbreak attacks, using spotlighting (delimiter marking) on Grok 3.

Defend coding copilot Against encoded payloads (base64/ROT13) on Llama 3.1 405B

Layered defense design for a coding copilot deployment against encoded payloads (base64/ROT13) attacks, using input sanitization on Llama 3.1 405B.

Defend coding copilot Against tool-use hijacking on Claude 4.5 Sonnet

Layered defense design for a coding copilot deployment against tool-use hijacking attacks, using input sanitization on Claude 4.5 Sonnet.

Defend coding copilot Against prompt leaking attacks on Command R+

Layered defense design for a coding copilot deployment against prompt leaking attacks attacks, using output content filter on Command R+.

Defend coding copilot Against DAN-style persona attack on Mistral Large

Layered defense design for a coding copilot deployment against DAN-style persona attack attacks, using output content filter on Mistral Large.

💬ChatGPT

319730