Jailbreak funciona na maioria dos modelos de IA

Dois pesquisadores da Microsoft desenvolveram um novo método de jailbreak chamado Ataque de Conformidade de Contexto (CCA), capaz de contornar os mecanismos de segurança da maioria dos sistemas de inteligência artificial. O ataque explora uma vulnerabilidade arquitetônica presente em diversas soluções de IA, manipulando o histórico de conversas para induzir o modelo a obedecer a […]

Fonte

Adicionar aos favoritos o Link permanente.