研究人员发现,少量的微调可以消除旨在防止OpenAI的GPT-3.5 Turbo等LLM喷出有毒物质的安全措施(Thomas Claburn/The Register)

OpenAI GPT-3.5 Turbo聊天机器人防御以API挠痒的”2毛钱”消散–为防止大型语言模型而创建的”护栏”。

查看原文