GPT-4模型的已知风险、控制策略及其启示
时间:2024-04-28 点击:132 来源:
内容摘要:当前,基于GPT-3.5版本的ChatGPT等生成式人工智能的安全隐患持续引发热议,越来越多的业界人士对此表示担忧,特别是包括图灵奖得主约书亚·本吉奥、著名科技企业家伊隆·马斯克等在内的1000余名科技人士发表公开信,要求暂停训练比GPT-4更强大的AI系统,更是将这种质疑和担忧推向高潮。OpenAI发布的GPT-4《技术报告》《系统卡》《我们迈向人工智能安全的路径》等技术文件详细介绍GPT-4上线前测试中发现的12种风险及采取的相应对策。这些风险是在现实环境中测试实际发生的,极具代表性,为降低这些风险而采取的举措亦具有针对性。我国基于大语言模型的生成式人工智能工具正在快速发展,如百度“文心一言”、阿里“通义千问”、商汤“商量”等相继发布,后续的风险管控是不可回避的问题,OpenAI的相关实践具有较强的参考借鉴意义。