​国际组织首次就大模型安全发布标准 多家中外科技企业参编

​国际组织首次就大模型安全发布标准 多家中外科技企业参编
2024年04月18日 21:53 中国经营报

本报记者 李晖 北京报道

大语言模型技术自去年以来持续火爆,其安全问题一直是全球关注焦点。

第27届联合国科技大会正在瑞士日内瓦召开。日前,在以“塑造AI的未来”为主题的AI边会上,世界数字技术院(WDTA)发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。这是国际组织首次就大模型安全领域发布国际标准,代表全球人工智能安全评估和测试进入新的基准。

《中国经营报》记者获悉,这两项国际标准是由OpenAI、蚂蚁集团科大讯飞、谷歌、微软、OPPO、百度、腾讯、Meta、英伟达等数十家企业的专家学者共同编制而成。

WDTA人工智能安全可信负责任工作组组长黄连金在会上表示,此次发布的标准填补了大语言模型和生成式AI应用方面安全测试领域的空白,为业界提供了统一的测试框架和明确的测试方法,有助于提高AI系统安全性,促进AI技术负责任发展,增强公众信任。

近年来,全球均在加强对于大模型安全的研究和管控。2023年7月,国家网信办颁布《生成式人工智能服务管理暂行办法》;2024年3月,全国网络安全标准化技术委员会发布TC260-003《生成式人工智能服务安全基本要求》;2024年3月,欧盟通过《人工智能法案》……上述官方文件的发布,对促进生成式人工智能安全可信发展,达成全球人工智能治理领域合作共识起到了推动作用。

在行业层面,大模型安全测试领域的国际标准一直尚未建立。

官方信息显示,WDTA是在日内瓦注册的国际非政府组织,遵从联合国指导框架,致力于在全球范围内推进数字技术,促进国际合作。AI STR(安全、可信、负责任)计划是WDTA的核心倡议,旨在确保人工智能系统的安全性、可信性和责任性。OpenAI、谷歌、微软、Meta、华为、科大讯飞、蚂蚁集团、中国电子、国际数据空间协会(IDSA)、弗劳恩霍夫研究所等均为其成员单位。

据了解,此次发布的两项国际标准是大模型及生成式AI应用方面的安全测试标准。其中,《生成式人工智能应用安全测试标准》由WDTA作为牵头单位。该标准为测试和验证生成式AI应用的安全性提供了一个框架,特别是那些使用大语言模型(LLM)构建的应用程序。它定义了人工智能应用程序架构每一层的测试和验证范围,包括基础模型选择、嵌入和矢量数据库、RAG或检索增强生成、AI应用运行时安全等,确保AI应用各个方面都经过严格的安全性和合规性评估,保障其在整个生命周期内免受威胁和漏洞侵害。

另一项《大语言模型安全测试方法》由蚂蚁集团作为牵头单位。该标准则为大模型本身的安全性评估提供了一套全面、严谨且实操性强的结构性方案。它提出了大语言模型的安全风险分类、攻击的分类分级方法以及测试方法,并率先给出了四种不同攻击强度的攻击手法分类标准,提供了严格的评估指标和测试程序等,可解决大语言模型固有的复杂性,全面测试其抵御敌对攻击的能力,使开发人员和组织能够识别和缓解潜在漏洞,并最终提高使用大语言模型构建的人工智能系统的安全性和可靠性。

蚂蚁集团机器智能部总经理、蚂蚁安全实验室首席科学家王维强在发言时表示,生成式AI将释放巨大的生产力,但也要对它带来的新风险高度警惕。

“大型科技公司应在促进生成式AI安全和负责任的发展中发挥关键作用,利用其资源、专业知识和影响力推动构建一个优先考虑安全、隐私和道德考量的生态系统。例如,通过制定行业标准与指南,为开发和部署生成式AI系统的开发者和机构提供清晰指导;投入研发并开放保障生成式AI安全的工具,形成产业共治。”他表示。

记者浏览WDTA官网发现,上述两项标准属于AI STR计划的重要成果。该计划工作内容包括:为安全、值得信赖和负责任的人工智能开发和部署制定最佳实践、指南和框架;倡导促进负责任的人工智能发展的政策框架,并与利益相关者合作,提高对人工智能相关风险和机遇的认识,培育负责任的人工智能使用文化;建立认证和认可计划,以验证人工智能系统是否符合安全、可信和负责任标准,为利益相关者和消费者提供保证等。

目前,AI STR计划已经形成《全球人工智能治理宣言》《关于人工智能未来机遇和风险的报告》以及上述两项标准等文件。

(编辑:何莎莎 审核:朱紫云 校对:刘军)

海量资讯、精准解读,尽在新浪财经APP
AI 人工智能 科技企业

VIP课程推荐

加载中...

APP专享直播

1/10

热门推荐

收起
新浪财经公众号
新浪财经公众号

24小时滚动播报最新的财经资讯和视频,更多粉丝福利扫描二维码关注(sinafinance)

股市直播

  • 图文直播间
  • 视频直播间

7X24小时

  • 04-25 欧莱新材 688530 --
  • 04-01 宏鑫科技 301539 10.64
  • 03-29 灿芯股份 688691 19.86
  • 03-27 无锡鼎邦 872931 6.2
  • 03-25 中瑞股份 301587 21.73
  • 新浪首页 语音播报 相关新闻 返回顶部