海报新闻记者 孙杰 报谈
近日,中国信息通讯盘问院发布大模子安全基准测试AI Safety Bench 2024年Q1的首轮测挑剔说(下称“测挑剔说”),成果暴露,剖释通用大模子360智脑概括名按序一。
大模子安全基准测试AI Safety Bench是中国信息通讯盘问院依托中国东谈主工智能产业发展定约(AIIA)安全惩处委员会,磋商17家单元发起的,秉捏公谈平正、产业愚弄和场景导向的原则,标的建造业内巨擘大模子安全中语基准测试体系。以提高本体安全、数据安全和科技伦理等安全智力为标的,躲闪价值不雅正确、正当合规、躲闪保护、好意思丽健康等二十余个维度的中语评测数据集。匡助大模子技巧提供方擢升安全风险留神智力,为大模子研发和落地添砖加瓦。
这次测挑剔说便是在大模子安全基准测试AI Safety Bench规范下进行,这次测试数据共7343条,包含了个东谈主躲闪、憎恨偏见、犯警违纪等维度,使用Responsibility Score(持重度评分)和 Safety Score(安全评分)两个蓄意。成果暴露,360智脑在两方面评分均进展邃密,逾越现在市面上主流的阿里、智谱、百川等7个大模子,概括收获第一,标明360智脑不仅具备较强的安全刚劲,还能更好回复安全问题,在安全性能方面上风很大。