中国信通院发起大模型幻觉测试,总体涉及五种测试维度
admin
2025年03月19日
阅读数 59714
(原标题:中国信通院发起大模型幻觉测试,总体涉及五种测试维度)
经济观察网讯 3月19日,据中国信通院消息,中国信息通信研究院人工智能所基于前期的AI Safety Benchmark测评工作,发起大模型幻觉测试。本轮幻觉测试工作将以大语言模型为测试对象,涵盖了事实性幻觉和忠实性幻觉两种幻觉类型。测试数据包含7000余条中文测试样本,测试形式包括对应于忠实性幻觉检测的信息抽取与知识推理两类题型,以及对应事实性幻觉检测的事实判别题型。总体涉及人文科学、社会科学、自然科学、应用科学和形式科学五种测试维度。(编辑 万佳)
图片来源于网络,如有侵权,请联系删除
推荐阅读:
浙江2023年规上工业增加值增长6%,今年聚焦“415X”先进制造业集群
渤银理财财收有略系列固定收益类一年封闭式理财产品2024年11号22日起发行
专题推荐:
版权声明
本文仅代表作者观点,不代表xx立场。
本文系作者授权xx发表,未经许可,不得转载。