高效技术提高了机器学习模型的可靠性
强大的机器学习模型正被用来帮助人们解决棘手的问题,例如在医学图像中识别疾病或为自动驾驶汽车检测道路障碍物。但机器学习模型可能会出错,因此在高风险环境中,人类知道何时信任模型的预测至关重要。
不确定性量化是提高模型可靠性的一种工具;该模型会产生一个分数以及表示预测正确的置信度的预测。虽然不确定性量化可能很有用,但现有方法通常需要重新训练整个模型才能赋予它这种能力。训练涉及向模型展示数百万个示例,以便它可以学习一项任务。然后再训练需要数以百万计的新数据输入,这可能是昂贵且难以获得的,并且还会使用大量的计算资源。
麻省理工学院和MIT-IBM沃森人工智能实验室的研究人员现已开发出一种技术,使模型能够执行更有效的不确定性量化,同时使用比其他方法少得多的计算资源,并且不需要额外的数据。他们的技术不需要用户重新训练或修改模型,对于许多应用程序来说足够灵活。
该技术涉及创建一个更简单的伴随模型,以协助原始机器学习模型估计不确定性。这个较小的模型旨在识别不同类型的不确定性,这可以帮助研究人员深入研究不准确预测的根本原因。
“不确定性量化对于机器学习模型的开发人员和用户来说都是必不可少的。开发人员可以利用不确定性测量来帮助开发更强大的模型,而对于用户来说,它可以在现实世界中部署模型时增加另一层信任和可靠性。我们的这项工作为不确定性量化提供了一种更灵活、更实用的解决方案,”电气工程和计算机科学研究生、该技术论文的主要作者沉茂豪说。
Shen与YuhengBu共同撰写了这篇论文,YuhengBu是电子研究实验室(RLE)的前博士后,现在是佛罗里达大学的助理教授;麻省理工学院-IBM沃森人工智能实验室的研究人员PrasannaSattigeri、SoumyaGhosh和SubhroDas;资深作者格雷戈里·沃内尔(GregoryWornell)是住友商事工程学教授,负责领导信号、信息和算法实验室RLE,并且是麻省理工学院-IBM沃森人工智能实验室的成员。该研究将在AAAI人工智能会议上发表,该论文可在arXiv预印本服务器上获取。
量化不确定性
在不确定性量化中,机器学习模型会为每个输出生成一个数值分数,以反映其对该预测准确性的信心。通过从头构建新模型或重新训练现有模型来纳入不确定性量化通常需要大量数据和昂贵的计算,这通常是不切实际的。更重要的是,现有方法有时会产生降低模型预测质量的意外后果。
麻省理工学院和麻省理工学院-IBM沃森人工智能实验室的研究人员因此将注意力集中在以下问题上:给定一个预训练模型,他们如何使其能够执行有效的不确定性量化?
他们通过创建一个更小、更简单的模型(称为元模型)来解决这个问题,该模型附加到更大的预训练模型,并使用更大的模型已经学会的特征来帮助它进行不确定性量化评估。
“元模型可以应用于任何预训练模型。最好能够访问模型的内部结构,因为我们可以获得更多关于基础模型的信息,但如果你只有最终输出,它也可以工作。它仍然可以预测置信度分数,”Sattigeri说。
他们设计元模型以使用包括两种类型不确定性的技术产生不确定性量化输出:数据不确定性和模型不确定性。数据不确定性是由损坏的数据或不准确的标签引起的,只能通过修复数据集或收集新数据来减少。在模型不确定性中,模型不确定如何解释新观察到的数据,并可能做出错误的预测,这很可能是因为它没有看到足够多的相似训练示例。在部署模型时,这个问题是一个特别具有挑战性但很常见的问题。在现实世界中,他们经常遇到与训练数据集不同的数据。
“当你在新环境中使用该模型时,你的决定的可靠性是否发生了变化?你需要某种方式来确定它是否适用于这种新制度,或者你是否需要为这种特定的新环境收集训练数据,”Wornell说。
验证量化
一旦模型产生了不确定性量化分数,用户仍然需要确保分数本身是准确的。研究人员通常通过创建一个较小的数据集来验证准确性,该数据集是从原始训练数据中提取出来的,然后在提取的数据上测试模型。然而,这种技术在测量不确定性量化方面效果不佳,因为该模型可以实现良好的预测精度,同时仍然过于自信,Shen说。
他们通过向验证集中的数据添加噪声创建了一种新的验证技术——这种噪声数据更像是可能导致模型不确定性的分布外数据。研究人员使用这个嘈杂的数据集来评估不确定性量化。
他们通过查看元模型如何为各种下游任务捕获不同类型的不确定性来测试他们的方法,包括分布外检测和错误分类检测。他们的方法不仅在每个下游任务中优于所有基线,而且实现这些结果所需的训练时间更少。
这项技术可以帮助研究人员启用更多机器学习模型来有效地执行不确定性量化,最终帮助用户更好地决定何时相信预测。
展望未来,研究人员希望将他们的技术应用于更新的模型类别,例如具有与传统神经网络不同结构的大型语言模型,Shen说。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
宝子们,杭州 房子装修完成啦!这次要给大家分享几家设计超赞的装修公司哦。它们各具特色,从空间规划到风格...浏览全文>>
-
欲筑室者,先治其基。在上海,装修房子对于每个业主而言,都是极为关键的一步,然而,如何挑选一家值得信赖的...浏览全文>>
-
2025年以来,联通支付严格贯彻落实国家战略部署,以数字和科技为驱动,做好金融五篇大文章,履行支付为民社会...浏览全文>>
-
良工巧匠,方能筑就华居;精雕细琢,方可打造美家。当我们谈论装修公司时,选择一家靠谱可靠的公司是至关重要...浏览全文>>
-
在当今社会,随着城市化进程的高速推进,建筑垃圾的产生量与日俱增。据权威数据显示,我国每年建筑垃圾产生量超 ...浏览全文>>
-
家人们,在上海要装修,选对公司那可太重要了!古语有云:"安得广厦千万间,大庇天下寒士俱欢颜。"一个温馨的...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,各大品牌纷纷推出各具特色的车型以满足消费者多样化的需求。作为国内新能源...浏览全文>>
-
近年来,随着汽车市场的不断变化和消费者需求的升级,安徽滁州地区的宝来2025新款车型在市场上引起了广泛关注...浏览全文>>
-
随着汽车市场的不断变化,滁州地区的消费者对高尔夫车型的关注度持续上升。作为大众品牌旗下的经典车型,高尔...浏览全文>>
-
在2023年,大众探影以其时尚的设计和出色的性能赢得了众多消费者的青睐。作为一款小型SUV,探影凭借其紧凑的车...浏览全文>>
- 安徽滁州途安L新车报价2022款,最低售价16.68万起,入手正当时
- 小鹏G7试驾,新手必知的详细步骤
- 别克GL8预约试驾,4S店的贴心服务与流程
- 安徽阜阳ID.4 CROZZ落地价全解,买车必看的省钱秘籍
- 淮北探岳多少钱 2025款落地价,最低售价17.69万起现在该入手吗?
- 安徽淮南大众CC新款价格2025款多少钱能落地?
- 淮北长安启源C798价格,最低售价12.98万起现在该入手吗?
- 安徽淮南途锐价格,各配置车型售价全解析
- 蒙迪欧试驾预约,4S店体验全攻略
- 沃尔沃XC40试驾需要注意什么
- 滁州ID.4 X新车报价2025款,各车型售价大公开,性价比爆棚
- 试驾思域,快速操作,轻松体验驾驶乐趣
- 试驾长安CS35PLUS,一键搞定,开启豪华驾驶之旅
- 天津滨海ID.6 X落地价限时特惠,最低售价25.9888万起,错过不再有
- 天津滨海凌渡多少钱?看完这篇购车攻略再做决定
- 安徽池州长安猎手K50落地价,买车前的全方位指南
- 山东济南ID.6 CROZZ 2024新款价格,最低售价19.59万起,现车充足
- 试驾海狮05EV,新手必知的详细步骤
- 生活家PHEV多少钱 2025款落地价走势,近一个月最低售价63.98万起,性价比凸显
- 奇瑞风云A9试驾,新手必知的详细步骤