合成图像为人工智能训练效率树立了新标杆
数据是新的土壤,在这片肥沃的新土地上,麻省理工学院的研究人员种植的不仅仅是像素。通过使用合成图像来训练机器学习模型,一组科学家最近超越了传统“真实图像”训练方法所获得的结果。
该方法的核心是一个名为 StableRep 的系统,它不仅仅使用任何合成图像;它通过超流行的文本到图像模型(例如稳定扩散)生成它们。这就像用文字创造世界一样。
那么 StableRep 的秘诀是什么?一种称为“多元积极对比学习”的策略。
麻省理工学院博士 Lijie Fan 表示:“我们正在教授模型通过上下文和方差来更多地了解高级概念,而不仅仅是向其提供数据。” 电气工程专业的学生,麻省理工学院计算机科学和人工智能实验室 (CSAIL) 的附属机构,目前发布到arXiv预印本服务器的工作的首席研究员。
“当多个图像全部由相同的文本生成,并且全部被视为同一底层事物的描述时,模型会更深入地研究图像背后的概念,比如对象,而不仅仅是它们的像素。”
这种方法将相同文本提示生成的多个图像视为正对,在训练期间提供附加信息,不仅增加更多多样性,而且向视觉系统指定哪些图像相似、哪些图像不同。值得注意的是,StableRep 在广泛的数据集中超越了在真实图像上训练的顶级模型(例如 SimCLR 和 CLIP)。
“虽然 StableRep 有助于缓解机器学习中数据采集的挑战,但它也引领了人工智能训练技术的新时代。根据命令生成高质量、多样化的合成图像的能力可以帮助减少繁琐的费用和资源, ”范说。
数据收集的过程从来都不是一帆风顺的。在 20 世纪 90 年代,研究人员必须手动拍摄照片来收集物体和面部的数据集。2000 年代,人们在互联网上搜索数据。然而,这些原始的、未经整理的数据与现实世界的场景相比往往存在差异,并反映了社会偏见,呈现出一种扭曲的现实观点。
通过人为干预清理数据集的任务不仅成本高昂,而且极具挑战性。不过,想象一下,如果这种艰巨的数据收集可以简化为像用自然语言发出命令一样简单的事情。
StableRep 获胜的一个关键方面是对生成模型中“指导尺度”的调整,这确保了合成图像的多样性和保真度之间的微妙平衡。经过微调后,用于训练这些自监督模型的合成图像被发现与真实图像一样有效,甚至更有效。
向前迈进了一步,添加了语言监督,创建了一个增强的变体:StableRep+。当使用 2000 万张合成图像进行训练时,与使用 5000 万张真实图像进行训练的 CLIP 模型相比,StableRep+ 不仅实现了卓越的准确性,而且还显示出显着的效率。
然而,前方的道路并非一帆风顺。研究人员坦诚地解决了一些局限性,包括当前图像生成速度缓慢、文本提示与生成图像之间的语义不匹配、偏见的潜在放大以及图像归因的复杂性,所有这些都是未来进步必须解决的问题。
另一个问题是,StableRep 需要首先在大规模真实数据上训练生成模型。该团队承认,从真实数据开始仍然是必要的;但是,当您拥有良好的生成模型时,您可以将其重新用于新任务,例如训练识别模型和视觉表示。
该团队指出,他们还没有摆脱从真实数据开始的需要;只是一旦你有了一个好的生成模型,你就可以将其重新用于新任务,例如训练识别模型和视觉表示。
虽然 StableRep 通过减少对大量真实图像集合的依赖提供了一个很好的解决方案,但它也引起了人们对用于这些文本到图像模型的未经整理的数据中隐藏偏差的担忧。文本提示的选择是图像合成过程中不可或缺的一部分,但并不完全没有偏见,“这表明了细致的文本选择或可能的人工管理的重要作用,”范说。
“使用最新的文本到图像模型,我们对图像生成获得了前所未有的控制,允许通过单个文本输入获得多种视觉效果。这在效率和多功能性方面超越了现实世界的图像收集。事实证明它特别有用在特殊任务中,例如平衡长尾识别中的图像多样性,为使用真实图像进行训练提供了实用的补充,”范说。
“我们的工作标志着视觉学习向前迈出了一步,朝着提供具有成本效益的培训替代方案的目标迈进,同时强调了持续改进数据质量和合成的必要性。”
“长期以来,生成模型学习的一个梦想是能够生成对判别模型训练有用的数据,”谷歌 DeepMind 研究员、多伦多大学计算机科学教授 David Fleet 说道,他没有参与这篇论文。
“虽然我们已经看到了一些生命的迹象,但梦想一直难以捉摸,尤其是在高分辨率图像等大规模复杂领域。据我所知,这篇论文首次提供了令人信服的证据,证明梦想正在成为现实他们表明,从大量合成图像数据中进行对比学习可以产生优于从大规模 真实数据中学习到的表示,并有可能改善无数下游视觉任务。”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
作为A股市场中极具代表性的黄金珠宝行业龙头企业,作为中国历史最悠久的珠宝品牌之一,老凤祥(股票代码:600612)...浏览全文>>
-
宝子们,杭州 房子装修完成啦!这次要给大家分享几家设计超赞的装修公司哦。它们各具特色,从空间规划到风格...浏览全文>>
-
欲筑室者,先治其基。在上海,装修房子对于每个业主而言,都是极为关键的一步,然而,如何挑选一家值得信赖的...浏览全文>>
-
2025年以来,联通支付严格贯彻落实国家战略部署,以数字和科技为驱动,做好金融五篇大文章,履行支付为民社会...浏览全文>>
-
良工巧匠,方能筑就华居;精雕细琢,方可打造美家。当我们谈论装修公司时,选择一家靠谱可靠的公司是至关重要...浏览全文>>
-
在当今社会,随着城市化进程的高速推进,建筑垃圾的产生量与日俱增。据权威数据显示,我国每年建筑垃圾产生量超 ...浏览全文>>
-
家人们,在上海要装修,选对公司那可太重要了!古语有云:"安得广厦千万间,大庇天下寒士俱欢颜。"一个温馨的...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,各大品牌纷纷推出各具特色的车型以满足消费者多样化的需求。作为国内新能源...浏览全文>>
-
近年来,随着汽车市场的不断变化和消费者需求的升级,安徽滁州地区的宝来2025新款车型在市场上引起了广泛关注...浏览全文>>
-
随着汽车市场的不断变化,滁州地区的消费者对高尔夫车型的关注度持续上升。作为大众品牌旗下的经典车型,高尔...浏览全文>>
- 安徽滁州途安L新车报价2022款,最低售价16.68万起,入手正当时
- 小鹏G7试驾,新手必知的详细步骤
- 别克GL8预约试驾,4S店的贴心服务与流程
- 安徽阜阳ID.4 CROZZ落地价全解,买车必看的省钱秘籍
- 淮北探岳多少钱 2025款落地价,最低售价17.69万起现在该入手吗?
- 安徽淮南大众CC新款价格2025款多少钱能落地?
- 淮北长安启源C798价格,最低售价12.98万起现在该入手吗?
- 安徽淮南途锐价格,各配置车型售价全解析
- 蒙迪欧试驾预约,4S店体验全攻略
- 沃尔沃XC40试驾需要注意什么
- 滁州ID.4 X新车报价2025款,各车型售价大公开,性价比爆棚
- 试驾思域,快速操作,轻松体验驾驶乐趣
- 试驾长安CS35PLUS,一键搞定,开启豪华驾驶之旅
- 天津滨海ID.6 X落地价限时特惠,最低售价25.9888万起,错过不再有
- 天津滨海凌渡多少钱?看完这篇购车攻略再做决定
- 安徽池州长安猎手K50落地价,买车前的全方位指南
- 山东济南ID.6 CROZZ 2024新款价格,最低售价19.59万起,现车充足
- 试驾海狮05EV,新手必知的详细步骤
- 生活家PHEV多少钱 2025款落地价走势,近一个月最低售价63.98万起,性价比凸显
- 奇瑞风云A9试驾,新手必知的详细步骤