生成式人工智能解释
快速浏览一下头条新闻就会发现,如今生成人工智能似乎无处不在。事实上,其中一些头条新闻实际上可能是由生成式人工智能撰写的,例如OpenAI的ChatGPT,这是一个聊天机器人,它表现出了不可思议的能力,可以生成似乎是由人类编写的文本。
但当人们说“生成式人工智能”时,他们真正的意思是什么?
在过去几年生成式人工智能热潮之前,当人们谈论人工智能时,通常他们谈论的是可以学习根据数据进行预测的机器学习模型。例如,使用数百万个示例对此类模型进行训练,以预测特定X射线是否显示肿瘤迹象,或者特定借款人是否可能拖欠贷款。
生成式人工智能可以被认为是一种机器学习模型,经过训练可以创建新数据,而不是对特定数据集进行预测。生成式人工智能系统能够学习生成更多看起来像它所训练的数据的对象。
“当谈到生成人工智能和其他类型人工智能的实际机制时,区别可能有点模糊。通常,相同的算法可以用于两者,”电气工程和计算机副教授PhillipIsola说麻省理工学院的科学教授,也是计算机科学和人工智能实验室(CSAIL)的成员。
尽管ChatGPT及其同类产品的发布引起了大肆宣传,但该技术本身并不是全新的。这些强大的机器学习模型借鉴了50多年前的研究和计算进展。
复杂性增加
生成式人工智能的一个早期例子是一个简单得多的模型,称为马尔可夫链。该技术以俄罗斯数学家安德烈·马尔科夫(AndreyMarkov)的名字命名,他于1906年引入了这种统计方法来对随机过程的行为进行建模。在机器学习中,马尔可夫模型长期以来一直用于下一个单词预测任务,例如电子邮件程序中的自动完成功能。
在文本预测中,马尔可夫模型通过查看前一个单词或前面的几个单词来生成句子中的下一个单词。但由于这些简单的模型只能回顾那么远的时间,因此它们不擅长生成可信的文本,麻省理工学院电气工程和计算机科学的ThomasSiebel教授TommiJaakkola说,他也是CSAIL和计算机科学研究所的成员。数据、系统和社会(IDSS)。
“我们在过去十年之前就已经开始生成东西了,但这里的主要区别在于我们可以生成的对象的复杂性以及我们可以训练这些模型的规模,”他解释道。
就在几年前,研究人员还倾向于寻找一种能够充分利用特定数据集的机器学习算法。但这种关注点已经发生了一些转移,许多研究人员现在正在使用更大的数据集(可能包含数亿甚至数十亿的数据点)来训练可以取得令人印象深刻结果的模型。
ChatGPT和类似系统的基础模型的工作方式与马尔可夫模型非常相似。但一个很大的区别是ChatGPT更大、更复杂,有数十亿个参数。它接受了大量数据的训练——在本例中,是互联网上公开的大部分文本。
在这个庞大的文本语料库中,单词和句子以具有一定依赖性的顺序出现。这种重复有助于模型理解如何将文本切割成具有一定可预测性的统计块。它学习这些文本块的模式,并利用这些知识来提出接下来可能发生的情况。
更强大的架构
虽然更大的数据集是导致生成式人工智能繁荣的催化剂之一,但各种重大研究进展也导致了更复杂的深度学习架构。
2014年,蒙特利尔大学的研究人员提出了一种称为生成对抗网络(GAN)的机器学习架构。GAN使用两种协同工作的模型:一个学习生成目标输出(如图像),另一个学习区分真实数据和生成器的输出。生成器试图欺骗鉴别器,并在此过程中学习做出更真实的输出。图像生成器StyleGAN就是基于这些类型的模型。
一年后,斯坦福大学和加州大学伯克利分校的研究人员引入了扩散模型。通过迭代地完善其输出,这些模型学习生成与训练数据集中的样本相似的新数据样本,并已用于创建逼真的图像。扩散模型是文本到图像生成系统稳定扩散的核心。
2017年,谷歌的研究人员推出了Transformer架构,该架构已用于开发大型语言模型,例如为ChatGPT提供支持的语言模型。在自然语言处理中,转换器将文本语料库中的每个单词编码为标记,然后生成注意图,该注意图捕获每个标记与所有其他标记的关系。此注意力图可帮助转换器在生成新文本时理解上下文。
这些只是可用于生成人工智能的众多方法中的几种。
一系列应用
所有这些方法的共同点是它们将输入转换为一组标记,这些标记是数据块的数字表示。只要您的数据可以转换为这种标准的令牌格式,那么理论上,您就可以应用这些方法来生成看起来相似的新数据。
“你的里程可能会有所不同,具体取决于数据的噪声程度以及提取信号的难度,但它确实越来越接近通用CPU可以接收任何类型的数据并开始在统一的环境中处理它的方式。方式,”伊索拉说。
这为生成式人工智能开辟了广泛的应用领域。
例如,伊索拉的团队正在使用生成式人工智能来创建合成图像数据,这些数据可用于训练另一个智能系统,例如教授计算机视觉模型如何识别物体。
Jaakkola的团队正在使用生成式人工智能来设计新颖的蛋白质结构或指定新材料的有效晶体结构。他解释说,就像生成模型学习语言依赖性一样,如果它显示晶体结构,它就可以学习使结构稳定和可实现的关系。
但是,虽然生成模型可以取得令人难以置信的结果,但它们并不是所有类型数据的最佳选择。麻省理工学院电气工程和计算机科学系Andrew和ErnaViterbi教授DevavratShah表示,对于涉及对结构化数据(例如电子表格中的表格数据)进行预测的任务,生成式AI模型的性能往往优于传统的机器学习方法。IDSS和信息与决策系统实验室的成员。
“在我看来,它们的最高价值就是成为对人类友好的机器的绝佳界面。以前,人类必须用机器的语言与机器对话才能使事情发生。现在,这个界面已经弄清楚了如何与人类和机器对话,”沙阿说。
举起危险信号
生成式人工智能聊天机器人现在被用于呼叫中心来回答人类客户的问题,但这一应用程序强调了实施这些模型的一个潜在危险信号——工人流离失所。
此外,生成式人工智能可以继承和扩散训练数据中存在的偏见,或放大仇恨言论和虚假陈述。这些模型具有剽窃的能力,并且可以生成看起来像是由特定人类创作者制作的内容,从而引发潜在的版权问题。
另一方面,沙阿提出,生成式人工智能可以赋予艺术家权力,他们可以使用生成工具来帮助他们制作他们可能无法制作的创意内容。
未来,他认为生成式人工智能将改变许多学科的经济学。
Isola认为生成式人工智能的一个有前途的未来方向是其在制造中的应用。也许它可以生成可以生产的椅子的计划,而不是让模型制作椅子的图像。
他还看到了生成式人工智能系统在开发更通用的智能人工智能代理方面的未来用途。
“这些模型的工作原理和我们认为人脑的工作原理存在差异,但我认为也有相似之处。我们有能力在头脑中思考和梦想,提出有趣的想法或计划,我认为生成式人工智能也是使代理能够做到这一点的工具之一,”伊索拉说。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
作为A股市场中极具代表性的黄金珠宝行业龙头企业,作为中国历史最悠久的珠宝品牌之一,老凤祥(股票代码:600612)...浏览全文>>
-
宝子们,杭州 房子装修完成啦!这次要给大家分享几家设计超赞的装修公司哦。它们各具特色,从空间规划到风格...浏览全文>>
-
欲筑室者,先治其基。在上海,装修房子对于每个业主而言,都是极为关键的一步,然而,如何挑选一家值得信赖的...浏览全文>>
-
2025年以来,联通支付严格贯彻落实国家战略部署,以数字和科技为驱动,做好金融五篇大文章,履行支付为民社会...浏览全文>>
-
良工巧匠,方能筑就华居;精雕细琢,方可打造美家。当我们谈论装修公司时,选择一家靠谱可靠的公司是至关重要...浏览全文>>
-
在当今社会,随着城市化进程的高速推进,建筑垃圾的产生量与日俱增。据权威数据显示,我国每年建筑垃圾产生量超 ...浏览全文>>
-
家人们,在上海要装修,选对公司那可太重要了!古语有云:"安得广厦千万间,大庇天下寒士俱欢颜。"一个温馨的...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,各大品牌纷纷推出各具特色的车型以满足消费者多样化的需求。作为国内新能源...浏览全文>>
-
近年来,随着汽车市场的不断变化和消费者需求的升级,安徽滁州地区的宝来2025新款车型在市场上引起了广泛关注...浏览全文>>
-
随着汽车市场的不断变化,滁州地区的消费者对高尔夫车型的关注度持续上升。作为大众品牌旗下的经典车型,高尔...浏览全文>>
- 安徽滁州途安L新车报价2022款,最低售价16.68万起,入手正当时
- 小鹏G7试驾,新手必知的详细步骤
- 别克GL8预约试驾,4S店的贴心服务与流程
- 安徽阜阳ID.4 CROZZ落地价全解,买车必看的省钱秘籍
- 淮北探岳多少钱 2025款落地价,最低售价17.69万起现在该入手吗?
- 安徽淮南大众CC新款价格2025款多少钱能落地?
- 淮北长安启源C798价格,最低售价12.98万起现在该入手吗?
- 安徽淮南途锐价格,各配置车型售价全解析
- 蒙迪欧试驾预约,4S店体验全攻略
- 沃尔沃XC40试驾需要注意什么
- 滁州ID.4 X新车报价2025款,各车型售价大公开,性价比爆棚
- 试驾思域,快速操作,轻松体验驾驶乐趣
- 试驾长安CS35PLUS,一键搞定,开启豪华驾驶之旅
- 天津滨海ID.6 X落地价限时特惠,最低售价25.9888万起,错过不再有
- 天津滨海凌渡多少钱?看完这篇购车攻略再做决定
- 安徽池州长安猎手K50落地价,买车前的全方位指南
- 山东济南ID.6 CROZZ 2024新款价格,最低售价19.59万起,现车充足
- 试驾海狮05EV,新手必知的详细步骤
- 生活家PHEV多少钱 2025款落地价走势,近一个月最低售价63.98万起,性价比凸显
- 奇瑞风云A9试驾,新手必知的详细步骤