什么是深度学习?
深度学习是一种先进的人工智能技术,在过去的几年中,由于海量的数据和增强的计算能力,它已变得越来越流行。这是我们每天使用的许多应用程序背后的主要技术,包括在线语言翻译和社交媒体中的自动面部标记。
该技术还被证明对医疗保健有用:今年早些时候,麻省理工学院(MIT)的计算机科学家利用深度学习创建了一种用于检测乳腺癌的新计算机程序。
经典模型要求工程师手动定义检测癌症的规则和逻辑,但是对于这种新模型,科学家们提供了深度学习算法,对来自60,000名患者的90,000次全分辨率乳房X线照片进行了扫描,并让其找到了患者扫描之间的常见模式最终罹患乳腺癌的人和那些没有患乳腺癌的人。它可以提前五年预测乳腺癌,比以前的风险预测模型有了很大的改进。
机器学习到底是什么?
深度学习是机器学习的一个子集,它是人工智能的一个分支,可将计算机配置为通过经验执行任务。与经典的基于规则的AI系统相反,机器学习算法通过处理带注释的示例来开发其行为,该过程称为“训练”。
例如,要创建欺诈检测程序,您可以使用交易清单及其最终结果(合法或欺诈)来训练机器学习算法。机器学习模型检查示例,并开发合法交易和欺诈交易之间共同特征的统计表示。之后,当您向算法提供新交易的数据时,它将根据从训练示例中收集的模式将其分类为合法或欺诈。
根据经验,您提供的数据质量越高,机器学习算法在执行任务时就越准确。
机器学习在解决规则定义不明确且无法编码为不同命令的问题时特别有用。不同类型的算法擅长于不同任务。
深度学习和神经网络
尽管经典的机器学习算法解决了基于规则的程序所遇到的许多问题,但它们在处理诸如图像,视频,声音文件和非结构化文本之类的软数据时却表现欠佳。
AI研究人员和数据科学家Jeremy Howard表示,例如,使用经典的机器学习方法创建乳腺癌预测模型将需要数十名领域专家,计算机程序员和数学家的努力。研究人员将不得不进行大量的特征工程设计,这是一个艰巨的过程,需要对计算机进行编程才能在X射线和MRI扫描中找到已知的图案。之后,工程师在提取的功能之上使用机器学习。创建这样的AI模型需要花费数年时间。
深度学习算法使用深度神经网络解决了相同的问题,深度神经网络是一种受人脑启发的软件体系结构(尽管神经网络与生物神经元不同)。神经网络是一层层的变量,它们可以根据自己所训练的数据的属性进行调整,并能够执行诸如对图像进行分类以及将语音转换为文本之类的任务。
神经网络特别擅长在非结构化数据中独立查找常见模式。例如,当您在不同对象的图像上训练深层神经网络时,它会找到从这些图像中提取特征的方法。神经网络的每一层都检测特定的特征,例如边缘,拐角,面部,眼球等。
神经网络的顶层检测一般特征。更深的层检测实际对象(来源:arxiv.org)
通过使用神经网络,深度学习算法消除了对特征工程的需求。就麻省理工学院的乳腺癌预测模型而言,得益于深度学习,该项目所需的计算机科学家和领域专家的工作量大大减少,开发时间也减少了。此外,该模型还能够找到人类分析师错过的乳房X线照片扫描中的特征和图案。
自1950年代以来(至少在概念上)存在神经网络。但是直到最近,AI社区还是大都拒绝了它们,因为它们需要大量的数据和计算能力。在过去的几年中,存储,数据和计算资源的可用性和可承受性将神经网络推向了AI创新的前沿。
深度学习有什么用?
深度学习可以在多个领域帮助计算机解决以前无法解决的问题。
计算机视觉:计算机视觉是使用软件来理解图像和视频内容的科学。这是深度学习取得很大进步的领域之一。除了乳腺癌之外,深度学习图像处理算法还可以检测其他类型的癌症并帮助诊断其他疾病。
但是,深度学习也根植于您每天使用的许多应用程序中。苹果的Face ID使用深度学习,而Google相册也将深度学习用于各种功能,例如搜索对象和场景以及校正图像。Facebook使用深度学习来自动标记您上传的照片中的人物。
深度学习还可以帮助社交媒体公司自动识别和阻止可疑内容,例如暴力和裸露内容。最后,深度学习在使无人驾驶汽车了解周围环境方面发挥着非常重要的作用。
语音和语音识别:当您向Amazon Echo智能扬声器或Google Assistant说出命令时,深度学习算法会将语音转换为文本命令。一些在线应用程序使用深度学习来转录音频和视频文件。Google最近发布了一款设备上的实时Gboard语音转录智能手机应用程序,该应用程序使用深度学习功能在您讲话时进行打字。
自然语言处理(NLP)和生成(NLG):自然语言处理是提取非结构化文本含义的科学,一直是经典软件的历史难题。用计算机规则定义书面语言的所有细微差别和隐藏含义实际上是不可能的。但是在大量文本上训练的神经网络可以准确地执行许多NLP任务。
当Google转换为深度学习时,其翻译服务的性能突然提升。智能扬声器使用深度学习的NLP来了解命令的各种细微差别,例如您询问天气或方向的不同方式。
深度学习在生成有意义的文本(也称为自然语言生成)方面也非常有效。Gmail的Smart Reply和Smart Compose使用深度学习来对您的电子邮件和建议进行相关回复,以完善您的句子。OpenAI今年早些时候开发的文本生成模型创建了连贯文本的长篇摘录。
深度学习的局限性
尽管有很多好处,深度学习也有一些缺点。
数据依赖性:通常,深度学习算法需要大量的训练数据才能准确地执行任务。不幸的是,对于许多问题,没有足够的质量训练数据来创建深度学习模型。
可解释性:神经网络以极其复杂的方式发展其行为-即使其创建者也难以理解其行为。缺乏可解释性使得在深度学习算法中对错误进行故障排除和修复错误极为困难。
算法偏差:深度学习算法与其所训练的数据一样好。问题在于训练数据通常包含隐藏或明显的偏差,而算法继承了这些偏差。例如,主要在的图片上训练的面部识别算法在非上的表现会较不准确。
缺乏概括性:深度学习算法擅长执行重点任务,但不擅长概括其知识。与人类不同,经过训练可以玩《星际争霸》的深度学习模型将无法玩类似的游戏:例如《魔兽争霸》。而且,深度学习在处理偏离其训练示例(也称为“边缘案例”)的数据方面很差。在无人驾驶汽车等情况下,这可能会带来危险,因为错误可能导致致命的后果。
深度学习的未来
今年早些时候,深度学习的先驱者获得了图灵奖,这是与诺贝尔奖相当的计算机科学。但是深度学习和神经网络的工作还远远没有结束。正在努力改善深度学习。
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
作为A股市场中极具代表性的黄金珠宝行业龙头企业,作为中国历史最悠久的珠宝品牌之一,老凤祥(股票代码:600612)...浏览全文>>
-
宝子们,杭州 房子装修完成啦!这次要给大家分享几家设计超赞的装修公司哦。它们各具特色,从空间规划到风格...浏览全文>>
-
欲筑室者,先治其基。在上海,装修房子对于每个业主而言,都是极为关键的一步,然而,如何挑选一家值得信赖的...浏览全文>>
-
2025年以来,联通支付严格贯彻落实国家战略部署,以数字和科技为驱动,做好金融五篇大文章,履行支付为民社会...浏览全文>>
-
良工巧匠,方能筑就华居;精雕细琢,方可打造美家。当我们谈论装修公司时,选择一家靠谱可靠的公司是至关重要...浏览全文>>
-
在当今社会,随着城市化进程的高速推进,建筑垃圾的产生量与日俱增。据权威数据显示,我国每年建筑垃圾产生量超 ...浏览全文>>
-
家人们,在上海要装修,选对公司那可太重要了!古语有云:"安得广厦千万间,大庇天下寒士俱欢颜。"一个温馨的...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,各大品牌纷纷推出各具特色的车型以满足消费者多样化的需求。作为国内新能源...浏览全文>>
-
近年来,随着汽车市场的不断变化和消费者需求的升级,安徽滁州地区的宝来2025新款车型在市场上引起了广泛关注...浏览全文>>
-
随着汽车市场的不断变化,滁州地区的消费者对高尔夫车型的关注度持续上升。作为大众品牌旗下的经典车型,高尔...浏览全文>>
- 安徽滁州途安L新车报价2022款,最低售价16.68万起,入手正当时
- 小鹏G7试驾,新手必知的详细步骤
- 别克GL8预约试驾,4S店的贴心服务与流程
- 安徽阜阳ID.4 CROZZ落地价全解,买车必看的省钱秘籍
- 淮北探岳多少钱 2025款落地价,最低售价17.69万起现在该入手吗?
- 安徽淮南大众CC新款价格2025款多少钱能落地?
- 淮北长安启源C798价格,最低售价12.98万起现在该入手吗?
- 安徽淮南途锐价格,各配置车型售价全解析
- 蒙迪欧试驾预约,4S店体验全攻略
- 沃尔沃XC40试驾需要注意什么
- 滁州ID.4 X新车报价2025款,各车型售价大公开,性价比爆棚
- 试驾思域,快速操作,轻松体验驾驶乐趣
- 试驾长安CS35PLUS,一键搞定,开启豪华驾驶之旅
- 天津滨海ID.6 X落地价限时特惠,最低售价25.9888万起,错过不再有
- 天津滨海凌渡多少钱?看完这篇购车攻略再做决定
- 安徽池州长安猎手K50落地价,买车前的全方位指南
- 山东济南ID.6 CROZZ 2024新款价格,最低售价19.59万起,现车充足
- 试驾海狮05EV,新手必知的详细步骤
- 生活家PHEV多少钱 2025款落地价走势,近一个月最低售价63.98万起,性价比凸显
- 奇瑞风云A9试驾,新手必知的详细步骤