韩国游戏巨头研究头像AI卡通化 终于实现了翻译的信达
年轻一代人当中,很多都是 ACG(动画、漫画和游戏)死忠。在社交网络上,经常会看到动漫角色的头像,因为对于这部分用户来说,共同的爱好是他们鉴别彼此、增进交流的一种有效方式。
然而有两个小问题:首先,热门动漫作品就那么几部,撞头像的事故经常发生。以及,甭管账户的主人是什么性别,头像一水都是可爱女生,时间长了毫无辨识度了。每次上网看帖,就像围观一帮动漫角色在互相留言点赞……
我们都知道,最近几年基于神经网络的 AI 发展的很快,其中有一种技术叫做风格迁移 (style transfer),简单来说就是让图片 A 获得图片 B 的风格,但仍然具有明显的 A 的特征。
有了这项技术之后,ACG爱好者也可以让自己的头像具有动漫风格了。只是效果仍然不是很令人满意,看起来像是用画笔和颜色对人脸照片描边而已:
这种风格迁移其实有点违背初衷:很多人用动漫头像是为了可爱,可是最终输出看起来一点都不可爱。
然而 ACG 爱好者是不会停止脚步的!
一群韩国的 AI 研究者最近发布了一篇论文,展示了他们在图片到图片翻译 (image-to-image translation) 上取得的重要进展。
他们实现的效果,看起来更像是找了一位漫画家,对着原始照片认真地再创作,效果超过了所有现存的头像卡通化技术:
用红框标出的分别为原图(a) 和输出结果 (e),输出的头像不但风格更加接近我们经常在动漫当中看到的形象,和原图的可识别度也很高。
在非监督学习的方法和生成对抗网络(简称 GAN)的架构基础上,研究者加入了全新的注意力模块,并发明了一种名为“自适应层-实例归一化”(AdaLIN)的 归一化机制,开发出一种全新的神经网络。
正是因为研究者设计的全新的注意力和归一化机制,我们可以从输出结果中看到,这个神经网络对于不同特征进行了不同的处理。
该放大的特征,比如眼睛,被放大了;该缩小的特征,比如鼻子、嘴巴,也得到了缩小;至于其它特征,比如发型、发色、肤色,甚至包括面部阴影,也有相当准确的还原。
研究者指出,之前的图像风格迁移结果,之所以看起来像描边,是必须把原图的线条背景映射到输出结果上;而他们开发的注意力和归一化机制,能够对原图和目标风格图进行注意力绘制,然后引导模型对不同的区域和特征进行不同的重构。
也就是说,这个新的模型能够理解,动漫头像必须有大眼睛、更具线条感的头发,以及更鲜亮的发色和瞳色。它会按照这些(从输入的参考头像中取得的)原则去进行翻译。
研究者在论文中提到,他们的这个模型在简单的风格迁移基础上,已经上了一个新的台阶,有了变形的能力 (object transfiguration)。
他们发明的自适应层-实例归一机制 AdaLIN,还有一些其它优势,比如可调节性,研究者可以对层(Layer) 和实例 (Instance) 分别进行调整,从而在输出中实现不同程度的形状和材质变化。
下图中可以看到,从横排第三到第六,是对归一机制进行调整所得到的不同结果:
在文字翻译中,输出的结果要符合对象语言的语法、使用习惯等等。在图片翻译 (image-to-image translation) 中其实也是一样。你可以这样理解:之前的风格迁移,都只是在做“字面翻译”,而 U-GAT-IT 在“信达雅”上实现了突破。
该技术的另一厉害之处,是可以对几乎任何类型的照片(动物、宠物脸部、风景)进行准确的图片翻译,而且不需要对神经网络的参数进行任何调整:
头像瞬间萌化!这个技术让你一键变身日漫主角值得提及的是,包括 Kim 在内的三名作者均来自人称游戏界“高丽双雄”之一的韩国游戏公司 NCsoft;另一作者来自波音韩国工程科技中心。
NCsoft 开发的老牌网游《天堂》(Lineage 1 &2)于1998年上线,已经在包括在内的多国连续运营21年,还有《永恒之塔》等几款知名游戏。但少有人知的是,实际上 NCsoft 也是韩国在人工智能研发方面最激进的公司之一。
据《韩国时报报道》,NCsoft 在 2011年就已设立了专门研发团队,目前运营着人工智能中心、自然语言处理中心两个独立的研究机构。前者负责游戏AI、语音识别和计算机视觉,后者主攻语言理解和知识系统。
头像瞬间萌化!这个技术让你一键变身日漫主角NCsoft 人工智能中心、自然语言处理中心负责人在该公司举办的活动上两个中心的负责人直接向公司创始人兼 CEO 金泽辰直接管理,员工总数约为160人,今年内将增员到300人左右。
NCsoft 投入深度学习的主要目的,是在游戏和服务中引入相关技术。目前,该公司正在使用 AI 检测外挂,以及基于玩家的游戏习惯和兴趣数据进行服务定制化。
而本文所提到的这项技术,将能够极大改善玩家的游戏体验——或许以后不用捏脸,只要上传头像,就能生成准确的卡通化游戏角色了。
头像瞬间萌化!这个技术让你一键变身日漫主角波音去年刚刚在韩国成立工程和科技中心,主要研究方向包括自动化、人工智能、航空电子学和数据分析等等。该机构的技术员工主要来自韩国本土的知名高校和科技公司等。
目前,这项技术还没有一个可用的 demo,不过如果你对 TensorFlow 比较熟悉,可以在 GitHub 上浏览代码[2]或阅读原文并按照使用说明,在自己的电脑上跑起来~
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
-
宝子们,杭州 房子装修完成啦!这次要给大家分享几家设计超赞的装修公司哦。它们各具特色,从空间规划到风格...浏览全文>>
-
欲筑室者,先治其基。在上海,装修房子对于每个业主而言,都是极为关键的一步,然而,如何挑选一家值得信赖的...浏览全文>>
-
2025年以来,联通支付严格贯彻落实国家战略部署,以数字和科技为驱动,做好金融五篇大文章,履行支付为民社会...浏览全文>>
-
良工巧匠,方能筑就华居;精雕细琢,方可打造美家。当我们谈论装修公司时,选择一家靠谱可靠的公司是至关重要...浏览全文>>
-
在当今社会,随着城市化进程的高速推进,建筑垃圾的产生量与日俱增。据权威数据显示,我国每年建筑垃圾产生量超 ...浏览全文>>
-
家人们,在上海要装修,选对公司那可太重要了!古语有云:"安得广厦千万间,大庇天下寒士俱欢颜。"一个温馨的...浏览全文>>
-
近年来,新能源汽车市场发展迅猛,各大品牌纷纷推出各具特色的车型以满足消费者多样化的需求。作为国内新能源...浏览全文>>
-
近年来,随着汽车市场的不断变化和消费者需求的升级,安徽滁州地区的宝来2025新款车型在市场上引起了广泛关注...浏览全文>>
-
随着汽车市场的不断变化,滁州地区的消费者对高尔夫车型的关注度持续上升。作为大众品牌旗下的经典车型,高尔...浏览全文>>
-
在2023年,大众探影以其时尚的设计和出色的性能赢得了众多消费者的青睐。作为一款小型SUV,探影凭借其紧凑的车...浏览全文>>
- 安徽滁州途安L新车报价2022款,最低售价16.68万起,入手正当时
- 小鹏G7试驾,新手必知的详细步骤
- 别克GL8预约试驾,4S店的贴心服务与流程
- 安徽阜阳ID.4 CROZZ落地价全解,买车必看的省钱秘籍
- 淮北探岳多少钱 2025款落地价,最低售价17.69万起现在该入手吗?
- 安徽淮南大众CC新款价格2025款多少钱能落地?
- 淮北长安启源C798价格,最低售价12.98万起现在该入手吗?
- 安徽淮南途锐价格,各配置车型售价全解析
- 蒙迪欧试驾预约,4S店体验全攻略
- 沃尔沃XC40试驾需要注意什么
- 滁州ID.4 X新车报价2025款,各车型售价大公开,性价比爆棚
- 试驾思域,快速操作,轻松体验驾驶乐趣
- 试驾长安CS35PLUS,一键搞定,开启豪华驾驶之旅
- 天津滨海ID.6 X落地价限时特惠,最低售价25.9888万起,错过不再有
- 天津滨海凌渡多少钱?看完这篇购车攻略再做决定
- 安徽池州长安猎手K50落地价,买车前的全方位指南
- 山东济南ID.6 CROZZ 2024新款价格,最低售价19.59万起,现车充足
- 试驾海狮05EV,新手必知的详细步骤
- 生活家PHEV多少钱 2025款落地价走势,近一个月最低售价63.98万起,性价比凸显
- 奇瑞风云A9试驾,新手必知的详细步骤