自聊天机器(qì)人ChatGPT火爆以来,微软公(gōng)司创(chuàng)始人比尔·盖茨已多次公开谈论人工智能(néng)话题。在最近的一次采访(fǎng)中,他(tā)再次(cì)表示:“AI可能(néng)会(huì)让科技行业迎来一次(cì)剧烈的洗牌”。
这个(gè)结论(lùn)是他在(zài)当地时间2月(yuè)20日(rì)接受《In Good Company》节目专访时提出的。
他预(yù)期,AI的发展(zhǎn)可能会威胁到谷歌的市占(zhàn)率,因为(wèi)微软在(zài)AI方面的行动相当(dāng)迅速。而(ér)最终科技巨(jù)头将(jiāng)把AI整合成用户的(de)“全能助手”,包揽一切应用,与人们进行沟通并(bìng)提供建议,可以取代亚马逊、Siri或Outlook等应用。
大佬(lǎo)口中全(quán)能助手(shǒu)的到来可能(néng)尚(shàng)需(xū)时日,但由(yóu)ControlNet引发的又一(yī)次(cì)AI绘画(huà)浪潮,让AIGC在ChatGPT的(de)话题热(rè)点包围中杀出重(zhòng)围。
01
ControlNet颠覆AI绘画新玩法
AIGC向可控(kòng)靠近
以AI绘画为(wèi)代表(biǎo)的(de)AIGC上(shàng)一次爆火的(de)时候,还是(shì)2022年8月,在(zài)美(měi)国科罗(luó)拉多州(zhōu)举(jǔ)办(bàn)的新兴数字艺(yì)术家竞赛(sài)中(zhōng),一幅名为《太空歌剧院(yuàn)》的作品(pǐn)获奖(jiǎng)。
随后各大厂商的AI绘画软件被广大网友熟(shú)知(zhī)并体(tǐ)验,Stable Diffusion便是其中代(dài)表。
用户(hù)们可以在应用(yòng)中输(shū)入一组关(guān)键词或者一(yī)张照片,就能获(huò)得(dé)一幅AI创作的画作。
作画的关键就是所输入(rù)的文本。同一(yī)组关键词也可以创作出很多(duō)张风格不(bù)一(yī)样(yàng)的(de)画作,这(zhè)让创作的过(guò)程就(jiù)像开盲盒(hé)。
很多用户很喜欢这(zhè)种不确定的惊喜,他们会将生成的美(měi)图(tú)当(dāng)做头(tóu)像。而另一部(bù)分喜欢翻看AI绘画的“翻车”作品。在社交媒体上,许多用(yòng)户分享AI“翻(fān)车(chē)现(xiàn)场”,例如,一位网友的小狗(gǒu)照片被AI画成(chéng)了“肌肉男”,还有网友的个人照片(piàn)被(bèi)AI识别成了建筑。
而如(rú)今(jīn)随着ControlNet的出现与加持,以往AI绘(huì)画的填写关键词游(yóu)戏可能(néng)要(yào)被(bèi)颠(diān)覆了。
ControlNet是一位正(zhèng)在斯坦福(fú)读博的中国人张吕敏创(chuàng)作的一种(zhǒng)基于控制(zhì)点的图(tú)像变(biàn)形算法,主要用于数字(zì)图像处理、计算(suàn)机视觉和计算机图形学等(děng)领域。
其SD插(chā)件一经发(fā)布(bù),在短短的两天内便成为了AI绘(huì)画领域最新(xīn)的热点。
在此之(zhī)前,大(dà)家用(yòng)了很(hěn)多方法(fǎ)想让AI生成的(de)结果尽可(kě)能的符合要求,但是都不尽如(rú)人意,它的出(chū)现代表着AI生成开(kāi)始进入真(zhēn)正的可控时期。
因为ControlNet可以直接提取画面(miàn)的(de)构图,人(rén)物的姿势和画面(miàn)的深度信息(xī)等(děng)。有了它的帮助(zhù),就(jiù)不用频繁的(de)用提(tí)示词来碰运气,抽盲盒式(shì)的创(chuàng)作了。
通俗的说ControlNet相当于给AI绘画加了“魔法”,不少博主的作品(pǐn)已经获得了大量的(de)浏(liú)览(lǎn)量,“viggo”就是(shì)其中(zhōng)之(zhī)一,他用朋友的照片直接带(dài)她们走进(jìn)动漫世界。
viggo先用StableDiffusion图片转文字。
再用Text2Prompt插件拓展找到对应(yīng)的关(guān)键词;最后用ControlNet插件绑(bǎng)定(dìng)骨骼开始换(huàn)关键(jiàn)词试效果。
通过图片就可以看出来,效果十分惊艳。
更厉害的(de)是,除了真实的照片,草图也(yě)可以加上“魔法(fǎ)”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能实现线稿转(zhuǎn)全彩图。大神(shén)张吕敏其(qí)本尊也(yě)亲自回应。
不得不(bù)说当(dāng)下AIGC已经变得越来越强大(dà),甚至输(shū)出的(de)作品都已经(jīng)能以假乱真了(le)。
02
难辨虚实,AIGC技术力(lì)爆发
警惕(tì)安全(quán)问题
近日,“苏州金鸡湖(hú)有游艇(tǐng)party”的(de)消息火遍网络(luò),而经过警方辟(pì)谣(yáo)这所(suǒ)谓的“party”可能是全国第一(yī)起AI绘图诈(zhà)骗。
由于(yú)这个活动里面给出的美女照片(piàn)都是AI制作的真人照片绘图,因为太逼真,被大家当成真事传播了。
不过仔(zǎi)细观察可(kě)以(yǐ)发现,活动发起者提(tí)供的照(zhào)片(piàn)中有个很大(dà)的漏洞可以发现并非真人,而是(shì)AI绘(huì)图,那便是图片(piàn)中女性的手指部分有(yǒu)的存在异(yì)常。
有行业人事表示(shì):“现(xiàn)在因(yīn)为手指部分的绘(huì)画算法比较复杂,AI还不太会画人(rén)的手,但最新看(kàn)到的图(tú)片已经有越来(lái)越完美(měi)的AI模型出现,以后可能(néng)就(jiù)完全没(méi)有漏洞了。”
类似(shì)的AI作(zuò)图诈(zhà)骗在国外(wài)也已有发生。据英国广播公司报道,土耳其地震期(qī)间,有Tiktok用户使用AI合(hé)成(chéng)了儿童(tóng)受(shòu)灾(zāi)的假照片(piàn)发布到网络(luò),以此诱骗善良的人打(dǎ)赏“捐助(zhù)”从而实施诈骗(piàn)。
目(mù)前(qián)随着技术发(fā)展,AIGC已经(jīng)能做出真(zhēn)人(rén)照片般的绘图效果,如果(guǒ)这样的图片(piàn)被用来诈(zhà)骗(piàn),将(jiāng)非常可怕。
此外AIGC还引发了很(hěn)多担忧,一方(fāng)面(miàn),批判(pàn)者认为AI在(zài)“学习”了大量前人的作品之后(hòu),其创作没有任何情绪和灵魂,难以(yǐ)和人类的艺(yì)术(shù)创作相提并论。
另一(yī)方面(miàn),AIGC背后(hòu)的版权、目前都并没有(yǒu)得(dé)到有效(xiào)的解(jiě)决,还有AIGC会不会(huì)代替人类“至高(gāo)无上”的(de)创(chuàng)意。
马(mǎ)斯克也强调,人(rén)工(gōng)智能的安全问(wèn)题需要得到重视(shì),太(tài)晚就(jiù)来不及了。
03
AIGC下一站(zhàn)除(chú)了视频,还有远方(fāng)
技(jì)术(shù)都是(shì)有两面性的,潜在(zài)的危害并不能(néng)掩盖其光辉(huī)的贡献。现在看来,人工(gōng)智能技(jì)术将是第四次工(gōng)业革(gé)命的核心驱(qū)动力量,将(jiāng)创造新的增长(zhǎng)奇(qí)迹。
过去一(yī)年,人(rén)工(gōng)智能在技(jì)术和(hé)商(shāng)业层(céng)面(miàn)都有了巨大进(jìn)展(zhǎn),AI绘画就是人(rén)工智能技术发生方向性改变(biàn)的一(yī)个代表。其(qí)下一站或(huò)许就是视频。
此(cǐ)前,Meta和(hé)谷歌(gē)先后发布了(le)几条引爆科技(jì)圈的短视频。这(zhè)些(xiē)视频引(yǐn)发关注并非内容做得(dé)多优秀,反(fǎn)而都(dōu)非常(cháng)简单,比如一匹正在(zài)喝水的马,一只画画的玩具熊(xióng),或者一(yī)段骑摩托车的第(dì)一视角录像(xiàng),随便一个有手机(jī)的人(rén)都可以(yǐ)随手录下一段。
但这些(xiē)短(duǎn)视频的创(chuàng)作方式非常(cháng)简(jiǎn)单,创作者仅仅需要(yào)向(xiàng)AI输(shū)入一段话,甚至只是说一下要求,AI就可以根(gēn)据需(xū)要生成(chéng)一段视频(pín)。
谷(gǔ)歌(gē)发布的两个AI生成视(shì)频分(fēn)别来自(zì)于Imagen Video和Phenaki,前者主要(yào)突出的是(shì)高清,与(yǔ)Meta的Make-A-Video没有(yǒu)太多的差别。
在Make-A-Video公布了AI生成的视(shì)频后,AI圈就已经玩了一波梗(gěng),一(yī)个能够做出(chū)更高清视(shì)频的AI还(hái)不足(zú)以(yǐ)在短时间内戳(chuō)中兴奋点。
Phenaki更加令(lìng)人震惊的地方在(zài)于,它可以(yǐ)制作出超过2分(fēn)钟的连贯的也有确切(qiè)内容的视(shì)频(pín),这才是真(zhēn)正让人们感到惊喜的地方(fāng)。因为(wèi)无论AI生(shēng)成的视频多么高清,也只(zhǐ)能是(shì)为内容(róng)生产(chǎn)者提供(gōng)一(yī)个(gè)灵感,一个素材,一个过(guò)场动(dòng)画。
不过能够制(zhì)作出有具体剧情(qíng)内容的视频就意味着,一(yī)些视(shì)频创作由AI代替人(rén)工(gōng)完成(chéng)已经(jīng)初(chū)步有了可能。
当下AI的发展速度已经超过大部分人的想象(xiàng)。内容产业的本(běn)质是供给(gěi)创造需求,AIGC作为全新的内容生产方式(shì),可以为内容产(chǎn)业带来更新的内容风格、更快的生(shēng)产(chǎn)速(sù)度,更低的生产成本,这无疑会驱(qū)动(dòng)内(nèi)容产业的大爆发。
除了(le)AI绘图(tú)、视(shì)频,AIGC技术还能应用于音乐、代码、机器人动作等多种内容形式的生成。不难(nán)发(fā)现该项技术不仅在游戏(xì)等行业(yè)能得到有效应用,对于下一代互联网各种元素的构(gòu)建亦有关键意义(yì)。
从(cóng)商业化的角度(dù)来(lái)看,文化娱(yú)乐、教育(yù)、传媒等诸(zhū)多领域,本身(shēn)就对基于(yú)AI的可视化内容有(yǒu)强烈需求。
因此,AI绘画及视频或不是结果(guǒ),而只是AI进程中的一块(kuài)重要拼图,有望在技(jì)术更新(xīn)的加持(chí)下实现更大的(de)应用价值(zhí)。
AI从理解(jiě)内(nèi)容,走向了(le)可以(yǐ)生成内容,甚至(zhì)能(néng)够(gòu)创造(zào)出独立价值和独立视角的内容。AIGC的再次出圈,更代表(biǎo)着未(wèi)来(lái)的(de)先进生(shēng)产力即将到来。
04
紧抓大模(mó)型与算力,牢固AIGC底座(zuò)
从技术的发展也可以看出,在语(yǔ)言大模型、图像大模型之后,多模态大模型已经成为了(le)新的趋势。
大模(mó)型被(bèi)誉为当前人(rén)工(gōng)智能发展的(de)智(zhì)能底座,是全球竞(jìng)争最激(jī)烈的研究方(fāng)向(xiàng)之(zhī)一,包括(kuò)谷歌、亚马逊、百(bǎi)度、阿里、腾讯(xùn)等(děng)众多头部企业都在竞相发力。
不过训练大模型的确价格不(bù)菲,以(yǐ)国盛证券(quàn)发(fā)布(bù)的《ChatGPT需要多(duō)少(shǎo)算力》报(bào)告估算,GPT-3训练一次的成本约为140万美(měi)元。而(ér)对于一(yī)些(xiē)更大的LLM(大型语(yǔ)言模(mó)型),训练成本则介于200万(wàn)美元至1200万(wàn)美元(yuán)高价之间。
以ChatGPT在2023年1月的独立(lì)访客(kè)平均数1300万计算(suàn),其对应芯片需求(qiú)为3万多(duō)片英(yīng)伟达A100 GPU,初始投(tóu)入成本约为8亿美元,每日仅(jǐn)电费就在5万美元(yuán)左右。
此外不论是(shì)ChatGPT还是AIGC,都离不开庞大算力支持。在关注各类大模型的发展同(tóng)时,更(gèng)应该关注算力网(wǎng)络的建设。
算力网络正驱(qū)动AI产业发展进入(rù)史诗(shī)级加速进程,让AIGC及(jí)通用AI这(zhè)一(yī)人工智能发展的终极(jí)目标(biāo)离得更近。
因为算力可以(yǐ)对突破性技(j蟑螂在床上爬了还能睡吗,蟑螂在床上爬了还能睡吗ì)术创新提供大力的支(zhī)持。这方面,多模态大模(mó)型是典型。作为面向(xiàng)未(wèi)来(lái)强人工智能、通用人工智能的(de)重(zhòng)要技术创(chuàng)新(xīn),多模态大模型(xíng)已经在人工智能(néng)领域(yù)提出了很多(duō)年,业界也有不少技术突破,但是(shì),多模(mó)态大模(mó)型进一步往下走,算(suàn)力需求呈(chéng)几何式上(shàng)升,一般(bān)的算力基(jī)础(chǔ)设施(shī)很快将难以胜任。
从图像、文(wén)字、语音单独一项的训练,到双模(mó)态、三模态的跃迁,让人工智能可以灵(líng)活应对不同模态的转化、像人与世界交互一样(yàng)自然,这方(fāng)面(miàn),由算力网(wǎng)络来驱(qū)动将(jiāng)有(yǒu)明(míng)显优(yōu)势。
此(cǐ)外,还有(yǒu)很(hěn)多需(xū)要爆发式增长的算力来支撑的技术创新,将(jiāng)在(zài)人工智(zhì)能算力网络支(zhī)撑下快速推进。
AIGC已经露出曙光,期待(dài)在大模型和大算力的支(zhī)持下AIGC能(néng)持续(xù)颠(diān)覆内容生产的方式,将创造的边际成(chéng)本(běn)降低,让万众受益。
未经允许不得转载:橘子百科-橘子都知道 蟑螂在床上爬了还能睡吗,蟑螂在床上爬了还能睡吗
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了