橘子百科-橘子都知道橘子百科-橘子都知道

不朽的意思

不朽的意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人(rén)ChatGPT火爆以来,微软公(gōng)司创(chuàng)始人比尔·盖(gài)茨(cí)已多次公(gōng)开谈(tán)论人工(gōng)智能话题。在最近的(de)一(yī)次(cì)采访(fǎng)中(zhōng),他(tā)再次表示:“AI可能(néng)会(huì)让科(kē)技行(xíng)业迎来一次(cì)剧烈的洗牌”。

这(zhè)个结论是(shì)他在当地时间2月(yuè)20日接受(shòu)《In Good Company》节目(mù)专访时(shí)提(tí)出的。

他预期,AI的发展可能(néng)会威胁到谷歌(gē)的市占率,因为(wèi)微软在AI方面的行动相当迅速。而最终科技(jì)巨头(tóu)将把AI整合成用户的“全能(néng)助(zhù)手”,包揽(lǎn)一(yī)切应用,与人们进(jìn)行沟(gōu)通并(bìng)提供(gōng)建(jiàn)议,可以取代亚马逊(xùn)、Siri或Outlook等应用。

大佬(lǎo)口中(zhōng)全能(néng)助手的(de)到来可能尚需时日,但由ControlNet引发的又(yòu)一次AI绘画浪潮,让AIGC在(zài)ChatGPT的话题(tí)热点包围中杀出重围。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向可控(kòng)靠近

以AI绘画为代表的AIGC上一次爆(bào)火(huǒ)的时候,还是2022年(nián)8月(yuè),在美国科罗(luó)拉多(duō)州举(jǔ)办的(de)新(xīn)兴数字艺(yì)术家竞(jìng)赛中,一幅名为《太空歌剧院》的作品(pǐn)获奖。

随后各(gè)大厂(chǎng)商的AI绘画软件(jiàn)被广大网(wǎng)友熟知(zhī)并体验,Stable Diffusion便(biàn)是其中代表。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技(jì)行(xíng)业(yè)?_黑料正(zhèng)能量

用户们可(kě)以在应用中输入(rù)一组关键词或(huò)者(zhě)一张(zhāng)照片,就能获得(dé)一幅AI创作的画作(zuò)。

作(zuò)画的关键就是所输入(rù)的文本。同(tóng)一组关(guān)键词也可(kě)以创作出很多张风格不一样的画作,这让创作的过程就(jiù)像开盲盒(hé)。

很多用户(hù)很喜欢这(zhè)种不确(què)定的惊喜,他(tā)们会将生成的美图当做头(tóu)像(xiàng)。而另一部分喜欢翻(fān)看AI绘画的“翻车”作品。在(zài)社(shè)交(jiāo)媒体上,许多用户分享AI“翻车(chē)现(xiàn)场(chǎng)”,例(lì)如,一(yī)位网友的小狗照片被AI画成了“肌肉男”,还(hái)有网(wǎng)友的(de)个人(rén)照(zhào)片被AI识别成(chéng)了(le)建筑。

而如(rú)今随着ControlNet的出现与加持,以往(wǎng)AI绘画的(de)填写关(guān)键词游戏(xì)可能要被颠(diān)覆了。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进(jìn)入可(kě)控期,将(jiāng)洗牌科技(jì)行业?_黑料正能量

ControlNet是一位正在斯坦福读博的(de)中(zhōng)国人(rén)张吕敏创作的一种基(jī)于控制(zhì)点的图像变形算(suàn)法(fǎ),主要用于数字图像处(chù)理(lǐ)、计算(suàn)机视(shì)觉和计算机图(tú)形学等领域。

其(qí)SD插件(jiàn)一经发(fā)布(bù),在短短的(de)两天(tiān)内便成为了AI绘画领域最(zuì)新的热(rè)点。

在(zài)此之(zhī)前,大家用(yòng)了不朽的意思很多方法想(xiǎng)让AI生(shēng)成的(de)结(jié)果尽可能的符合要求(qiú),但(dàn)是都不尽如(rú)人(rén)意,它的出现代(dài)表着AI生成开始进入(rù)真(zhēn)正(zhèng)的可控(kòng)时期。

因为ControlNet可以直接提取画面的(de)构图,人(rén)物的姿势(shì)和画(huà)面的(de)深度信(xìn)息等。有了它的帮(bāng)助,就不用频繁(fán)的用提示词来碰运气(qì),抽(chōu)盲盒式的创作了。

通俗的说ControlNet相当于给AI绘画加(jiā)了“魔法”,不少博主的作品(pǐn)已经获(huò)得了(le)大量的(de)浏览量,“viggo”就是其中之一(yī),他用朋友的照(zhào)片直(zhí)接带她们走进(jìn)动漫世界(jiè)。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀疯了,AIGC或(huò)进入可(kě)控期(qī),将洗牌科(kē)技行(xíng)业?_黑料正能量

viggo先用StableDiffusion图片转文字。

再用(yòng)Text2Prompt插件拓展(zhǎn)找(zhǎo)到对应的关键词;最(zuì)后用ControlNet插件绑定骨(gǔ)骼开始换关(guān)键词试效果。

ChatGPT之后又(yòu)一应用杀疯了(le),AIGC或进(jìn)入(rù)可控(kòng)期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量

通(tōng)过(guò)图片就可(kě)以看出来,效果(guǒ)十分(fēn)惊艳。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行(xíng)业?_黑(hēi)料正(zhèng)能量

ChatGPT之后(hòu)又(yòu)一应用(yòng)杀疯了,AIGC或(huò)进入(rù)可控(kòng)期,将洗牌(pái)科技(jì)行业(yè)?_黑料正(zhèng)能量

更厉害的是,除了真实(shí)的(de)照片,草图也可以(yǐ)加上(shàng)“魔法(fǎ)”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现(xiàn)线稿转全(quán)彩图。大神张吕敏其本尊也亲自回应。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科(kē)技行业?_黑(hēi)料(liào)正能(néng)量

不得不说当(dāng)下AIGC已经变得越来越强大,甚至输出的作品都已经(jīng)能以假乱真(zhēn)了。

02

难辨虚实,AIGC技术力爆发(fā)

警(jǐng)惕安(ān)全问题(tí)

近日(rì),“苏州金鸡(jī)湖(hú)有游艇party”的消息火遍网络,而经过(guò)警方辟谣(yáo)这所谓的“party”可能是全国第(dì)一起AI绘图诈骗。

由于这个活动(dòng)里(lǐ)面给(gěi)出(chū)的美女照片都是AI制作的(de)真人照片绘图,因为太(tài)逼真,被大家当成真事传播(bō)了

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控期,将洗牌(pái)科技行(xíng)业?_黑料正(zhèng)能量(liàng)

不过仔细观(guān)察可以发现,活动发起者提供的照片中有个很大(dà)的漏洞可以(yǐ)发(fā)现并非(fēi)真人,而是AI绘图,那便是图片中(zhōng)女(nǚ)性的手指部分有的存在异常。

ChatGPT之(zhī)后(hòu)又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

有行业人事(shì)表示:“现在因为手指部分的绘画算法比(bǐ)较复杂,AI还不太会画人的(de)手(shǒu),但最新看到的图(tú)片(piàn)已经有越(yuè)来越完美(měi)的AI模(mó)型出(chū)现(xiàn),以后可能就完(wán)全没有漏洞(dòng)了(le)。

类似的AI作图诈骗在国外也已有发(fā)生(shēng)。据英国广播(bō)公司(sī)报(bào)道(dào),土耳其地震期间,有Tiktok用(yòng)户使用AI合成了儿童(tóng)受(shòu)灾的假照片发布到网络(luò),以此(cǐ)诱骗(piàn)善良的(de)人(rén)打赏“捐助”从而实施诈骗。

目前随着(zhe)技术发(fā)展,AIGC已经能做出真人(rén)照(zhào)片般的绘图效果,如果这样的图片被用来诈骗,将非常可怕。

此外AIGC还引发了很(hěn)多担忧(yōu),一方面,批(pī)判(pàn)者认为(wèi)AI在(zài)“学习”了大(dà)量前人的作(zuò)品之后,其创作(zuò)没有任何情绪和灵魂(hún),难(nán)以和人类(lèi)的艺术创作相提并论。

另一方面,AIGC背(bèi)后的(de)版权(quán)、目前都并没有得(dé)到(dào)有效的解决,还(hái)有AIGC会(huì)不会(huì)代替人类(lèi)“至(zhì)高无上”的创意。

马斯克也强调,人工智(zhì)能的安全问(wèn)题需要得到重(zhòng)视(shì),太晚就(jiù)来不及了。

03

AIGC下一站(zhàn)除了视频,还有远方

技术都是有(yǒu)两面性的,潜在(zài)的(de)危害并不(bù)能(néng)掩盖其(qí)光辉的贡献。现在看(kàn)来,人工智能技术将是(shì)第四次工业革(gé)命(mìng)的核心驱动力量(liàng),将创(chuàng)造(zào)新(xīn)的增长奇迹。

过去一年,人工智能在技术和商业(yè)层面都有了巨大(dà)进(jìn)展,AI绘画(huà)就是(shì)人工智(zhì)能(néng)技术(shù)发生(shēng)方(fāng)向(xiàng)性(xìng)改变的一个代表。其(qí)下一站或许就(jiù)是(shì)视频。

此前,Meta和谷歌先(xiān)后发布了(le)几条引爆科(kē)技(jì)圈的短(duǎn)视频(pín)。这些视频(pín)引发关注(zhù)并非内容(róng)做得多优秀(xiù),反而都非常简单,比(bǐ)如(rú)一匹正在喝水(shuǐ)的(de)马,一(yī)只画画(huà)的玩具熊,或者一(yī)段骑摩托车的第一视角录像,随便一个有手机的人(rén)都可以(yǐ)随手(shǒu)录下一段。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入(rù)可控期,将洗牌(pái)科技行业?_黑料正能量

但这些短视频的创作方(fāng)式非常简(jiǎn)单,创作者仅仅需(xū)要向AI输入(rù)一段话,甚至只是说一下(xià)要求,AI就可以根据需要生成一段视频(pín)。

谷歌发布的两个AI生成视频(pín)分别来自于Imagen Video和Phenaki,前者主要突出的是高(gāo)清(qīng),与(yǔ)Meta的Make-A-Video没(méi)有太多(duō)的差别(bié)。

在(zài)Make-A-Video公布了(le)AI生成的(de)视(shì)频后,AI圈就已经玩了一(yī)波梗,一个(gè)能够做(zuò)出更高清视频的(de)AI还不足(zú)以在短时间(jiān)内(nèi)戳中兴奋点(diǎn)。

Phenaki更加(jiā)令人(rén)震惊(jīng)的地方在于,它可以制作出超(chāo)过(guò)2分钟的连贯(guàn)的(de)也(yě)有确切内容的视频,这才是(shì)真正(zhèng)让(ràng)人们感到惊喜的地方。因为无论AI生成的视频多么高清,也只能(néng)是为内容生产者提供一个灵(líng)感,一个(gè)素不朽的意思材,一个(gè)过场动画。

不过能够制(zhì)作出有具体剧(jù)情内容(róng)的(de)视频就意味着,一些视频创(chuàng)作由(yóu)AI代替人工完成已经初步有了可能。

当下(xià)AI的发展速度已(yǐ)经(jīng)超过(guò)大(dà)部分人的想象(xiàng)。内容产业的本质是供给创造(zào)需求,AIGC作为全新的内(nèi)容(róng)生产(chǎn)方(fāng)式,可(kě)以为(wèi)内容产业带(dài)来更新的内容(róng)风格、更(gèng)快的生产速度,更(gèng)低的生产成本,这无疑会驱动内容产(chǎn)业的(de)大爆(bào)发。

除了AI绘图、视(shì)频,AIGC技术还(hái)能应用于音乐、代码、机器人(rén)动作(zuò)等(děng)多种内容(róng)形式的(de)生(shēng)成。不难发现该(gāi)项技术不仅(jǐn)在游戏等(děng)行(xíng)业能得到(dào)有效应用,对于下一(yī)代互联网各种元(yuán)素(sù)的构建亦有关键意义。

从商业化的角度来看,文化(huà)娱乐(lè)、教育、传(chuán)媒等诸多领(lǐng)域,本身就对基于AI的(de)可(kě)视化内容有强(qiáng)烈需(xū)求。

因此,AI绘画及(jí)视频或不(bù)是(shì)结果,而只是AI进程中的一(yī)块重(zhòng)要拼图,有望在技(jì)术(shù)更新的加(jiā)持下(xià)实现(xiàn)更大的应用价值。

AI从理解内容(róng),走向了可以(yǐ)生成(chéng)内容(róng),甚至能够(gòu)创造出(chū)独(dú)立价值和独立视角的(de)内容(róng)。AIGC的再次出(chū)圈,更代表着未来的(de)先进生产力(lì)即将到来。

ChatGPT之后又(yòu)一应用(yòng)杀(shā)疯了,AIGC或进入(rù)可(kě)控期(qī),将洗牌科技行业?_黑料正能量

04

紧抓大(dà)模型与算(suàn)力(lì),牢固AIGC底座

从技(jì)术的发展也可(kě)以看(kàn)出(chū),在语言大模(mó)型、图像大模型之(zhī)后,多模态大模型已经成为了新的趋势。

大模(mó)型被誉为当前人(rén)工智能发展的(de)智能底(dǐ)座,是全球竞争(zhēng)最激(jī)烈的(de)研(yán)究方向之一,包括谷歌、亚(yà)马(mǎ)逊、百度、阿里、腾讯等众多头部企业都在(zài)竞相(xiāng)发(fā)力。

不过训练大模型的确价格不菲,以(yǐ)国盛(shèng)证券发布的《ChatGPT需(xū)要多(duō)少(shǎo)算力》报(bào)告估算,GPT-3训练一次的成本约为140万美元。而(ér)对(duì)于一些更大的LLM(大型(xíng)语言模型),训练成本则介(jiè)于200万美元至(zhì)1200万美(měi)元高价(jià)之间。

以ChatGPT在2023年1月的独立访(fǎng)客平均数1300万计算,其对应(yīng)芯片需求为3万(wàn)多片英伟达A100 GPU,初始投(tóu)入成本约为8亿(yì)美(měi)元,每日仅电费就(jiù)在(zài)5万美元左右。

ChatGPT之(zhī)后又一应(yīng)用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正能量

此外不论是ChatGPT还是AIGC,都离不开(kāi)庞大算(suàn)力支持。在关注各类大模型的发展同时(shí),更(gèng)应该关注(zhù)算力(lì)网络的建(jiàn)设。

算力网络(luò)正驱动AI产(chǎn)业(yè)发展进入史诗级加(jiā)速进程,让AIGC及通用AI这一人(rén)工智能发展的终极目标离得更近。

因为算力可(kě)以对突破性技(jì)术创(chuàng)新提供大力的(de)支持。这方面,多模态大(dà)模型(xíng)是典型。作为面向未来强人(rén)工智能、通用(yòng)人工(gōng)智能的重要技术(shù)创新,多模态大模型已(yǐ)经在人工智能领域提出了很多年(nián),业界也有不(bù)少技术(shù)突破,但是,多模态大模型(xíng)进一步往(wǎng)下走(zǒu),算力需求呈(chéng)几(jǐ)何式(shì)上升(shēng),一般的算(suàn)力基础设施很(hěn)快(kuài)将(jiāng)难以(yǐ)胜任。

从图像、文(wén)字、语(yǔ)音(yīn)单(dān)独一(yī)项的训练,到双模态(tài)、三模(mó)态的跃迁,让人(rén)工智能可(kě)以(yǐ)灵活应(yīng)对不同(tóng)模态的转化(huà)、像人与世界交互一样自然,这方面,由算力网(wǎng)络来(lái)驱动将有明显优(yōu)势(shì)。

ChatGPT之(zhī)后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量

此外,还有很多(duō)需要爆发式增(zēng)长的算力来支撑的技术创新(xīn),将在人工智能算力网络支撑下快速推进。

AIGC已经露出曙光,期待在大模型(xíng)和大算力的支(zhī)持(chí)下AIGC能持续颠覆(fù)内容(róng)生产的方(fāng)式,将创造的边际成本降(jiàng)低,让万众受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 不朽的意思

评论

5+2=