橘子百科-橘子都知道橘子百科-橘子都知道

蟑螂在床上爬了还能睡吗,蟑螂在床上爬了还能睡吗

蟑螂在床上爬了还能睡吗,蟑螂在床上爬了还能睡吗 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人ChatGPT火爆以来,微软公(gōng)司创(chuàng)始人比尔·盖茨已多次公开谈论人工智能(néng)话题。在最近的一次采访(fǎng)中,他(tā)再次(cì)表示:“AI可能(néng)会(huì)让科技行业迎来一次(cì)剧烈的洗牌”。

这个(gè)结论(lùn)是他在(zài)当地时间2月(yuè)20日(rì)接受《In Good Company》节目专访时提出的。

他预(yù)期,AI的发展(zhǎn)可能会威胁到谷歌的市占(zhàn)率,因为(wèi)微软在(zài)AI方面的行动相当(dāng)迅速。而(ér)最终科技巨(jù)头将(jiāng)把AI整合成用户的(de)“全能助手”,包揽一切应用,与人们进行沟通并(bìng)提供建议,可以取代亚马逊、Siri或Outlook等应用。

大佬(lǎo)口中全(quán)能助手(shǒu)的到来可能(néng)尚(shàng)需(xū)时日,但由(yóu)ControlNet引发的又一(yī)次(cì)AI绘画(huà)浪潮,让AIGC在ChatGPT的(de)话题热(rè)点包围中杀出重(zhòng)围。

ChatGPT之后(hòu)又一应(yīng)用杀疯(fēng)了,AIGC或进入(rù)可(kě)控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向可控(kòng)靠近

以AI绘画为(wèi)代表(biǎo)的(de)AIGC上(shàng)一次爆火的(de)时候,还是(shì)2022年8月,在(zài)美(měi)国科罗(luó)拉多州(zhōu)举(jǔ)办(bàn)的新兴数字艺(yì)术家竞赛(sài)中(zhōng),一幅名为《太空歌剧院(yuàn)》的作品(pǐn)获奖(jiǎng)。

随后各大厂商的AI绘画软件被广大网友熟(shú)知(zhī)并体(tǐ)验,Stable Diffusion便是其中代(dài)表。

ChatGPT之后又一(yī)应用(yòng)杀疯(fēng)了,AIGC或进入可(kě)控(kòng)期,将洗牌科(kē)技行业?_黑料(liào)正能量

用户(hù)们可以在应用(yòng)中输(shū)入一组关(guān)键词或者一(yī)张照片,就能获(huò)得(dé)一幅AI创作的画作。

作画的关键就是所输入(rù)的文本。同一(yī)组关键词也可以创作出很多(duō)张风格不(bù)一(yī)样(yàng)的(de)画作,这(zhè)让创作的过(guò)程就(jiù)像开盲盒(hé)。

很多用户很喜欢这(zhè)种不确定的惊喜,他们会将生成的美(měi)图(tú)当(dāng)做头(tóu)像。而另一部(bù)分喜欢翻看AI绘画的“翻车”作品。在社交媒体上,许多用(yòng)户分享AI“翻(fān)车(chē)现(xiàn)场”,例如,一位网友的小狗(gǒu)照片被AI画成(chéng)了“肌肉男”,还有网友的个人照片(piàn)被(bèi)AI识别成了建筑。

而如(rú)今(jīn)随着ControlNet的出现与加持,以往AI绘(huì)画的填写关键词游(yóu)戏可能(néng)要(yào)被(bèi)颠(diān)覆了。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正(zhèng)能量(liàng)

ControlNet是一位正(zhèng)在斯坦福(fú)读博的中国人张吕敏创(chuàng)作的一种(zhǒng)基于控制(zhì)点的图(tú)像变(biàn)形算法,主要用于数字(zì)图像处理、计算(suàn)机视觉和计算机图形学等(děng)领域。

其SD插(chā)件一经发(fā)布(bù),在短短的两天内便成为了AI绘(huì)画领域最新(xīn)的热点。

在此之(zhī)前,大(dà)家用(yòng)了很(hěn)多方法(fǎ)想让AI生成的(de)结果尽可(kě)能的符合要求,但是都不尽如(rú)人意,它的出(chū)现代表着AI生成开(kāi)始进入真(zhēn)正的可控时期。

因为ControlNet可以直接提取画面(miàn)的(de)构图,人(rén)物的姿势和画面(miàn)的深度信息(xī)等(děng)。有了它的帮助(zhù),就(jiù)不用频繁的(de)用提(tí)示词来碰运气,抽盲盒式(shì)的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘画加了“魔法”,不少博主的作品(pǐn)已经获得了大量的(de)浏(liú)览(lǎn)量,“viggo”就是(shì)其中(zhōng)之(zhī)一,他用朋友的照片直接带(dài)她们走进(jìn)动漫世界。

ChatGPT之(zhī)后又(yòu)一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑料正能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应(yīng)的关(guān)键词;最后用ControlNet插件绑(bǎng)定(dìng)骨骼开始换(huàn)关键(jiàn)词试效果。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技(jì)行业?_黑料(liào)正能量

通过图片就可以看出来,效果十分惊艳。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技行业?_黑(hēi)料(liào)正能量

ChatGPT之后又一应(yīng)用杀疯了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能量

更厉害的(de)是,除了真实的照片,草图也(yě)可以加上“魔法(fǎ)”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能实现线稿转(zhuǎn)全彩图。大神(shén)张吕敏其(qí)本尊也(yě)亲自回应。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控期,将洗牌(pái)科技行(xíng)业?_黑(hēi)料正(zhèng)能量

不得不(bù)说当(dāng)下AIGC已经变得越来越强大(dà),甚至输(shū)出的(de)作品都已经(jīng)能以假乱真了(le)。

02

难辨虚实,AIGC技术力(lì)爆发

警惕(tì)安全(quán)问题

近日,“苏州金鸡湖(hú)有游艇(tǐng)party”的(de)消息火遍网络(luò),而经过警方辟(pì)谣(yáo)这所(suǒ)谓的“party”可能是全国第一(yī)起AI绘图诈(zhà)骗。

由于(yú)这个活动里面给出的美女照片(piàn)都是AI制作的真人照片绘图,因为太逼真,被大家当成真事传播了

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控期,将洗(xǐ)牌(pái)科技行业?_黑料正能量

不过仔(zǎi)细观察可(kě)以(yǐ)发现,活动发起者提(tí)供的照(zhào)片(piàn)中有个很大(dà)的漏洞可以发现并非真人,而是(shì)AI绘(huì)图,那便是图片(piàn)中女性的手指部分有(yǒu)的存在异(yì)常。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科(kē)技(jì)行(xíng)业(yè)?_黑料正(zhèng)能量

有行业人事表示(shì):“现(xiàn)在因(yīn)为手指部分的绘(huì)画算法比较复杂,AI还不太会画人(rén)的手,但最新看(kàn)到的图(tú)片已经有越来(lái)越完美(měi)的AI模型出现,以后可能(néng)就(jiù)完全没(méi)有漏洞了。

类似(shì)的AI作(zuò)图诈(zhà)骗在国外(wài)也已有发生。据英国广播公司报道,土耳其地震期(qī)间,有Tiktok用户使用AI合(hé)成(chéng)了儿童(tóng)受(shòu)灾(zāi)的假照片(piàn)发布到网络(luò),以此诱骗善良的人打(dǎ)赏“捐助(zhù)”从而实施诈骗(piàn)。

目(mù)前(qián)随着技术发(fā)展,AIGC已经(jīng)能做出真(zhēn)人(rén)照片般的绘图效果,如果(guǒ)这样的图片(piàn)被用来诈(zhà)骗(piàn),将(jiāng)非常可怕。

此外AIGC还引发了很(hěn)多担忧,一方(fāng)面(miàn),批判(pàn)者认为AI在(zài)“学习”了大量前人的作品之后(hòu),其创作没有任何情绪和灵魂,难以(yǐ)和人类的艺(yì)术(shù)创作相提并论。

另一(yī)方面(miàn),AIGC背后(hòu)的版权、目前都并没有(yǒu)得(dé)到有效(xiào)的解(jiě)决,还有AIGC会不会(huì)代替人类“至高(gāo)无上”的(de)创(chuàng)意。

马(mǎ)斯克也强调,人(rén)工(gōng)智能的安全问(wèn)题需要得到重视(shì),太(tài)晚就(jiù)来不及了。

03

AIGC下一站(zhàn)除(chú)了视频,还有远方(fāng)

技(jì)术(shù)都是(shì)有两面性的,潜在(zài)的危害并不能(néng)掩盖其光辉(huī)的贡献。现在看来,人工(gōng)智能技(jì)术将是第四次工(gōng)业革(gé)命的核心驱(qū)动力量,将(jiāng)创造新的增长(zhǎng)奇(qí)迹。

过去一(yī)年,人(rén)工(gōng)智能在技(jì)术和(hé)商(shāng)业层(céng)面(miàn)都有了巨大进(jìn)展(zhǎn),AI绘画就是人(rén)工智能技术发生方向性改变(biàn)的一(yī)个代表。其(qí)下一站或(huò)许就是视频。

此(cǐ)前,Meta和(hé)谷歌(gē)先后发布了(le)几条引爆科技(jì)圈的短视频。这(zhè)些(xiē)视频引(yǐn)发关注并非内容做得(dé)多优秀,反(fǎn)而都(dōu)非常(cháng)简单,比如一匹正在(zài)喝水的马,一只画画的玩具熊(xióng),或者一(yī)段骑摩托车的第(dì)一视角录像(xiàng),随便一个有手机(jī)的人(rén)都可以(yǐ)随手录下一段。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入可(kě)控期,将洗牌科技(jì)行业?_黑料正能(néng)量(liàng)

但这些(xiē)短(duǎn)视频的创(chuàng)作方式非常(cháng)简(jiǎn)单,创作者仅仅需要(yào)向(xiàng)AI输(shū)入一段话,甚至只是说一下要求,AI就可以根(gēn)据需(xū)要生成(chéng)一段视频(pín)。

谷(gǔ)歌(gē)发布的两个AI生成视(shì)频分(fēn)别来自(zì)于Imagen Video和Phenaki,前者主要(yào)突出的是(shì)高清,与(yǔ)Meta的Make-A-Video没有(yǒu)太多的差别。

在Make-A-Video公布了AI生成的视(shì)频后,AI圈就已经玩了一波梗(gěng),一(yī)个能够做出(chū)更高清视(shì)频的AI还(hái)不足(zú)以(yǐ)在短时间内戳(chuō)中兴奋点。

Phenaki更加令(lìng)人震惊的地方在(zài)于,它可以(yǐ)制作出超过2分(fēn)钟的连贯的也有确切(qiè)内容的视(shì)频(pín),这才是真(zhēn)正让人们感到惊喜的地方(fāng)。因为(wèi)无论AI生(shēng)成的视频多么高清,也只(zhǐ)能是(shì)为内容(róng)生产(chǎn)者提供(gōng)一(yī)个(gè)灵感,一个素材,一个过(guò)场动(dòng)画。

不过能够制(zhì)作出有具体剧情(qíng)内容的视频就意味着,一(yī)些视(shì)频创作由AI代替人(rén)工(gōng)完成(chéng)已经(jīng)初(chū)步有了可能。

当下AI的发展速度已经超过大部分人的想象(xiàng)。内容产业的本(běn)质是供给(gěi)创造需求,AIGC作为全新的内容生产方式(shì),可以为内容产(chǎn)业带来更新的内容风格、更快的生(shēng)产(chǎn)速(sù)度,更低的生产成本,这无疑会驱(qū)动(dòng)内(nèi)容产业的大爆发。

除了(le)AI绘图(tú)、视(shì)频,AIGC技术还能应用于音乐、代码、机器人动作等多种内容形式的生成。不难(nán)发(fā)现该项技术不仅在游戏(xì)等行业(yè)能得到有效应用,对于下一代互联网各种元素的构(gòu)建亦有关键意义(yì)。

从(cóng)商业化的角度(dù)来(lái)看,文化娱(yú)乐、教育(yù)、传媒等诸(zhū)多领域,本身(shēn)就对基于(yú)AI的可视化内容有(yǒu)强烈需求。

因此,AI绘画及视频或不是结果(guǒ),而只是AI进程中的一块(kuài)重要拼图,有望在技(jì)术更新(xīn)的加持(chí)下实现更大的(de)应用价值(zhí)。

AI从理解(jiě)内(nèi)容,走向了(le)可以(yǐ)生成内容,甚至(zhì)能(néng)够(gòu)创造(zào)出独立价值和独立视角的内容。AIGC的再次出圈,更代表(biǎo)着未(wèi)来(lái)的(de)先进生(shēng)产力即将到来。

ChatGPT之后又一(yī)应(yīng)用杀(shā)疯了,AIGC或进入可控期,将(jiāng)洗牌科技行业?_黑料(liào)正能(néng)量

04

紧抓大模(mó)型与算力,牢固AIGC底座(zuò)

从技术的发展也可以看出,在语(yǔ)言大模型、图像大模型之后,多模态大模型已经成为了(le)新的趋势。

大模(mó)型被(bèi)誉为当前人(rén)工(gōng)智能发展的(de)智(zhì)能底座,是全球竞(jìng)争最激(jī)烈的研究方(fāng)向(xiàng)之(zhī)一,包括(kuò)谷歌、亚马逊、百(bǎi)度、阿里、腾讯(xùn)等(děng)众多头部企业都在竞相发力。

不过训练大模型的确价格不(bù)菲,以(yǐ)国盛证券(quàn)发(fā)布(bù)的《ChatGPT需要多(duō)少(shǎo)算力》报(bào)告估算,GPT-3训练一次的成本约为140万美(měi)元。而(ér)对于一(yī)些(xiē)更大的LLM(大型语(yǔ)言模(mó)型),训练成本则介于200万(wàn)美元至1200万(wàn)美元(yuán)高价之间。

以ChatGPT在2023年1月的独立(lì)访客(kè)平均数1300万计算(suàn),其对应芯片需求(qiú)为3万多(duō)片英(yīng)伟达A100 GPU,初始投(tóu)入成本约为8亿美元,每日仅(jǐn)电费就在5万美元(yuán)左右。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行(xíng)业?_黑料(liào)正能量(liàng)

此外不论是(shì)ChatGPT还是AIGC,都离不开庞大算力支持。在关注各类大模型的发展同(tóng)时,更(gèng)应该关注算力网(wǎng)络的建设。

算力网络正驱(qū)动AI产业发展进入(rù)史诗(shī)级加速进程,让AIGC及(jí)通用AI这(zhè)一(yī)人工智能发展的终极(jí)目标(biāo)离得更近。

因为算力可以(yǐ)对突破性技(j蟑螂在床上爬了还能睡吗,蟑螂在床上爬了还能睡吗ì)术创新提供大力的支(zhī)持。这方面,多模态大模(mó)型是典型。作为面向(xiàng)未(wèi)来(lái)强人工智能、通用人工智能的(de)重(zhòng)要技术创(chuàng)新(xīn),多模态大模型(xíng)已经在人工智能(néng)领域(yù)提出了很多(duō)年,业界也有不少技术突破,但是(shì),多模(mó)态大模(mó)型进一步往下走,算(suàn)力需求呈(chéng)几何式上(shàng)升,一般(bān)的算力基(jī)础(chǔ)设施(shī)很快将难以胜任。

从图像、文(wén)字、语音单独一项的训练,到双模(mó)态、三模态的跃迁,让人工智能可以灵(líng)活应对不同模态的转化、像人与世界交互一样(yàng)自然,这方(fāng)面(miàn),由算力网(wǎng)络来驱(qū)动将(jiāng)有(yǒu)明(míng)显优(yōu)势。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

此(cǐ)外,还有(yǒu)很(hěn)多需(xū)要爆发式增长的算力来支撑的技术创新,将(jiāng)在(zài)人工智(zhì)能算力网络支(zhī)撑下快速推进。

AIGC已经露出曙光,期待(dài)在大模型和大算力的支(zhī)持下AIGC能(néng)持续(xù)颠(diān)覆内容生产的方式,将创造的边际成(chéng)本(běn)降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 蟑螂在床上爬了还能睡吗,蟑螂在床上爬了还能睡吗

评论

5+2=