橘子百科-橘子都知道橘子百科-橘子都知道

正、异、新,正异新的区分

正、异、新,正异新的区分 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆(bào)以(yǐ)来(lái),微软(ruǎn)公司创始(shǐ)人比尔·盖茨已多次(cì)公(gōng)开谈论人(rén)工(gōng)智能话题。在最近的一次采访中,他再次(cì)表示:“AI可能(néng)会让(ràng)科技行业迎来一次(cì)剧烈的洗(xǐ)牌”。

这个结论是(shì)他在当地时间2月20日(rì)接受(shòu)《In Good Company》节目专访时(shí)提出的。

他预期,AI的发展可能会(huì)威(wēi)胁到谷歌(gē)的市占(zhàn)率,因为微软(ruǎn)在AI方面(miàn)的行动相当(dāng)迅速。而(ér)最(zuì)终科技巨头将把AI整合成用户的“全能助(zhù)手(shǒu)”,包揽(lǎn)一切应用(yòng),与(yǔ)人们(men)进行沟通并提供建议,可以取(qǔ)代亚(yà)马逊、Siri或Outlook等应用。

大(dà)佬口(kǒu)中全能助(zhù)手的(de)到(dào)来可(kě)能尚(shàng)需时日,但(dàn)由ControlNet引发的又(yòu)一次AI绘画浪潮,让AIGC在ChatGPT的话题热点包围中杀出重围。

ChatGPT之后又一(yī)应用杀(shā)疯了(le),AIGC或进入可(kě)控期(qī),将洗(xǐ)牌科技行业?_黑(hēi)料(liào)正能量

01

ControlNet颠覆AI绘画新玩法

AIGC向(xiàng)可(kě)控靠近(jìn)

以AI绘画为代(dài)表的AIGC上一次爆火(huǒ)的时候,还(hái)是2022年(nián)8月(yuè),在美国科罗(luó)拉(lā)多州举办的新兴数字艺术家竞赛中,一幅名为《太空歌(gē)剧院》的作品获奖(jiǎng)。

随后各大厂商(shāng)的(de)AI绘画软(ruǎn)件(jiàn)被广(guǎng)大网(wǎng)友熟知并(bìng)体验,Stable Diffusion便(biàn)是(shì)其(qí)中代(dài)表。

ChatGPT之(zhī)后又一应用杀(shā)疯了,AIGC或进入可控期(qī),将洗牌科(kē)技行业?_黑料(liào)正能量

用户们可以(yǐ)在应用中输入(rù)一组(zǔ)关(guān)键词或者一(yī)张(zhāng)照(zhào)片,就能获得一幅AI创(chuàng)作的(de)画作(zuò)。

作画的(de)关键就是所输入的文本(běn)。同一组关键词也可(kě)以创作(zuò)出很(hěn)多张风格不一(yī)样(yàng)的画作,这让创作(zuò)的(de)过程就像开盲盒。

很多用户(hù)很喜(xǐ)欢(huān)这种(zhǒng)不确(què)定(dìng)的(de)惊喜,他们(men)会将生(shēng)成(chéng)的美(měi)图当做头像。而(ér)另一(yī)部分(fēn)喜欢翻看(kàn)AI绘画的“翻车”作品。在社交(jiāo)媒体上,许多用户分享AI“翻车现场”,例如(rú),一位网友的小狗照片(piàn)被AI画成(chéng)了(le)“肌(jī)肉男(nán)”,还(hái)有网友的个人照片被AI识别(bié)成了建筑。

而如今随着ControlNet的出现(xiàn)与加持,以(yǐ)往AI绘画的填写(xiě)关键词游戏可能要被(bèi)颠覆了。

ChatGPT之后又一(yī)应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

ControlNet是一(yī)位(wèi)正在斯坦福读博的中国人张吕敏创作的(de)一(yī)种基于(yú)控(kòng)制点(diǎn)的图像变(biàn)形算法(fǎ),主要用于数字图像处理(lǐ)、计(jì)算机视觉和计算机图(tú)形学等领域。

其SD插件一经发(fā)布,在短短的两天(tiān)内便成为(wèi)了(le)AI绘画领域最新的热点。

在此之前,大家(jiā)用了很多(duō)方法想(xiǎng)让AI生成的结果(guǒ)尽可能(néng)的符合要(yào)求,但是(shì)都不尽如(rú)人意,它的(de)出现(xiàn)代表着AI生成开始进(jìn)入真(zhēn)正的可(kě)控时期。

因为(wèi)ControlNet可以(yǐ)直接提取画(huà)面的构图,人(rén)物(wù)的姿(zī)势和画(huà)面的深度信息(xī)等。有了(le)它的帮助(zhù),就不(bù)用(yòng)频繁的用(yòng)提示词来碰运气,抽(chōu)盲盒式的创作了。

通俗的说ControlNet相当(dāng)于给(gěi)AI绘画加了(le)“魔(mó)法(fǎ)”,不少博(bó)主的作品(pǐn)已经获(huò)得了(le)大量的(de)浏(liú)览量,“viggo”就是(shì)其中之一(yī),他(tā)用朋友的照片(piàn)直接(jiē)带她们(men)走进(jìn)动(dòng)漫世界。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将洗(xǐ)牌(pái)科(kē)技(jì)行业(yè)?_黑料正(zhèng)能(néng)量

viggo先用StableDiffusion图片(piàn)转文字。

再用Text2Prompt插(chā)件拓展找到对应的关键词(cí);最后(hòu)用ControlNet插(chā)件绑(bǎng)定(dìng)骨(gǔ)骼开始换关键词试(shì)效果。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可(kě)控期(qī),将洗牌科技(jì)行业?_黑料正能量

通过(guò)图(tú)片(piàn)就(jiù)可以看出来(lái),效果(guǒ)十(shí)分(fēn)惊艳。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能量

ChatGPT之后(hòu)又一应用杀疯了,AIGC或(huò)进入(rù)可控期,将洗牌(pái)科技行(xíng)业?_黑(hēi)料(liào)正能量

更厉害的是,除了真(zhēn)实的照片(piàn),草图(tú)也可以加上“魔法”,知乎(hū)大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能实现线稿转全彩图。大神张吕敏(mǐn)其本尊也(yě)亲自回应。

ChatGPT之后又(yòu)一(yī)应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技(jì)行业?_黑(hēi)料正能量

不得不说(shuō)当下AIGC已经变(biàn)得越(yuè)来(lái)越(yuè)强大(dà),甚至(zhì)输出的(de)作(zuò)品都已经能以假乱真了。

02

难辨虚实,AIGC技(jì)术力爆发

警(jǐng)惕安(ān)全问题

近日,“苏州(zhōu)金鸡湖有游艇party”的消息火遍网络(luò),而(ér)经(jīng)过警方辟(pì)谣这所(suǒ)谓的“party”可(kě)能是全国第一起(qǐ)AI绘图诈骗。

由于这(zhè)个活动里面给出的美女照片都是AI制作(zuò)的(de)真(zhēn)人照片绘图(tú),因为太逼真,被大家当成真事传播(bō)了

ChatGPT之(zhī)后(hòu)又一应用杀疯(fēng)了,AIGC或进入(rù)可控期,将洗牌(pái)科(kē)技(jì)行业?_黑料正(zhèng)能量

不过仔(zǎi)细观(guān)察(chá)可以(yǐ)发现,活动(dòng)发起者(zhě)提供的照片中有个(gè)很大的漏(lòu)洞可以发现(xiàn)并(bìng)非真(zhēn)人(rén),而是AI绘图,那便(biàn)是图片中女性的手指部分有的存在异(yì)常。

ChatGPT之后又(yòu)一应用杀(shā)疯了,AIGC或进入(rù)可(kě)控期,将洗(xǐ)牌科技行(xíng)业?_黑(hēi)料(liào)正能量

有(yǒu)行业人事(shì)表示:“现(xiàn)在(zài)因为手(shǒu)指(zhǐ)部(bù)分的绘(huì)画算法比(bǐ)较复杂,AI还不太会画人的手,但最新(xīn)看到的图片已经有越来(lái)越完美的AI模型(xíng)出(chū)现,以后(hòu)可能就完(wán)全没有漏(lòu)洞了。

类似的AI作图诈(zhà)骗在国外也(yě)已(yǐ)有发生。据英国广播(bō)公司报道,土耳其地(dì)震期间,有(yǒu)Tiktok用户使(shǐ)用AI合成了儿童(tóng)受灾的假照(zhào)片(piàn)发(fā)布到网络(luò),以此诱骗善良的人打(dǎ)赏(shǎng)“捐助”从(cóng)而实施诈骗。

目前随着技术发展,AIGC已经(jīng)能做出真人照片般的绘图效果,如果这样的图片被用来诈骗,将非常可怕。

此外AIGC还引(yǐn)发了(le)很多担忧,一(yī)方面,批判者认为AI在(zài)“学习”了大量前(qián)人(rén)的作品(pǐn)之(zhī)后(hòu),其创作没(méi)有任(rèn)何情绪和灵魂,难以和人类的艺术(shù)创作相提并论。

另(lìng)一方面(miàn),AIGC背后(hòu)的(de)版权、目前都并没有得到有效的解决,还(hái)有AIGC会不(bù)会代(dài)替人类“至高(gāo)无上”的创意。

马(mǎ)斯克也强(qiáng)调,人工智能的(de)安全问(wèn)题需(xū)要得(dé)到重(zhòng)视(shì),太晚就来不及了。

03

AIGC下一站除了视频,还有远方

技术都是有两面性的,潜(qián)在(zài)的危害(hài)并不能掩(yǎn)盖其光辉的贡献。现(xiàn)在看来,人工(gōng)智能技(jì)术将(jiāng)是(shì)第四次(cì)工业革(gé)命的核(hé)心驱动力量,将(jiāng)创造(zào)新的增长奇迹。

过(guò)去一年,人(rén)工智能在技(jì)术和商业层面都有了巨大(dà)进展,AI绘画就是人工智能技(jì)术发生方向性改变(biàn)的一个代(dài)表。其下一(yī)站或(huò)许就是视频。

此前,Meta和(hé)谷歌(gē)先后发布了几条(tiáo)引爆科技(jì)圈的短视频。这些视频引(yǐn)发关注并(bìng)非内容做得多优秀,反而都非常简(jiǎn)单,比如一匹正在喝(hē)水的马,一(yī)只画画的玩(wán)具熊,或者一段(duàn)骑摩托车的第一视角(jiǎo)录像,随便一个有手机的人都可(kě)以随手录下一段。

ChatGPT之(zhī)后(hòu)又(yòu)一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将(jiāng)洗牌科技行(xíng)业?_黑料(liào)正(zhèng)能量

但这(zhè)些短视频的创作方式非常简单(dān),创作者仅仅需要向AI输(shū)入一段话,甚至只是(shì)说一(yī)下要(yào)求(qiú),AI就可以(yǐ)根据(jù)需要生成一(yī)段视频。

谷歌发布的两个AI生(shēng)成视(shì)频(pín)分(fēn)别来(lái)自于Imagen Video和Phenaki,前者(zhě)主要突出的是(shì)高清,与Meta的Make-A-Video没有太多(duō)的差别(bié)。

在Make-A-Video公(gōng)布了(le)AI生成的视(shì)频后(hòu),AI圈就已经玩了一波梗,一个(gè)能够做出更高清视频(pín)的(de)AI还不足以在短时间内(nèi)戳(chuō)中兴奋点。

Phenaki更加令人震惊的(de)地(dì)方在于,它(tā)可(kě)以制作(zuò)出超过2分钟的连贯的也(yě)有确切内容的视(shì)频,这(zhè)才是真(zhēn)正让人(rén)们感到(dào)惊喜(xǐ)的地方(fāng)。因为无(wú)论AI生成的视频(pín)多么高(gāo)清,也只能是为内容生产者提供一个灵感,一个素(sù)材(cái),一个过场动(dòng)画。

不过能(néng)够(gòu)制作出有(yǒu)具体剧情(qíng)内容的(de)视频就意味(wèi)着,一些视频创作由AI代替人工完成(chéng)已(yǐ)经初步有了可(kě)能。

当下AI的发展速度已经超过大部分人(rén)的想(xiǎng)象。内容(róng)产业的本(běn)质是供给创造需求,AIGC作(zuò)为全新的内容生产方式,可以为内容产业(yè)带来更新的内(nèi)容(róng)风格、更快的(de)生产速度,更低的生产成(chéng)本,这无(wú)疑会(huì)驱动内容产业的大爆(bào)发。

除了AI绘图、视频,AIGC技术还能应用于音(yīn)乐、代码(mǎ)、机器人动作等多种(zhǒng)内容形式(shì)的生成(chéng)。不难(nán)发(fā)现该项(xiàng)技术不(bù)仅在游戏等(děng)行业能得到有效应用,对(duì)于下一代(dài)互联网各种元素的构建(jiàn)亦有关键(jiàn)意义。

从商业化(huà)的角度来看(kàn),文化娱乐、教育(yù)、传媒等诸多(duō)领域(yù),本身就(jiù)对基(jī)于(yú)AI的可视化内容有强(qiáng)烈需求。

因此,AI绘画(huà)及视频或不是结果(guǒ),而只是AI进程中的(de)一块重要拼(pīn)图,有望在技术(shù)更新的(de)加持下实(shí)现更大的应用价(jià)值。

AI从理解内容(róng),走向了可以生(shēng)成内容(róng),甚至能够创造出独(dú)立价(jià)值和(hé)独(dú)立视角的内容。AIGC的再次(cì)出圈,更代表着未来(lái)的先进生产力即将(jiāng)到来(lái)。

ChatGPT之后又一应(yīng)用杀(shā)疯(fēng)了,AIGC或进入(rù)可控期(qī),将洗牌科技行(xíng)业(yè)?_黑料(liào)正(zhèng)能量

04

紧(jǐn)抓大模型与算力,正、异、新,正异新的区分(láo)固AIGC底座

从技术(shù)的发展也可以看出,在语言大模型、图像(xiàng)大模型之后,多模态大模型(xíng)已经(jīng)成为(w正、异、新,正异新的区分èi)了新的趋势(shì)。

大(dà)模型被誉(yù)为当前(qián)人工智(zhì)能发(fā)展的智能底座,是全球(qiú)竞(jìng)争(zhēng)最(zuì)激(jī)烈(liè)的研究(jiū)方向之一,包括谷(gǔ)歌、亚(yà)马逊、百度、阿(ā)里、腾讯(xùn)等(děng)众(zhòng)多头部企业都在竞(jìng)相发力。

不过(guò)训练大模型的确价(jià)格不菲,以(yǐ)国盛证券发(fā)布的(de)《ChatGPT需要(yào)多少算力(lì)》报告估算,GPT-3训练一(yī)次的成本约(yuē)为(wèi)140万美元。而对于一(yī)些更(gèng)大的LLM(大型语(yǔ)言模型),训练成本则介(jiè)于200万美(měi)元至1200万美元高价之间。

以ChatGPT在2023年1月的(de)独立访客平(píng)均(jūn)数1300万计算(suàn),其对应芯(xīn)片需求为(wèi)3万(wàn)多片英伟达(dá)A100 GPU,初始投(tóu)入成本约为(wèi)8亿美元(yuán),每日仅电费就在5万美元(yuán)左(zuǒ)右。

ChatGPT之(zhī)后又一应用(yòng)杀(shā)疯(fēng)了,AIGC或(huò)进(jìn)入(rù)可控期,将(jiāng)洗牌科(kē)技(jì)行业(yè)?_黑料正(zhèng)能量

此外不论是ChatGPT还是AIGC,都离不开(kāi)庞大算力支持。在(zài)关注(zhù)各类(lèi)大模型(xíng)的发展同时,更应该关注(zhù)算(suàn)力(lì)网络(luò)的(de)建设。

算力(lì)网络正(zhèng)驱(qū)动AI产(chǎn)业发展进(jìn)入史(shǐ)诗(shī)级加速进程,让AIGC及通(tōng)用AI这一人工智能发展的终极(jí)目标离(lí)得更近。

因(yīn)为算力可以对(duì)突破(pò)性技(jì)术创新提(tí)供大力的支(zhī)持(chí)。这方面,多(duō)模态(tài)大模型是典型。作(zuò)为面(miàn)向(xiàng)未(wèi)来强人(rén)工智能、通(tōng)用(yòng)人(rén)工智能的重(zhòng)要(yào)技术(shù)创新,多模态大模型已经在人工智(zhì)能领域(yù)提(tí)出了很(hěn)多(duō)年,业界(jiè)也有(yǒu)不少技术突破,但(dàn)是(shì),多(duō)模态大模(mó)型进一步往下走,算(suàn)力需求呈几何式上升,一般(bān)的算力基(jī)础设施很(hěn)快将(jiāng)难以胜任(rèn)。

从图(tú)像、文(wén)字、语音单独一(yī)项的训练,到(dào)双(shuāng)模(mó)态、三模(mó)态(tài)的跃迁,让人工智能可以灵活应对不同模(mó)态的(de)转化、像(xiàng)人与世界交互一样自然,这方(fāng)面,由算(suàn)力网络来驱动将有明显优势(shì)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业?_黑(hēi)料正(zhèng)能(néng)量

此(cǐ)外,还有很多需要爆发式增长(zhǎng)的算力来(lái)支撑的技术创新,将(jiāng)在人工智能算力网络支撑下(xià)快速推进。

AIGC已经(jīng)露出曙(shǔ)光(guāng),期待在大(dà)模型(xíng)和大算(suàn)力(lì)的支持下AIGC能持续(xù)颠覆内容生产的方式,将创造的边际成本降低,让万(wàn)众(zhòng)受益。

未经允许不得转载:橘子百科-橘子都知道 正、异、新,正异新的区分

评论

5+2=