橘子百科-橘子都知道橘子百科-橘子都知道

12是什么意思

12是什么意思 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人(rén)ChatGPT火爆以来,微软(ruǎn)公司(sī)创始人比(bǐ)尔·盖茨(cí)已(yǐ)多次公开谈论(lùn)人(rén)工智(zhì)能话题。在最近的一次采访中,他再次表示:“AI可(kě)能会让科技(jì)行业迎来一次剧烈(liè)的洗牌”。

这个结论是他在当地时间(jiān)2月(yuè)20日(rì)接(jiē)受《In Good Company》节(jié)目专访时(shí)提出的(de)。

他预期,AI的(de)发展可能会威(wēi)胁(xié)到(dào)谷(gǔ)歌的市占(zhàn)率(lǜ),因为微软在AI方面的(de)行(xíng)动(dòng)相当迅(xùn)速(sù)。而最终科技巨(jù)头将把(bǎ)AI整合成用户的“全能助手”,包揽一(yī)切应用,与人(rén)们(men)进行沟(gōu)通并提供(gōng)建(jiàn)议,可以取(qǔ)代亚马逊、Siri或(huò)Outlook等应(yīng)用。

大佬口中全能助手(shǒu)的(de)到(dào)来可能(néng)尚需时日,但(dàn)由ControlNet引发(fā)的(de)又一次AI绘画浪(làng)潮,让AIGC在ChatGPT的话题(tí)热点包围中(zhōng)杀出重围。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌(pái)科(kē)技行业(yè)?_黑料正能量

01

ControlNet颠(diān)覆(fù)AI绘画新玩(wán)法

AIGC向可控靠(kào)近

以AI绘画为代表(biǎo)的AIGC上一次爆火的时候(hòu),还(hái)是(shì)2022年(nián)8月,在美国科罗(luó)拉多州举办的新兴数字艺术家竞(jìng)赛中,一幅名为《太空歌(gē)剧院》的作品获奖。

随后各大厂商的(de)AI绘画软(ruǎn)件被广大网(wǎng)友(yǒu)熟知并体验,Stable Diffusion便(biàn)是其(qí)中代(dài)表。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

用户们可以在应(yīng)用中输入一(yī)组(zǔ)关键(jiàn)词(cí)或者一张照(zhào)片,就能获得(dé)一幅AI创作的(de)画作(zuò)。

作(zuò)画的关键就是所(suǒ)输(shū)入的(de)文本。同一组关键词(cí)也(yě)可以创(chuàng)作(zuò)出很多张风(fēng)格不一(yī)样的画作(zuò),这让创作(zuò)的过程就像(xiàng)开盲盒(hé)。

很多用(yòng)户很喜欢这种不确(què)定(dìng)的惊(jīng)喜,他们会(huì)将生(shēng)成(chéng)的美(měi)图当做头(tóu)像。而另一部(bù)分喜(xǐ)欢翻看AI绘画(huà)的“翻车”作品(pǐn)。在社交媒体上,许(xǔ)多(duō)用户分享AI“翻车现(xiàn)场”,例如(rú),一位网友的(de)小狗照(zhào)片被AI画成了“肌肉男(nán)”,还有网友(yǒu)的(de)个人(rén)照片(piàn)被AI识别成了建筑。

而(ér)如今随着ControlNet的出现与加持,以往AI绘画(huà)的填写关键词游(yóu)戏(xì)可能(néng)要被颠覆了。

ChatGPT之后(hòu)又一应用(yòng)杀(shā)疯了,AIGC或(huò)进(jìn)入可控期,将(jiāng)洗牌科技行业?_黑料正能量

ControlNet是一位正在(zài)斯坦福读博(bó)的中(zhōng)国(guó)人张吕敏创作(zuò)的一种基(jī)于控制(zhì)点的图像变形算(suàn)法,主(zhǔ)要用于数(shù)字图像(xiàng)处理(lǐ)、计算机视觉和计(jì)算机图形(xíng)学等领域(yù)。

其(qí)SD插件(jiàn)一经发布,在短短的两天内便(biàn)成为了(le)AI绘画领域最新的(de)热点。

在此之前,大家用了很多方法想让AI生成的(de)结果(guǒ)尽(jǐn)可能的符合要求,但(dàn)是都不尽如人意,它的出现代表(biǎo)着AI生成开(kāi)始(shǐ)进入真正(zhèng)的可(kě)控时期。

因为(wèi)ControlNet可以(yǐ)直接提取画面的(de)构图,人物的姿势和(hé)画面的深度信息等。有(yǒu)了它(tā)的帮(bāng)助,就不用频繁的用提示词来碰(pèng)运气,抽盲盒式的创作了。

通俗(sú)的说ControlNet相当于给AI绘画加了“魔(mó)法”,不少博主的(de)作品已经获得了大量的浏览量(liàng),“viggo”就是其中(zhōng)之一,他用朋友的照片(piàn)直接带(dài)她们走进动漫世(shì12是什么意思)界(jiè)。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技(jì)行业?_黑料(liào)正能量

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应(yīng)的关键词;最后(hòu)用ControlNet插件绑定骨(gǔ)骼开始换关键词试效(xiào)果。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进入可控期,将(jiāng)洗牌科(kē)技行(xíng)业?_黑料正能量

通过图片就(jiù)可以看出来,效果十分惊艳。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入可控期,将(jiāng)洗(xǐ)牌(pái)科技行业?_黑料正能量

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或进(jìn)入可控期(qī),将洗(xǐ)牌科(kē)技行业?_黑料正能量

更厉(lì)害的是,除(chú)了真实的(de)照(zhào)片,草图也可以加(jiā)上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到(dào)ControlNet还能(néng)实现线稿转全彩图。大(dà)神张吕(lǚ)敏其本尊也亲自回应。

ChatGPT之后又一应用杀疯了(le),AIGC或进入可控期,将洗牌科技行业?_黑料正能(néng)量

不(bù)得不说当下AIGC已(yǐ)经(jīng)变(biàn)得越来越强大,甚至输出(chū)的(de)作品(pǐn)都已经能以假(jiǎ)乱真了(le)。

02

难辨虚实,AIGC技(jì)术力爆(bào)发

警惕安全问题

近日,“苏(sū)州(zhōu)金鸡湖(hú)有游艇party”的消息(xī)火遍网络,而经过(guò)警方(fāng)辟谣(yáo)这所谓的“party”可(kě)能是(shì)全国第一起AI绘(huì)图诈骗(piàn)。

由于(yú)这(zhè)个活动里面(miàn)给出的美(měi)女照片都是AI制作的真人照(zhào)片绘图,因为太逼真,被大家(jiā)当(dāng)成真事传播了

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入(rù)可(kě)控期,将洗牌科技(jì)行业?_黑料正(zhèng)能量

不过仔(zǎi)细观察可(kě)以发现(xiàn),活(huó)动发起者(zhě)提供的照片中有(yǒu)个(gè)很大的漏洞可以发现并非真人,而是AI绘图,那便是图片中女性(xìng)的手指部分(fēn)有的存在异常。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技(jì)行(xíng)业?_黑料正能(néng)量

有(yǒu)行业(yè)人事表示:“现在因为手(shǒu)指部分的绘画算(suàn)法比较(jiào)复杂,AI还不(bù)太(tài)会画人的手,但(dàn)最(zuì)新看到的图(tú)片已(yǐ)经有越来越完美(měi)的(de)AI模型出现,以(yǐ)后可能(néng)就(jiù)完(wán)全没(méi)有漏(lòu)洞了。

类似的AI作(zuò)图诈骗在国外也已有发生(shēng)。据(jù)英国(guó)广播公司报道(dào),土耳其地震期间(jiān),有Tiktok用(yòng)户使用AI合成了儿童受灾的假(jiǎ)照片发布(bù)到网络,以此(cǐ)诱骗善良的人打赏“捐助”从(cóng)而(ér)实施诈骗(piàn)。

目前随着技术发展,AIGC已经(jīng)能(néng)做(zuò)出真(zhēn)人(rén)照片(piàn)般的绘(huì)图效果,如果(guǒ)这(zhè)样的(de)图片被用来(lái)诈骗(piàn),将非常可(kě)怕。

此外AIGC还(hái)引(yǐn)发了很多担忧,一方(fāng)面,批判者认为(wèi)AI在“学习(xí)”了大量前人的作品之后,其创作没有任何情绪和灵魂,难以和人(rén)类的艺(yì)术(shù)创作相提(tí)并论。

另一(yī)方面,AIGC背后的(de)版权、目前都并没(méi)有得到有效的解决,还有AIGC会不会代替(tì)人类(lèi)“至高无上”的创(chuàng)意。

马斯克也强调,人工智能的安(ān)全问题需要得到重视,太晚就来不及了。

03

AIGC下一(yī)站除了(le)视频,还(hái)有远方

技(jì)术都是有两面性的(de),潜在(zài)的(de)危害并不能掩盖其光辉(huī)的(de)贡(gòng)献。现在看来,人工智能技术将是第四次(cì)工业革命(mìng)的核心驱(qū)动(dòng)力(lì)量,将创造新的增长(zhǎng)奇迹。

过去(qù)一年,人工智能在技术(shù)和商业层(céng)面(miàn)都有了巨大进展,AI绘画(huà)就是人工智能技术发生方向性(xìng)改(gǎi)变的一个代表(biǎo)。其下一站或许就是视频。

此前,Meta和谷歌先后发布了(le)几条引爆科技圈的短视频。这些(xiē)视频引发关注(zhù)并非内容做得多优秀,反而都非常简单,比如一匹正在喝水的(de)马,一只画画的玩具熊,或者一段骑摩托车(chē)的第一视角(jiǎo)录像(xiàng),随(suí)便(biàn)一个有手机的人都可以随手录下(xià)一段。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌科(kē)技行业?_黑料正(zhèng)能量

但(dàn)这些短视(shì)频的创作方(fāng)式非常(cháng)简单,创作者仅仅需要向(xiàng)AI输入一段话,甚至只是说一(yī)下要(yào)求(qiú),AI就可以(yǐ)根据需要生成一段视频(pín)。

谷歌(gē)发布的两个AI生成视频(pín)分别来自于Imagen Video和Phenaki,前者主要突出的是高清,与(yǔ)Meta的Make-A-Video没有太多的差别(bié)。

在Make-A-Video公布了AI生成的视频后,AI圈就(jiù)已经玩了一波梗,一个能够做出更高(gāo)清(qīng)视频的(de)AI还不足以在短时间内戳中兴(xīng)奋点。

Phenaki更加令(lìng)人震惊的地方在(zài)于,它可以制作出超过2分钟的(de)连贯的也有(yǒu)确切内容(róng)的视频(pín),这(zhè)才是真正(zhèng)让人们感到惊(jīng)喜(xǐ)的地(dì)方。因为无论AI生成(chéng)的视(shì)频多么高清,也只能是为(wèi)内容(róng)生产者提(tí)供一个灵感,一个素材,一个过场动画(huà)。

不过(guò)能够制(zhì)作出有具体剧情内容的视频就意味着(zhe),一些视频创作由AI代替(tì)人工完成已(yǐ)经初步有了可能(néng)。

当(dāng)下AI的发展速度已经超过(guò)大部(bù)分人的想(xiǎng)象。内容产(chǎn)业的本质是供(gōng)给创造(zào)需求,AIGC作为全(quán)新的内(nèi)容生产(chǎn)方式,可以为内容产(chǎn)业带来更(gèng)新的内容风格、更快的生产速度,更低的生产(chǎn)成本,这(zhè)无疑会驱动(dòng)内容产业的大爆(bào)发。

除了AI绘(huì)图(tú)、视(shì)频,AIGC技术还(hái)能应用于音乐、代码、机器人动(dòng)作等(děng)多种内(nèi)容形式(shì)的(de)生成。不(bù)难(nán)发现该项技术不仅(jǐn)在游戏等(děng)行(xíng)业(yè)能(néng)得到有效应用,对(duì)于下一(yī)代互联网各种元(yuán)素的构建亦有关键意义(yì)。

从商业化的角度(dù)来看,文(wén)化娱乐、教育、传媒(méi)等诸多领域(yù),本身(shēn)就对(duì)基于AI的可视化内容有强烈需求。

因(yīn)此,AI绘画(huà)及(jí)视频(pín)或不是结果(guǒ),而只是AI进程(chéng)中的(de)一块重要拼图(tú),有望在(zài)技术(shù)更新的加持下实(shí)现更大(dà)的(de)应用价值。

AI从理解(jiě)内容(róng),走向(xiàng)了(le)可以生成(chéng)内容,甚至(zhì)能(néng)够(gòu)创(chuàng)造出独立(lì)价值(zhí)和独(dú)立视角(jiǎo)的内(nèi)容。12是什么意思rong>AIGC的再次出圈,更代(dài)表(biǎo)着(zhe)未来的先(xiān)进生产力即将到来。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌(pái)科技行业?_黑(hēi)料正能量

04

紧抓大模(mó)型与算力(lì),牢(láo)固(gù)AIGC底(dǐ)座(zuò)

从技术的(de)发(fā)展也可以看出,在语言大模型(xíng)、图像大模型之(zhī)后,多模态(tài)大模型已经(jīng)成为了新的趋势(shì)。

大模型被誉(yù)为当前(qián)人工智(zhì)能发展的(de)智能(néng)底座,是(shì)全球竞争(zhēng)最激烈(liè)的研究方向之一,包括谷歌(gē)、亚马逊、百度(dù)、阿里、腾讯等(děng)众多头部企(qǐ)业都(dōu)在(zài)竞相发(fā)力。

不过训练大模型的确价格不菲,以国盛证券发布的《ChatGPT需要多少算力》报告估算,GPT-3训练(liàn)一次的成本约为(wèi)140万美(měi)元。而对于一(yī)些更大的LLM(大型(xíng)语言模(mó)型),训练成(chéng)本则介于(yú)200万美元至1200万(wàn)美元(yuán)高价之间(jiān)。

以ChatGPT在2023年1月的(de)独(dú)立访客平(píng)均(jūn)数1300万(wàn)计算,其对应(yīng)芯片(piàn)需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日仅电(diàn)费就在5万美元左右。

ChatGPT之后又一(yī)应用杀疯了,AIGC或进(jìn)入可控期(qī),将洗(xǐ)牌科技行业?_黑料正能量

此外不论是(shì)ChatGPT还是AIGC,都离不开庞大(dà)算(suàn)力支(zhī)持(chí)。在(zài)关注(zhù)各类大(dà)模型(xíng)的发(fā)展(zhǎn)同时,更应该关注算力网络的建设。

算力网络正驱动AI产(chǎn)业(yè)发(fā)展(zhǎn)进入(rù)史诗级加速进程(chéng),让(ràng)AIGC及通用(yòng)AI这一人工智能(néng)发展的终极目标(biāo)离得更(gèng)近。

因(yīn)为算力可以对突破性(xìng)技术创新提供大力的支持。这方面,多(duō)模态大模型是典型。作(zuò)为面向未来强人工智能、通用人工智能的重要(yào)技术创新,多模态大模型已(yǐ)经(jīng)在人(rén)工智能领域(yù)提(tí)出(chū)了很多年,业界也有不少技术突破,但是(shì),多模态大模型进一(yī)步往下走,算力需求呈几何式(shì)上升,一(yī)般的算力基础(chǔ)设(shè)施很快将难以胜任。

从图像、文(wén)字(zì)、语音单(dān)独一项(xiàng)的训练(liàn),到(dào)双模态、三模态(tài)的跃迁,让人工智(zhì)能可以灵活应(yīng)对不(bù)同模态的转(zhuǎn)化、像人与世界交互(hù)一样自然(rán),这方面,由算力网络来驱动将有明显优势。

ChatGPT之后又(yòu)一(yī)应用杀疯了,AIGC或进入可控期(qī),将洗牌(pái)科技行业?_黑料正(zhèng)能量

此外,还有很多需要(yào)爆发式增长的算力来支撑的技术创新,将在人工智能算力(lì)网络支撑下快速推进。

AIGC已经露出曙光,期(qī)待在大模型和(hé)大算力的支持下AIGC能持(chí)续颠覆内容生产的方式,将创造(zào)的(de)边(biān)际成本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 12是什么意思

评论

5+2=