橘子百科-橘子都知道橘子百科-橘子都知道

正、异、新,正异新的区分

正、异、新,正异新的区分 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天(tiān)机器(qì)人ChatGPT火爆以来,微软公司创始人比尔·盖茨已多次公开谈论人(rén)工智能话题。在最近的一次(cì)采访中,他再次表示:“AI可(kě)能会让科技行业迎来一次剧烈的洗牌”。

这个(gè)结论是他在(zài)当地时间2月20日接受《In Good Company》节目(mù)专访时(shí)提(tí)出的。

他预期,AI的(de)发展可能会(huì)威胁到谷歌(gē)的市占率,因为(wèi)微软在AI方(fāng)面的行(xíng)动相当迅速。而最终科技(jì)巨头将(jiāng)把AI整合成用户的“全能助手”,包揽一切应用,与人(rén)们进行沟通并提供建议,可以取代亚马逊、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到(dào)来可能尚需时日,但由ControlNet引(yǐn)发的(de)又一次AI绘(huì)画浪(làng)潮(cháo),让AIGC在ChatGPT的话题热点包围中杀出(chū)重(zhòng)围。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行业(yè)?_黑料正能量

01

ControlNet颠(diān)覆AI绘画新玩法

AIGC向可(kě)控靠近

以AI绘画为代表的AIGC上(shàng)一次爆火的时候,还是2022年8月,在美国科罗拉多州(zhōu)举办(bàn)的新兴数字艺术家竞(jìng)赛中(zhōng),一幅名为《太空歌(gē)剧院》的作(zuò)品获奖。

随(suí)后各大(dà)厂(chǎng)商的(de)AI绘画(huà)软件(jiàn)被(bèi)广大网友熟知(zhī)并体(tǐ)验,Stable Diffusion便是其中代(dài)表。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进(jìn)入可控(kòng)期(qī),将洗(xǐ)牌(pái)科技行业?_黑料(liào)正能量(liàng)

用户们可以在应用中(zhōng)输入一组(zǔ)关键词或者一张照片(piàn),就能获得一(yī)幅AI创(chuàng)作的(de)画作。

作画的关键(jiàn)就是所(suǒ)输入(rù)的(de)文(wén)本。同一(yī)组关键词也可以创(chuàng)作出很多张风格不一样的画作,这(zhè)让创作的过程就像开(kāi)盲盒。

很多用户很喜(xǐ)欢这种不确(què)定的惊(jīng)喜,他(tā)们会将(jiāng)生(shēng)成(chéng)的美图当做头(tóu)像。而另一(yī)部分喜欢翻看(kàn)AI绘画(huà)的“翻车(chē)”作品(pǐn)。在社(shè)交媒体(tǐ)上,许多用户(hù)分享AI“翻车(chē)现场”,例如(rú),一位(wèi)网友的小(xiǎo)狗照片被AI画成了“肌肉男”,还有网友的个人照片被AI识别成了建筑。

而如今随着ControlNet的出现与加持,以往AI绘画的(de)填写关键词游戏可能(néng)要(yào)被颠覆(fù)了。

ChatGPT之后(hòu)又(yòu)一应用杀(shā)疯了,AIGC或进入(rù)可控期,将洗牌科技(jì)行业?_黑料正(zhèng)能量(liàng)

ControlNet是一位(wèi)正在斯坦福读博(bó)的中国人张吕敏创作的(de)一种基于(yú)控制(zhì)点的图像变形算法,主要用于数字图像处理、计算(suàn)机视(shì)觉和计算机图形学等领域。

其SD插(chā)件一(yī)经(jīng)发布,在短短的两天内便成为了(le)AI绘(huì)画领域最新的(de)热点(diǎn)。

在此之前(qián),大(dà)家(jiā)用了(le)很多方法想(xiǎng)让AI生成的结(jié)果尽可能的符合要求,但是(shì)都不(bù)尽如人意,它的出现(xiàn)代表(biǎo)着AI生成开始(shǐ)进入真正的可控(kòng)时正、异、新,正异新的区分期。

因(yīn)为ControlNet可以直接提取画面的构图(tú),人物的姿(zī)势和画面的(de)深度信息等。有了它的帮(bāng)助,就(jiù)不用频繁(fán)的用提示词来碰运气,抽盲(máng)盒式的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘(huì)画加了“魔法”,不少博主(zhǔ)的作品已经获得了大量的浏览量,“viggo”就是其中之一(yī),他用朋友的照(zhào)片直(zhí)接带(dài)她们走进动漫(màn)世(shì)界。

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进入可(kě)控期,将(jiāng)洗牌科技行(xíng)业?_黑料正(zhèng)能量(liàng)

viggo先(xiān)用StableDiffusion图片转(zhuǎn)文字。

再用Text2Prompt插件拓展(zhǎn)找到对应的(de)关(guān)键词;最后用ControlNet插(chā)件绑定(dìng)骨骼(gé)开(kāi)始换关(guān)键词试效果。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技(jì)行业?_黑料正(zhèng)能量

通过图片(piàn)就可以看出来,效果十分(fēn)惊艳(yàn)。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正(zhèng)能量(liàng)

ChatGPT之后又一应用(yòng)杀(shā)疯(fēng)了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

更厉害的是,除了真(zhēn)实的(de)照片,草(cǎo)图也(yě)可以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现线稿转全彩图。大(dà)神张吕敏其(qí)本(běn)尊也(yě)亲自回应。

ChatGPT之后又一应用(yòng)杀疯了(le),AIGC或进入可控(kòng)期,将洗(xǐ)牌科技(jì)行业(yè)?_黑料正(zhèng)能(néng)量

不得不说当(dāng)下AIGC已经变得越来越强大,甚至输出的作品都已经(jīng)能以假(jiǎ)乱真了(le)。

02

难辨虚实,AIGC技术力爆发

警惕安全问题

近日,“苏州金(jīn)鸡湖有游(yóu)艇party”的消息火遍网络,而经过警方辟谣这(zhè)所(suǒ)谓的“party”可能是全国第一起AI绘图诈骗(piàn)。

由于这(zhè)个活动里(lǐ)面给出的美(měi)女照片都(dōu)是AI制(zhì)作的(de)真人照片绘图,因为太逼(bī)真,被大家当成真(zhēn)事传(chuán)播了

ChatGPT之后(hòu)又一(yī)应用杀疯了,AIGC或进入可控期,将洗牌科技(jì)行(xíng)业?_黑料正(zhèng)能量(liàng)

不过(guò)仔细观察可以发现(xiàn),活动(dòng)发起者提供(gōng)的照片中有(yǒu)个(gè)很大(dà)的漏洞可(kě)以(yǐ)发现并非真人,而(ér)是AI绘图,那(nà)便是图片中女(nǚ)性(xìng)的手(shǒu)指(zhǐ)部分(fēn)有的存在异常。

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?_黑料(liào)正能量(liàng)

有行业人事表(biǎo)示:“现在因为手指部分的绘画算法比(bǐ)较复杂,AI还(hái)不(bù)太会画人(rén)的手,但最(zuì)新(xīn)看(kàn)到的图片已经有越来越完(wán)美的AI模型出现(xiàn),以后可(kě)能就(jiù)完全没(méi)有漏洞(dòng)了。

类(lèi)似的AI作(zuò)图(tú)诈骗在国外也已有发生。据英国(guó)广播公(gōng)司报道,土耳其地震期间,有Tiktok用户使用AI合成(chéng)了儿童受灾(zāi)的假照片发布到(dào)网络,以此诱骗(piàn)善良的人打赏“捐助”从而实施诈骗。

目前(qián)随(suí)着技术(shù)发展,AIGC已经能做出真人(rén)照片般的绘(huì)图效果,如(rú)果这(zhè)样的图片被用来(lái)诈骗,将非常可怕(pà)。

此外AIGC还引(yǐn)发(fā)了很多担忧,一(yī)方面,批判者认为AI在(zài)“学习”了大量前人(rén)的作品之后,其(qí)创(chuàng)作没(méi)有(yǒu)任何情(qíng)绪和灵魂,难以和人类(lèi)的艺术创作相提并论(lùn)。

另一方面,AIGC背后(hòu)的版权(quán)、目(mù)前都(dōu)并没有得到有效的解决,还有AIGC会不会代替(tì)人类“至高无上”的创意。

马斯克也强调,人工智能的安全(quán)问题需要得到重视,太(tài)晚就(jiù)来不(bù)及了。

03

AIGC下一(yī)站除了视(shì)频,还(hái)有远(yuǎn)方

技术(shù)都是有两面性的,潜(qián)在的(de)危害(hài)并不能掩(yǎn)盖(gài)其光辉的贡献(xiàn)。现(xiàn)在看来(lái),人工智(zhì)能技术(shù)将是第四次(cì)工业革命(mìng)的(de)核心(xīn)驱动力量,将创造新的增长(zhǎng)奇迹。

过去一年,人(rén)工(gōng)智能在技(jì)术和商业层面都有了巨大进(jìn)展,AI绘画就是人工智能技术发生方向性改变的(de)一(yī)个代表。其(qí)下一站或许就(jiù)是视频(pín)。

此前,Meta和谷歌先(xiān)后发布了几(jǐ)条引爆科技圈的(de)短(duǎn)视频。这些视频(pín)引发关注并非内容做得(dé)多优秀,反而都非(fēi)常简单(dān),比如一匹正在喝水(shuǐ)的马(mǎ),一只画画(huà)的(de)玩具熊,或者一(yī)段(duàn)骑摩托车的第一视角(jiǎo)录像(xiàng),随便一个有手(shǒu)机的人都可以随手录下一段(duàn)。

ChatGPT之后又一(yī)应(yīng)用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正能量(liàng)

但这些短视频的(de)创作方式(shì)非常(cháng)简单,创(chuàng)作者仅(jǐn)仅需要向AI输入一段话,甚至只是(shì)说一下要求,AI就可以根据(jù)需要生成一段视频。

谷歌(gē)发布(bù)的两个AI生成视频分(fēn)别来自于Imagen Video和(hé)Phenaki,前者主要突(tū)出的是高清,与Meta的(de)Make-A-Video没有太多的差(chà)别。

在Make-A-Video公布了AI生成的视(shì)频(pín)后,AI圈(quān)就(jiù)已经玩了一波梗,一个能够做出更高清视频的(de)AI还不足以在短(duǎn)时间内戳中兴奋点。

Phenaki更(gèng)加令人震(zhèn)惊(jīng)的(de)地方(fāng)在于(yú),它可以制作出超(chāo)过2分钟的(de)连贯的也有(yǒu)确切内容的(de)视频,这才是真正让人们感到惊喜的地(dì)方(fāng)。因(yīn)为无(wú)论AI生成的视(shì)频(pín)多么(me)高清,也只能是为内(nèi)容(róng)生(shēng)产者(zhě)提供一个灵(líng)感(gǎn),一个素材(cái),一个过(guò)场动画(huà)。

不过能(néng)够制作出有具体剧情内容的视频就意味着(zhe),一些视频创作由(yóu)AI代(dài)替人工完成(chéng)已经(jīng)初步有了可能。

当下AI的发展速度已经超过大部(bù)分(fēn)人(rén)的(de)想象(xiàng)。内容产业的本(běn)质是供给创造需(xū)求(qiú),AIGC作为全新(xīn)的(de)内容生产方式,可以为内容产业带来更新的内容风格、更(gèng)快的生产速度,更低的生产成本,这无疑会(huì)驱动内(nèi)容产业的(de)大爆发(fā)。

除了AI绘图、视频(pín),AIGC技(jì)术还能应用(yòng)于音乐、代码、机器人(rén)动(dòng)作等多种内容形式的生成。不难发现该项技术不仅在游戏等行业能得到有效应用(yòng),对于下一代互(hù)联网(wǎng)各种(zhǒng)元素(sù)的构建(jiàn)亦有关(guān)键意义(yì)。

从(cóng)商(shāng)业(yè)化的角度来看,文化娱乐、教(jiào)育(yù)、传(chuán)媒(méi)等(děng)诸多领域(yù),本身就对基于AI的可(kě)视化内容有强烈需求。

因此,AI绘画及视频或不是(shì)结果(guǒ),而只是AI进程(chéng)中的一块重要拼图,有望(wàng)在技术(shù)更新的(de)加持下实现更大的应用价值。

AI从理解内容,走(zǒu)向了可(kě)以(yǐ)生成内容(róng),甚至能够创造出独立价值和独立视角(jiǎo)的内容。AIGC的再(zài)次出圈,更代表着未(wèi)来的先进生产力即将到来。

ChatGPT之(zhī)后又(yòu)一应用(yòng)杀(shā)疯(fēng)了(le),AIGC或进入可(kě)控期,将洗(xǐ)牌科(kē)技行业(yè)?_黑料正(zhèng)能量

04

紧抓大(dà)模型与算力(lì),牢固AIGC底(dǐ)座(zuò)

从技术的发展(zhǎn)也可以看出,在语言大模型(xíng)、图像大(dà)模(mó)型之后,多模态大模型(xíng)已经(jīng)成(chéng)为了新的趋势。

大模型被(bèi)誉为当前人工智能发展的智能底座,是(shì)全球竞争最激烈的研究方(fāng)向之一,包括谷歌、亚马逊(xùn)、百度、阿里、腾(téng)讯等(děng)众多头部企业都在竞相发力(lì)。

不过训练大模(mó)型的(de)确价(jià)格不菲(fēi),以(yǐ)国盛证券发布(bù)的《ChatGPT需要多(duō)少算力》报告估算(suàn),GPT-3训练(liàn)一次的成本约为140万美元。而对于一(yī)些更大的LLM(大型语言模型),训练成本则介于200万美元至(zhì)1200万美元高价之间。

以ChatGPT在2023年1月的(de)独立(lì)访客平(píng)均数1300万计算,其对应(yīng)芯片需求为3万多片英伟达A100 GPU,初始投(tóu)入(rù)成本约为8亿美元,每日仅电费就在5万美元左右。

ChatGPT之(zhī)后(hòu)又一应(yīng)用杀疯了,AIGC或进入可控(kòng)期,将洗牌(pái)科技行业?_黑料正(zhèng)能量(liàng)

此外不论是ChatGPT还是AIGC,都离(lí)不(bù)开庞大算力支持。在(zài)关(guān)注各类(lèi)大模(mó)型的发(fā)展同时,更应该关注(zhù)算力网(wǎng)络的(de)建设。

算力网络正驱动AI产业(yè)发展进入史诗(shī)级加速进程(chéng),让AIGC及通用AI这(zhè)一人工(gōng)智能发展的(de)终极目标离(lí)得更近。

因为算力可以对突破性技(jì)术创新提供大力的支正、异、新,正异新的区分(zhī)持。这(zhè)方(fāng)面(miàn),多模态大模(mó)型是典型。作为(wèi)面向未来强(qiáng)人工智(zhì)能、通用人工智能的重要技术创新,多模态大模(mó)型已经在人(rén)工智能领域提出了很多(duō)年,业(yè)界也有不少技术突破,但是,多(duō)模态大(dà)模型(xíng)进一步往下走,算力(lì)需求呈(chéng)几何式上升,一(yī)般的算(suàn)力基(jī)础设(shè)施(shī)很快将难以胜(shèng)任(rèn)。

从图(tú)像、文字、语音单独一项的训练,到双模态、三模态的跃迁(qiān),让(ràng)人工智(zhì)能可(kě)以灵(líng)活应对不同模态的转化(huà)、像(xiàng)人与世界(jiè)交互(hù)一样自然,这方面(miàn),由算力(lì)网络来(lái)驱动将有明显优势。

ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能(néng)量

此外,还有很多需要(yào)爆发式增长的算力来支撑的技术创新(xīn),将在人工(gōng)智能算(suàn)力网络支撑下快速推进(jìn)。

AIGC已经露出曙光,期待在大模型和大算力的支持下AIGC能持续颠覆内容生(shēng)产的方式(shì),将(jiāng)创造的边(biān)际成本降低,让万众受益。

未经允许不得转载:橘子百科-橘子都知道 正、异、新,正异新的区分

评论

5+2=