橘子百科-橘子都知道橘子百科-橘子都知道

俄罗斯是资本主义还是社会主义

俄罗斯是资本主义还是社会主义 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器(qì)人ChatGPT火爆(bào)以来,微软公司创(chuàng)始人比尔·盖茨已多次公开谈(tán)论人工智能话题(tí)。在最近的一(yī)次采(cǎi)访中,他再(zài)次表示(shì):“AI可能会让科技行(xíng)业迎来一次(cì)剧(jù)烈的(de)洗牌”。

这个结论是(shì)他(tā)在当地时(shí)间2月20日接受《In Good Company》节目专访时提出的(de)。

他(tā)预期,AI的发展可能会威(wēi)胁到谷歌的市占率,因为微软在AI方(fāng)面的行动相当迅(xùn)速(sù)。而最(zuì)终科(kē)技(jì)巨头将把AI整合成(chéng)用户的“全能助(zhù)手”,包揽一切应用,与人们进行沟通并提供建议,可(kě)以(yǐ)取(qǔ)代亚(yà)马逊、Siri或Outlook等应用。

大佬口中全能助(zhù)手的到(dào)来可能尚需时日(rì),但由ControlNet引发的又一(yī)次AI绘(huì)画(huà)浪潮,让(ràng)AIGC在(zài)ChatGPT的话题热点(diǎn)包围(wéi)中杀出重围(wéi)。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控(kòng)期,将洗牌科技行业?_黑料正能量

01

ControlNet颠覆(fù)AI绘画新玩法

AIGC向可控(kòng)靠近(jìn)

以(yǐ)AI绘画为代(dài)表的AIGC上一(yī)次(cì)爆火的时(shí)候,还(hái)是2022年8月,在美国科罗(luó)拉多州举办(bàn)的新兴数字(zì)艺术家竞赛中(zhōng),一幅名为《太空歌(gē)剧院》的作品获奖。

随后各大厂商的AI绘画(huà)软件(jiàn)被广大网友熟知(zhī)并体验(yàn),Stable Diffusion便是其中代表。

ChatGPT之后又一应用杀疯了,AIGC或进入(rù)可(kě)控期(qī),将洗(xǐ)牌科(kē)技行业?_黑料正能量

用户们可(kě)以在应用中输入一组关键词(cí)或者一张(zhāng)照片,就能获得(dé)一幅AI创作的画(huà)作。

作画的关键就是所输(shū)入的文本。同一组(zǔ)关键词也可(kě)以创作出(chū)很多张风(fēng)格不(bù)一样的画作,这(zhè)让创(chuàng)作的过程就像开盲盒。

很多用(yòng)户很喜欢(huān)这种不(bù)确定的惊喜,他们会将生成的(de)美(měi)图当做(zuò)头(tóu)像。而另一部分喜欢翻看(kàn)AI绘画的“翻车”作品(pǐn)。在(zài)社交媒体上,许多用户(hù)分享AI“翻车现场(chǎng)”,例如,一位网友的小狗照(zhào)片被AI画成了(le)“肌肉男”,还(hái)有网友的个人照片被AI识(shí)别(bié)成了建筑。

而如今随着ControlNet的(de)出现与加持,以(yǐ)往AI绘画(huà)的填(tián)写关键词游戏可能(néng)要被(bèi)颠覆(fù)了。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正(zhèng)能量

ControlNet是一位正在斯坦(tǎn)福读博的中(zhōng)国人(rén)张(zhāng)吕敏创作的一种(zhǒng)基于控制(zhì)点的(de)图像(xiàng)变(biàn)形算法,主要用于数字(zì)图像处(chù)理(lǐ)、计算机视觉和计算机(jī)图形(xíng)学等(děng)领域。

其SD插(chā)件一经发布,在短短(duǎn)的两天(tiān)内便成(chéng)为了AI绘画领域最新的(de)热点。

在此之前,大家(jiā)用(yòng)了很(hěn)多(duō)方法想让AI生成的结果尽可能(néng)的符合要求,但是都不尽(jǐn)如人意,它的(de)出现代表着AI生成开始进入真(zhēn)正的可控(kòng)时期。

因为ControlNet可(kě)以(yǐ)直接提取(qǔ)画面(miàn)的构图(tú),人物的姿势和俄罗斯是资本主义还是社会主义画面的深度信息等。有了它的帮助,就不用频繁的用提示词来碰运(yùn)气,抽盲盒式的创作(zuò)了(le)。

通(tōng)俗的说ControlNet相当于给AI绘画加了“魔法”,不少博主的作品已(yǐ)经获得了大量的浏览量,“viggo”就是其中之一,他用朋友的照片直接(jiē)带她们走进动漫世界(jiè)。

ChatGPT之后又一应(yīng)用杀(shā)疯了,AIGC或进入可控(kòng)期,将洗牌科技(jì)行业?_黑(hēi)料正能量(liàng)

viggo先用StableDiffusion图(tú)片转文字(zì)。

再用Text2Prompt插件拓展(zhǎn)找到对应的(de)关键词;最后(hòu)用(yòng)ControlNet插件绑定骨(gǔ)骼开始(shǐ)换(huàn)关键词试效果(guǒ)。

ChatGPT之后又一应(yīng)用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能(néng)量

通过图片(piàn)就可(kě)以看出来,效(xiào)果(guǒ)十分惊艳。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料正能量(liàng)

ChatGPT之(zhī)后(hòu)又一(yī)应用杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌科技行(xíng)业?_黑料正能(néng)量(liàng)

更厉害的是,除(chú)了真(zhēn)实的照片(piàn),草(cǎo)图也可(kě)以加上“魔法”,知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能实现线(xiàn)稿转(zhuǎn)全彩(cǎi)图。大神张(zhāng)吕敏其本尊也亲(qīn)自(zì)回应(yīng)。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入(rù)可控期,将洗牌科技行业?_黑料正能量(liàng)

不得(dé)不说当下(xià)AIGC已经变得越来越强大,甚至输出的作品都(dōu)已经能以假乱真了。

02

难辨虚实,AIGC技术力爆发

警惕安全问题(tí)

近日,“苏州金鸡湖有(yǒu)游艇party”的消息火遍网络(luò),而(ér)经(jīng)过警方辟谣这所谓的“party”可能是全国第一起AI绘图(tú)诈骗(piàn)。

由于这个活动里面给出的(de)美(měi)女照片都是(shì)AI制作的真人照片绘图(tú),因为太(tài)逼真(zhēn),被(bèi)大家当成真事(shì)传播(bō)了

ChatGPT之(zhī)后(hòu)又一应用杀疯了,AIGC或进(jìn)入可控(kòng)期,将洗牌科技(jì)行业?_黑料正(zhèng)能量

不过仔(zǎi)细观察可(kě)以发现,活动发起者(zhě)提(tí)供的照片(piàn)中有个很大的漏洞(dòng)可以发现并非真人,而是AI绘图,那便是(shì)图片中女性(xìng)的手(shǒu)指部分有(yǒu)的存在异(yì)常。

ChatGPT之(zhī)后(hòu)又一(yī)应用杀(shā)疯了,AIGC或进入(rù)可控期,将洗牌(pái)科技行业(yè)?_黑料正能量

有行业人事表示:“现在因(yīn)为(wèi)手指部分的绘画算法(fǎ)比较复杂,AI还不太会画人的手,但最新看(kàn)到(dào)的图片已经有越来(lái)越(yuè)完(wán)美(měi)的AI模型出(chū)现,以后可能就完全没(méi)有漏洞了。

类似的AI作图诈骗在(zài)国外也已有发生(shēng)。据英(yīng)国广播(bō)公(gōng)司报道,土耳其地震期间,有Tiktok用户(hù)使用AI合成了儿(ér)童受灾的假照片发(fā)布到网络,以此诱骗善良(liáng)的人打赏“捐助”从(cóng)而实施(shī)诈骗。

目(mù)前随着技(jì)术发(fā)展,AIGC已经能做(zuò)出真人照片般的绘(huì)图(tú)效果,如果这样(yàng)的(de)图(tú)片被用来诈骗,将非常可怕。

此外AIGC还引发了很多担忧,一方(fāng)面(miàn),批判者(zhě)认(rèn)为AI在“学(xué)习”了大量前人的作品之后,其创作没有任何情(qíng)绪和灵魂,难(nán)以和人类的艺术(shù)创作(zuò)相提并论。

另一方面,AIGC背后的版权、目前都并没有得到(dào)有效的解决(jué),还有(yǒu)AIGC会不会代(dài)替(tì)人类(lèi)“至高无上”的(de)创意。

马(mǎ)斯克也强调(diào),人工(gōng)智能的安全问题需要得到重视,太晚(wǎn)就来不及了。

03

AIGC下一站除了视频,还有远(yuǎn)方

技术都是有两面性的,潜在的危害并(bìng)不(bù)能(néng)掩盖其光(guāng)辉(huī)的(de)贡献(xiàn)。现在看(kàn)来,人(rén)工智(zhì)能技术(shù)将(jiāng)是第(dì)四次工业革命的(de)核心驱动力量,将(jiāng)创造新的增长奇迹(jì)。

过去一年,人工智(zhì)能在(zài)技术和商(shāng)业层面(miàn)都有了巨(jù)大进展,AI绘画就是(shì)人工智能(néng)技术发生(shēng)方向性改变的一个代表。其下一站(zhàn)或许就是视(shì)频。

此(cǐ)前,Meta和(hé)谷歌(gē)先后发布了(le)几条引爆科技圈的短视频(pín)。这些视频引(yǐn)发关注并非内容做得多优(yōu)秀,反而都非常简单,比如(rú)一匹正在喝水的马,一只画画的玩具熊,或者(zhě)一(yī)段骑(qí)摩(mó)托(tuō)车的第一视(shì)角(jiǎo)录像,随便一个有手机的(de)人(rén)都可(kě)以随手录(lù)下一段(duàn)。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入(rù)可控期,将洗牌科技行业?_黑料正能量(liàng)

但这些短视频的创作方式非常简单,创作(zuò)者仅仅需要向AI输入(rù)一(yī)段话,甚至(zhì)只是说一下(xià)要求,AI就可以根据需(xū)要生成一段视频。

谷歌发布的两个AI生成视频分别(bié)来自于Imagen Video和Phenaki,前者主要突出的是高清(qīng),与Meta的Make-A-Video没(méi)有太多的(de)差别。

在(zài)Make-A-Video公布了AI生成(chéng)的(de)视频后,AI圈(quān)就已(yǐ)经玩了(le)一波梗,一个能够(gòu)做出(chū)更高(gāo)清视频的AI还(hái)不足(zú)以在短时间内戳中兴奋点。

Phenaki更加(jiā)令人震惊(jīng)的地(dì)方在于(yú),它可以制作出超过(guò)2分钟的(de)连贯(guàn)的也有确切内容的视频,这才是真(zhēn)正让(ràng)人们感(gǎn)到惊(jīng)喜的(de)地方。因为(wèi)无论AI生成的视频(pín)多么高清,也(yě)只(zhǐ)能是(shì)为内容生(shēng)产者提供一个灵感,一个素材,一个过场动画。

不过能够制作出有具体剧(jù)情内容的视频(pín)就意味着(zhe),一些视频创作由(yóu)AI代替人工(gōng)完成已经初步有了可能。

当(dāng)下AI的发展速(sù)度已经超过(guò)大部分人的想象。内(nèi)容产业的本质(zhì)是(shì)供给创造需求,AIGC作为全新(xīn)的(de)内(nèi)容生产方式,可(kě)以为内(nèi)容产业带(dài)来更(gèng)新(xīn)的内容风格、更快(kuài)的生产速度,更低的(de)生产(chǎn)成本,这无疑会驱(qū)动内(nèi)容产业的大(dà)爆(bào)发。

除(chú)了AI绘图、视频,AIGC技术还(hái)能应用于(yú)音乐(lè)、代(dài)码、机器人动作等多种内(nèi)容形式的生成(chéng)。不难发现该项技术不(bù)仅在游戏等(děng)行(xíng)业能得(dé)到有效应用,对于下一代互(hù)联网(wǎng)各(gè)种(zhǒng)元素的(de)构建(jiàn)亦有(yǒu)关键意(yì)义。

从商(shāng)业化的角度来看,文(wén)化娱乐、教育、传媒等诸多领域,本身就对基于(yú)AI的可视化内(nèi)容(róng)有强烈需求。

因此(cǐ),AI绘画及视(shì)频(pín)或不(bù)是结(jié)果(guǒ),而只是AI进(jìn)程中的一块重(zhòng)要拼图,有望在技术(shù)更新的加(jiā)持下实现更大的(de)应(yīng)用价值。

AI从理解内容(róng),走向了(le)可以(yǐ)生成内容,甚至能够创造出独(dú)立(lì)价值和(hé)独立(lì)视角的内容。AIGC的再(zài)次出(chū)圈(quān),更代(dài)表着未来的先进生(shēng)产力即将到(dào)来。

ChatGPT之后又一应用杀疯了,AIGC或(huò)进(jìn)入可控期,将(jiāng)洗牌科(kē)技行(xíng)业?_黑料正能量

04

紧抓大模型与算力,牢固AIGC底座(zuò)

从技(jì)术的发展也可以看出,在(zài)语言大模型、图像大模型(xíng)之后,多模态大模(mó)型已经(jīng)成为(wèi)了新的趋势。

大模型被誉为(wèi)当(dāng)前人工智能发展的智能底座(zuò),是全(quán)球(qiú)竞争(zhēng)最激烈的研究方向之一,包括谷歌(gē)、亚马逊、百度(dù)、阿里、腾讯等众(zhòng)多头部企业都在竞相发力。

不过训练大模型的确价(jià)格(gé)不菲,以国盛(shèng)证券发布的《ChatGPT需要多(duō)少算力》报(bào)告估算,GPT-3训练一次的成本(běn)约为140万美元。而对于一些更大的LLM(大(dà)型语(yǔ)言模(mó)型),训(xùn)练成(chéng)本则(zé)介于200万美元至1200万美(měi)元高价之间。

以ChatGPT在2023年(nián)1月的独立访客平均数1300万计算,其对应(yīng)芯片(piàn)需求为3万多片英伟(wěi)达A100 GPU,初始(shǐ)投入成本约为8亿美元(yuán),每日仅电费就在5万(wàn)美元左右。

ChatGPT之(zhī)后(hòu)又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑料正能量(liàng)

此外不论是ChatGPT还是AIGC,都离不开庞大算(suàn)力支持(chí)。在关注各类大模型的发展同时,更应该关注算力(lì)网络的建设。

算力网络(luò)正驱动(dòng)AI产业发展进入史诗级加速进(jìn)程,让AIGC及通用AI这(zhè)一(yī)人工智能(néng)发(fā)展的终(zhōng)极目标离得更(gèng)近。

因为算力可以(yǐ)对突破性技术创新提供大(dà)力的支持。这方面,多模态大(dà)模型是典型。作为面向(xiàng)未来强人工智能、通用人工智能的重要技术创新(xīn),多模(mó)态大模型已经在人工智能领域提出了很多年(nián),业界也有不少技术突破,但是,多模态(tài)大模(mó)型进一(yī)步往下走,算力需求呈几何式上升,一般的算力基础(chǔ)设施很快将(jiāng)难以胜任(rèn)。

从图像、文字、语(yǔ)音单独一项(xiàng)的训练,到(dào)双模态、三模态的跃迁,让人工(gōng)智能可以(yǐ)灵活(huó)应(yīng)对不同模态的(de)转化、像人与世界(jiè)交互一样自(zì)然,这方面(miàn),由算力网络来驱动将有明(míng)显(xiǎn)优(yōu)势(shì)。

ChatGPT之后又一(yī)应用杀(shā)疯了(le),AIGC或进入可控(kòng)期,将洗牌科技行业?_黑(hēi)料正能量

此外,还有(yǒu)很(hěn)多(duō)需(xū)要爆发式增长的算力来支撑的(de)技术创(chuàng)新,将(jiāng)在人工(gōng)智能算力网(wǎng)络支撑下快速推进。

AIGC已经露出曙光(guāng),期待在(zài)大模型和大算力的支持下AIGC能持续颠覆(fù)内容生(shēng)产的方(fāng)式(shì),将创(chuàng)造的边际成(chéng)本降(jiàng)低,让万众(zhòng)受(shòu)益。

未经允许不得转载:橘子百科-橘子都知道 俄罗斯是资本主义还是社会主义

评论

5+2=