橘子百科-橘子都知道橘子百科-橘子都知道

独肖有哪几个

独肖有哪几个 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自(zì)聊天(tiān)机器人ChatGPT火爆以来,微软(ruǎn)公司(sī)创始人比尔·盖茨(cí)已(yǐ)多次公(gōng)开谈论人(rén)工智能话(huà)题。在最近的一次采访(fǎng)中(zhōng),他再次表示(shì):“AI可能会(huì)让(ràng)科(kē)技行业迎来一次(cì)剧烈的(de)洗牌”。

这个(gè)结论是他(tā)在当地(dì)时间2月20日(rì)接受《In Good Company》节目专访(fǎng)时提(tí)出的。

他预期,AI的发展可能会威胁(xié)到谷歌(gē)的市(shì)占率,因为微软在AI方面的行动相(xiāng)当迅速。而(ér)最终科(kē)技(jì)巨头将把(bǎ)AI整合成用户的“全能助手”,包揽一(yī)切应(yīng)用,与(yǔ)人们进行(xíng)沟通并提供建议,可以取代(dài)亚马逊、Siri或Outlook等应用。

大佬口中全能(néng)助手的到来可能尚需时日,但由ControlNet引发的又一次AI绘画浪潮,让AIGC在(zài)ChatGPT的话题热点包(bāo)围(wéi)中杀出(chū)重围。

ChatGPT之后又一应用杀(shā)疯了(le),AIGC或进(jìn)入可(kě)控期(qī),将洗(xǐ)牌科技行(xíng)业?_黑料正能量

01

ControlNet颠覆(fù)AI绘画新玩法

AIGC向可(kě)控靠近

以AI绘画为代(dài)表(biǎo)的AIGC上(shàng)一次爆(bào)火的(de)时候,还是2022年8月(yuè),在美国科罗拉(lā)多州举办的(de)新(xīn)兴数字艺术家(jiā)竞(jìng)赛中,一幅名(míng)为《太空歌剧院》的作品获(huò)奖。

随后各大厂商的AI绘画软件被(bèi)广大网友熟知并(bìng)体验,Stable Diffusion便(biàn)是其(qí)中(zhōng)代表。

ChatGPT之后(hòu)又一应用杀疯(fēng)了,AIGC或进入可控期,将洗牌科技行业?_黑料正能量

用户们可(kě)以在应用中输入(rù)一组关键词或者一张照片(piàn),就能获(huò)得一幅AI创作的画作。

作(zuò)画的(de)关键(jiàn)就是所(suǒ)输入的文本(běn)。同一组(zǔ)关键词也可以创作出很多张风格不一样的画作(zuò),这(zhè)让创作(zuò)的过(guò)程就像开盲盒。

很(hěn)多用户很喜(xǐ)欢这种(zhǒng)不确定(dìng)的惊喜,他(tā)们(men)会将生成的美图当做头像(xiàng)。而(ér)另(lìng)一(yī)部分喜(xǐ)欢翻看AI绘画(huà)的“翻车”作品。在(zài)社(shè)交媒体上(shàng),许多(duō)用户分享AI“翻车现场”,例如,一位(wèi)网(wǎng)友的(de)小狗照片被AI画成了“肌肉男(nán)”,还(hái)有网友的个(gè)人(rén)照片被AI识别成(chéng)了建筑(zhù)。

而如今随着ControlNet的出现(xiàn)与加(jiā)持,以往(wǎng)AI绘画的填写关键词游戏可能(néng)要被颠覆了。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或(huò)进入可控(kòng)期,将洗牌科技行业?_黑(hēi)料(liào)正能量

ControlNet是一位(wèi)正在斯坦福读博的中国人张(zhāng)吕敏创作的(de)一(yī)种基于控制点的图像变形算法(fǎ),主要用于数字(zì)图像处理(lǐ)、计算机视觉和(hé)计算机图形学(xué)等领(lǐng)域。

其SD插件(jiàn)一经发布,在(zài)短(duǎn)短的(de)两(liǎng)天(tiān)内便成为了(le)AI绘画领(lǐng)域(yù)最(zuì)新的热点。

在此(cǐ)之前(qián),大(dà)家用了很多方法想让(ràng)AI生成(chéng)的(de)结(jié)果(guǒ)尽可能的符合要求,但(dàn)是(shì)都不尽(jǐn)如(rú)人意,它的出现代表着(zhe)AI生成开始进入真正的可控时期。

因(yīn)为ControlNet可(kě)以直接(jiē)提取画面的构图,人物的姿势和画面的深度信息等。有了它(tā)的帮助,就不用频繁的用提示词独肖有哪几个(cí)来碰(pèng)运气,抽盲盒式的创作了。

通俗(sú)的说ControlNet相(xiāng)当于(yú)给AI绘(huì)画加了“魔(mó)法”,不少博(bó)主的作品已(yǐ)经获得了大量的浏览量,“viggo”就(jiù)是其(qí)中之(zhī)一,他用朋友的照片(piàn)直接(jiē)带她们走进(jìn)动(dòng)漫(màn)世(shì)界。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或(huò)进入可控期,将洗牌科技行业?_黑料正能量

viggo先(xiān)用(yòng)StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到(dào)对应的关键词(cí);最后用ControlNet插件(jiàn)绑定骨(gǔ)骼开始换关(guān)键词(cí)试效(xiào)果(guǒ)。

ChatGPT之后又一应用杀疯了,AIGC或进入可(kě)控期,将洗牌科技行业?_黑料正能(néng)量(liàng)

通过图片就(jiù)可以看出来,效果十分惊艳。

ChatGPT之(zhī)后又(yòu)一应(yīng)用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业(yè)?_黑料(liào)正能量

ChatGPT之后(hòu)又一应用杀(shā)疯了(le),AIGC或(huò)进入可控期,将洗(xǐ)牌科(kē)技行业(yè)?_黑料正能量(liàng)

更(gèng)厉害(hài)的是,除了真实(shí)的照片,草图也可以(yǐ)加上“魔法(fǎ)”,知乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还能实现线稿转(zhuǎn)全彩(cǎi)图。大神张吕敏其本尊(zūn)也(yě)亲自回应。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或(huò)进入可(kě)控期(qī),将洗牌科(kē)技(jì)行业?_黑料(liào)正能量

不得不说当下AIGC已经(jīng)变得越(yuè)来(lái)越(yuè)强大,甚至输出的作(zuò)品都(dōu)已经能以(yǐ)假乱真了。

02

难(nán)辨(biàn)虚实,AIGC技术力(lì)爆(bào)发

警惕安全(quán)问题

近日,“苏州金鸡(jī)湖有游艇party”的消(xiāo)息火遍网络(luò),而经过警方辟(pì)谣这所谓(wèi)的(de)“party”可能是(shì)全(quán)国第(dì)一起AI绘图(tú)诈(zhà)骗。

由(yóu)于(yú)这个活动(dòng)里面给出的美女(nǚ)照片都是AI制作的(de)真人照(zhào)片绘图,因(yīn)为太逼真,被大家当成真事传播(bō)了

ChatGPT之后又(yòu)一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌(pái)科技行业?_黑料正能量(liàng)

不过仔细观察可以(yǐ)发现,活动(dòng)发(fā)起者提供(gōng)的照片中有个很大的漏洞(dòng)可以(yǐ)发现并(bìng)非真人,而是AI绘图,那(nà)便是图片中女性的(de)手指部分(fēn)有(yǒu)的存(cún)在异常。

ChatGPT之后(hòu)又一应用杀疯(fēng)了(le),AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量

有行(xíng)业人(rén)事表示:“现(xiàn)在(zài)因为手(shǒu)指部分的绘(huì)画(huà)算法(fǎ)比(bǐ)较(jiào)复杂,AI还不太会(huì)画人的手,但最新看到的图片已经有越来越完美的AI模型出现,以后(hòu)可能就完全没有漏洞(dòng)了。

类(lèi)似的AI作图诈骗在国外(wài)也已有发生(shēng)。据(jù)英国广播公(gōng)司(sī)报道(dào),土耳其地震期间(jiān),有Tiktok用户(hù)使用AI合成(chéng)了儿(ér)童(tóng)受灾的假照片发(fā)布到网(wǎng)络,以此(cǐ)诱骗善良的人打(dǎ)赏“捐助”从而(ér)实施诈骗。

目(mù)前随着技(jì)术发展,AIGC已(yǐ)经能做出真人照片般的绘图效果,如果这样的图片被用来诈骗(piàn),将非(fēi)常(cháng)可怕。

此外AIGC还引发了很多担忧,一方面,批判者(zhě)认(rèn)为(wèi)AI在“学习”了大量前人的作品之(zhī)后,其创作没有任何情绪和灵魂(hún),难以(yǐ)和人类的艺(yì)术创作(zuò)相提并论。

另(lìng)一方面,AIGC背后的版权、目前都并没有得到(dào)有(yǒu)效的解决,还有AIGC会不会(huì)代替人类“至高无上”的创意。

马斯克也强调,人工智能的安全问(wèn)题需要得(dé)到(dào)重视,太晚(wǎn)就来不(bù)及了(le)。

03

AIGC下一站除了视频,还有(yǒu)远(yuǎn)方

技术(shù)都是有两(liǎng)面性的(de),潜在的危害(hài)并不能掩盖(gài)其(qí)光辉的贡献(xiàn)。现(xiàn)在(zài)看来,人工智能技术将是第(dì)四次工业革命的核心驱动力量(liàng),将(jiāng)创造(zào)新的增长奇(qí)迹(jì)。

过去一年,人(rén)工智能在技术和商(shāng)业层面都有了(le)巨(jù)大进展,AI绘画就是人工智(zhì)能技(jì)术发生方向性改变的一(yī)个(gè)代表。其下一站或许就是视频。

此前,Meta和谷歌先后发布了(le)几条引(yǐn)爆科技圈的短视频。这些视(shì)频引发关注(zhù)并非内容做得多优秀,反而都非常简单,比如一(yī)匹正在喝水的马,一只画画的玩具熊,或者一(yī)段骑摩托车的第(dì)一视角录(lù)像,随便一(yī)个有手(shǒu)机的人都可以随(suí)手录下一段。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可(kě)控(kòng)期,将洗牌科技行(xíng)业?_黑料正能(néng)量

但这些短视频的创作(zuò)方(fāng)式非常简单,创作(zuò)者(zhě)仅(jǐn)仅需要向AI输(shū)入一段话,甚至只是(shì)说(shuō)一下要(yào)求,AI就(jiù)可以根据需(xū)要(yào)生成一段视(shì)频(pín)。

谷歌发(fā)布的两个(gè)AI生(shēng)成视频分别来自于Imagen Video和Phenaki,前者主要突出(chū)的(de)是高(gāo)清,与Meta的Make-A-Video没有(yǒu)太多的(de)差(chà)别。

在(zài)Make-A-Video公布了AI生成的(de)视(shì)频后(hòu),AI圈就已经(jīng)玩了一波(bō)梗,一个能(néng)够(gòu)做出(chū)更高清视频的AI还(hái)不足以在短时(shí)间内(nèi)戳中(zhōng)兴奋点。

Phenaki更加令人震惊的(de)地方在于,它可以制作出超过2分钟的连(lián)贯的也(yě)有确(què)切(qiè)内容(róng)的视频,这才是(shì)真正让人(rén)们感到惊(jīng)喜的地(dì)方。因为无(wú)论AI生成(chéng)的视频多么高(gāo)清,也只能是为内容生产者(zhě)提(tí)供一(yī)个(gè)灵(líng)感,一个素材,一个(gè)过场动画。

不过能够制作出有具体剧(jù)情内容的视频就意(yì)味着,一些视(shì)频创作由AI代替人工完成(chéng)已经初步有了可能。

当下AI的发展速度已经(jīng)超(chāo)过大部(bù)分(fēn)人的想象(xiàng)。内容产业(yè)的本质是供给创造(zào)需求,AIGC作为全新的内(nèi)容(róng)生产方式(shì),可以(yǐ)为内(nèi)容产业(yè)带来更新(xīn)的(de)内容风(fēng)格、更快的生(shēng)产速度,更低的生产成本,这无疑会(huì)驱动(dòng)内容产业的大爆(bào)发。

除了AI绘(huì)图、视频,AIGC技(jì)术还能(néng)应用于音乐、代码、机器人(rén)动作等多种(zhǒng)内容形式的生成。不难发现该项技术不(bù)仅在游戏(xì)等行业(yè)能得(dé)到有效应用,对于下一(yī)代(dài)互(hù)联网各种元素的构建亦(yì)有关(guān)键意义。

从商业(yè)化的角(jiǎo)度来(lái)看,文化(huà)娱乐(lè)、教育、传(chuán)媒(méi)等诸多领(lǐng)域,本身就对基于AI的(de)可(kě)视化内容有强烈需求。

因此,AI绘画及视频或不是结(jié)果(guǒ),而只是AI进程中的(de)一块重(zhòng)要(yào)拼图,有望在技术更新(xīn)的加持下实现更大(dà)的应用价值。

AI从理解内容,走向了可(kě)以生成内容,甚至能够创造出独立(lì)价值和独立(lì)视角的内容。AIGC的再次出圈(quān),更代表(biǎo)着未来的先进生产力即将到来。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进入可控期,将洗牌科(kē)技行业?_黑料正能量

04

紧抓大模型与算力,牢(láo)固AIGC底座

从技术的发展也可以看出,在语言(yán)大(dà)模型(xíng)、图像大(dà)模型之后,多模态大模型已经(jīng)成为了新(xīn)的(de)趋势。

大模型被誉为当前(qián)人(rén)工智能(néng)发展的智能底座,是全(quán)球竞争最激烈的研究方向之一(yī),包括谷歌(gē)、亚马逊、百度、阿(ā)里、腾讯等众(zhòng)多头(tóu)部企业都在竞相发力。

不(bù)过(guò)训练大模型的确价格不菲,以国盛证券发(fā)布的《ChatGPT需要(yào)多少算力》报告估算,GPT-3训练(liàn)一(yī)次的(de)成本约为140万(wàn)美元。而对于一些更(gèng)大的LLM(大型语言模(mó)型),训练成(chéng)本则介于200万美元至(zhì)1200万(wàn)美(měi)元高价(jià)之间。

以ChatGPT在(zài)2023年1月的独立访客平均数1300万计算,其对应芯片需求(qiú)为3万多片英伟达A100 GPU,初始投入成本约为8亿美(měi)元,每日仅电费(fèi)就(jiù)在5万美元左右(yòu)。

ChatGPT之后又一应用(yòng)杀疯了,AIGC或进入(rù)可控期,将(jiāng)洗牌科技行业?_黑料正能量(liàng)

此(cǐ)外不论是ChatGPT还(hái)是AIGC,都离不开庞(páng)大算力支持(chí)。在(zài)关(guān)注各类大模型(xíng)的发展同(tóng)时,更(gèng)应该关注(zhù)算力网络的建设。

算力网络正驱动AI产业发展进入史诗级(jí)加速进程,让AIGC及通(tōng)用AI这一(yī)人工智能发展的终极目(mù)标离(lí)得更近。

因为算(suàn)力(lì)可(kě)以对突破性技术创新(xīn)提供大力(lì)的(de)支持。这(zhè)方面,多模态大模型是典型。作为面向(xiàng)未(wèi)来强人工智能、通用人工智能的重要技术创新,多模态(tài)大模(mó)型已经在(zài)人工(gōng)智能领域(yù)提出了很多年,业界也有不少技术突破,但是,多模态大(dà)模型进一步往(wǎng)下走,算力需求呈几何(hé)式上升(shēng),一般的(de)算力(lì)基础设施很快将难以胜任。

从图像、文字、语音单独一项的(de)训练(liàn),到双模态(tài)、三模(mó)态的跃迁,让人工智(zhì)能可以灵(líng)活(huó)应(yīng)对不(bù)同(tóng)模(mó)态的转化(huà)、像(xiàng)人与(yǔ)世界(jiè)交互一(yī)样(yàng)自(zì)然(rán),这方面,由算力网(wǎng)络来(lái)驱(qū)动(dòng)将有(yǒu)明显优势。

ChatGPT之后又(yòu)一应用杀疯(fēng)了,AIGC或(huò)进入(rù)可控期,将(jiāng)洗牌(pái)科技(jì)行业?_黑料正(zhèng)能量

此外,还有很多需(xū)要(yào)爆发式(shì)增长的(de)算力来支撑的技术创新(xīn),将在人工智能算力网络支撑下(xià)快速推进。

AIGC已经(jīng)露出曙光,期待在大(dà)模(mó)型和大算(suàn)力的(de)支持下(xià)AIGC能持续颠覆(fù)内容生产的方式(shì),将创造的(de)边际成本降低,让万众(zhòng)受益(yì)。

未经允许不得转载:橘子百科-橘子都知道 独肖有哪几个

评论

5+2=