自聊天机(jī)器人(rén)ChatGPT火爆以(yǐ)来,微软(ruǎn)公司创始人比尔·盖茨已多次公开谈论人工(gōng)智(zhì)能话题。在最近的一(yī)次采访中,他再(zài)次表(biǎo)示(shì):“AI可能会让科技行业(yè)迎来一次(cì)剧烈的洗牌”。
这个结论是他在当地时(shí)间(jiān)2月20日接(jiē)受《In Good Company》节目专访时提出的(de)。
他预期,AI的(de)发展可(kě)能会(huì)威胁(xié)到谷歌的市占率,因为微(wēi)软在AI方面的行动相(xiāng)当迅速。而最终(zhōng)科(kē)技巨头(tóu)将把AI整合成用户的(de)“全能(néng)助手(shǒu)”,包揽一切应(yīng)用,与人们进(jìn)行沟通并(bìng)提供建议,可以取代亚马逊、Siri或Outlook等应用(yòng)。
大佬口中(zhōng)全能助手的到来可能尚需时日(rì),但(dàn)由(yóu)ControlNet引发的又(yòu)一次AI绘画浪潮(cháo),让AIGC在(zài)ChatGPT的话题热(rè)点包围中(zhōng)杀出重围。
孕妇一天吃几个山竹,孕妇一天吃几个山竹比较好="300,640" data-type="jpeg" data-w="1000">
01
ControlNet颠覆AI绘画新玩(wán)法
AIGC向可控靠近
以(yǐ)AI绘画为代表的(de)AIGC上一次(cì)爆火的时候,还是2022年8月,在(zài)美国科罗拉多州举办的新兴数字艺术家(jiā)竞赛中,一幅名为《太空歌剧院》的(de)作品获(huò)奖。
随(suí)后各(gè)大厂商的(de)AI绘画软件被(bèi)广(guǎng)大网友熟知并(bìng)体(tǐ)验,Stable Diffusion便是(shì)其中(zhōng)代表(biǎo)。
用户们可(kě)以在应用中输(shū)入(rù)一组关键词或者一张(zhāng)照片(piàn),就(jiù)能获得一幅AI创作(zuò)的画作。
作画的关键就是所(suǒ)输入的(de)文本。同一组关键词也可以创(chuàng)作出很多张风格不一样(yàng)的画(huà)作,这让(ràng)创(chuàng)作的过程就像开(kāi)盲盒(hé)。
很多(duō)用户很喜欢这种(zhǒng)不确定的(de)惊喜,他们会(huì)将生成的美图当做头像。而另(lìng)一部分(fēn)喜欢翻看AI绘画的“翻车”作品。在社交媒体上,许多(duō)用户分(fēn)享AI“翻(fān)车现场”,例如,一位(wèi)网(wǎng)友的(de)小(xiǎo)狗照片被(bèi)AI画成了“肌肉男”,还有网友(yǒu)的个人照(zhào)片被AI识(shí)别(bié)成了(le)建筑。
而(ér)如(rú)今随(suí)着ControlNet的出现与(yǔ)加(jiā)持,以(yǐ)往(wǎng)AI绘画的填(tián)写关键(jiàn)词(cí)游戏可(kě)能要(yào)被颠(diān)覆了(le)。
ControlNet是(shì)一位正在斯坦福(fú)读博的中国人(rén)张吕(lǚ)敏创作的一种基于(yú)控(kòng)制点的图像变形算法,主要用于数字(zì)图(tú)像处理(lǐ)、计(jì)算机视(shì)觉和计算机图形学等领域。
其SD插件一(yī)经发布,在短短的两天内便成为(wèi)了AI绘画领域(yù)最新的热点(diǎn)。
在此之前,大家用了很(hěn)多方法(fǎ)想让(ràng)AI生成的结果尽可能的符合要求,但是(shì)都不尽(jǐn)如人意,它的(de)出现代表着(zhe)AI生(shēng)成(chéng)开始进入真(zhēn)正的可控时期。
因为ControlNet可以直接提取画面的构图(tú),人物(wù)的姿势和画面(miàn)的深度信(xìn)息(xī)等。有了它的帮助,就不用频繁的(de)用提示词来碰运(yùn)气,抽盲盒式的创作了。
通俗的说ControlNet相当于给AI绘画加(jiā)了(le)“魔法(fǎ)”,不少博(bó)主(zhǔ)的作(zuò)品已经(jīng)获(huò)得了大(dà)量的浏(liú)览(lǎn)量,“viggo”就是其中(zhōng)之一,他用朋友的照片直接带她(tā)们走进动漫世(shì)界。
viggo先(xiān)用StableDiffusion图片转文(wén)字。
再用Text2Prompt插(chā)件(jiàn)拓展找到对应的关键词;最后(hòu)用ControlNet插件绑定骨骼开始换(huàn)关键词试效果。
通过图片就可以(yǐ)看(kàn)出来,效果十分惊(jīng)艳。
更厉害的是,除了真实的照片,草图也可(kě)以加上“魔(mó)法”,知(zhī)乎大(dà)牛(niú)“DevPoint”和“逗砂”介(jiè)绍到ControlNet还能实现(xiàn)线稿(gǎo)转全(quán)彩图(tú)。大(dà)神张吕敏(mǐn)其本尊也亲自回(huí)应。
不(bù)得不说当(dāng)下(xià)AIGC已经变得越(yuè)来越(yuè)强(qiáng)大,甚(shèn)至输出的作(zuò)品都已经能以假乱真了。
02
难辨虚实,AIGC技术力爆发
警惕安(ān)全问题(tí)
近日,“苏州金鸡湖有(yǒu)游艇party”的消(xiāo)息火遍网络(luò),而(ér)经过警方辟谣这所谓的“party”可能是全国第一起(qǐ)AI绘图(tú)诈骗。
由(yóu)于这个活动里面给出的美(měi)女(nǚ)照片都是AI制作的(de)真人照片绘图,因为(wèi)太逼真,被(bèi)大家当成真(zhēn)事传播了。
不过仔细观察可(kě)以(yǐ)发现(xiàn),活动(dòng)发(fā)起者提(tí)供的照(zhào)片中有(yǒu)个很大(dà)的漏洞可以发(fā)现并非真人(rén),而(ér)是AI绘(huì)图,那便是(shì)图片中女性的手指部分有(yǒu)的存(cún)在异(yì)常。
有行(xíng)业(yè)人事(shì)表示:“现在因(yīn)为手指部分(fēn)的(de)绘(huì)画算法(fǎ)比(bǐ)较复(fù)杂,AI还不太(tài)会画人的手,但最新看(kàn)到的图片(piàn)已经(jīng)有越(yuè)来越完美的AI模型出现,以后可能就完全(quán)没有(yǒu)漏(lòu)洞了。”
类(lèi)似的AI作图(tú)诈骗在国外(wài)也(yě)已有(yǒu)发生(shēng)。据英国广播(bō)公(gōng)司报(bào)道(dào),土耳其地震期间(jiān),有Tiktok用户使用AI合(hé)成了儿童(tóng)受灾的假照(zhào)片发布到网络(luò),以(yǐ)此诱骗善良的(de)人打赏(shǎng)“捐助(zhù)”从而实施诈骗。
目前(qián)随(suí)着技术发展,AIGC已(yǐ)经能做(zuò)出真人照片般的(de)绘(huì)图效果,如果(guǒ)这样(yàng)的(de)图片被用(yòng)来诈(zhà)骗,将非常(cháng)可(kě)怕。
此外AIGC还引发了(le)很多担忧,一方(fāng)面,批判者认(rèn)为AI在“学习”了大(dà)量前人的(de)作品之后(hòu),其创作没有任(rèn)何情(qíng)绪和灵(líng)魂,难以和人类的(de)艺术创作相提并论。
另一方面,AIGC背后(hòu)的版(bǎn)权、目前都并没有得到有效(xiào)的解决(jué),还有AIGC会(huì)不会代替人类“至高(gāo)无上(shàng)”的创意(yì)。
马(mǎ)斯克(kè)也强调,人工智能的安全问题需要(yào)得到重视,太晚就来不及了(le)。
03
AIGC下(xià)一站除了视频(pín),还有远方
技术(shù)都是有两(liǎng)面性的,潜(qián)在的(de)危害并不(bù)能掩盖(gài)其光辉的贡献(xiàn)。现(xiàn)在(zài)看来,人工智能(néng)技术将(jiāng)是第(dì)四次工业革命的核(hé)心驱动(dòng)力量(liàng),将创造(zào)新(xīn)的增长奇(qí)迹。
过去一年,人工智能在(zài)技术和(hé)商业(yè)层面都有了(le)巨大(dà)进展,AI绘画就是人工智(zhì)能(néng)技术(shù)发生(shēng)方向性(xìng)改变的(de)一个代表(biǎo)。其下一站或许(xǔ)就是视频。
此(cǐ)前,Meta和谷(gǔ)歌(gē)先后发布了几(jǐ)条引爆科技(jì)圈的短视频。这些视频(pín)引(yǐn)发(fā)关注并非内容做得多优(yōu)秀,反而都非(fēi)常简(jiǎn)单(dān),比如一匹正在喝(hē)水的马,一只画画(huà)的玩具熊,或者(zhě)一段骑摩托车(chē)的第(dì)一视角录像,随便(biàn)一个有手机的人都可以(yǐ)随手录下(xià)一段。
但这些短视(shì)频的创作方(fāng)式非常简单,创作者仅仅需要向AI输入一(yī)段话,甚至(zhì)只(zhǐ)是说一下(xià)要求,AI就可以根据(jù)需(xū)要生成一段视频。
谷歌发布的两(liǎng)个(gè)AI生成(chéng)视(shì)频分(fēn)别来自于Imagen Video和Phenaki,前(qián)者主要突出的是高清,与Meta的Make-A-Video没有(yǒu)太多(duō)的差(chà)别(bié)。
在Make-A-Video公(gōng)布(bù)了AI生(shēng)成的视(shì)频后(hòu),AI圈就已(yǐ)经玩(wán)了一波梗(gěng),一(yī)个能够做出更(gèng)高清(qīng)视频的AI还不(bù)足以(yǐ)在(zài)短时间内戳中兴奋点。
Phenaki更加令人(rén)震(zhèn)惊(jīng)的地方在(zài)于,它可以(yǐ)制作出超过2分钟的(de)连贯(guàn)的也(yě)有(yǒu)确切内容的视频,这才(cái)是真(zhēn)正让人(rén)们感(gǎn)到惊喜的地方。因(yīn)为无(wú)论AI生成的视频多么高清,也只(zhǐ)能是(shì)为(wèi)内容生(shēng)产者(zhě)提供一个灵(líng)感(gǎn),一(yī)个素材,一个(gè)过(guò)场动画(huà)。
不(bù)过能够制作(zuò)出有具体(tǐ)剧情(qíng)内容的视频就意味着,一些(xiē)视频创作由(yóu)AI代替人工(gōng)完成已经初步有了可能。
当(dāng)下AI的发展速度已经超过大部分人的(de)想象。内容(róng)产(chǎn)业的本质是供给创造需求(qiú),AIGC作为(wèi)全新的内(nèi)容(róng)生产方式,可以(yǐ)为内(nèi)容产(chǎn)业带来更新的内(nèi)容风格、更快的生产速(sù)度,更低的生产(chǎn)成本,这无疑会(huì)驱动内容(róng)产业的大爆(bào)发。
除(chú)了AI绘图、视频(pín),AIGC技术还能应(yīng)用于音(yīn)乐、代码(mǎ)、机器(qì)人动作等多种内容(róng)形式的生成。不难(nán)发(fā)现该项技术(shù)不仅在游戏等(děng)行业能得到(dào)有效(xiào)应(yīng)用,对于(yú)下一代互联网各种元(yuán)素的(de)构建亦有(yǒu)关键(jiàn)意义。
从商业化的(de)角度(dù)来看(kàn),文(wén)化娱乐、教育、传媒等诸多领域(yù),本(běn)身就(jiù)对基(jī)于AI的可视化内(nèi)容有强烈需求(qiú)。
因此,AI绘画及(jí)视频或不(bù)是结果,而只(zhǐ)是(shì)AI进程(chéng)中(zhōng)的一块(kuài)重要拼图,有望在技术更新的加持(chí)下实现(xiàn)更(gèng)大的应用价值。
AI从理解(jiě)内容,走(zǒu)向了(le)可以(yǐ)生(shēng)成内容,甚至能够(gòu)创造出独立价值和独立视角的内容。AIGC的(de)再次出圈,更代表(biǎo)着未来的先进(jìn)生产力(lì)即将(jiāng)到(dào)来。
04
紧抓大模型与算力(lì),牢固AIGC底座(zuò)
从技(jì)术的发展也可以看(kàn)出(chū),在语言大模型(xíng)、图像大模型之后(hòu),多模态大模型已经成为(wèi)了新(xīn)的(de)趋势。
大模型(xíng)被誉(yù)为(wèi)当前人(rén)工智能发(fā)展的(de)智(zhì)能底(dǐ)座,是全球(qiú)竞(jìng)争(zhēng)最激烈的研究方向(xiàng)之一(yī),包括谷歌、亚马逊、百度(dù)、阿(ā)里、腾讯(xùn)等(děng)众多(duō)头部企业都在竞相发(fā)力。
不(bù)过(guò)训练(liàn)大模型的确价格不菲,以国盛证券发布的《ChatGPT需要多(duō)少算(suàn)力》报告(gào)估算,GPT-3训练一次(cì)的(de)成本约为(wèi)140万美(měi)元。而(ér)对(duì)于一(yī)些更大的LLM(大型语言模型),训练成(chéng)本则介于200万美(měi)元至1200万美元高价之间。
以ChatGPT在2023年(nián)1月的(de)独立访客平均数1300万计(jì)算,其对应芯(xīn)片需求为(wèi)3万多片(piàn)英伟达(dá)A100 GPU,初(chū)始投入成(chéng)本约为8亿美元,每日仅(jǐn)电(diàn)费就在5万美元(yuán)左右。
此外(wài)不(bù)论是ChatGPT还是(shì)AIGC,都离不开庞大算力支持。在关(guān)注各类大模型的发(fā)展同时,更应该关注算(suàn)力网络的建设。
算力网(wǎng)络正驱动AI产业发展进入史诗级加速(sù)进程,让AIGC及通用AI这一人工智能发展的终极目标离得更近(jìn)。
因为算力可以对(duì)突破性技术创新提供大力的支(zhī)持(chí)。这方面(miàn),多(duō)模态大模型是典(diǎn)型。作为(wèi)面(miàn)向未(wèi)来强(qiáng)人工(gōng)智能、通用人工智能的(de)重要(yào)技术创(chuàng)新,多模(mó)态大模(mó)型(xíng)已(yǐ)经在人工智(zhì)能领域提出了很(hěn)多年,业界也有不少技术突破,但是,多(duō)模态大模型进一步往(wǎng)下走,算力需(xū)求呈几何式上升,一般(bān)的算力(lì)基础(chǔ)设施很快将难以胜孕妇一天吃几个山竹,孕妇一天吃几个山竹比较好(shèng)任(rèn)。
从图(tú)像、文字、语音单独一项的(de)训练,到双模态(tài)、三模态的跃迁(qiān),让(ràng)人工智能可(kě)以(yǐ)灵活应(yīng)对不同模(mó)态的转(zhuǎn)化、像(xiàng)人与世界交互一样(yàng)自然(rán),这方面(miàn),由算力(lì)网(wǎng)络(luò)来驱动将有明(míng)显优势(shì)。
此(cǐ)外,还有很多(duō)需要爆发(fā)式增长的算力来支撑的技(jì)术创新(xīn),将在(zài)人工智能(néng)算(suàn)力网络支撑下快速推进。
AIGC已(yǐ)经露出曙光,期待在大(dà)模(mó)型和大算力的支持下AIGC能持续颠(diān)覆内容生产(chǎn)的方(fāng)式(shì),将创造的边际成(chéng)本降低(dī),让万众受益。
未经允许不得转载:橘子百科-橘子都知道 孕妇一天吃几个山竹,孕妇一天吃几个山竹比较好
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了