正、异、新，正异新的区分-橘子百科-橘子都知道

正、异、新，正异新的区分 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人ChatGPT火爆(bào)以(yǐ)来(lái)，微软(ruǎn)公司创始(shǐ)人比尔·盖茨已多次(cì)公(gōng)开谈论人(rén)工(gōng)智能话题。在最近的一次采访中，他再次(cì)表示：“AI可能(néng)会让(ràng)科技行业迎来一次(cì)剧烈的洗(xǐ)牌”。

这个结论是(shì)他在当地时间2月20日(rì)接受(shòu)《In Good Company》节目专访时(shí)提出的。

他预期，AI的发展可能会(huì)威(wēi)胁到谷歌(gē)的市占(zhàn)率，因为微软(ruǎn)在AI方面(miàn)的行动相当(dāng)迅速。而(ér)最(zuì)终科技巨头将把AI整合成用户的“全能助(zhù)手(shǒu)”，包揽(lǎn)一切应用(yòng)，与(yǔ)人们(men)进行沟通并提供建议，可以取(qǔ)代亚(yà)马逊、Siri或Outlook等应用。

大(dà)佬口(kǒu)中全能助(zhù)手的(de)到(dào)来可(kě)能尚(shàng)需时日，但(dàn)由ControlNet引发的又(yòu)一次AI绘画浪潮，让AIGC在ChatGPT的话题热点包围中杀出重围。

ChatGPT之后又一(yī)应用杀(shā)疯了(le)，AIGC或进入可(kě)控期(qī)，将洗(xǐ)牌科技行业？_黑(hēi)料(liào)正能量

ControlNet颠覆AI绘画新玩法

AIGC向(xiàng)可(kě)控靠近(jìn)

以AI绘画为代(dài)表的AIGC上一次爆火(huǒ)的时候，还(hái)是2022年(nián)8月(yuè)，在美国科罗(luó)拉(lā)多州举办的新兴数字艺术家竞赛中，一幅名为《太空歌(gē)剧院》的作品获奖(jiǎng)。

随后各大厂商(shāng)的(de)AI绘画软(ruǎn)件(jiàn)被广(guǎng)大网(wǎng)友熟知并(bìng)体验，Stable Diffusion便(biàn)是(shì)其(qí)中代(dài)表。

用户们可以(yǐ)在应用中输入(rù)一组(zǔ)关(guān)键词或者一(yī)张(zhāng)照(zhào)片，就能获得一幅AI创(chuàng)作的(de)画作(zuò)。

作画的(de)关键就是所输入的文本(běn)。同一组关键词也可(kě)以创作(zuò)出很(hěn)多张风格不一(yī)样(yàng)的画作，这让创作(zuò)的(de)过程就像开盲盒。

很多用户(hù)很喜(xǐ)欢(huān)这种(zhǒng)不确(què)定(dìng)的(de)惊喜，他们(men)会将生(shēng)成(chéng)的美(měi)图当做头像。而(ér)另一(yī)部分(fēn)喜欢翻看(kàn)AI绘画的“翻车”作品。在社交(jiāo)媒体上，许多用户分享AI“翻车现场”，例如(rú)，一位网友的小狗照片(piàn)被AI画成(chéng)了(le)“肌(jī)肉男(nán)”，还(hái)有网友的个人照片被AI识别(bié)成了建筑。

而如今随着ControlNet的出现(xiàn)与加持，以(yǐ)往AI绘画的填写(xiě)关键词游戏可能要被(bèi)颠覆了。

ControlNet是一(yī)位(wèi)正在斯坦福读博的中国人张吕敏创作的(de)一(yī)种基于(yú)控(kòng)制点(diǎn)的图像变(biàn)形算法(fǎ)，主要用于数字图像处理(lǐ)、计(jì)算机视觉和计算机图(tú)形学等领域。

其SD插件一经发(fā)布，在短短的两天(tiān)内便成为(wèi)了(le)AI绘画领域最新的热点。

在此之前，大家(jiā)用了很多(duō)方法想(xiǎng)让AI生成的结果(guǒ)尽可能(néng)的符合要(yào)求，但是(shì)都不尽如(rú)人意，它的(de)出现(xiàn)代表着AI生成开始进(jìn)入真(zhēn)正的可(kě)控时期。

因为(wèi)ControlNet可以(yǐ)直接提取画(huà)面的构图，人(rén)物(wù)的姿(zī)势和画(huà)面的深度信息(xī)等。有了(le)它的帮助(zhù)，就不(bù)用(yòng)频繁的用(yòng)提示词来碰运气，抽(chōu)盲盒式的创作了。

通俗的说ControlNet相当(dāng)于给(gěi)AI绘画加了(le)“魔(mó)法(fǎ)”，不少博(bó)主的作品(pǐn)已经获(huò)得了(le)大量的(de)浏(liú)览量，“viggo”就是(shì)其中之一(yī)，他(tā)用朋友的照片(piàn)直接(jiē)带她们(men)走进(jìn)动(dòng)漫世界。

viggo先用StableDiffusion图片(piàn)转文字。

再用Text2Prompt插(chā)件拓展找到对应的关键词(cí)；最后(hòu)用ControlNet插(chā)件绑(bǎng)定(dìng)骨(gǔ)骼开始换关键词试(shì)效果。

通过(guò)图(tú)片(piàn)就(jiù)可以看出来(lái)，效果(guǒ)十(shí)分(fēn)惊艳。

更厉害的是，除了真(zhēn)实的照片(piàn)，草图(tú)也可以加上“魔法”，知乎(hū)大牛“DevPoint”和“逗砂”介绍(shào)到ControlNet还能实现线稿转全彩图。大神张吕敏(mǐn)其本尊也(yě)亲自回应。

不得不说(shuō)当下AIGC已经变(biàn)得越(yuè)来(lái)越(yuè)强大(dà)，甚至(zhì)输出的(de)作(zuò)品都已经能以假乱真了。

难辨虚实，AIGC技(jì)术力爆发

警(jǐng)惕安(ān)全问题

近日，“苏州(zhōu)金鸡湖有游艇party”的消息火遍网络(luò)，而(ér)经(jīng)过警方辟(pì)谣这所(suǒ)谓的“party”可(kě)能是全国第一起(qǐ)AI绘图诈骗。

由于这(zhè)个活动里面给出的美女照片都是AI制作(zuò)的(de)真(zhēn)人照片绘图(tú)，因为太逼真，被大家当成真事传播(bō)了。

不过仔(zǎi)细观(guān)察(chá)可以(yǐ)发现，活动(dòng)发起者(zhě)提供的照片中有个(gè)很大的漏(lòu)洞可以发现(xiàn)并(bìng)非真(zhēn)人(rén)，而是AI绘图，那便(biàn)是图片中女性的手指部分有的存在异(yì)常。

ChatGPT之后又(yòu)一应用杀(shā)疯了，AIGC或进入(rù)可(kě)控期，将洗(xǐ)牌科技行(xíng)业？_黑(hēi)料(liào)正能量

有(yǒu)行业人事(shì)表示：“现(xiàn)在(zài)因为手(shǒu)指(zhǐ)部(bù)分的绘(huì)画算法比(bǐ)较复杂，AI还不太会画人的手，但最新(xīn)看到的图片已经有越来(lái)越完美的AI模型(xíng)出(chū)现，以后(hòu)可能就完(wán)全没有漏(lòu)洞了。”

类似的AI作图诈(zhà)骗在国外也(yě)已(yǐ)有发生。据英国广播(bō)公司报道，土耳其地(dì)震期间，有(yǒu)Tiktok用户使(shǐ)用AI合成了儿童(tóng)受灾的假照(zhào)片(piàn)发(fā)布到网络(luò)，以此诱骗善良的人打(dǎ)赏(shǎng)“捐助”从(cóng)而实施诈骗。

目前随着技术发展，AIGC已经(jīng)能做出真人照片般的绘图效果，如果这样的图片被用来诈骗，将非常可怕。

此外AIGC还引(yǐn)发了(le)很多担忧，一(yī)方面，批判者认为AI在(zài)“学习”了大量前(qián)人(rén)的作品(pǐn)之(zhī)后(hòu)，其创作没(méi)有任(rèn)何情绪和灵魂，难以和人类的艺术(shù)创作相提并论。

另(lìng)一方面(miàn)，AIGC背后(hòu)的(de)版权、目前都并没有得到有效的解决，还(hái)有AIGC会不(bù)会代(dài)替人类“至高(gāo)无上”的创意。

马(mǎ)斯克也强(qiáng)调，人工智能的(de)安全问(wèn)题需(xū)要得(dé)到重(zhòng)视(shì)，太晚就来不及了。

AIGC下一站除了视频，还有远方

技术都是有两面性的，潜(qián)在(zài)的危害(hài)并不能掩(yǎn)盖其光辉的贡献。现(xiàn)在看来，人工(gōng)智能技(jì)术将(jiāng)是(shì)第四次(cì)工业革(gé)命的核(hé)心驱动力量，将(jiāng)创造(zào)新的增长奇迹。

过(guò)去一年，人(rén)工智能在技(jì)术和商业层面都有了巨大(dà)进展，AI绘画就是人工智能技(jì)术发生方向性改变(biàn)的一个代(dài)表。其下一(yī)站或(huò)许就是视频。

此前，Meta和(hé)谷歌(gē)先后发布了几条(tiáo)引爆科技(jì)圈的短视频。这些视频引(yǐn)发关注并(bìng)非内容做得多优秀，反而都非常简(jiǎn)单，比如一匹正在喝(hē)水的马，一(yī)只画画的玩(wán)具熊，或者一段(duàn)骑摩托车的第一视角(jiǎo)录像，随便一个有手机的人都可(kě)以随手录下一段。

但这(zhè)些短视频的创作方式非常简单(dān)，创作者仅仅需要向AI输(shū)入一段话，甚至只是(shì)说一(yī)下要(yào)求(qiú)，AI就可以(yǐ)根据(jù)需要生成一(yī)段视频。

谷歌发布的两个AI生(shēng)成视(shì)频(pín)分(fēn)别来(lái)自于Imagen Video和Phenaki，前者(zhě)主要突出的是(shì)高清，与Meta的Make-A-Video没有太多(duō)的差别(bié)。

在Make-A-Video公(gōng)布了(le)AI生成的视(shì)频后(hòu)，AI圈就已经玩了一波梗，一个(gè)能够做出更高清视频(pín)的(de)AI还不足以在短时间内(nèi)戳(chuō)中兴奋点。

Phenaki更加令人震惊的(de)地(dì)方在于，它(tā)可(kě)以制作(zuò)出超过2分钟的连贯的也(yě)有确切内容的视(shì)频，这(zhè)才是真(zhēn)正让人(rén)们感到(dào)惊喜(xǐ)的地方(fāng)。因为无(wú)论AI生成的视频(pín)多么高(gāo)清，也只能是为内容生产者提供一个灵感，一个素(sù)材(cái)，一个过场动(dòng)画。

不过能(néng)够(gòu)制作出有(yǒu)具体剧情(qíng)内容的(de)视频就意味(wèi)着，一些视频创作由AI代替人工完成(chéng)已(yǐ)经初步有了可(kě)能。

当下AI的发展速度已经超过大部分人(rén)的想(xiǎng)象。内容(róng)产业的本(běn)质是供给创造需求，AIGC作(zuò)为全新的内容生产方式，可以为内容产业(yè)带来更新的内(nèi)容(róng)风格、更快的(de)生产速度，更低的生产成(chéng)本，这无(wú)疑会(huì)驱动内容产业的大爆(bào)发。

除了AI绘图、视频，AIGC技术还能应用于音(yīn)乐、代码(mǎ)、机器人动作等多种(zhǒng)内容形式(shì)的生成(chéng)。不难(nán)发(fā)现该项(xiàng)技术不(bù)仅在游戏等(děng)行业能得到有效应用，对(duì)于下一代(dài)互联网各种元素的构建(jiàn)亦有关键(jiàn)意义。

从商业化(huà)的角度来看(kàn)，文化娱乐、教育(yù)、传媒等诸多(duō)领域(yù)，本身就(jiù)对基(jī)于(yú)AI的可视化内容有强(qiáng)烈需求。

因此，AI绘画(huà)及视频或不是结果(guǒ)，而只是AI进程中的(de)一块重要拼(pīn)图，有望在技术(shù)更新的(de)加持下实(shí)现更大的应用价(jià)值。

AI从理解内容(róng)，走向了可以生(shēng)成内容(róng)，甚至能够创造出独(dú)立价(jià)值和(hé)独(dú)立视角的内容。AIGC的再次(cì)出圈，更代表着未来(lái)的先进生产力即将(jiāng)到来(lái)。

紧(jǐn)抓大模型与算力，牢正、异、新，正异新的区分(láo)固AIGC底座

从技术(shù)的发展也可以看出，在语言大模型、图像(xiàng)大模型之后，多模态大模型(xíng)已经(jīng)成为(w正、异、新，正异新的区分èi)了新的趋势(shì)。

大(dà)模型被誉(yù)为当前(qián)人工智(zhì)能发(fā)展的智能底座，是全球(qiú)竞(jìng)争(zhēng)最(zuì)激(jī)烈(liè)的研究(jiū)方向之一，包括谷(gǔ)歌、亚(yà)马逊、百度、阿(ā)里、腾讯(xùn)等(děng)众(zhòng)多头部企业都在竞(jìng)相发力。

不过(guò)训练大模型的确价(jià)格不菲，以(yǐ)国盛证券发(fā)布的(de)《ChatGPT需要(yào)多少算力(lì)》报告估算，GPT-3训练一(yī)次的成本约(yuē)为(wèi)140万美元。而对于一(yī)些更(gèng)大的LLM(大型语(yǔ)言模型)，训练成本则介(jiè)于200万美(měi)元至1200万美元高价之间。

以ChatGPT在2023年1月的(de)独立访客平(píng)均(jūn)数1300万计算(suàn)，其对应芯(xīn)片需求为(wèi)3万(wàn)多片英伟达(dá)A100 GPU，初始投(tóu)入成本约为(wèi)8亿美元(yuán)，每日仅电费就在5万美元(yuán)左(zuǒ)右。

此外不论是ChatGPT还是AIGC，都离不开(kāi)庞大算力支持。在(zài)关注(zhù)各类(lèi)大模型(xíng)的发展同时，更应该关注(zhù)算(suàn)力(lì)网络(luò)的(de)建设。

算力(lì)网络正(zhèng)驱(qū)动AI产(chǎn)业发展进(jìn)入史(shǐ)诗(shī)级加速进程，让AIGC及通(tōng)用AI这一人工智能发展的终极(jí)目标离(lí)得更近。

因(yīn)为算力可以对(duì)突破(pò)性技(jì)术创新提(tí)供大力的支(zhī)持(chí)。这方面，多(duō)模态(tài)大模型是典型。作(zuò)为面(miàn)向(xiàng)未(wèi)来强人(rén)工智能、通(tōng)用(yòng)人(rén)工智能的重(zhòng)要(yào)技术(shù)创新，多模态大模型已经在人工智(zhì)能领域(yù)提(tí)出了很(hěn)多(duō)年，业界(jiè)也有(yǒu)不少技术突破，但(dàn)是(shì)，多(duō)模态大模(mó)型进一步往下走，算(suàn)力需求呈几何式上升，一般(bān)的算力基(jī)础设施很(hěn)快将(jiāng)难以胜任(rèn)。

从图(tú)像、文(wén)字、语音单独一(yī)项的训练，到(dào)双(shuāng)模(mó)态、三模(mó)态(tài)的跃迁，让人工智能可以灵活应对不同模(mó)态的(de)转化、像(xiàng)人与世界交互一样自然，这方(fāng)面，由算(suàn)力网络来驱动将有明显优势(shì)。