正、异、新，正异新的区分-橘子百科-橘子都知道

正、异、新，正异新的区分 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天(tiān)机器(qì)人ChatGPT火爆以来，微软公司创始人比尔·盖茨已多次公开谈论人(rén)工智能话题。在最近的一次(cì)采访中，他再次表示：“AI可(kě)能会让科技行业迎来一次剧烈的洗牌”。

这个(gè)结论是他在(zài)当地时间2月20日接受《In Good Company》节目(mù)专访时(shí)提(tí)出的。

他预期，AI的(de)发展可能会(huì)威胁到谷歌(gē)的市占率，因为(wèi)微软在AI方(fāng)面的行(xíng)动相当迅速。而最终科技(jì)巨头将(jiāng)把AI整合成用户的“全能助手”，包揽一切应用，与人(rén)们进行沟通并提供建议，可以取代亚马逊、Siri或Outlook等应(yīng)用。

大佬口中全能助手的到(dào)来可能尚需时日，但由ControlNet引(yǐn)发的(de)又一次AI绘(huì)画浪(làng)潮(cháo)，让AIGC在ChatGPT的话题热点包围中杀出(chū)重(zhòng)围。

ChatGPT之后(hòu)又一应(yīng)用杀疯了，AIGC或进入可控期，将洗牌科技(jì)行业(yè)？_黑料正能量

ControlNet颠(diān)覆AI绘画新玩法

AIGC向可(kě)控靠近

以AI绘画为代表的AIGC上(shàng)一次爆火的时候，还是2022年8月，在美国科罗拉多州(zhōu)举办(bàn)的新兴数字艺术家竞(jìng)赛中(zhōng)，一幅名为《太空歌(gē)剧院》的作(zuò)品获奖。

随(suí)后各大(dà)厂(chǎng)商的(de)AI绘画(huà)软件(jiàn)被(bèi)广大网友熟知(zhī)并体(tǐ)验，Stable Diffusion便是其中代(dài)表。

用户们可以在应用中(zhōng)输入一组(zǔ)关键词或者一张照片(piàn)，就能获得一(yī)幅AI创(chuàng)作的(de)画作。

作画的关键(jiàn)就是所(suǒ)输入(rù)的(de)文(wén)本。同一(yī)组关键词也可以创(chuàng)作出很多张风格不一样的画作，这(zhè)让创作的过程就像开(kāi)盲盒。

很多用户很喜(xǐ)欢这种不确(què)定的惊(jīng)喜，他(tā)们会将(jiāng)生(shēng)成(chéng)的美图当做头(tóu)像。而另一(yī)部分喜欢翻看(kàn)AI绘画(huà)的“翻车(chē)”作品(pǐn)。在社(shè)交媒体(tǐ)上，许多用户(hù)分享AI“翻车(chē)现场”，例如(rú)，一位(wèi)网友的小(xiǎo)狗照片被AI画成了“肌肉男”，还有网友的个人照片被AI识别成了建筑。

而如今随着ControlNet的出现与加持，以往AI绘画的(de)填写关键词游戏可能(néng)要(yào)被颠覆(fù)了。

ControlNet是一位(wèi)正在斯坦福读博(bó)的中国人张吕敏创作的(de)一种基于(yú)控制(zhì)点的图像变形算法，主要用于数字图像处理、计算(suàn)机视(shì)觉和计算机图形学等领域。

其SD插(chā)件一(yī)经(jīng)发布，在短短的两天内便成为了(le)AI绘(huì)画领域最新的(de)热点(diǎn)。

在此之前(qián)，大(dà)家(jiā)用了(le)很多方法想(xiǎng)让AI生成的结(jié)果尽可能的符合要求，但是(shì)都不(bù)尽如人意，它的出现(xiàn)代表(biǎo)着AI生成开始(shǐ)进入真正的可控(kòng)时正、异、新，正异新的区分期。

因(yīn)为ControlNet可以直接提取画面的构图(tú)，人物的姿(zī)势和画面的(de)深度信息等。有了它的帮(bāng)助，就(jiù)不用频繁(fán)的用提示词来碰运气，抽盲(máng)盒式的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘(huì)画加了“魔法”，不少博主(zhǔ)的作品已经获得了大量的浏览量，“viggo”就是其中之一(yī)，他用朋友的照(zhào)片直(zhí)接带(dài)她们走进动漫(màn)世(shì)界。

viggo先(xiān)用StableDiffusion图片转(zhuǎn)文字。

再用Text2Prompt插件拓展(zhǎn)找到对应的(de)关(guān)键词；最后用ControlNet插(chā)件绑定(dìng)骨骼(gé)开(kāi)始换关(guān)键词试效果。

通过图片(piàn)就可以看出来，效果十分(fēn)惊艳(yàn)。

更厉害的是，除了真(zhēn)实的(de)照片，草(cǎo)图也(yě)可以加上“魔法”，知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还能实(shí)现线稿转全彩图。大(dà)神张吕敏其(qí)本(běn)尊也(yě)亲自回应。

不得不说当(dāng)下AIGC已经变得越来越强大，甚至输出的作品都已经(jīng)能以假(jiǎ)乱真了(le)。

难辨虚实，AIGC技术力爆发

警惕安全问题

近日，“苏州金(jīn)鸡湖有游(yóu)艇party”的消息火遍网络，而经过警方辟谣这(zhè)所(suǒ)谓的“party”可能是全国第一起AI绘图诈骗(piàn)。

由于这(zhè)个活动里(lǐ)面给出的美(měi)女照片都(dōu)是AI制(zhì)作的(de)真人照片绘图，因为太逼(bī)真，被大家当成真(zhēn)事传(chuán)播了。

不过(guò)仔细观察可以发现(xiàn)，活动(dòng)发起者提供(gōng)的照片中有(yǒu)个(gè)很大(dà)的漏洞可(kě)以(yǐ)发现并非真人，而(ér)是AI绘图，那(nà)便是图片中女(nǚ)性(xìng)的手(shǒu)指(zhǐ)部分(fēn)有的存在异常。

ChatGPT之后又(yòu)一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？_黑料(liào)正能量(liàng)

有行业人事表(biǎo)示：“现在因为手指部分的绘画算法比(bǐ)较复杂，AI还(hái)不(bù)太会画人(rén)的手，但最(zuì)新(xīn)看(kàn)到的图片已经有越来越完(wán)美的AI模型出现(xiàn)，以后可(kě)能就(jiù)完全没(méi)有漏洞(dòng)了。”

类(lèi)似的AI作(zuò)图(tú)诈骗在国外也已有发生。据英国(guó)广播公(gōng)司报道，土耳其地震期间，有Tiktok用户使用AI合成(chéng)了儿童受灾(zāi)的假照片发布到(dào)网络，以此诱骗(piàn)善良的人打赏“捐助”从而实施诈骗。

目前(qián)随(suí)着技术(shù)发展，AIGC已经能做出真人(rén)照片般的绘(huì)图效果，如(rú)果这(zhè)样的图片被用来(lái)诈骗，将非常可怕(pà)。

此外AIGC还引(yǐn)发(fā)了很多担忧，一(yī)方面，批判者认为AI在(zài)“学习”了大量前人(rén)的作品之后，其(qí)创(chuàng)作没(méi)有(yǒu)任何情(qíng)绪和灵魂，难以和人类(lèi)的艺术创作相提并论(lùn)。

另一方面，AIGC背后(hòu)的版权(quán)、目(mù)前都(dōu)并没有得到有效的解决，还有AIGC会不会代替(tì)人类“至高无上”的创意。

马斯克也强调，人工智能的安全(quán)问题需要得到重视，太(tài)晚就(jiù)来不(bù)及了。

AIGC下一(yī)站除了视(shì)频，还(hái)有远(yuǎn)方

技术(shù)都是有两面性的，潜(qián)在的(de)危害(hài)并不能掩(yǎn)盖(gài)其光辉的贡献(xiàn)。现(xiàn)在看来(lái)，人工智(zhì)能技术(shù)将是第四次(cì)工业革命(mìng)的(de)核心(xīn)驱动力量，将创造新的增长(zhǎng)奇迹。

过去一年，人(rén)工(gōng)智能在技(jì)术和商业层面都有了巨大进(jìn)展，AI绘画就是人工智能技术发生方向性改变的(de)一(yī)个代表。其(qí)下一站或许就(jiù)是视频(pín)。

此前，Meta和谷歌先(xiān)后发布了几(jǐ)条引爆科技圈的(de)短(duǎn)视频。这些视频(pín)引发关注并非内容做得(dé)多优秀，反而都非(fēi)常简单(dān)，比如一匹正在喝水(shuǐ)的马(mǎ)，一只画画(huà)的(de)玩具熊，或者一(yī)段(duàn)骑摩托车的第一视角(jiǎo)录像(xiàng)，随便一个有手(shǒu)机的人都可以随手录下一段(duàn)。

但这些短视频的(de)创作方式(shì)非常(cháng)简单，创(chuàng)作者仅(jǐn)仅需要向AI输入一段话，甚至只是(shì)说一下要求，AI就可以根据(jù)需要生成一段视频。

谷歌(gē)发布(bù)的两个AI生成视频分(fēn)别来自于Imagen Video和(hé)Phenaki，前者主要突(tū)出的是高清，与Meta的(de)Make-A-Video没有太多的差(chà)别。

在Make-A-Video公布了AI生成的视(shì)频(pín)后，AI圈(quān)就(jiù)已经玩了一波梗，一个能够做出更高清视频的(de)AI还不足以在短(duǎn)时间内戳中兴奋点。

Phenaki更(gèng)加令人震(zhèn)惊(jīng)的(de)地方(fāng)在于(yú)，它可以制作出超(chāo)过2分钟的(de)连贯的也有(yǒu)确切内容的(de)视频，这才是真正让人们感到惊喜的地(dì)方(fāng)。因(yīn)为无(wú)论AI生成的视(shì)频(pín)多么(me)高清，也只能是为内(nèi)容(róng)生(shēng)产者(zhě)提供一个灵(líng)感(gǎn)，一个素材(cái)，一个过(guò)场动画(huà)。

不过能(néng)够制作出有具体剧情内容的视频就意味着(zhe)，一些视频创作由(yóu)AI代(dài)替人工完成(chéng)已经(jīng)初步有了可能。

当下AI的发展速度已经超过大部(bù)分(fēn)人(rén)的(de)想象(xiàng)。内容产业的本(běn)质是供给创造需(xū)求(qiú)，AIGC作为全新(xīn)的(de)内容生产方式，可以为内容产业带来更新的内容风格、更(gèng)快的生产速度，更低的生产成本，这无疑会(huì)驱动内(nèi)容产业的(de)大爆发(fā)。

除了AI绘图、视频(pín)，AIGC技(jì)术还能应用(yòng)于音乐、代码、机器人(rén)动(dòng)作等多种内容形式的生成。不难发现该项技术不仅在游戏等行业能得到有效应用(yòng)，对于下一代互(hù)联网(wǎng)各种(zhǒng)元素(sù)的构建(jiàn)亦有关(guān)键意义(yì)。

从(cóng)商(shāng)业(yè)化的角度来看，文化娱乐、教(jiào)育(yù)、传(chuán)媒(méi)等(děng)诸多领域(yù)，本身就对基于AI的可(kě)视化内容有强烈需求。

因此，AI绘画及视频或不是(shì)结果(guǒ)，而只是AI进程(chéng)中的一块重要拼图，有望(wàng)在技术(shù)更新的(de)加持下实现更大的应用价值。

AI从理解内容，走(zǒu)向了可(kě)以(yǐ)生成内容(róng)，甚至能够创造出独立价值和独立视角(jiǎo)的内容。AIGC的再(zài)次出圈，更代表着未(wèi)来的先进生产力即将到来。

紧抓大(dà)模型与算力(lì)，牢固AIGC底(dǐ)座(zuò)

从技术的发展(zhǎn)也可以看出，在语言大模型(xíng)、图像大(dà)模(mó)型之后，多模态大模型(xíng)已经(jīng)成(chéng)为了新的趋势。

大模型被(bèi)誉为当前人工智能发展的智能底座，是(shì)全球竞争最激烈的研究方(fāng)向之一，包括谷歌、亚马逊(xùn)、百度、阿里、腾(téng)讯等(děng)众多头部企业都在竞相发力(lì)。

不过训练大模(mó)型的(de)确价(jià)格不菲(fēi)，以(yǐ)国盛证券发布(bù)的《ChatGPT需要多(duō)少算力》报告估算(suàn)，GPT-3训练(liàn)一次的成本约为140万美元。而对于一(yī)些更大的LLM(大型语言模型)，训练成本则介于200万美元至(zhì)1200万美元高价之间。

以ChatGPT在2023年1月的(de)独立(lì)访客平(píng)均数1300万计算，其对应(yīng)芯片需求为3万多片英伟达A100 GPU，初始投(tóu)入(rù)成本约为8亿美元，每日仅电费就在5万美元左右。

此外不论是ChatGPT还是AIGC，都离(lí)不(bù)开庞大算力支持。在(zài)关(guān)注各类(lèi)大模(mó)型的发(fā)展同时，更应该关注(zhù)算力网(wǎng)络的(de)建设。

算力网络正驱动AI产业(yè)发展进入史诗(shī)级加速进程(chéng)，让AIGC及通用AI这(zhè)一人工(gōng)智能发展的(de)终极目标离(lí)得更近。

因为算力可以对突破性技(jì)术创新提供大力的支正、异、新，正异新的区分(zhī)持。这(zhè)方(fāng)面(miàn)，多模态大模(mó)型是典型。作为(wèi)面向未来强(qiáng)人工智(zhì)能、通用人工智能的重要技术创新，多模态大模(mó)型已经在人(rén)工智能领域提出了很多(duō)年，业(yè)界也有不少技术突破，但是，多(duō)模态大(dà)模型(xíng)进一步往下走，算力(lì)需求呈(chéng)几何式上升，一(yī)般的算(suàn)力基(jī)础设(shè)施(shī)很快将难以胜(shèng)任(rèn)。

从图(tú)像、文字、语音单独一项的训练，到双模态、三模态的跃迁(qiān)，让(ràng)人工智(zhì)能可(kě)以灵(líng)活应对不同模态的转化(huà)、像(xiàng)人与世界(jiè)交互(hù)一样自然，这方面(miàn)，由算力(lì)网络来(lái)驱动将有明显优势。