蟑螂在床上爬了还能睡吗，蟑螂在床上爬了还能睡吗-橘子百科-橘子都知道

蟑螂在床上爬了还能睡吗，蟑螂在床上爬了还能睡吗 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器(qì)人ChatGPT火爆以来，微软公(gōng)司创(chuàng)始人比尔·盖茨已多次公开谈论人工智能(néng)话题。在最近的一次采访(fǎng)中，他(tā)再次(cì)表示：“AI可能(néng)会(huì)让科技行业迎来一次(cì)剧烈的洗牌”。

这个(gè)结论(lùn)是他在(zài)当地时间2月(yuè)20日(rì)接受《In Good Company》节目专访时提出的。

他预(yù)期，AI的发展(zhǎn)可能会威胁到谷歌的市占(zhàn)率，因为(wèi)微软在(zài)AI方面的行动相当(dāng)迅速。而(ér)最终科技巨(jù)头将(jiāng)把AI整合成用户的(de)“全能助手”，包揽一切应用，与人们进行沟通并(bìng)提供建议，可以取代亚马逊、Siri或Outlook等应用。

大佬(lǎo)口中全(quán)能助手(shǒu)的到来可能(néng)尚(shàng)需(xū)时日，但由(yóu)ControlNet引发的又一(yī)次(cì)AI绘画(huà)浪潮，让AIGC在ChatGPT的(de)话题热(rè)点包围中杀出重(zhòng)围。

ChatGPT之后(hòu)又一应(yīng)用杀疯(fēng)了，AIGC或进入(rù)可(kě)控期，将(jiāng)洗牌科技行(xíng)业？_黑料正能量

ControlNet颠覆AI绘画新玩法

AIGC向可控(kòng)靠近

以AI绘画为(wèi)代表(biǎo)的(de)AIGC上(shàng)一次爆火的(de)时候，还是(shì)2022年8月，在(zài)美(měi)国科罗(luó)拉多州(zhōu)举(jǔ)办(bàn)的新兴数字艺(yì)术家竞赛(sài)中(zhōng)，一幅名为《太空歌剧院(yuàn)》的作品(pǐn)获奖(jiǎng)。

随后各大厂商的AI绘画软件被广大网友熟(shú)知(zhī)并体(tǐ)验，Stable Diffusion便是其中代(dài)表。

用户(hù)们可以在应用(yòng)中输(shū)入一组关(guān)键词或者一(yī)张照片，就能获(huò)得(dé)一幅AI创作的画作。

作画的关键就是所输入(rù)的文本。同一(yī)组关键词也可以创作出很多(duō)张风格不(bù)一(yī)样(yàng)的(de)画作，这(zhè)让创作的过(guò)程就(jiù)像开盲盒(hé)。

很多用户很喜欢这(zhè)种不确定的惊喜，他们会将生成的美(měi)图(tú)当(dāng)做头(tóu)像。而另一部(bù)分喜欢翻看AI绘画的“翻车”作品。在社交媒体上，许多用(yòng)户分享AI“翻(fān)车(chē)现(xiàn)场”，例如，一位网友的小狗(gǒu)照片被AI画成(chéng)了“肌肉男”，还有网友的个人照片(piàn)被(bèi)AI识别成了建筑。

而如(rú)今(jīn)随着ControlNet的出现与加持，以往AI绘(huì)画的填写关键词游(yóu)戏可能(néng)要(yào)被(bèi)颠(diān)覆了。

ControlNet是一位正(zhèng)在斯坦福(fú)读博的中国人张吕敏创(chuàng)作的一种(zhǒng)基于控制(zhì)点的图(tú)像变(biàn)形算法，主要用于数字(zì)图像处理、计算(suàn)机视觉和计算机图形学等(děng)领域。

其SD插(chā)件一经发(fā)布(bù)，在短短的两天内便成为了AI绘(huì)画领域最新(xīn)的热点。

在此之(zhī)前，大(dà)家用(yòng)了很(hěn)多方法(fǎ)想让AI生成的(de)结果尽可(kě)能的符合要求，但是都不尽如(rú)人意，它的出(chū)现代表着AI生成开(kāi)始进入真(zhēn)正的可控时期。

因为ControlNet可以直接提取画面(miàn)的(de)构图，人(rén)物的姿势和画面(miàn)的深度信息(xī)等(děng)。有了它的帮助(zhù)，就(jiù)不用频繁的(de)用提(tí)示词来碰运气，抽盲盒式(shì)的创(chuàng)作了。

通俗的说ControlNet相当于给AI绘画加了“魔法”，不少博主的作品(pǐn)已经获得了大量的(de)浏(liú)览(lǎn)量，“viggo”就是(shì)其中(zhōng)之(zhī)一，他用朋友的照片直接带(dài)她们走进(jìn)动漫世界。

viggo先用StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到对应(yīng)的关(guān)键词；最后用ControlNet插件绑(bǎng)定(dìng)骨骼开始换(huàn)关键(jiàn)词试效果。

通过图片就可以看出来，效果十分惊艳。

更厉害的(de)是，除了真实的照片，草图也(yě)可以加上“魔法(fǎ)”，知乎大牛“DevPoint”和“逗砂”介绍到ControlNet还(hái)能实现线稿转(zhuǎn)全彩图。大神(shén)张吕敏其(qí)本尊也(yě)亲自回应。

不得不(bù)说当(dāng)下AIGC已经变得越来越强大(dà)，甚至输(shū)出的(de)作品都已经(jīng)能以假乱真了(le)。

难辨虚实，AIGC技术力(lì)爆发

警惕(tì)安全(quán)问题

近日，“苏州金鸡湖(hú)有游艇(tǐng)party”的(de)消息火遍网络(luò)，而经过警方辟(pì)谣(yáo)这所(suǒ)谓的“party”可能是全国第一(yī)起AI绘图诈(zhà)骗。

由于(yú)这个活动里面给出的美女照片(piàn)都是AI制作的真人照片绘图，因为太逼真，被大家当成真事传播了。

不过仔(zǎi)细观察可(kě)以(yǐ)发现，活动发起者提(tí)供的照(zhào)片(piàn)中有个很大(dà)的漏洞可以发现并非真人，而是(shì)AI绘(huì)图，那便是图片(piàn)中女性的手指部分有(yǒu)的存在异(yì)常。

ChatGPT之后又(yòu)一应用杀疯了，AIGC或进入可控(kòng)期，将洗牌科(kē)技(jì)行(xíng)业(yè)？_黑料正(zhèng)能量

有行业人事表示(shì)：“现(xiàn)在因(yīn)为手指部分的绘(huì)画算法比较复杂，AI还不太会画人(rén)的手，但最新看(kàn)到的图(tú)片已经有越来(lái)越完美(měi)的AI模型出现，以后可能(néng)就(jiù)完全没(méi)有漏洞了。”

类似(shì)的AI作(zuò)图诈(zhà)骗在国外(wài)也已有发生。据英国广播公司报道，土耳其地震期(qī)间，有Tiktok用户使用AI合(hé)成(chéng)了儿童(tóng)受(shòu)灾(zāi)的假照片(piàn)发布到网络(luò)，以此诱骗善良的人打(dǎ)赏“捐助(zhù)”从而实施诈骗(piàn)。

目(mù)前(qián)随着技术发(fā)展，AIGC已经(jīng)能做出真(zhēn)人(rén)照片般的绘图效果，如果(guǒ)这样的图片(piàn)被用来诈(zhà)骗(piàn)，将(jiāng)非常可怕。

此外AIGC还引发了很(hěn)多担忧，一方(fāng)面(miàn)，批判(pàn)者认为AI在(zài)“学习”了大量前人的作品之后(hòu)，其创作没有任何情绪和灵魂，难以(yǐ)和人类的艺(yì)术(shù)创作相提并论。

另一(yī)方面(miàn)，AIGC背后(hòu)的版权、目前都并没有(yǒu)得(dé)到有效(xiào)的解(jiě)决，还有AIGC会不会(huì)代替人类“至高(gāo)无上”的(de)创(chuàng)意。

马(mǎ)斯克也强调，人(rén)工(gōng)智能的安全问(wèn)题需要得到重视(shì)，太(tài)晚就(jiù)来不及了。

AIGC下一站(zhàn)除(chú)了视频，还有远方(fāng)

技(jì)术(shù)都是(shì)有两面性的，潜在(zài)的危害并不能(néng)掩盖其光辉(huī)的贡献。现在看来，人工(gōng)智能技(jì)术将是第四次工(gōng)业革(gé)命的核心驱(qū)动力量，将(jiāng)创造新的增长(zhǎng)奇(qí)迹。

过去一(yī)年，人(rén)工(gōng)智能在技(jì)术和(hé)商(shāng)业层(céng)面(miàn)都有了巨大进(jìn)展(zhǎn)，AI绘画就是人(rén)工智能技术发生方向性改变(biàn)的一(yī)个代表。其(qí)下一站或(huò)许就是视频。

此(cǐ)前，Meta和(hé)谷歌(gē)先后发布了(le)几条引爆科技(jì)圈的短视频。这(zhè)些(xiē)视频引(yǐn)发关注并非内容做得(dé)多优秀，反(fǎn)而都(dōu)非常(cháng)简单，比如一匹正在(zài)喝水的马，一只画画的玩具熊(xióng)，或者一(yī)段骑摩托车的第(dì)一视角录像(xiàng)，随便一个有手机(jī)的人(rén)都可以(yǐ)随手录下一段。

但这些(xiē)短(duǎn)视频的创(chuàng)作方式非常(cháng)简(jiǎn)单，创作者仅仅需要(yào)向(xiàng)AI输(shū)入一段话，甚至只是说一下要求，AI就可以根(gēn)据需(xū)要生成(chéng)一段视频(pín)。

谷(gǔ)歌(gē)发布的两个AI生成视(shì)频分(fēn)别来自(zì)于Imagen Video和Phenaki，前者主要(yào)突出的是(shì)高清，与(yǔ)Meta的Make-A-Video没有(yǒu)太多的差别。

在Make-A-Video公布了AI生成的视(shì)频后，AI圈就已经玩了一波梗(gěng)，一(yī)个能够做出(chū)更高清视(shì)频的AI还(hái)不足(zú)以(yǐ)在短时间内戳(chuō)中兴奋点。

Phenaki更加令(lìng)人震惊的地方在(zài)于，它可以(yǐ)制作出超过2分(fēn)钟的连贯的也有确切(qiè)内容的视(shì)频(pín)，这才是真(zhēn)正让人们感到惊喜的地方(fāng)。因为(wèi)无论AI生(shēng)成的视频多么高清，也只(zhǐ)能是(shì)为内容(róng)生产(chǎn)者提供(gōng)一(yī)个(gè)灵感，一个素材，一个过(guò)场动(dòng)画。

不过能够制(zhì)作出有具体剧情(qíng)内容的视频就意味着，一(yī)些视(shì)频创作由AI代替人(rén)工(gōng)完成(chéng)已经(jīng)初(chū)步有了可能。

当下AI的发展速度已经超过大部分人的想象(xiàng)。内容产业的本(běn)质是供给(gěi)创造需求，AIGC作为全新的内容生产方式(shì)，可以为内容产(chǎn)业带来更新的内容风格、更快的生(shēng)产(chǎn)速(sù)度，更低的生产成本，这无疑会驱(qū)动(dòng)内(nèi)容产业的大爆发。

除了(le)AI绘图(tú)、视(shì)频，AIGC技术还能应用于音乐、代码、机器人动作等多种内容形式的生成。不难(nán)发(fā)现该项技术不仅在游戏(xì)等行业(yè)能得到有效应用，对于下一代互联网各种元素的构(gòu)建亦有关键意义(yì)。

从(cóng)商业化的角度(dù)来(lái)看，文化娱(yú)乐、教育(yù)、传媒等诸(zhū)多领域，本身(shēn)就对基于(yú)AI的可视化内容有(yǒu)强烈需求。

因此，AI绘画及视频或不是结果(guǒ)，而只是AI进程中的一块(kuài)重要拼图，有望在技(jì)术更新(xīn)的加持(chí)下实现更大的(de)应用价值(zhí)。

AI从理解(jiě)内(nèi)容，走向了(le)可以(yǐ)生成内容，甚至(zhì)能(néng)够(gòu)创造(zào)出独立价值和独立视角的内容。AIGC的再次出圈，更代表(biǎo)着未(wèi)来(lái)的(de)先进生(shēng)产力即将到来。

紧抓大模(mó)型与算力，牢固AIGC底座(zuò)

从技术的发展也可以看出，在语(yǔ)言大模型、图像大模型之后，多模态大模型已经成为了(le)新的趋势。

大模(mó)型被(bèi)誉为当前人(rén)工(gōng)智能发展的(de)智(zhì)能底座，是全球竞(jìng)争最激(jī)烈的研究方(fāng)向(xiàng)之(zhī)一，包括(kuò)谷歌、亚马逊、百(bǎi)度、阿里、腾讯(xùn)等(děng)众多头部企业都在竞相发力。

不过训练大模型的确价格不(bù)菲，以(yǐ)国盛证券(quàn)发(fā)布(bù)的《ChatGPT需要多(duō)少(shǎo)算力》报(bào)告估算，GPT-3训练一次的成本约为140万美(měi)元。而(ér)对于一(yī)些(xiē)更大的LLM(大型语(yǔ)言模(mó)型)，训练成本则介于200万(wàn)美元至1200万(wàn)美元(yuán)高价之间。

以ChatGPT在2023年1月的独立(lì)访客(kè)平均数1300万计算(suàn)，其对应芯片需求(qiú)为3万多(duō)片英(yīng)伟达A100 GPU，初始投(tóu)入成本约为8亿美元，每日仅(jǐn)电费就在5万美元(yuán)左右。

此外不论是(shì)ChatGPT还是AIGC，都离不开庞大算力支持。在关注各类大模型的发展同(tóng)时，更(gèng)应该关注算力网(wǎng)络的建设。

算力网络正驱(qū)动AI产业发展进入(rù)史诗(shī)级加速进程，让AIGC及(jí)通用AI这(zhè)一(yī)人工智能发展的终极(jí)目标(biāo)离得更近。

因为算力可以(yǐ)对突破性技(j蟑螂在床上爬了还能睡吗，蟑螂在床上爬了还能睡吗ì)术创新提供大力的支(zhī)持。这方面，多模态大模(mó)型是典型。作为面向(xiàng)未(wèi)来(lái)强人工智能、通用人工智能的(de)重(zhòng)要技术创(chuàng)新(xīn)，多模态大模型(xíng)已经在人工智能(néng)领域(yù)提出了很多(duō)年，业界也有不少技术突破，但是(shì)，多模(mó)态大模(mó)型进一步往下走，算(suàn)力需求呈(chéng)几何式上(shàng)升，一般(bān)的算力基(jī)础(chǔ)设施(shī)很快将难以胜任。

从图像、文(wén)字、语音单独一项的训练，到双模(mó)态、三模态的跃迁，让人工智能可以灵(líng)活应对不同模态的转化、像人与世界交互一样(yàng)自然，这方(fāng)面(miàn)，由算力网(wǎng)络来驱(qū)动将(jiāng)有(yǒu)明(míng)显优(yōu)势。