独肖有哪几个-橘子百科-橘子都知道

独肖有哪几个 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自(zì)聊天(tiān)机器人ChatGPT火爆以来，微软(ruǎn)公司(sī)创始人比尔·盖茨(cí)已(yǐ)多次公(gōng)开谈论人(rén)工智能话(huà)题。在最近的一次采访(fǎng)中(zhōng)，他再次表示(shì)：“AI可能会(huì)让(ràng)科(kē)技行业迎来一次(cì)剧烈的(de)洗牌”。

这个(gè)结论是他(tā)在当地(dì)时间2月20日(rì)接受《In Good Company》节目专访(fǎng)时提(tí)出的。

他预期，AI的发展可能会威胁(xié)到谷歌(gē)的市(shì)占率，因为微软在AI方面的行动相(xiāng)当迅速。而(ér)最终科(kē)技(jì)巨头将把(bǎ)AI整合成用户的“全能助手”，包揽一(yī)切应(yīng)用，与(yǔ)人们进行(xíng)沟通并提供建议，可以取代(dài)亚马逊、Siri或Outlook等应用。

大佬口中全能(néng)助手的到来可能尚需时日，但由ControlNet引发的又一次AI绘画浪潮，让AIGC在(zài)ChatGPT的话题热点包(bāo)围(wéi)中杀出(chū)重围。

ChatGPT之后又一应用杀(shā)疯了(le)，AIGC或进(jìn)入可(kě)控期(qī)，将洗(xǐ)牌科技行(xíng)业？_黑料正能量

ControlNet颠覆(fù)AI绘画新玩法

AIGC向可(kě)控靠近

以AI绘画为代(dài)表(biǎo)的AIGC上(shàng)一次爆(bào)火的(de)时候，还是2022年8月(yuè)，在美国科罗拉(lā)多州举办的(de)新(xīn)兴数字艺术家(jiā)竞(jìng)赛中，一幅名(míng)为《太空歌剧院》的作品获(huò)奖。

随后各大厂商的AI绘画软件被(bèi)广大网友熟知并(bìng)体验，Stable Diffusion便(biàn)是其(qí)中(zhōng)代表。

用户们可(kě)以在应用中输入(rù)一组关键词或者一张照片(piàn)，就能获(huò)得一幅AI创作的画作。

作(zuò)画的(de)关键(jiàn)就是所(suǒ)输入的文本(běn)。同一组(zǔ)关键词也可以创作出很多张风格不一样的画作(zuò)，这(zhè)让创作(zuò)的过(guò)程就像开盲盒。

很(hěn)多用户很喜(xǐ)欢这种(zhǒng)不确定(dìng)的惊喜，他(tā)们(men)会将生成的美图当做头像(xiàng)。而(ér)另(lìng)一(yī)部分喜(xǐ)欢翻看AI绘画(huà)的“翻车”作品。在(zài)社(shè)交媒体上(shàng)，许多(duō)用户分享AI“翻车现场”，例如，一位(wèi)网(wǎng)友的(de)小狗照片被AI画成了“肌肉男(nán)”，还(hái)有网友的个(gè)人(rén)照片被AI识别成(chéng)了建筑(zhù)。

而如今随着ControlNet的出现(xiàn)与加(jiā)持，以往(wǎng)AI绘画的填写关键词游戏可能(néng)要被颠覆了。

ControlNet是一位(wèi)正在斯坦福读博的中国人张(zhāng)吕敏创作的(de)一(yī)种基于控制点的图像变形算法(fǎ)，主要用于数字(zì)图像处理(lǐ)、计算机视觉和(hé)计算机图形学(xué)等领(lǐng)域。

其SD插件(jiàn)一经发布，在(zài)短(duǎn)短的(de)两(liǎng)天(tiān)内便成为了(le)AI绘画领(lǐng)域(yù)最(zuì)新的热点。

在此(cǐ)之前(qián)，大(dà)家用了很多方法想让(ràng)AI生成(chéng)的(de)结(jié)果(guǒ)尽可能的符合要求，但(dàn)是(shì)都不尽(jǐn)如(rú)人意，它的出现代表着(zhe)AI生成开始进入真正的可控时期。

因(yīn)为ControlNet可(kě)以直接(jiē)提取画面的构图，人物的姿势和画面的深度信息等。有了它(tā)的帮助，就不用频繁的用提示词独肖有哪几个(cí)来碰(pèng)运气，抽盲盒式的创作了。

通俗(sú)的说ControlNet相(xiāng)当于(yú)给AI绘(huì)画加了“魔(mó)法”，不少博(bó)主的作品已(yǐ)经获得了大量的浏览量，“viggo”就(jiù)是其(qí)中之(zhī)一，他用朋友的照片(piàn)直接(jiē)带她们走进(jìn)动(dòng)漫(màn)世(shì)界。

viggo先(xiān)用(yòng)StableDiffusion图片转文字。

再用Text2Prompt插件拓展找到(dào)对应的关键词(cí)；最后用ControlNet插件(jiàn)绑定骨(gǔ)骼开始换关(guān)键词(cí)试效(xiào)果(guǒ)。

通过图片就(jiù)可以看出来，效果十分惊艳。

更(gèng)厉害(hài)的是，除了真实(shí)的照片，草图也可以(yǐ)加上“魔法(fǎ)”，知乎大牛“DevPoint”和(hé)“逗砂”介绍到ControlNet还能实现线稿转(zhuǎn)全彩(cǎi)图。大神张吕敏其本尊(zūn)也(yě)亲自回应。

不得不说当下AIGC已经(jīng)变得越(yuè)来(lái)越(yuè)强大，甚至输出的作(zuò)品都(dōu)已经能以(yǐ)假乱真了。

难(nán)辨(biàn)虚实，AIGC技术力(lì)爆(bào)发

警惕安全(quán)问题

近日，“苏州金鸡(jī)湖有游艇party”的消(xiāo)息火遍网络(luò)，而经过警方辟(pì)谣这所谓(wèi)的(de)“party”可能是(shì)全(quán)国第(dì)一起AI绘图(tú)诈(zhà)骗。

由(yóu)于(yú)这个活动(dòng)里面给出的美女(nǚ)照片都是AI制作的(de)真人照(zhào)片绘图，因(yīn)为太逼真，被大家当成真事传播(bō)了。

不过仔细观察可以(yǐ)发现，活动(dòng)发(fā)起者提供(gōng)的照片中有个很大的漏洞(dòng)可以(yǐ)发现并(bìng)非真人，而是AI绘图，那(nà)便是图片中女性的(de)手指部分(fēn)有(yǒu)的存(cún)在异常。

ChatGPT之后(hòu)又一应用杀疯(fēng)了(le)，AIGC或进入可控期，将洗牌科技行(xíng)业？_黑料正能量

有行(xíng)业人(rén)事表示：“现(xiàn)在(zài)因为手(shǒu)指部分的绘(huì)画(huà)算法(fǎ)比(bǐ)较(jiào)复杂，AI还不太会(huì)画人的手，但最新看到的图片已经有越来越完美的AI模型出现，以后(hòu)可能就完全没有漏洞(dòng)了。”

类(lèi)似的AI作图诈骗在国外(wài)也已有发生(shēng)。据(jù)英国广播公(gōng)司(sī)报道(dào)，土耳其地震期间(jiān)，有Tiktok用户(hù)使用AI合成(chéng)了儿(ér)童(tóng)受灾的假照片发(fā)布到网(wǎng)络，以此(cǐ)诱骗善良的人打(dǎ)赏“捐助”从而(ér)实施诈骗。

目(mù)前随着技(jì)术发展，AIGC已(yǐ)经能做出真人照片般的绘图效果，如果这样的图片被用来诈骗(piàn)，将非(fēi)常(cháng)可怕。

此外AIGC还引发了很多担忧，一方面，批判者(zhě)认(rèn)为(wèi)AI在“学习”了大量前人的作品之(zhī)后，其创作没有任何情绪和灵魂(hún)，难以(yǐ)和人类的艺(yì)术创作(zuò)相提并论。

另(lìng)一方面，AIGC背后的版权、目前都并没有得到(dào)有(yǒu)效的解决，还有AIGC会不会(huì)代替人类“至高无上”的创意。

马斯克也强调，人工智能的安全问(wèn)题需要得(dé)到(dào)重视，太晚(wǎn)就来不(bù)及了(le)。

AIGC下一站除了视频，还有(yǒu)远(yuǎn)方

技术(shù)都是有两(liǎng)面性的(de)，潜在的危害(hài)并不能掩盖(gài)其(qí)光辉的贡献(xiàn)。现(xiàn)在(zài)看来，人工智能技术将是第(dì)四次工业革命的核心驱动力量(liàng)，将(jiāng)创造(zào)新的增长奇(qí)迹(jì)。

过去一年，人(rén)工智能在技术和商(shāng)业层面都有了(le)巨(jù)大进展，AI绘画就是人工智(zhì)能技(jì)术发生方向性改变的一(yī)个(gè)代表。其下一站或许就是视频。

此前，Meta和谷歌先后发布了(le)几条引(yǐn)爆科技圈的短视频。这些视(shì)频引发关注(zhù)并非内容做得多优秀，反而都非常简单，比如一(yī)匹正在喝水的马，一只画画的玩具熊，或者一(yī)段骑摩托车的第(dì)一视角录(lù)像，随便一(yī)个有手(shǒu)机的人都可以随(suí)手录下一段。

但这些短视频的创作(zuò)方(fāng)式非常简单，创作(zuò)者(zhě)仅(jǐn)仅需要向AI输(shū)入一段话，甚至只是(shì)说(shuō)一下要(yào)求，AI就(jiù)可以根据需(xū)要(yào)生成一段视(shì)频(pín)。

谷歌发(fā)布的两个(gè)AI生(shēng)成视频分别来自于Imagen Video和Phenaki，前者主要突出(chū)的(de)是高(gāo)清，与Meta的Make-A-Video没有(yǒu)太多的(de)差(chà)别。

在(zài)Make-A-Video公布了AI生成的(de)视(shì)频后(hòu)，AI圈就已经(jīng)玩了一波(bō)梗，一个能(néng)够(gòu)做出(chū)更高清视频的AI还(hái)不足以在短时(shí)间内(nèi)戳中(zhōng)兴奋点。

Phenaki更加令人震惊的(de)地方在于，它可以制作出超过2分钟的连(lián)贯的也(yě)有确(què)切(qiè)内容(róng)的视频，这才是(shì)真正让人(rén)们感到惊(jīng)喜的地(dì)方。因为无(wú)论AI生成(chéng)的视频多么高(gāo)清，也只能是为内容生产者(zhě)提(tí)供一(yī)个(gè)灵(líng)感，一个素材，一个(gè)过场动画。

不过能够制作出有具体剧(jù)情内容的视频就意(yì)味着，一些视(shì)频创作由AI代替人工完成(chéng)已经初步有了可能。

当下AI的发展速度已经(jīng)超(chāo)过大部(bù)分(fēn)人的想象(xiàng)。内容产业(yè)的本质是供给创造(zào)需求，AIGC作为全新的内(nèi)容(róng)生产方式(shì)，可以(yǐ)为内(nèi)容产业(yè)带来更新(xīn)的(de)内容风(fēng)格、更快的生(shēng)产速度，更低的生产成本，这无疑会(huì)驱动(dòng)内容产业的大爆(bào)发。

除了AI绘(huì)图、视频，AIGC技(jì)术还能(néng)应用于音乐、代码、机器人(rén)动作等多种(zhǒng)内容形式的生成。不难发现该项技术不(bù)仅在游戏(xì)等行业(yè)能得(dé)到有效应用，对于下一(yī)代(dài)互(hù)联网各种元素的构建亦(yì)有关(guān)键意义。

从商业(yè)化的角(jiǎo)度来(lái)看，文化(huà)娱乐(lè)、教育、传(chuán)媒(méi)等诸多领(lǐng)域，本身就对基于AI的(de)可(kě)视化内容有强烈需求。

因此，AI绘画及视频或不是结(jié)果(guǒ)，而只是AI进程中的(de)一块重(zhòng)要(yào)拼图，有望在技术更新(xīn)的加持下实现更大(dà)的应用价值。

AI从理解内容，走向了可(kě)以生成内容，甚至能够创造出独立(lì)价值和独立(lì)视角的内容。AIGC的再次出圈(quān)，更代表(biǎo)着未来的先进生产力即将到来。

紧抓大模型与算力，牢(láo)固AIGC底座

从技术的发展也可以看出，在语言(yán)大(dà)模型(xíng)、图像大(dà)模型之后，多模态大模型已经(jīng)成为了新(xīn)的(de)趋势。

大模型被誉为当前(qián)人(rén)工智能(néng)发展的智能底座，是全(quán)球竞争最激烈的研究方向之一(yī)，包括谷歌(gē)、亚马逊、百度、阿(ā)里、腾讯等众(zhòng)多头(tóu)部企业都在竞相发力。

不(bù)过(guò)训练大模型的确价格不菲，以国盛证券发(fā)布的《ChatGPT需要(yào)多少算力》报告估算，GPT-3训练(liàn)一(yī)次的(de)成本约为140万(wàn)美元。而对于一些更(gèng)大的LLM(大型语言模(mó)型)，训练成(chéng)本则介于200万美元至(zhì)1200万(wàn)美(měi)元高价(jià)之间。

以ChatGPT在(zài)2023年1月的独立访客平均数1300万计算，其对应芯片需求(qiú)为3万多片英伟达A100 GPU，初始投入成本约为8亿美(měi)元，每日仅电费(fèi)就(jiù)在5万美元左右(yòu)。

此(cǐ)外不论是ChatGPT还(hái)是AIGC，都离不开庞(páng)大算力支持(chí)。在(zài)关(guān)注各类大模型(xíng)的发展同(tóng)时，更(gèng)应该关注(zhù)算力网络的建设。

算力网络正驱动AI产业发展进入史诗级(jí)加速进程，让AIGC及通(tōng)用AI这一(yī)人工智能发展的终极目(mù)标离(lí)得更近。

因为算(suàn)力(lì)可(kě)以对突破性技术创新(xīn)提供大力(lì)的(de)支持。这(zhè)方面，多模态大模型是典型。作为面向(xiàng)未(wèi)来强人工智能、通用人工智能的重要技术创新，多模态(tài)大模(mó)型已经在(zài)人工(gōng)智能领域(yù)提出了很多年，业界也有不少技术突破，但是，多模态大(dà)模型进一步往(wǎng)下走，算力需求呈几何(hé)式上升(shēng)，一般的(de)算力(lì)基础设施很快将难以胜任。

从图像、文字、语音单独一项的(de)训练(liàn)，到双模态(tài)、三模(mó)态的跃迁，让人工智(zhì)能可以灵(líng)活(huó)应(yīng)对不(bù)同(tóng)模(mó)态的转化(huà)、像(xiàng)人与(yǔ)世界(jiè)交互一(yī)样(yàng)自(zì)然(rán)，这方面，由算力网(wǎng)络来(lái)驱(qū)动(dòng)将有(yǒu)明显优势。