自聊天(tiān)机器人ChatGPT火(huǒ)爆以来,微软公司(sī)创始人比(bǐ)尔·盖(gài)茨已多次(cì)公开谈(tán)论人工智(zhì)能(néng)话题。在(zài)最(zuì)近的一次采访中,他(tā)再次表示:“AI可能会让科(kē)技行(xíng)业(yè)迎来一次剧烈的洗牌”。
这个结论是(shì)他在(zài)当(dāng)地时间2月(yuè)20日接受《In Good Company》节目专访(fǎng)时提出的。
他预期,AI的发(fā)展(zhǎn)可(kě)能会威胁到谷(gǔ)歌的市(shì)占率(lǜ),因为微软在AI方面的行动相当迅速。而最终科技巨(jù)头将把AI整合(hé)成用(yòng)户(hù)的“全能助手”,包揽一切应(yīng)用,与(yǔ)人们进(jìn)行(xíng)沟通并(bìng)提供(gōng)建(jiàn)议,可以取代亚马逊、Siri或Outlook等应用。
大佬口中全(quán)能助手的到来可(kě)能(néng)尚需时日,但(dàn)由ControlNet引发的又一次AI绘画浪潮(cháo),让AIGC在(zài)ChatGPT的(de)话题热点包围中(zhōng)杀出重围。
01
ControlNet颠(diān)覆AI绘画(huà)新玩法
AIGC向可控靠近
以(yǐ)AI绘(huì)画为代表的(de)AIGC上一次(cì)爆火(huǒ)的时(shí)候,还(hái)是2022年8月,在美(měi)国科罗拉多(duō)州举办的(de)新兴数(shù)字艺术(shù)家竞(jìng)赛(sài)中,一幅名为《太(tài)空歌(gē)剧院(yuàn)》的作品获奖。
随后(hòu)各大厂商的AI绘画软件被广(guǎng)大网友熟知并(bìng)体验(yàn),Stable Diffusion便是其中代表(biǎo)。
用户们可以在应用中(zhōng)输入(rù)一组关键词或者一张照片,就能获得一幅AI创作的画作。
作画的(de)关键就是所输入(rù)的文本。同一组(zǔ)关(guān)键词(cí)也(yě)可以创作出很多张(zhāng)风格不一(yī)样(yàng)的画作,这让创作的过(guò)程就像开盲(máng)盒。
很多用(yòng)户很喜(xǐ)欢这种不(bù)确(què)定的惊(jīng)喜,他们会将(jiāng)生成的美(měi)图当做头像。而另一部分喜欢翻(fān)看AI绘画的“翻(fān)车”作品。在(zài)社交媒体上,许(xǔ)多用户(hù)分享AI“翻车现场”,例如,一位网友的小(xiǎo)狗照片被(bèi)AI画成了“肌肉男(nán)”,还有网(wǎng)友(yǒu)的个人照片被AI识(shí)别成了建(jiàn)筑。
而如今随着ControlNet的出现与加持,以往AI绘画的填写关(guān)键词游戏(xì)可能要被(bèi)颠(diān)覆了。
ControlNet是一位正在(zài)斯坦福(fú)读博的(de)中国人张(zhāng)吕敏创(chuàng)作的一种基于控制点的图像变形(xíng)算法(fǎ),主要用于数字(zì)图像处(chù)理、计算机(jī)视觉和(hé)计算机图形(xíng)学等领(lǐng)域。
其SD插(chā)件一经发布(bù),在(zài)短短的两天内便成为了(le)AI绘画领域最新的热点。
在此之前,大家用了很多(duō)方法想让AI生成的(de)结果(guǒ)尽可能的符合要求,但是都不尽如人意,它的出现(xiàn)代(dài)表着AI生成开始(shǐ)进入真正的(de)可控时期。
因为ControlNet可以直接提取画面(miàn)的构图,人物的姿势(shì)和画(huà)面的(de)深(shēn)度信息(xī)等。有(yǒu)了它的帮助,就不用频繁的用提示词来碰运气,抽盲盒式的(de)创(chuàng)作(zuò)了。
通俗的说ControlNet相当于给AI绘画加了“魔法”,不少博主的作品(pǐn)已经获得了大量的(de)浏览量,“viggo”就是其中(zhōng)之一(yī),他用(yòng)朋友的照片直接带她们走进动漫世界。
viggo先用StableDiffusion图片转(zhuǎn)文字。
再用Text2Prompt插件拓展(zhǎn)找到(dào)对(duì)应的关键词(cí);最后用ControlNet插件绑定骨骼开始换关键词试(shì)效果。
通过图片就可以看出来(lái),效果十分惊艳(yàn)。
更厉害(hài)的是,除了真(zhēn)实的(de)照片,草图也可(kě)以加上“魔(mó)法”,知(zhī)乎大(dà)牛“DevPoint”和(hé)“逗砂(shā)”介绍(shào)到(dào)ControlNet还能实(shí)现线稿转全彩图(tú)。大神张吕敏其(qí)本尊也亲自(zì)回(huí)应(yīng)。
不得(dé)不(bù)说当下AIGC已经变得(dé)越来越强大,甚(shèn)至输出的作品都(dōu)已经能以假乱真(zhēn)了。
02
难辨虚实,AIGC技术力爆(bào)发(fā)
警惕(tì)安全问题
近日,“苏州金(jīn)鸡湖有(yǒu)游艇(tǐng)party”的(de)消息(xī)火遍网络(luò),而经过警方(fāng)辟谣这(zhè)所谓的“party”可(kě)能(néng)是全(quán)国第一起AI绘图诈骗。
由(yóu)于这(zhè)个活动里面给出的美女(nǚ)照片都是AI制作的真人照片(piàn)绘图,因为太逼真(zhēn),被大家当成真事传播了。
不(bù)过仔细(xì)观察可(kě)以发现,活(huó)动(dòng)发(fā)起者提供的照(zhào)片中有个很大的漏(lòu)洞(dòng)可以发现并非真人,而(ér)是AI绘图(tú),那便是图片中(zhōng)女(nǚ)性(xìng)的手指(zhǐ)部(bù)分有(yǒu)的存在异常(cháng)。
有行业人事表(biǎo)示:“现在因为手指部分(fēn)的绘画算法比较复(fù)杂(zá),AI还不太(tài)会画人的手,但最新看到的图片已经(jīng)有(yǒu)越来越完美的AI模型(xíng)出现,以后可能就完(wán)全没有(yǒu)漏洞了。”
类似的AI作图诈骗在国(guó)外也已有发生。据英国广(guǎng)播公司报(bào)道,土耳其地震期间,有Tiktok用(yòng)户使用AI合成了儿(ér)童受灾的假照片发布到网(wǎng)络,以此诱骗善(shàn)良(liáng)的(de)人(rén)打赏“捐助”从而(ér)实施诈(zhà)骗(piàn)。
目前(qián)随(suí)着技(jì)术发展,AIGC已经(jīng)能做出(chū)真(zhēn)人照片般的绘图效果,如果这样的图(tú)片(piàn)被(bèi)用来诈(zhà)骗,将非常可(kě)怕。
此外(wài)AIGC还引发了很(hěn)多担忧,一方面,批判(pàn)者认为AI在“学(xué)习”了大量前(qián)人(rén)的作品之后,其创作没有任何情(qíng)绪和(hé)灵魂,难以(yǐ)和人类的艺(yì)术创作相提(tí)并论。
另一方(fāng)面,AIGC背后(hòu)的版权、目前(qián)都并没(méi)有(yǒu)得到有(yǒu)效(xiào)的解决,还有(yǒu)AIGC会(huì)不会代替人类“至高无上”的创意(yì)。
马斯(sī)克也强调,人工智(zhì)能的安全问题需要得(dé)到重视,太晚就来不及(jí)了。
03
AIGC下(xià)一站除了(le)视频,还有远方
技术都是有两面性(xìng)的(de),潜在的危(wēi)害(hài)并不能掩盖其光辉(huī)的贡献。现在看(kàn)来(lái),人工智能(néng)技术将是(shì)第四次(cì)工业革命的核(hé)心驱动力量,将创(chuàng)造新(xīn)的增长奇迹。
过去一年,人工智能在技术和商业层面都有了(le)巨大进展,AI绘画(huà)就(jiù)是(shì)人(rén)工智能技术发生方向性改(gǎi)变(biàn)的一个代(dài)表。其下一(yī)站(zhàn)或许就是(shì)视频。
此(cǐ)前(qián),Meta和谷歌先后(hòu)发布了几条引爆科技圈的短(duǎn)视频(pín)。这些(xiē)视频引(yǐn)发关注并非内容做得多优秀(xiù),反而都非常简单,比如(rú)一匹(pǐ)正(zhèng)在喝水的马,一只画(huà)画的玩具熊,或者一段骑摩托车的第(dì)一视角录(lù)像(xiàng),随便一个有(yǒu)手机的人(rén)都可以随手录下一段。
但这些短视(shì)频的创作方式非常(cháng)简单,创作者仅(jǐn)仅需(xū)要向AI输入一段话,甚至只是说一下要求(qiú),AI就可以根据需要生成(chéng)一段视频(pín)。
谷歌发(fā)布的两(liǎng)个AI生成视频分别来(lái)自于Imagen Video和(hé)Phenaki,前者主要突出的是高清(qīng),与Meta的(de)Make-A-Video没有太(tài)多(duō)的差别。
在Make-A-Video公布了AI生(shēng)成(chéng)的(de)视频后,AI圈(quān)就已经玩了(le)一(yī)波梗(gěng),一个能够做(zuò)出更高清视频(pín)的AI还不足以在短时间内戳中兴奋(fèn)点。
Phenaki更加令(lìng)人(rén)震惊的地方在(zài)于(yú),它可(kě)以制作出超过2分钟(zhōng)的连贯的也有确切内(nèi)容(róng)的视频(pín),这才(cái)是真正(zhèng)让人们感(gǎn)到惊(jīng)喜的地方。因为(wèi)无论AI生成的视频(pín)多么高清,也只(zhǐ)能(néng)是(shì)为内容生产者提供(gōng)一个灵感,一个素材,一个过场动画。
不过能够制作出有具体剧情内容的视频(pín)就意味着,一些视频创作由AI代替(tì)人工(gōng)完成已经(jīng)初步有了可能。
当下AI的(de)发展速度已经超过大部分(fēn)人的想象(xiàng)。内容产业的本质是供给(gěi)创造需求,AIGC作为全(quán)新(xīn)的内容生产方式(shì),可以为内容产(chǎn)业带来(lái)更新的内(nèi)容风格(gé)、更快的生(shēng)产速度(dù),更低的(de)生产(chǎn)成本,这(zhè)无疑会驱(qū)动(dòng)内容产业的大爆发(fā)。
除了AI绘图、视(shì)频,AIGC技术还能应用(yòng)于音乐(lè)、代码(mǎ)、机(jī)器人动(dòng)作(zuò)等多种内容形式的生成。不难(nán)发现该项技术不仅在游戏等行业能得(dé)到有效应用,对于下一代(dài)互联网各(gè)种元素的(de)构建亦有关(guān)键意义。
从商(shāng)业化的角度(dù)来看,文(wén)化娱乐、教育、传(chuán)媒等诸多领域,本身就对(duì)基于AI的可视化内(nèi)容有强烈需求。
因此,AI绘画及视频或不是结果,而只是AI进(jìn)程中的一块重要拼图,有望在技术更新的(de)加持下实(shí)现更大的应用价值。
AI从理解(jiě)内(nèi)容,走向(xiàng)了可以生(shēng)成内(nèi)容,甚至能够创造出独立价值和独立视角的(de)内容。AIGC的再次出(chū)圈,更代表(biǎo)着未来的(de)先进生产力即将到来。
04
紧(jǐn)抓大模型与算力(lì),牢固AIGC底座
从技术的发展也可以看出,在(zài)语言大模(mó)型、图像大(dà)模型之后,多(duō)模态大模型已经成为(wèi)了新的趋势。
大(dà)模型被誉(yù)为(wèi)当前人工智能发展的智能底座,是全球竞争最激(jī)烈的(de)研究(jiū)方向(xiàng)之一,包(bāo)括谷歌、亚马(mǎ)逊(xùn)、百度(dù)、阿(ā)里、腾讯等众多头(tóu)部企业都在(zài)竞相发力。
不过(guò)训练大模型(xíng)的(de)确(què)价(jià)格不菲,以国盛证券发(fā)布的(de)《ChatGPT需要多少算力》报告(gào)估算,GPT-3训练一次的成本约(yuē)为140万美元。而对于一些(xiē)更大的LLM(大型语言模型),训练成(chéng)本(běn)则介于200万美(měi)元至(zhì)1200万美元(yuán)高价之间。
以ChatGPT在2023年1月的(de)独立访客平均数1300万(wàn)计算,其对(duì)应芯片需(xū)求(qiú)为3万多片(piàn)英伟达A100 GPU,初(chū)始(shǐ)投入(rù)成本(běn)约(yuē)为8亿美元,每日仅(jǐn)电费(fèi)就在5万美(měi)元左右。
此外(wài)不论是ChatGPT还(hái)是AIGC,都离不开庞大算(suàn)力支持。在关注各类大模(mó)型的发展同时,更应(yīng)该关注算力网络的建设。
算(suàn)力网(wǎng)络正驱动AI产业发展(zhǎn)进(jìn)入史(shǐ)诗级加速进程,让AIGC及通用AI这一人工智(zhì)能发(fā)展的终极目标离得(dé)更近。
因为算力可以对突破(pò)性技术创(chuàng)新提供大力的支持。这方面,多模态大模型是典(diǎn)型。作为面向未(wèi)来强人工(gōng)智能、通用人(rén)工(gōng)智能的重要技术创新,多模态大模型已经在人工智能领域提出(chū)了很(hěn)多(duō)年,业(yè)界也有(yǒu)不少技术突破,但是,多模态大(dà)模型(xíng)进一步(bù)往下走,算力需求(qiú)呈几何式上升,一般的(de)算力基础(chǔ)设施很快(kuài)将难(nán)以胜任。
从图像、文(wén)字、语音单(dān)独一(yī)项(xiàng)的训练,到双模态、三(sān)模态(tài)的跃(yuè)迁,让人工智(zhì)能可以灵活(huó)放在里面睡一晚是什么感受,放里面睡觉是什么样的感受应(yīng)对不(bù)同(tóng)模态的转化(huà)、像人与世界交互一样(yàng)自然,这方面,由算力网络来(lái)驱动(dòng)将(jiāng)有明显优势(shì)。
此外(wài),还有很多需(xū)要爆发式增(zēng)长的算力来支撑的技术创新(xīn),将在(zài)人工(gōng)智能算力(lì)网络支撑下快速推进。
AIGC已经露出(chū)曙光(guāng),期待在大模型和大算力(lì)的支持(chí)下AIGC能持续(xù)颠覆内容生产的方式,将创(chuàng)造的边际成本降低,让万众(zhòng)受(shòu)益。
未经允许不得转载:成都工装公司_工装装修效果图_专注公装设计装修 - 无同之家装饰 放在里面睡一晚是什么感受,放里面睡觉是什么样的感受
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了