自聊天(tiān)机器人ChatGPT火爆以来(lái),微(wēi)软公司(sī)创始人(rén)比尔·盖(gài)茨已多次公开谈(tán)论人工智能话题(tí)。在最(zuì)近的(de)一(yī)次采访中,他(tā)再次表(biǎo)示(shì):“AI可能会让科(kē)技行(xíng)业迎来一次剧(jù)烈的(de)洗牌”。
这个结论是他在当(dāng)地时间2月(yuè)20日接受《In Good Company》节目专访时(shí)提(tí)出的。
他预期,AI的发展可能会(huì)威胁(xié)到谷歌的市占率,因为微软在AI方面(miàn)的行动(dòng)相(xiāng)当迅速。而最终(zhōng)科技巨(jù)头(tóu)将(jiāng)把AI整合成用户的“全能助手(shǒu)”,包(bāo)揽(lǎn)一切应用,与人(rén)们进(jìn)行沟通(tōng)并提供建议,可(kě)以取(qǔ)代亚(yà)马(mǎ)逊、Siri或Outlook等应(yīng)用。
大佬口中全(quán)能助手(shǒu)的(de)到(dào)来可(kě)能尚需时日,但(dàn)由ControlNet引发的又一(yī)次AI绘画浪(làng)潮,让AIGC在(zài)ChatGPT的话题热点包(bāo)围中杀(shā)出(chū)重(zhòng)围(wéi)。
01
ControlNet颠覆AI绘画新玩法
AIGC向可控(kòng)靠(kào)近
以AI绘画为代表的(de)AIGC上一(yī)次爆火的时候(hòu),还是(shì)2022年8月,在美国(guó)科罗(luó)拉多州举办(bàn)的新兴数(shù)字艺术家竞赛(sài)中,一幅名为《太空歌剧院(yuàn)》的作品获奖(jiǎng)。
随后各大厂(chǎng)商(shāng)的AI绘(huì)画(huà)软件被(bèi)广大网友熟(shú)知并体验,Stable Diffusion便是其中代表。
用户们可以(yǐ)在应用(yòng)中(zhōng)输入一组关键词或者(zhě)一张照片,就能获得一幅AI创作的画作(zuò)。
作画的关(guān)键就是所(suǒ)输入的文本(běn)。同一组关键(jiàn)词也可(kě)以创作出很多张风(fēng)格不一(yī)样的画(huà)作(zuò),这让创作的过(guò)程就像开盲盒(hé)。
很多用户(hù)很(hěn)喜欢这种(zhǒng)不确定(dìng)的惊喜,他们会(huì)将(jiāng)生成的美图当做头像(xiàng)。而另一(yī)部分喜欢翻看AI绘画的“翻车”作品。在社交媒体上,许多用户(hù)分享AI“翻(fān)车现场(chǎng)”,例如,一(yī)位(wèi)网友的小狗(gǒu)照(zhào)片被(bèi)AI画成了“肌(jī)肉男”,还(hái)有网(wǎng)友的个人照片被AI识别成了建筑。
而如(rú)今随着(zhe)ControlNet的出现与加(jiā)持,以往AI绘画(huà)的填写(xiě)关(guān)键词游(yóu)戏可(kě)能要被颠(diān)覆(fù)了。
ControlNet是一位(wèi)正在(zài)斯坦(tǎn)福读博的中国人(rén)张(zhāng)吕敏创作的一种基(jī)于(yú)控制点的图像变(biàn)形算法,主要用于数字图(tú)像处理、计算机视觉和计算机(jī)图形学等领域。
其SD插(chā)件一经(jīng)发布,在短短的两天内便成为(wèi)了AI绘画领域最新的热点。
在此之前,大(dà)家用了很(hěn)多方法想让AI生成的结(jié)果尽可能的符合(hé)要求,但是(shì)都不尽如人意(yì),它的出现代(dài)表(biǎo)着AI生成(chéng)开始进入(人+工念什么 人工念什么姓rù)真正的可控时(shí)期。
因为ControlNet可以直接提取画(huà)面的构图(tú),人物的姿势(shì)和画面的深度信息等(děng)。有了它的帮助,就(jiù)不(bù)用频(pín)繁的用提(tí)示词来碰(pèng)运气,抽盲(máng)盒(hé)式的创作了。
通俗(sú)的说ControlNet相当于给AI绘(huì)画加了“魔法”,不少博(bó)主的(de)作(zuò)品已经获得了大量(liàng)的浏览量,“viggo”就是其中之一,他用朋(péng)友的照片直接带(dài)她们走进动漫世(shì)界。
viggo先用StableDiffusion图片转文字。
再用Text2Prompt插件(jiàn)拓展找到对(duì)应的(de)关键词;最(zuì)后(hòu)用ControlNet插件绑定(dìng)骨骼开始换(huàn)关键词试效果。
通过图片就可以看出(chū)来,效果十分惊艳。
更厉害(hài)的是,除了真实的照片,草图也(yě)可以加上“魔法”,知(zhī)乎大牛“DevPoint”和(hé)“逗(dòu)砂(shā)”介绍(shào)到ControlNet还能实现线稿转全彩图。大神张吕敏其本(běn)尊也(yě)亲自(zì)回应。
不得不说当下AIGC已经变得(dé)越来(lái)越强大,甚至输出的作品(pǐn)都(dōu)已经能以假(jiǎ)乱真了。
02
难辨虚(xū)实(shí),AIGC技术力爆发(fā)
警惕安(ān)全问题
近日,“苏州金(jīn)鸡湖有游(yóu)艇party”的消息火(huǒ)遍网络,而经过(guò)警方(fāng)辟谣这所谓(wèi)的“party”可能(néng)是(shì)全国第(dì)一(yī)起AI绘图(tú)诈骗。
由于这个活动里面给出的美女照片都是AI制作(zuò)的(de)真人(rén)照(zhào)片绘图(tú),因为太(tài)逼真(zhēn),被大(dà)家当成真(zhēn)事传播了。
不过仔细观察(chá)可以(yǐ)发现,活动发起(qǐ)者提(tí)供的(de)照(zhào)片中有个很(hěn)大的(de)漏洞可以发现并非(fēi)真人,而是(shì)AI绘图,那便(biàn)是图片中女性的手(shǒu)指部分有的存在异常。
有行业人事表示:“现在(zài)因为手指部分的(de)绘画算法比较复杂(zá),AI还不(bù)太会(huì)画人的手(shǒu),但最新看到的图片(piàn)已经有越来越完美的AI模型(xíng)出现,以(yǐ)后可能(néng)就完全没有(yǒu)漏洞(dòng)了。”
类似的AI作图诈骗在国外也已有发生。据英国(guó)广播(bō)公(gōng)司报道,土耳(ěr)其地震(zhèn)期(qī)间(jiān),有(yǒu)Tiktok用户使用AI合(hé)成了儿童受灾的假照片发布到网络,以此诱(yòu)骗(piàn)善良的人打赏“捐助”从(cóng)而实施诈骗。
目前随着(zhe)技(jì)术发(fā)展(zhǎn),AIGC已经能做出(chū)真人(rén)照片般的(de)绘图效果,如果(guǒ)这(zhè)样(yàng)的图片被(bèi)用来诈骗,将非常可怕(pà)。
此外AIGC还引发了(le)很(hěn)多担忧,一方面,批判者认为AI在(zài)“学习”了大量前人(rén)的作品之后,其创作没有任(rèn)何(hé)情绪和灵魂,难以和(hé)人类的艺术创作相(xiāng)提并(bìng)论(lùn)。
另一方面,AIGC背(bèi)后(hòu)的版权(quán)、目前都并没(méi)有得到(dào)有效的解决(jué),还(hái)有AIGC会(huì)不会(huì)代替人类“至高无上(shàng)”的创(chuàng)意(yì)。
马(mǎ)斯克也强调,人工智能的安全(quán)问题需要得到重视,太(tài)晚(wǎn)就来不(bù)及(jí)了。
03
AIGC下一站除了视频,还有远方
技术都是有(yǒu)两面性(xìng)的,潜(qián)在的危害并不(bù)能掩盖(gài)其光辉的贡(gòng)献。现(xiàn)在看来(lái),人工智能技术将是第四次工业革命的核(hé)心驱动力(lì)量,将创(chuàng)造新的增(zēng)长奇迹(jì)。
过(guò)去一年(nián),人工智能在技术和商(shāng)业层(céng)面(miàn)都(dōu)有了巨大进展,AI绘(huì)画就是人工智能技术发生方向性改变的一个代表。其(qí)下一站或许就是视频。
此前(qián),Meta和谷歌先后发(fā)布了几(jǐ)条(tiáo)引爆科技圈的(de)短视频。这些视频(pín)引发(fā)关注并非内容做(zuò)得多(duō)优秀,反而(ér)都非常简(jiǎn)单,比如一匹(pǐ)正在(zài)喝水的马,一只画画的(de)玩具熊,或者一段骑摩托车的第一视角录像,随便一个有手机的人都可以(yǐ)随手(shǒu)录下一段。
但这些短视频的(de)创作(zuò)方式非常简单,创作者(zhě)仅(jǐn)仅需要向AI输入一段(duàn)话,甚至只是说一下要求,AI就可以根据需要(yào)生成一段视频。
谷(gǔ)歌发布的两(liǎng)个AI生成视频分(fēn)别来自(zì)于Imagen Video和Phenaki,前(qián)者主要(yào)突出的是高(gāo)清,与Meta的(de)Make-A-Video没有太多的(de)差别(bié)。
在Make-A-Video公布了AI生成的视(shì)频(pín)后,AI圈就已(yǐ)经(jīng)玩了(le)一波梗,一个(gè)能够做出更(gèng)高清视频的AI还(hái)不足以在短时间(jiān)内戳中兴奋点。
Phenaki更加令人(rén)震(zhèn)惊的地方(fāng)在于,它可以制(zhì)作出超过(guò)2分钟的连贯的也(yě)有确(què)切内容的(de)视频,这才是真正(zhèng)让人们感到惊喜的(de)地方。因为无论AI生(shēng)成的(de)视(shì)频(pín)多么高清,也只能是为(wèi)内容生产者提供一个灵感,一个素(sù)材,一个(gè)过场动(dòng)画。
不过能(néng)够(gòu)制作出(chū)有(yǒu)具体(tǐ)剧(jù)情内(nèi)容的视(shì)频就意味着,一(yī)些视频(pín)创作由(yóu)AI代替人工完成(chéng)已经初步有了可能。
当(dāng)下AI的发(fā)展速(sù)度(dù)已经超过大部分(fēn)人的(de)想象。内(nèi)容产业的本质(zhì)是供给创(chuàng)造(zào)需(xū)求,AIGC作为全(quán)新的(de)内容生产方式,可以为内容产业(yè)带来更新的内容风格、更(gèng)快的生产速度,更低(dī)的生产(chǎn)成本(běn),这无疑会(huì)驱动内容产业的大爆发。
除了AI绘(huì)图、视频(pín),AIGC技术还能应用(yòng)于音乐、代码、机器人动作等多种内(nèi)容形(xíng)式的生成。不难发现该项技术不仅在游(yóu)戏等行业能得(dé)到有(yǒu)效(xiào)应(yīng)用(yòng),对(duì)于下一代(dài)互联网各种(zhǒng)元素的构建亦(yì)有关键意义。
从(cóng)商业(yè)化的角度来看,文化娱乐、教育、传(chuán)媒等(děng)诸多(duō)领域,本身就对(duì)基于AI的可视(shì)化(huà)内容(róng)有强(qiáng)烈需求(qiú)。
因此(cǐ),AI绘画及视频(pín)或(huò)不(bù)是(shì)结果,而只是AI进(jìn)程中(zhōng)的一块重(zhòng)要拼图(tú),有(yǒu)望(wàng)在技术更(gèng)新(xīn)的加持下实现更大的应用(yòng)价值。
AI从理解内(nèi)容,走(zǒu)向(xiàng)了可以生(shēng)成内容,甚至能够创造出独立价值和独立(lì)视角的内容。AIGC的(de)再次出圈(quān),更代表着未来的先进生(shēng)产力即将到(dào)来(lái)。
04
紧抓大模型与算力(lì),牢固AIGC底座
从技术的发展也(yě)可以看(kàn)出,在(zài)语言(yán)大(dà)模型、图像大模型之后(hòu),多模态(tài)大模型已经(jīng)成为(wèi)了新的趋势。
大模型被(bèi)誉为当前(qián)人(rén)工智能发(fā)展的(de)智能底座,是(shì)全球竞争最(zuì)激烈的(de)研究方(fāng)向之一,包括谷歌、亚马(mǎ)逊、百度、阿(ā)里、腾(téng)讯等众多(duō)头(tóu)部(bù)企业都在竞相(xiāng)发力。
不(bù)过(guò)训练大模型的(de)确(què)价格不菲,以国盛证券发布的《ChatGPT需要多少(shǎo)算(suàn)力》报(bào)告估算,GPT-3训练一次的(de)成本约为(wèi)140万美元。而对于一(yī)些更(gèng)大的LLM(大型语言(yán)模型),训练成本则介于200万美元至1200万(wàn)美元高价之(zhī)间(jiān)。
以ChatGPT在2023年1月的独(dú)立访客(kè)平均数1300万(wàn)计(jì)算,其对应芯片需求为3万多片英伟达A100 GPU,初始投入成本约为8亿美元,每日仅(jǐn)电费就在(zài)5万美元左右。
此外不论是ChatGPT还是AIGC,都离不开庞大(dà)算力支持(chí)。在关注各(gè)类(lèi)大模型的发(fā)展同时(shí),更应该关注算力网(wǎng)络(luò)的(de)建(jiàn)设(shè)。
算力网络正(zhèng)驱(qū)动AI产(chǎn)业发展进入史诗级加(jiā)速进程,让(ràng)AIGC及通用AI这(zhè)一人工智能发展的终极(jí)目标离得(dé)更近。
因为算力可以对突破性技术创新提供大力的支持。这方(fāng)面,多模态大模型是典型(xíng)。作为面向(xiàng)未来强人工智能(néng)、通用人工智能的重要技术(shù)创新,多模(mó)态大模型已经在(zài)人(rén)工智能领域(yù)提出了很(hěn)多年(nián),业界(jiè)也(yě)有不少技术突破,但是(shì),多(duō)模态大模型进一步(bù)往(wǎng)下走,算力需(xū)求呈几何式上升,一般(bān)的算(suàn)力基础(chǔ)设施(shī)很快将难以胜(shèng)任(rèn)。
从图(tú)像、文字、语音(yīn)单独一项的训练,到双模态、三模态的(de)跃迁,让人(rén)工智能可以灵(líng)活应对不同模态的转(zhuǎn)化、像人与(yǔ)世界交互一样自然(rán),这方面,由(yóu)算力网络来驱(qū)动将有(yǒu)明显(xiǎn)优(yōu)势。
此外,还(hái)有很(hěn)多需要爆发式增(zēng)长的算力来支(zhī)撑的技(jì)术创(chuàng)新(xīn),将(jiāng)在人工(gōng)智能算力网络支撑下快速推(tuī)进。
AIGC已经(jīng)露出曙光,期待在大模型和大算力的支(zhī)持下AIGC能持续(xù)颠覆内容生产的方式,将创造的边际成本降(jiàng)低,让万众受益。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了