自(zì)聊天机器人ChatGPT火爆以来,微软公司创始人比(bǐ)尔(ěr)·盖茨(cí)已多次公开谈论人工智能(néng)话题(tí)。在最近(jìn)的(de)一次(cì)采访中,他(tā)再次表示(shì):“AI可能会让科技行业迎来一次(cì)剧烈的洗牌”。
这个结论是他(tā)在当地时间2月20日接受(shòu)《In Good Company》节目专访(fǎng)时提出(chū)的。
他(tā)预期,AI的发展(zhǎn)可能会(huì)威胁到谷歌的市占(zhàn)率,因为微软(ruǎn)在(zài)AI方面(miàn)的行动相当迅速。而最终科技巨(jù)头将把AI整(zhěng)合(hé)成用户的“全(quán)能(néng)助手”,包揽一(yī)切应(yīng)用,与人们进行沟通(tōng)并提(tí)供建议,可以取代亚马(mǎ)逊、Siri或Outlook等应用。
大佬口中全能助手的到(dào)来可(kě)能尚需时日,但由ControlNet引发的(de)又(yòu)一次AI绘画浪潮,让AIGC在ChatGPT的话题热点包(bāo)围中(zhōng)杀出重(zhòng)围。
01
ControlNet颠覆(fù)AI绘画新玩法
AIGC向可控靠近
以(yǐ)AI绘(huì)画为代表的AIGC上一(yī)次爆火的时候,还是(shì)2022年8月,在美(měi)国科罗(luó)拉(lā)多州举办的新兴数字艺(yì)术家竞赛中,一幅名为(wèi)《太空(kōng)歌剧院(yuàn)》的作品(pǐn)获奖。
随后各大厂(chǎng)商的AI绘(huì)画软件被广大网友熟(shú)知并体验(yàn),Stable Diffusion便(biàn)是其中代(dài)表(biǎo)。
用户(hù)们可以在应(yīng)用中(zhōng)输入一组关键词或者(zhě)一(yī)张照片,就能获得一幅AI创作的画作。
作画的关键(jiàn)就是所(suǒ)输入的文本。同一组关键词也(yě)可(kě)以创作(zuò)出很多张风格不一样(yàng)的画(huà)作,这让创作的过程就像开盲盒(hé)。
很(hěn)多用户很喜欢这(zhè)种(zhǒng)不确定的惊喜(xǐ),他们会将生成的美图(tú)当(dāng)做头像(xiàng)。而另一部分喜欢翻看AI绘画的“翻车(chē)”作品。在社交(jiāo)媒体上(shàng),许(xǔ)多用户分享(xiǎng)AI“翻车现场”,例如,一位网友(yǒu)的小狗照片被AI画成(chéng)了“肌肉男”,还有网(wǎng)友(yǒu)的个人照(zhào)片被AI识别成了(le)建筑。
而如(rú)今随着ControlNet的出现与加持,以往AI绘画的填写关键词游戏可能(néng)要(yào)被颠覆了。
ControlNet是一(yī)位正在斯坦福读(dú)博(bó)的中国人张吕(lǚ)敏创作的一(yī)种基于(yú)控制点的图(tú)像变形(xíng)算法,主要(yào)用于数字图像处理、计(jì)算机视觉(jué)和计算机(jī)图形学(xué)等领(lǐng)域。
其SD插(chā)件一经发(fā)布(bù),在短短的两(liǎng)天内便成为了AI绘画领域最新的(de)热点。
在此(cǐ)之前,大家用了很(hěn)多方(fāng)法(fǎ)想让AI生成的结果(guǒ)尽可能的(de)符合要(yào)求,但是都不尽如人意,它的出现代表着AI生成(chéng)开始进入真正(zhèng)的(de)可控时期。
因为ControlNet可以(yǐ)直接提取画面(miàn)的构图,人物的(de)姿势和画面(miàn)的深度信息等(děng)。有了它的帮助,就不用频繁的(de)用(yòng)提示词来碰运气,抽盲盒式的创作了。
通俗的说ControlNet相当于给AI绘画(huà)加了“魔法”,不少(shǎo)博主的作品已经获得(dé)了(le)大量的浏览量,“viggo”就是其中(zhōng)之(zhī)一,他用朋友的照片直接带(dài)她们走进动漫世(shì)界。
viggo先用StableDiffusion图片(piàn)转文字。
再用Text2Prompt插件拓展找到对(duì)应的关键词(cí);最(zuì)后用ControlNet插件绑(bǎng)定(dìng)骨骼开始换关键词试效果。
通过图片就(jiù)可以看出来,效(xiào)果十分惊艳。
更厉(lì)害的是,除了(le)真实的照片,草图也(yě)可以加上(shàng)“魔法”,知乎大(dà)牛“DevPoint”和“逗砂(shā)”介绍到ControlNet还能实现线(xiàn)稿转全(quán)彩图。大神张吕敏其(qí)本尊也亲(qīn)自回应。
不(bù)得不说当下(xià)AIGC已经变得越来越强大,甚至输出的作(zuò)品(pǐn)都已经能以(yǐ)假乱真了。
02
难辨(biàn)虚实,AIGC技术力爆(bào)发
警(jǐng)惕安(ān)全问题
近日,“苏州金鸡湖有游艇party”的(de)消(xiāo)息火遍(biàn)网络,而经过警(jǐng)方辟谣这所(suǒ)谓的“party”可能(néng)是全国(guó)第一起AI绘图(tú)诈骗。
由(yóu)于(yú)这个活动里面给出的美女(nǚ)照片都是AI制作的真人(rén)照片绘(huì)图(tú),因为太逼真,被大家当成真(zhēn)事传播了。
不过仔细观察(chá)可以发(fā)现,活动发起者提(tí)供(gōng)的照片(piàn)中有个很(hěn)大的(de)漏洞可以发现并非(fēi)真人(rén),而是AI绘图,那便是(shì)图片中(zhōng)女(nǚ)性的手指部分有的存(cún)在异(yì)常。
有(yǒu)行(xíng)业(yè)人事表示(shì):“现在因为手(shǒu)指部分的(de)绘画算法比较复杂,AI还(hái)不太会画(huà)人的手(shǒu),但最(zuì)新看到的图片已经有越来越(yuè)完美的AI模型出现(xiàn),以后(hòu)可(kě)能(néng)就(jiù)完(wán)全没有漏(lòu)洞了。”
类似的AI作图诈骗在国外也已有发生。据英国广播公司(sī)报道,土耳其地震(zhèn)期(qī)间,有Tiktok用户(hù)使(shǐ)用(yòng)AI合成了儿童受灾的假照(zhào)片发布到网络,以(yǐ)此诱(yòu)骗(piàn)善良的(de)人打赏(shǎng)“捐助”从而实施诈骗。
目前(qián)随(suí)着技术(shù)发展,AIGC已经能(néng)做出(chū)真人(rén)照(zhào)片般的绘(huì)图(tú)效果,如果这样(yàng)的图(tú)片被(bèi)用来诈骗(piàn),将非常(cháng)可怕。
此外AIGC还引(yǐn)发了(le)很多担忧,一方(fāng)面,批(pī)判(pàn)者认(rèn)为AI在(zài)“学习”了大量前人的(de)作品之后,其创(chuàng)作(zuò)没(méi)有任(rèn)何情绪和灵魂,难以和人类的艺(yì)术创(chuàng)作相提并论。
另一方面,AIGC背后的版权、目前都并(bìng)没(méi)有得到有(yǒu)效的解(jiě)决(jué),还有AIGC会不会代替人类(lèi)“至高(gāo)无(wú)上”的创意。
马斯克也强调,人(rén)工智能的安全问题需要得到重视,太晚就来不及(jí)了。
03
AIGC下一站(zhàn)除(chú)了视频,还有远方
技术都是有两面性的,潜在的危害(hài)并不能掩盖(gài)其(qí)光辉的贡献。现(xiàn)在看来,人(rén)工智能技(jì)术将(jiāng)是第四次(cì)工(gōng)业革(gé)命的(de)核心(xīn)驱动力量,将(jiāng)创造新的(de)增长(zhǎng)奇迹。
过去一(yī)年,人工智能在技术(shù)和商(shāng)业层面都有了(le)巨大进展(zhǎn),AI绘画就是(shì)人工智能技术发(fā)生(shēng)方向(xiàng)性改变(biàn)的一个代表。其下一站或(huò)许就(jiù)是视频(pín)。
此(cǐ)前,Meta和谷歌(gē)先后发布了几条引爆科技圈的短视(shì)频。这些视频引(yǐn)发关注并非内容做得多优秀,反而都(dōu)非常(cháng)简单,比如一匹正(zhèng)在喝水的(de)马,一只画画的玩具熊,或者一段骑摩托车(chē)的第一视角录(lù)像(xiàng),随便一个(gè)有手机的(de)人都可以随手录下一段。
但这些短视频的(de)创作(zuò)方式非(fēi)常简单,创作者仅仅(jǐn)需要向AI输入一段(duàn)话,甚至(zhì)只(zhǐ)是说一下要求,AI就(jiù)可以根据需要生成一(yī)段视频(pín)。
谷歌发布(bù)的两个AI生成视频分别来自于(yú)Imagen Video和Phenaki,前(qián)者主要(yào)突出的是高清,与(yǔ)Meta的Make-A-Video没有太多(duō)的差别。
在Make-A-Video公布(bù)了AI生成的视频后,AI圈就已经玩了一(yī)波梗,一个能够(gòu)做出(chū)更高清视频的AI还不足以(yǐ)在短时(shí)间内(nèi)戳中兴奋点(diǎn)。
Phenaki更加令人震惊的(de)地方在于,它可以制作出超过2分(fēn)钟的连贯的(de)也有(yǒu)确切内(nèi)容的(de)视频,这才是(shì)真正让人们感到惊喜(xǐ)的(de)地(dì)方(fāng)。因为(wèi)无论(lùn)AI生成的视频多么(me)高清(qīng),也只(zhǐ)能是为内容生产(chǎn)者提供(gōng)一个灵感,一(yī)个素材,一(yī)个过(guò)场动(dòng)画(huà)。
不过能够制作出有具(jù)体剧(jù)情内容的视频就意味着,一(yī)些视频创作(zuò)由AI代(dài)替人工完成已(yǐ)经初步有了可能。
当下AI的发展速度已经超(chāo)过大(dà)部(bù)分(fēn)人(rén)的想象。内容(róng)产业(yè)的本(běn)质是供给(gěi)创造需求(qiú),AIGC作为全新(xīn)的内容生产(chǎn)方(fāng)式(shì),可以为内容(róng)产业带(dài)来更新的内容风(fēng)格(gé)、更快的生产速度,更低的生产(chǎn)成本,这无疑会驱(qū)动内容产(chǎn)业的(de)大爆发。
除了AI绘图、视频(pín),AIGC技术还能应用于音乐(lè)、代码、机器(qì)人(rén)动作等(děng)多种内容形式(shì)的生成。不(bù)难(nán)发现该项(xiàng)技术不(bù)仅(jǐn)在游戏等行反骨是什么意思 反骨是叛逆的意思吗业能得到有效应(yīng)用(yòng),对于下一代(dài)互联网(wǎng)各种(zhǒng)元(yuán)素(sù)的(de)构建(jiàn)亦有关键(jiàn)意义。
从商(shāng)业化(huà)的角度来看,文化(huà)娱乐、教育、传媒等诸多领域,本身就(jiù)对(duì)基于AI的(de)可视化内容(róng)有(yǒu)强烈需(xū)求(qiú)。
因此,AI绘画及(jí)视(shì)频(pín)或(huò)不是结果,而只(zhǐ)是AI进程中的(de)一块重要拼(pīn)图,有望在技术更新的加持下(xià)实现更大的应用价值。
AI从理解内容,走向了(le)可(kě)以(yǐ)生成内容,甚至能够创造出独立价值和独立视角的内(nèi)容。AIGC的再次出圈,更代(dài)表着未来的(de)先进生产(chǎn)力即将到来(lái)。
04
紧抓大模(mó)型(xíng)与算力,牢固(gù)AIGC底座
从技术的发展也可(kě)以看出,在语(yǔ)言(yán)大模型(xíng)、图像大(dà)模型(xíng)之后,多模态大模型已(yǐ)经成为了新的趋势。
大模型被誉为当前(qián)人工智(zhì)能(néng)发展的(de)智能底座,是全球竞争(zhēng)最激烈的(de)研究方向之(zhī)一,包括谷歌、亚马逊、百度、阿里、腾讯等(děng)众(zhòng)多头部企(qǐ)业(yè)都在竞(jìng)相发力(lì)。
不过训练(liàn)大模型(xíng)的确价格(gé)不菲(fēi),以国(guó)盛证券发布的(de)《ChatGPT需要多少(shǎo)算力》报告估算,GPT-3训练(liàn)一次的成本约为140万美(měi)元。而对于(yú)一些更大的LLM(大型语言(yán)模型),训练成本则介于200万美元(yuán)至(zhì)1200万(wàn)美元高(gāo)价之间(jiān)。
以ChatGPT在2023年1月的独立访客平均(jūn)数1300万(wàn)计算,其对(duì)应芯(xīn)片需求为3万多片英伟达A100 GPU,初始投(tóu)入成本(běn)约为8亿美元,每日仅电费就在5万美元(yuán)左右。
此外不论是(shì)ChatGPT还是AIGC,都离不开庞大算力支持。在关注各类大模(mó)型的发展同时(shí),更应该关(guān)注(zhù)算(suàn)力网络的建(jiàn)设。
算力网络正(zhèng)驱动AI产(chǎn)业发(fā)展(zhǎn)进入(rù)史(shǐ)诗级加(jiā)速进(jìn)程,让(ràng)AIGC及通用(yòng)AI这一人(rén)工(gōng)智能发展的终极目标离得更(gèng)近。
因(yīn)为算力可以对突破性技术创新提供大(dà)力的支(zhī)持。这方面,多模态大模型是(shì)典型。作为面向未来强人工智能、通用人工智能的(de)重要技(jì)术创新,多模态大模型已经在人(rén)工智能领域提出了很多年(nián),业界(jiè)也(yě)有不少技(jì)术突破(pò),但是,多模态大模(mó)型进一(yī)步往(wǎng)下走,算力需求(qiú)呈几何式(shì)上升,一般的(de)算力基础(chǔ)设施很(hěn)快将(jiāng)难以胜任。
从图(tú)像、文(wén)字、语音(yīn)单独一(yī)项的训练,到双(shuāng)模(mó)态、三模态的跃迁(qiān),让人工(gōng)智能可以灵(líng)活应对不同模态(tài)的转化(huà)、像人与(yǔ)世界交互一样自然,这方(fāng)面,由算力网(wǎng)络来驱动将有明显优(yōu)势(shì)。
此外,还有很多(duō)需要爆发式增长的算力来支撑(chēng)的技术创(chuàng)新,将在人工智能算力网(wǎng)络(luò)支撑(chēng)下快速(sù)推进。
AIGC已经露(lù)出曙光(guāng),期待(dài)在(zài)大模型和大算力的(de)支持下(xià)AIGC能持续(xù)颠覆内容生(shēng)产的(de)方式,将创造的(de)边际成本降(jiàng)低,让万众受益(yì)。
最新评论
非常不错
测试评论
是吗
真的吗
哇,还是漂亮呢,如果这留言板做的再文艺一些就好了
感觉真的不错啊
妹子好漂亮。。。。。。
呵呵,可以好好意淫了