快捷搜索:  

“这图一眼便是ai”那你能展开讲讲么?

"“这图一眼便是ai”那你能展开讲讲么?,这篇新闻报道详尽,内容丰富,非常值得一读。 这篇报道的内容很有深度,让人看了之后有很多的感悟。 作者对于这个话题做了深入的调查和研究,呈现了很多有价值的信息。 这篇报道的观点独到,让人眼前一亮。 新闻的写作风格流畅,文笔优秀,让人容易理解。 " 账号设置我的关注我的收藏申请的报道退出登录登录搜索36氪Auto数字时氪将来消费智能涌现将来城市启动Power on36氪出海36氪研究院潮生TIDE36氪企服点评36氪财经(Finance)职场bonus36碳后浪研究所暗涌Waves硬氪媒体品牌企业号企服点评36Kr研究院36Kr创新咨询企业服务核心服务城市之窗行政部门服务创投发布LP源计划VClubVClub投资机构库投资机构职位推介投资人认证投资人服务寻求报道36氪Pro创投氪堂企业入驻创业者服务创投平台 首页快讯资讯推荐财经(Finance)科技(Technology)创新城市最新创投汽车(Car)企服专精特新直播视频专题活动搜索寻求报道我要入驻城市合作“这图一眼就是AI”那你能展开讲讲么?果壳·2024-02-11 12:30关注当我们(We)在说“这张图一眼 AI”的时候,我们(We)到底在说些什么?

互联网有一条经典的“第 34 号规则”(Rule 34):如果一个东西存在,那么它必然会被用来搞黄色。AI 绘画就很好地说明了这一点——目前(Currently)最流行的几个 AI 绘画分享网站,都有至少三分之一的内容是各种黄图。

图源:GIPHY

但是这里出现了一个小小的问题:人们普遍觉得,这些图里的大多数,虽然黄,但不“色”。

是千篇一律的僵硬神色和动作?可能许是扭曲不自然(Nature)的姿态?又可能许是依旧容易画错的手指和奇怪的透视?是什么让人能够一眼分辨出某些图是 AI 画的?我们(We)真的要乞灵于“灵性”“灵魂”这样的词语吗?

当我们(We)能够理解,是什么让人能够判断出一张图是否是 AI 画的,我们(We)就能够更好的理解 AI 绘画本身。

  妙,可不可言? 

如今,我们(We)都多少大致了解过 AI 绘画的原理:首先,我们(We)要有一个训练数据集,这个数据集里包括一系列的图片,和与图片对应的、描述图片元素的一系列文本;把这些数据喂给 AI,AI 就能学会将这些文本和图片之间联系起来;专业的术语,就是将图片中的内容翻译成一个“高维的文本向量”;如果这种内容到向量之间的翻译足够合理,那么我们(We)就可以将这个翻译机制,也就是“多层神经网站”反过来使用,通过一系列的文本提示词(prompts),将文本向量重新翻译回相应的画面。

如果我们(We)将中间的 diffusion model 之类的技术细节省略,我们(We)会发现一个目前(Currently) AI 绘图和人类绘画最基本的逻辑区别:AI 绘画是从文字语言出发的;而人类的视觉艺术,是从视觉本身出发的。人类在画一幅画的时候,首先是从脑袋里想象出某个视觉形象,然后一步步细化,构成画面,这中间可以完全没有任何语言的参与;而 AI 绘画则要求你首先去总结出画面中的元素,形成文字,然后再通过文字反向去描述出画面。

图源:GIPHY

从这个角度,我们(We)可以察觉出它与本雅明所谓“机械复制时代的艺术”有着某种本质性的区别:视觉艺术,从本质上是不可言说的,可能者更准确的说,是在语言之外的;这点是因为人类大脑处理视觉图像与处理语言根本上不是同样的区域,我们(We)看到一幅图像所激发起的感情,我们(We)创作一幅图像所投入的感情,本质上都是语言之外的东西。

而目前(Currently)的 AI 绘画则实际上是我们(We)要用语言去描述视觉,那么它注定只能传达出我们(We)对于整个视觉世界中能够用语言描述的那一小部分。

所以,当我们(We)在使用 AI 绘图的时候,我们(We)给出的提示词,绝大多数情况下给出的是绘图中的“元素”;而不是绘图的“上下文”(context),可能者说逻辑;因为目前(Currently)的这套通过文本生成图片的 AI 算法本质上是无法理解逻辑的。图像中的逻辑也很难通过文字描述出来。最简单的例子,就是我们(We)鉴别 AI 曾经常用的“手指法”(如今已改进许多):AI 可以很容易地画出一个美少女,但是很难把美少女的手指数量画对。而手指数量的问题,实质上就是一个绘图逻辑问题:人类都知道人类每只手上都长着五根手指,但是 AI 是无法通过目前(Currently)的这套文本到图形的关联算法里学到这个基本知识的。

图源:网站

而为什么 AI 无法理解绘图的逻辑?这就要涉及我们(We)要说的目前(Currently) AI 面临的最基本的问题:世界模型。

  关于智慧的“模型” 

发明出“人工智能”的同时,人类科学家们需要回答一个同等重要的问题:什么是“智能”?

而随着人工智能 / 认知科学的进步和发展,我们(We)现在对于“人类智能是如何运行的”,有了更清晰的认识:人类,可能者准确的说已知所有生物智慧的运行基础,都依赖于一个“世界模型”——我们(We)依赖于对世界的认识,反过来界定我们(We)自身的存在。

图源:unsplash

我们(We)与周遭的世界和环境,与其他人的接触,都是我们(We)对于这个“世界模型”的调用和运行;如果没有这个世界模型,智能本身就不存在了。在认知科学里,这叫做“具身认知”:我们(We)身体和外界的关系构成了我们(We)“认知模型”里非常重要(甚至是最主要)的部分。而人类的抽象思维和语言(最关键的思考工具),则基本上完全依赖于对于这个物理世界的类比和模拟,这被称作“具身模拟”。

相关的内容可以参考几本书

《我们(We)赖以生存的隐喻》《我们(We)赖以生存的意义》《表象与本质》

这种对于物理世界的认识和建模,则是目前(Currently)人工智能开发里最大的障碍:如何让人工智能建立一个世界模型?让它能够理解它看到了什么,而不是作为一个单纯的统计分类机器?自动驾驶实际上就卡在这里:机器智能机械的分类它接受到的影像数据并且做相应的反应,而很难将这些数据统计和归纳,建立一个世界模型,所以自动驾驶才会出那么多的无穷无尽的 corner case。

图源:GIPHY

AI 绘图与人类绘画根本差异的原因也就在此:绘图 AI 是没有世界模型的。所谓的“上下文”可能者说“逻辑”,就是这个世界的基本的规律;人手一般都会有五根手指,这就是规律之一。绘图 AI 要能够理解它看到了什么,而不是神经网站单纯的记住了,某些元素和另一些元素一同出现的概率比较高,它才能表现得像一个人类画师。

曾有很多人质疑,AI 绘图是否能真的从事“创造性”工作,最本质的原因,就在于“创造性”本身就需要深刻的理解规律。

  太似媚俗,不似欺世 

祖国各地的景点一向有一个我很不喜欢的传统:一块石头,一座山峰,甚至是岩壁上的纹路,都要强行的把它攀附成某种具象的形象,然后再编出一段神话,相传这里原本有一个巨大的天界的 XXX,因为惹怒了玉皇大帝被打入凡间,然后流落此地化成了这块巨石 / 这座山峰云云。这座小丘山势平缓似乌龟,就叫乌龟岭;这座山峰形如蹲狮,就是狮子峰。我想果壳的读者在祖国各地旅游(Travel)的时候,应该经常碰见类似的这种景点描述,茫茫多数不胜数。

图源:GIPHY

那么这跟 AI 绘画又有什么关系呢?这种强行地,要把自然(Nature)的随机起伏特征强行解释为有意义的特征,在统计学上,叫做“过拟合”。当然,如果用自然(Nature)语言,这就叫用力过猛。

所以除开“手指法”,我们(We)识别 AI 绘画的一个很重要的手段,就是 AI 绘画经常会“用力过猛”。人类画师画的图一般而言都会有自己的轻重缓急:画师会为自己想要强调的画面增加更多细节,而其余的部分就可以糊一点、简单一些,自己省力之外观众也能自然(Nature)而然地注视那些更重要的部分;而 AI 生成的画面往往是平均的,AI 会在整个画面上不分青红皂白地堆满各种似是而非的细节,让整个画面显得没有重点。

一个熟悉 AI 绘画的人能够一眼鉴 AI,很多时候就在于这种视觉上的疲劳感觉:所有东西都很清晰,都很细致,都没有必要。这就跟你听导游讲了一万遍“这个石头像 XXX 所以叫 XXX,又叫 XXX”一样。

但是这种用力过猛如果放在合适的情境下,就不再是用力过猛了:使用合适的模型和充满脑洞的提示词,AI 绘画能画出那些人类画师不太可能画出来的离奇的图出来。相信人类历史(History)上没有画师会画出一张“猫咪单板滑雪”图出来(也不一定,我猜《猫和老鼠》里应该能找到类似画面),可能者老虎脑袋老虎毛皮的螃蟹(也不一定,没准《猫和老鼠》里也有……)。总之,当你看到这些离谱图的时候,你现在应该知道它肯定都是 AI 的作品。

图源:civitai

在摄影圈里一直有个说法:金头红头,最终看相机后面那颗头。摄影师也会抱怨:总有人问,这张照片拍得真好,是用什么相机拍的?但是绝不会有人问画家,这张画画得真好,是用什么画笔画的?

实际上在 AI 绘画的现在,问题是同样的:使用什么工具其实不是那么重要,重要的还是使用工具的人。绘画的 AI 模型本身是没有创造性的,而创造性要从使用 AI 的人那里生发出来。

好了,现在你脑袋里有一个离谱的想法,请使用合适的关键词让 AI 把它画出来。(可以把你的 prompts 在留言中分享给大家~)

本文来自微信公众号“果壳”(ID:Guokr42),作者:邓思渊,编辑:malt,36氪经授权发布。

该文观点仅代表作者本人,36氪平台仅提供信息存储空间服务。

+126

好文章,需要你的鼓励

果壳特邀作者9收  藏+10评  论打开微信“扫一扫”,打开网页后点击屏幕右上角分享按钮微  博沉浸阅读返回顶部参与评论评论千万条,友善第一条登录后参与讨论(Discuss)提交评论0/1000你可能也喜欢这些文章奥特曼7万亿美元芯片帝国野心曝光,OpenAI日产1000亿单词欲接管世界苹果Vision Pro带来Optic ID,但虹膜识别并不新鲜2023 北美独角兽体坛:渡渡鸟、矿泉水、AI 涌现关于Apple Vision Pro的一些启发传苹果VisionPro 4可能5月登陆祖国,大厂应用火速跟进今天(Today)起,他是黄仁勋院士,2024米国工程院院士名单出炉,清华黄翊东等当选外籍院士元宇宙里过大年:春晚、庙会、灯会亮相虚拟空间你还在为元宇宙投资而心动吗?揭开这个超过165万人的资金盘骗局三篇论文解决“语义分割的优化和评估”难题,鲁汶/清华/牛津等联合提出全新方法最新文章推荐吉祥汽车(Car),云度“套壳”?“这图一眼就是AI”那你能展开讲讲么?祖国公司全球化周报 | ​阿里Q3财报:世界业务收入大涨44% / 太二酸菜鱼将开放澳大利亚、新西兰加盟业务养老新趋势:00后涌入养老院,老人搬进寺庙芯片行业,需要怎样的工程师?年轻人的第一件新年战袍,从马面裙开始为带猫狗回家过年,我直接买了辆车三大交易所发布ESG信披指引,450余家上市公司将强制披露 | 最前线春晚广告40年:一部商业顶流变迁史贾玲现腹肌,宣发亮底牌,《热辣滚烫》能否“再赢一次”果壳特邀作者

作者有点忙,还没写简介

发表文章944篇最近内容“这图一眼就是AI”那你能展开讲讲么?1小时前听说,AI 红包封面超级赚钱昨天(Yesterday)Google也推出了“AI付费套餐”,和ChatGPT比哪个值?2024-02-09阅读更多内容,狠戳这里下一篇祖国公司全球化周报 | ​阿里Q3财报:世界业务收入大涨44% / 太二酸菜鱼将开放澳大利亚、新西兰加盟业务

聚焦祖国公司全球化大事、提供世界各地最新创投新闻(News);36氪出海致力于消除信息差,让读者将本周最值得关注的大事件尽收眼底。

2小时前

热门标签sm练习生sm祖国韩流俞永镇韩流明星(Star)完美陌生人飞船龙飞船斯宾塞七鱼宽带连接宽带梁文道看理想(Ideal)一千零一夜苹果公司团队郑州酒店杨振宁复旦大学(University)上海人上海生活(Life)数据解读百万主播youtube日本(Japan)lidar刘海洋金鑫新辣道脸萌app排行榜关于36氪城市合作寻求报道我要入驻投资者关系商务合作关于我们(We)联系我们(We)加入我们(We)网站谣言信息举报入口热门推荐热门资讯热门产品文章标签快讯标签合作伙伴鲸准氪空间富途牛牛企服点评人人都是产品经理领氪36氪APP下载iOS Android本站由 阿里云 提供计算与安危服务 违法和不良信息、未成年人保护举报电话:010-89650707 举报邮箱:jubao@36kr.com 网上有害信息举报© 2011~2024 首都多氪信息科技(Technology)有限公司 | 京ICP备12031756号-6 | 京ICP证150143号 | 京公网安备11010502036099号意见反馈36氪APP让一部分人先看到将来36氪鲸准氪空间

推送和解读前沿、有料的科技(Technology)创投资讯

一级市场金融信息和系统服务提供商

聚焦全球优秀创业者,项目融资率接近97%,领跑行业

“这图一眼就是AI”那你能展开讲讲么?

您可能还会对下面的文章感兴趣:

赞(946) 踩(14) 阅读数(8719) 最新评论 查看所有评论
加载中......
发表评论