Comparthing Logo
媒体哲学计算机视觉创意艺术大数据

作为艺术的摄影 vs 作为数据集的摄影

这种比较探讨了摄影作为个人创意表达媒介与其作为用于训练机器学习模型和组织全球数据的大型视觉信息库的现代角色之间的张力。

亮点

  • 艺术追求瞬间的“非凡”;数据集追求构建模型的“标准”。
  • 一件杰作可以改变人的一生,而一个数据点在统计学上微不足道。
  • 艺术价值由人类评论家决定;数据集价值由机器性能决定。
  • 人工智能的兴起已将数十亿张个人艺术快照转化为宝贵的训练数据。

摄影作为艺术是什么?

有意识地使用相机来表达愿景、唤起情感或提供对现实的独特视角。

  • 专注于捕捉人眼所看到的特定瞬间的“氛围”或独特性。
  • 依靠光线、构图和后期处理等主观选择来传达情绪。
  • 比起数量,更注重单张图片的质量和情感冲击力。
  • 常常引导观众深入思考或解读隐藏的含义或隐喻。
  • 重视摄影师的历史文化背景及其具体意图。

摄影数据集是什么?

将海量图像作为原始数据点进行分析、分类或人工智能训练。

  • 将图像视为数值数组和像素图案,而不是审美对象。
  • 机器学习需要大规模数据——通常是数百万张图像——才能有效进行。
  • 优先考虑多样性和代表性抽样,以减少算法偏差。
  • 剥离个人艺术意图,专注于客观标签和元数据。
  • 它是人脸识别和自动驾驶等技术的基础。

比较表

功能摄影作为艺术摄影数据集
主要价值审美和情感深度信息密度和效用
预期结果人际联系或反思算法准确性和预测
理想容量小而精的系列艾字节的各种视觉数据
创作者的角色作者(主观视角)数据提供者(客观来源)
成功指标文化影响或评论界赞誉高精确率和召回率
元数据的重要性视觉体验的重要性次之主要用于索引和培训
解释开放式和个人化固定的、标记的和分类的

详细对比

镜头背后的意图

在艺术摄影中,从光圈到快门按下的那一刻,每一个选择都是一种刻意的自我表达。相反,当摄影作品被用作数据集时,照片背后的“为什么”就无关紧要了;系统只关心“是什么”,以确保计算机能够在各种光照条件下识别出停车标志或猫。

质量与数量

一位艺术家可能要花费数周时间等待完美的光线,才能捕捉到一张足以讲述故事的定格画面。但在大数据时代,这样一张完美的照片不过是沧海一粟。数据集的构建依赖于数量和多样性,其中往往包含一些“糟糕”或模糊的照片,以帮助人工智能理解现实中纷繁复杂的不完美之处。

人性与数学

艺术摄影是连接创作者和观赏者两人的桥梁,共享着彼此共鸣或敬畏的瞬间。而数据集则将同一张照片视为一个数字矩阵。对算法而言,日落并非美丽,而是与“户外自然光”标签相匹配的特定红色和橙色像素频率。

上下文和元数据

对于一件艺术作品而言,其语境通常指的是媒介的历史或艺术家的生平。而对于数据集而言,语境则完全是结构性的。诸如GPS坐标、时间戳和对象标签之类的元数据是数据集的生命线,它们将视觉体验转化为可搜索的、功能强大的软件工具。

优点与缺点

摄影作为艺术

优点

  • +引发深思
  • +保护人类文化
  • +每单位财务价值高
  • +独特的个人愿景

继续

  • 主观且难以理解
  • 难以快速变现
  • 需要多年的技艺磨练。
  • 每张图片的覆盖范围有限。

摄影数据集

优点

  • +现代科技的动力
  • +极强的可扩展性
  • +解决实际问题
  • +对社会具有很高的实用价值

继续

  • 隐私问题
  • 贬低个人技艺
  • 缺乏情感意义
  • 算法偏差风险

常见误解

神话

人工智能数据集不需要“好的”艺术作品就能学习。

现实

事实上,数据集中的高质量、构图良好的照片比低质量的快照更能帮助模型理解深度、光照和纹理。

神话

将摄影作品作为数据集是一个新概念。

现实

自 19 世纪以来,摄影就被用作医疗记录、天文测绘和警察档案的数据集,这比数字人工智能的出现早得多。

神话

艺术家不能将自己的作品用作数据集。

现实

现在许多现代艺术家利用自己的个人档案训练自己的私人人工智能模型,以生成反映其风格的全新、独特的“合成”艺术作品。

神话

数据图像本身就很枯燥。

现实

有时,数据集的庞大规模——例如卫星图像或数千张街景照片——会展现出一种偶然的、令人难忘的美。

常见问题解答

我的个人照片是否被用作数据集的一部分?
很有可能。如果你将照片上传到公共社交媒体平台或有特定服务条款的云服务,这些图像通常会被抓取或合法用于训练图像识别算法。公司利用这些“免费”数据来训练人工智能识别世界。
照片可以既是艺术又是数据吗?
是的,这种情况很常见。一张精美的建筑照片或许可以作为艺术品在画廊展出,但一旦上传到房地产网站,它就变成了房产估值算法的数据点。其定义完全取决于图像在当时的具体用途。
为什么“偏见”在照片数据集中如此重要?
如果数据集主要包含某一特定人群的照片,人工智能就无法准确识别其他人。因此,拥有多样化、具有全球代表性的“数据”照片对于创建公平安全的技术(例如人脸解锁或医疗诊断)至关重要。
将摄影视为数据会对艺术界造成损害吗?
有人认为,这种做法将艺术家的作品变成了机器的商品,从而贬低了艺术家的作品价值。然而,也有人认为,这开辟了新的创作领域,使艺术家能够将“数据”作为一种新型的数字颜料来创作生成式作品。
在这个语境下,“抓取”指的是什么?
网络爬虫是指通过自动化方式从互联网下载数百万张图片来构建数据集。这种做法引发了关于版权的重大法律和伦理争议,因为艺术家通常不同意将他们的“艺术作品”转化为人工智能的“训练数据”。
科学家如何利用摄影作品作为数据集?
在生物学等领域,研究人员使用自动相机拍摄数千张动植物照片。然后,他们利用人工智能分析这些数据集,以追踪物种数量或生长模式,而这些对于人类来说,手动计数是不可能完成的。
人工智能摄影最终会取代艺术摄影吗?
人工智能可以模仿风格,但它没有自己的经历或“灵魂”可以分享。艺术摄影很可能仍将是人类的高端追求,而人工智能生成的图像将取代更偏重功能性的“数据集式”任务,例如素材库摄影。
什么样的照片才算“好的”数据集照片?
与艺术作品不同,一张“好的”数据集照片必须清晰标注,并且能够毫无歧义地展现其主题。它需要具有“代表性”,也就是说,它看起来应该像计算机在现实世界中可能遇到的事物,而不是风格化或抽象的。

裁决

当你的目标是激发灵感、传达复杂信息或创造持久影响时,请选择“艺术”视角。当你需要解决技术问题、自动化视觉任务或了解全球图像中的广泛模式时,请采用“数据集”视角。

相关比较