视觉叙事与自动图像标注
虽然这两个领域都涉及对数字图像的解读,但视觉叙事侧重于构建能够引起人类共鸣的情感叙事和序列,而自动图像标注则利用计算机视觉来识别和分类画面中的特定对象或属性,以便进行数据组织和搜索。
亮点
- 讲故事侧重于情感叙述,而贴标签侧重于对物体的字面识别。
- 人工智能可以瞬间给数百万张图片贴上标签,这是人类讲故事的人无法完成的任务。
- 理解言外之意、隐喻和文化敏感性需要人类的直觉。
- 标签提供了结构化元数据,使得视觉故事能够在网上被找到。
视觉叙事是什么?
图像艺术是指运用图像、图形和视频来传达叙事或唤起观众特定情感的艺术。
- 高度依赖心理触发因素和文化背景来传递信息。
- 优先考虑图像的“为什么”和“如何”,而不是字面意义上的“是什么”。
- 运用引导线和三分法等构图技巧来引导观众的视线。
- 它包含一个循序渐进的过程,其中一幅图像的意义建立在前一幅图像的意义之上。
- 仍然是一项独特的人类技能,需要同理心和创造性直觉。
自动图像标注是什么?
利用人工智能算法自动检测、标记和分类数字图像中的对象的过程。
- 使用卷积神经网络等深度学习模型处理视觉数据。
- 生成诸如“狗”、“公园”或“阳光明媚”之类的元数据标签,用于数据库索引。
- 每秒可处理数千张图像,且稳定性高。
- 训练精度依赖于海量的预先标注图像数据集。
- 减少数字资产管理和搜索引擎优化方面的人工劳动。
比较表
| 功能 | 视觉叙事 | 自动图像标注 |
|---|---|---|
| 主要目标 | 情感冲击和叙事 | 数据分类与检索 |
| 核心机制 | 人类的创造力和同理心 | 机器学习和模式识别 |
| 输出格式 | 广告宣传活动、电影或摄影专题 | 文本标签、元数据和替代文本 |
| 情境感知 | 高(理解讽刺、氛围和弦外之音) | 低级(识别没有更深层含义的物体) |
| 可扩展性 | 低(需要耗费大量时间的人力) | 高(可通过云计算大规模扩展) |
| 主观性 | 主观性很强,且容易产生多种解读。 | 力求客观、准确。 |
| 主要工具 | 摄像机、Adobe Creative Cloud、故事板 | TensorFlow、PyTorch、Cloud Vision API |
详细对比
意图和目的
视觉叙事旨在打动人心,无论是说服人们购买产品,还是激发他们特定的情感。与之相反,自动标注则帮助机器理解照片内容,以便人们日后能够找到这些照片。前者为观看者创造一段旅程,后者则为数据库构建地图。
情境的作用
人类讲故事的人知道,一张雨中孤零零的雨伞照片可能象征着孤独或坚韧。而人工智能标注工具只会看到“雨伞”和“雨”。机器无法理解其中蕴含的象征意义或文化细微差别,而这些正是故事能够打动人类观众的关键所在。
可扩展性和速度
一个精彩的故事急不得,它需要精心策划和对受众心理的深刻理解。然而,自动标注却能高效地处理海量数据。它扫描一百万张照片的整个图库所需的时间,可能还不如一个故事讲述者挑选一张标题图片的时间,这使其成为现代大数据应用不可或缺的一部分。
创意与技术准确性
在叙事中,模糊的照片可能是一种刻意的选择,用来表现运动或混乱。但对于自动标注系统来说,同样的模糊效果却可能被标记为“低质量”错误或无法识别主体。这凸显了技术精确性和艺术表达之间的差距。
优点与缺点
视觉叙事
优点
- +建立品牌忠诚度
- +令人难忘且引人入胜
- +细致入微且具有文化意识
- +高度的情感共鸣
继续
- −生产周期缓慢
- −生产成本高昂
- −难以衡量投资回报率
- −需要专业人才
自动图像标注
优点
- +性价比极高
- +惊人的处理速度
- +显著提升搜索引擎优化效果
- +结果始终如一
继续
- −缺乏情感深度
- −可能误认物体
- −忽略艺术意图
- −需要高质量数据
常见误解
人工智能最终可能会完全取代人类讲故事的人。
虽然人工智能可以建议布局或标记主题,但它缺乏创作真正能引起人类精神共鸣的故事所需的生活经验和同理心。
自动贴标准确率达100%。
算法仍然可能难以处理“极端情况”,例如不寻常的拍摄角度、光线不足或物体看起来相似,从而导致滑稽甚至冒犯性的标签错误。
视觉叙事就是用漂亮的图片来讲述故事。
真正的故事讲述需要精心设计的顺序和对观众心理的深刻理解;一张没有“钩子”的美丽照片算不上一个故事。
人工标注比人工智能标注更好。
对于大型项目而言,人类实际上不如人工智能稳定,也更容易疲劳,因此自动化系统在基本分类方面更胜一筹。
常见问题解答
我可以使用自动标注功能来辅助讲故事吗?
自动标签功能能否提升我网站的搜索引擎优化 (SEO) 效果?
哪种方案实施成本更高?
人工智能中的“语义”标注是什么?
视觉叙事只能用于视频吗?
社交媒体平台如何运用这两个概念?
人工智能能否识别图像中的情绪?
为什么故事背景如此重要?
裁决
当您需要与受众建立个人或情感联系时,请选择视觉叙事。当您有海量内容需要整理、搜索并供后端系统访问时,请使用自动图像标注。
相关比较
作为艺术的摄影 vs 作为数据集的摄影
这种比较探讨了摄影作为个人创意表达媒介与其作为用于训练机器学习模型和组织全球数据的大型视觉信息库的现代角色之间的张力。
党派宣传与客观报道
理解旨在强化特定政治偏见的新闻与秉持中立立场的新闻报道之间的区别,对于现代媒体素养至关重要。党派宣传优先考虑特定的意识形态议程或叙事,而客观报道则力求呈现可验证的事实,不偏袒任何一方,让受众能够根据所提供的证据得出自己的结论。
注意力经济与公民话语
在当今媒体格局中,注意力经济(将人类的注意力视为可供牟利的稀缺资源)与公民对话(依靠深思熟虑、理性交流来维系健康的民主)之间存在着深刻的张力。前者追求病毒式传播,后者则要求耐心、包容的参与。