Comparthing Logo
内容策略人工智能数字营销媒体

视觉叙事与自动图像标注

虽然这两个领域都涉及对数字图像的解读,但视觉叙事侧重于构建能够引起人类共鸣的情感叙事和序列,而自动图像标注则利用计算机视觉来识别和分类画面中的特定对象或属性,以便进行数据组织和搜索。

亮点

  • 讲故事侧重于情感叙述,而贴标签侧重于对物体的字面识别。
  • 人工智能可以瞬间给数百万张图片贴上标签,这是人类讲故事的人无法完成的任务。
  • 理解言外之意、隐喻和文化敏感性需要人类的直觉。
  • 标签提供了结构化元数据,使得视觉故事能够在网上被找到。

视觉叙事是什么?

图像艺术是指运用图像、图形和视频来传达叙事或唤起观众特定情感的艺术。

  • 高度依赖心理触发因素和文化背景来传递信息。
  • 优先考虑图像的“为什么”和“如何”,而不是字面意义上的“是什么”。
  • 运用引导线和三分法等构图技巧来引导观众的视线。
  • 它包含一个循序渐进的过程,其中一幅图像的意义建立在前一幅图像的意义之上。
  • 仍然是一项独特的人类技能,需要同理心和创造性直觉。

自动图像标注是什么?

利用人工智能算法自动检测、标记和分类数字图像中的对象的过程。

  • 使用卷积神经网络等深度学习模型处理视觉数据。
  • 生成诸如“狗”、“公园”或“阳光明媚”之类的元数据标签,用于数据库索引。
  • 每秒可处理数千张图像,且稳定性高。
  • 训练精度依赖于海量的预先标注图像数据集。
  • 减少数字资产管理和搜索引擎优化方面的人工劳动。

比较表

功能 视觉叙事 自动图像标注
主要目标 情感冲击和叙事 数据分类与检索
核心机制 人类的创造力和同理心 机器学习和模式识别
输出格式 广告宣传活动、电影或摄影专题 文本标签、元数据和替代文本
情境感知 高(理解讽刺、氛围和弦外之音) 低级(识别没有更深层含义的物体)
可扩展性 低(需要耗费大量时间的人力) 高(可通过云计算大规模扩展)
主观性 主观性很强,且容易产生多种解读。 力求客观、准确。
主要工具 摄像机、Adobe Creative Cloud、故事板 TensorFlow、PyTorch、Cloud Vision API

详细对比

意图和目的

视觉叙事旨在打动人心,无论是说服人们购买产品,还是激发他们特定的情感。与之相反,自动标注则帮助机器理解照片内容,以便人们日后能够找到这些照片。前者为观看者创造一段旅程,后者则为数据库构建地图。

情境的作用

人类讲故事的人知道,一张雨中孤零零的雨伞照片可能象征着孤独或坚韧。而人工智能标注工具只会看到“雨伞”和“雨”。机器无法理解其中蕴含的象征意义或文化细微差别,而这些正是故事能够打动人类观众的关键所在。

可扩展性和速度

一个精彩的故事急不得,它需要精心策划和对受众心理的深刻理解。然而,自动标注却能高效地处理海量数据。它扫描一百万张照片的整个图库所需的时间,可能还不如一个故事讲述者挑选一张标题图片的时间,这使其成为现代大数据应用不可或缺的一部分。

创意与技术准确性

在叙事中,模糊的照片可能是一种刻意的选择,用来表现运动或混乱。但对于自动标注系统来说,同样的模糊效果却可能被标记为“低质量”错误或无法识别主体。这凸显了技术精确性和艺术表达之间的差距。

优点与缺点

视觉叙事

优点

  • + 建立品牌忠诚度
  • + 令人难忘且引人入胜
  • + 细致入微且具有文化意识
  • + 高度的情感共鸣

继续

  • 生产周期缓慢
  • 生产成本高昂
  • 难以衡量投资回报率
  • 需要专业人才

自动图像标注

优点

  • + 性价比极高
  • + 惊人的处理速度
  • + 显著提升搜索引擎优化效果
  • + 结果始终如一

继续

  • 缺乏情感深度
  • 可能误认物体
  • 忽略艺术意图
  • 需要高质量数据

常见误解

神话

人工智能最终可能会完全取代人类讲故事的人。

现实

虽然人工智能可以建议布局或标记主题,但它缺乏创作真正能引起人类精神共鸣的故事所需的生活经验和同理心。

神话

自动贴标准确率达100%。

现实

算法仍然可能难以处理“极端情况”,例如不寻常的拍摄角度、光线不足或物体看起来相似,从而导致滑稽甚至冒犯性的标签错误。

神话

视觉叙事就是用漂亮的图片来讲述故事。

现实

真正的故事讲述需要精心设计的顺序和对观众心理的深刻理解;一张没有“钩子”的美丽照片算不上一个故事。

神话

人工标注比人工智能标注更好。

现实

对于大型项目而言,人类实际上不如人工智能稳定,也更容易疲劳,因此自动化系统在基本分类方面更胜一筹。

常见问题解答

我可以使用自动标注功能来辅助讲故事吗?
当然,很多创作者都这么做。你可以利用人工智能快速搜索素材库,例如搜索“日落”或“快乐的人”,找到最适合你故事的素材。它就像一个强大的图书管理员,让故事讲述者能够专注于创意构思。
自动标签功能能否提升我网站的搜索引擎优化 (SEO) 效果?
是的,效果显著。这些工具通过生成准确的替代文本和元数据,帮助搜索引擎理解您的视觉内容。这使得您的图片及其所属的故事更有可能出现在相关的搜索结果中。
哪种方案实施成本更高?
视觉叙事通常成本更高,因为它涉及人工、创意指导,而且往往还需要实体制作。自动标注通常更便宜,通常按图像计费,或者以软件即服务 (SaaS) 的形式提供固定订阅服务。
人工智能中的“语义”标注是什么?
语义标注是一种更高级的人工智能标签形式,它试图理解对象之间的关系。它不仅会识别“人”和“自行车”,还会将场景标注为“山地自行车”或“公园骑行”,从而更接近于叙述性描述。
视觉叙事只能用于视频吗?
完全不是。你可以通过一张震撼人心的照片、一系列信息图,甚至是精心策划的Instagram轮播图来讲述一个故事。媒介本身远不如精心设计的顺序和信息重要。
社交媒体平台如何运用这两个概念?
他们利用自动标签“读取”你的照片,进行审核和广告定向投放;而你,用户,则利用视觉叙事来打造个人品牌或与粉丝互动。一个是引擎,另一个是驾驶员。
人工智能能否识别图像中的情绪?
人工智能可以识别面部表情(例如微笑或皱眉),并将某些颜色与情绪联系起来,但它并不能“感受”情绪本身。它只是识别出一组像素模式,而这组像素模式已被告知与某个特定标签相对应。
为什么故事背景如此重要?
语境会改变一切的含义。一张紧闭的门的照片,在一个故事里可能意味着“结束”,而在另一个故事里则可能意味着“新的谜团”。人类会根据照片之前发生的事情来理解它的含义,而人工智能看到的仅仅是一扇门。

裁决

当您需要与受众建立个人或情感联系时,请选择视觉叙事。当您有海量内容需要整理、搜索并供后端系统访问时,请使用自动图像标注。

相关比较