Штучний інтелект зрештою може повністю замінити людей-оповідачів.
Хоча ШІ може пропонувати макети або теми тегів, йому бракує живого досвіду та емпатії, необхідних для створення історії, яка справді резонує з людським духом.
Хоча обидві галузі пов'язані з інтерпретацією цифрових зображень, візуальне оповідання зосереджується на створенні емоційного наративу та послідовності, що резонує з людським досвідом, тоді як автоматизоване маркування зображень використовує комп'ютерний зір для ідентифікації та категоризації певних об'єктів або атрибутів у кадрі для організації даних та можливості пошуку.
Мистецтво використання зображень, графіки та відео для передачі розповіді або викликання певних емоцій у аудиторії.
Процес використання алгоритмів штучного інтелекту для автоматичного виявлення, позначення та категоризації об'єктів на цифровому зображенні.
| Функція | Візуальна розповідь | Автоматизоване маркування зображень |
|---|---|---|
| Основна мета | Емоційний вплив та наратив | Категоризація та пошук даних |
| Основний механізм | Людська креативність та емпатія | Машинне навчання та розпізнавання образів |
| Вихідний формат | Рекламні кампанії, фільми або фотоесе | Текстові теги, метадані та альтернативний текст |
| Усвідомлення контексту | Високий (розуміє іронію, настрій та підтекст) | Низький (ідентифікує об'єкти без глибшого значення) |
| Масштабованість | Низький (вимагає трудомістких людських зусиль) | Високий (масштабно масштабований за допомогою хмарних обчислень) |
| Суб'єктивність | Дуже суб'єктивно та відкрито для інтерпретацій | Прагне до об'єктивної, буквальної точності |
| Основні інструменти | Камери, Adobe Creative Cloud, Розкадрування | API TensorFlow, PyTorch, Cloud Vision |
Візуальна розповідь історій покликана зворушити людей, чи то переконати їх купити продукт, чи викликати у них певну емоцію. Натомість, автоматизоване маркування допомагає машинам зрозуміти, що зображено на фотографії, щоб люди могли знайти ці фотографії пізніше. Одне створює подорож для глядача, а інше — карту для бази даних.
Людина-оповідач знає, що фотографія самотньої парасольки під дощем може символізувати самотність або стійкість. Інструмент маркування на основі штучного інтелекту просто побачить «парасольку» та «дощ». Машині бракує здатності сприймати символічну вагу чи культурні нюанси, які роблять історію привабливою для людської аудиторії.
Не можна поспішати зі створенням потужної історії; вона вимагає ретельного підбору та розуміння менталітету аудиторії. Однак автоматизоване маркування процвітає завдяки обсягу. Воно може просканувати цілу бібліотеку з мільйона фотографій за той час, який потрібен оповідачеві для вибору одного заголовного зображення, що робить його незамінним для сучасних програм для роботи з великими даними.
У розповіді історій розмита фотографія може бути навмисним вибором для зображення руху або хаосу. Для автоматизованого розробника розмітки та сама розмиття може бути позначена як помилка «низької якості» або нездатність ідентифікувати об’єкт. Це підкреслює розрив між технічною точністю та художньою виразністю.
Штучний інтелект зрештою може повністю замінити людей-оповідачів.
Хоча ШІ може пропонувати макети або теми тегів, йому бракує живого досвіду та емпатії, необхідних для створення історії, яка справді резонує з людським духом.
Автоматизоване маркування має 100% точність.
Алгоритми все ще можуть мати проблеми з «граничними випадками», такими як незвичайні ракурси камери, погане освітлення або об’єкти, які виглядають схожими, що призводить до кумедних або навіть образливих помилок тегування.
Візуальна розповідь — це просто гарні картинки.
Справжня розповідь передбачає стратегічну послідовність і глибоке розуміння психології аудиторії; гарне фото без «гачка» — це не історія.
Ручне тегування краще, ніж тегування за допомогою штучного інтелекту.
У великомасштабних проектах люди насправді менш послідовні та більш схильні до втоми, ніж штучний інтелект, що робить автоматизовані системи кращими для базової категоризації.
Оберіть візуальну розповідь історій, коли вам потрібно зв’язатися з аудиторією на особистому чи емоційному рівні. Зверніться до автоматизованого маркування зображень, коли у вас величезний обсяг контенту, який потрібно організувати, зробити доступним для пошуку та використовувати для серверних систем.
У сучасному медіаландшафті існує глибока суперечність між економікою уваги, яка трактує людську увагу як дефіцитний товар, що може бути використаний для отримання прибутку, та громадянським дискурсом, який спирається на цілеспрямований, обґрунтований обмін для підтримки здорової демократії. Хоча одна з них надає пріоритет вірусній взаємодії, інша вимагає терплячої, інклюзивної участі.
Розуміння розбіжності між новинами, розробленими для підтвердження певних політичних упереджень, та репортажами, що ґрунтуються на нейтралітеті, є життєво важливим для сучасної медіаграмотності. У той час як партійні повідомлення надають пріоритет певному ідеологічному порядку денному чи наративу, об’єктивні репортажі прагнуть представити перевірені факти, не займаючи чиєїсь сторони, дозволяючи аудиторії формувати власні висновки на основі наданих доказів.
Це порівняння досліджує суперечність між фотографією як засобом для індивідуального творчого самовираження та її сучасною роллю як масивного сховища візуальної інформації, що використовується для навчання моделей машинного навчання та організації глобальних даних.