هوش مصنوعی در نهایت میتواند به طور کامل جایگزین قصهگویان انسانی شود.
اگرچه هوش مصنوعی میتواند طرحبندیها یا مضامین برچسبگذاریشده را پیشنهاد دهد، اما فاقد تجربه زیسته و همدلی لازم برای خلق داستانی است که واقعاً با روح انسان طنینانداز شود.
در حالی که هر دو زمینه شامل تفسیر تصاویر دیجیتال هستند، داستانسرایی بصری بر ساخت یک روایت احساسی و توالی که با تجربه انسانی طنینانداز میشود، تمرکز دارد، در حالی که برچسبگذاری خودکار تصویر از بینایی رایانهای برای شناسایی و دستهبندی اشیاء یا ویژگیهای خاص در یک قاب برای سازماندهی دادهها و قابلیت جستجو استفاده میکند.
هنر استفاده از تصاویر، گرافیک و ویدئو برای انتقال یک روایت یا برانگیختن احساسات خاص در مخاطب.
فرآیند استفاده از الگوریتمهای هوش مصنوعی برای تشخیص، برچسبگذاری و دستهبندی خودکار اشیاء در یک تصویر دیجیتال.
| ویژگی | داستانسرایی بصری | برچسبگذاری خودکار تصویر |
|---|---|---|
| هدف اصلی | تأثیر عاطفی و روایت | دستهبندی و بازیابی دادهها |
| مکانیسم اصلی | خلاقیت و همدلی انسانی | یادگیری ماشین و تشخیص الگو |
| فرمت خروجی | کمپینهای تبلیغاتی، فیلمها یا مقالههای تصویری | برچسبهای متنی، فراداده و متن جایگزین |
| آگاهی از زمینه | بالا (کنایه، حس و حال و معنای ضمنی متن را درک میکند) | کم (اشیاء را بدون معنای عمیقتر شناسایی میکند) |
| مقیاسپذیری | کم (نیازمند تلاش انسانی زمانبر است) | بالا (قابلیت مقیاسپذیری گسترده از طریق محاسبات ابری) |
| سوبژکتیویته | بسیار ذهنی و قابل تفسیر | هدف، دقت عینی و تحتاللفظی است |
| ابزارهای اصلی | دوربینها، ادوبی کریتیو کلود، استوریبوردها | APIهای TensorFlow، PyTorch، Cloud Vision |
داستانسرایی بصری برای تأثیرگذاری بر افراد طراحی شده است، چه به معنای متقاعد کردن آنها برای خرید یک محصول باشد و چه ایجاد یک احساس خاص در آنها. در مقابل، برچسبگذاری خودکار برای کمک به ماشینها در درک محتوای یک عکس وجود دارد تا انسانها بتوانند بعداً آن عکسها را پیدا کنند. یکی سفری را برای بیننده ایجاد میکند، در حالی که دیگری نقشهای برای یک پایگاه داده میسازد.
یک قصهگوی انسانی میداند که عکس یک چتر تنها در باران ممکن است نشاندهنده تنهایی یا انعطافپذیری باشد. یک ابزار برچسبگذاری هوش مصنوعی به سادگی «چتر» و «باران» را میبیند. این دستگاه فاقد توانایی درک وزن نمادین یا ظرافتهای فرهنگی است که یک داستان را برای مخاطب انسانی جذاب میکند.
شما نمیتوانید یک داستان قدرتمند را با عجله بنویسید؛ این کار نیاز به گردآوری دقیق و درک طرز فکر مخاطب دارد. با این حال، برچسبگذاری خودکار با حجم زیاد تصاویر رونق میگیرد. این روش میتواند کل یک کتابخانه شامل یک میلیون عکس را در زمانی که یک قصهگو برای انتخاب یک تصویر سربرگ صرف میکند، اسکن کند و این امر آن را برای برنامههای مدرن کلانداده ضروری میسازد.
در داستانسرایی، یک عکس تار ممکن است انتخابی عمدی برای نشان دادن حرکت یا هرج و مرج باشد. برای یک برچسبگذار خودکار، همان تاری ممکن است به عنوان یک خطای «کیفیت پایین» یا عدم شناسایی سوژه علامتگذاری شود. این موضوع شکاف بین دقت فنی و بیان هنری را برجسته میکند.
هوش مصنوعی در نهایت میتواند به طور کامل جایگزین قصهگویان انسانی شود.
اگرچه هوش مصنوعی میتواند طرحبندیها یا مضامین برچسبگذاریشده را پیشنهاد دهد، اما فاقد تجربه زیسته و همدلی لازم برای خلق داستانی است که واقعاً با روح انسان طنینانداز شود.
برچسبگذاری خودکار ۱۰۰٪ دقیق است.
الگوریتمها هنوز هم میتوانند با «موارد حاشیهای» مانند زوایای غیرمعمول دوربین، نورپردازی ضعیف یا اشیاء شبیه به هم، که منجر به خطاهای برچسبگذاری طنزآمیز یا حتی توهینآمیز میشود، دست و پنجه نرم کنند.
داستانسرایی بصری فقط در مورد تصاویر زیباست.
داستانسرایی واقعی شامل یک توالی استراتژیک و درک عمیق از روانشناسی مخاطب است؛ یک عکس زیبا بدون «جذابیت» داستان نیست.
برچسبگذاری دستی بهتر از برچسبگذاری هوش مصنوعی است.
برای پروژههای بزرگ، انسانها در واقع نسبت به هوش مصنوعی، ثبات کمتری دارند و بیشتر مستعد خستگی هستند، و همین امر سیستمهای خودکار را برای دستهبندی اولیه برتر میکند.
وقتی نیاز دارید با مخاطب در سطح شخصی یا احساسی ارتباط برقرار کنید، داستانسرایی بصری را انتخاب کنید. وقتی حجم عظیمی از محتوا دارید که باید سازماندهی، جستجو و برای سیستمهای پشتیبان قابل دسترسی باشد، به برچسبگذاری خودکار تصویر روی آورید.
در چشمانداز رسانههای مدرن، تنش عمیقی بین اقتصاد توجه - که تمرکز انسان را به عنوان کالایی کمیاب برای سودآوری در نظر میگیرد - و گفتمان مدنی، که برای حفظ یک دموکراسی سالم به تبادل آگاهانه و منطقی متکی است، وجود دارد. در حالی که یکی تعامل ویروسی را در اولویت قرار میدهد، دیگری خواستار مشارکت صبورانه و فراگیر است.
درک شکاف بین اخباری که برای تأیید تعصبات سیاسی خاص طراحی شدهاند و گزارشهایی که ریشه در بیطرفی دارند، برای سواد رسانهای مدرن حیاتی است. در حالی که پیامهای حزبی، یک دستور کار یا روایت ایدئولوژیک خاص را در اولویت قرار میدهند، گزارشهای بیطرفانه تلاش میکنند حقایق قابل تأیید را بدون جانبداری ارائه دهند و به مخاطب اجازه دهند تا بر اساس شواهد ارائه شده، نتیجهگیریهای خود را انجام دهد.
این مقایسه، تنش بین عکاسی به عنوان رسانهای برای بیان خلاقانه فردی و نقش مدرن آن به عنوان مخزن عظیمی از اطلاعات بصری که برای آموزش مدلهای یادگیری ماشین و سازماندهی دادههای جهانی استفاده میشود را بررسی میکند.