AI 데이터셋은 학습에 '훌륭한' 예술 작품이 필요하지 않습니다.
실제로 데이터 세트에 포함된 고품질의 구도 좋은 사진은 저품질 스냅샷보다 모델이 깊이, 조명 및 질감을 훨씬 더 잘 이해하는 데 도움이 됩니다.
이 비교 분석은 개인의 창의적 표현 매체로서의 사진과, 기계 학습 모델을 훈련하고 전 세계 데이터를 정리하는 데 사용되는 방대한 시각 정보 저장소로서의 현대적 역할 사이의 긴장 관계를 탐구합니다.
의도적으로 카메라를 사용하여 비전을 표현하거나, 감정을 불러일으키거나, 현실에 대한 독특한 관점을 제공하는 것.
분석, 분류 또는 AI 학습을 위한 원시 데이터 포인트로 취급되는 방대한 양의 이미지 모음.
| 기능 | 사진은 예술이다 | 사진 데이터셋 |
|---|---|---|
| 기본 값 | 미적 깊이와 감정적 깊이 | 정보 밀도 및 유용성 |
| 원하는 결과 | 인간관계 또는 성찰 | 알고리즘 정확도 및 예측 |
| 이상적인 볼륨 | 소규모로 엄선된 컬렉션 | 엑사바이트 규모의 다양한 시각 데이터 |
| 창조자의 역할 | 저자의 주관적 관점 | 데이터 제공자(객관적 출처) |
| 성공 지표 | 문화적 영향 또는 비평가들의 호평 | 높은 정밀도 및 재현율 |
| 메타데이터의 중요성 | 시각적 경험 다음으로 중요한 것 | 색인 및 교육용 기본 사항 |
| 해석 | 개방적이고 개인적입니다 | 고정형, 레이블형, 범주형 |
예술 사진에서 조리개부터 셔터가 눌리는 순간까지 모든 선택은 의도적인 자기표현 행위입니다. 반대로 사진이 데이터셋으로 사용될 때는 사진을 찍은 '이유'는 중요하지 않습니다. 시스템은 컴퓨터가 다양한 조명 조건에서 정지 표지판이나 고양이를 식별할 수 있도록 '무엇'을 담았을 때만 관심을 갖습니다.
예술가는 이야기를 담아낼 결정적인 한 장의 사진을 찍기 위해 완벽한 빛을 몇 주 동안 기다릴 수도 있습니다. 하지만 빅데이터의 세계에서 그 완벽한 이미지 한 장은 바다의 한 방울에 불과합니다. 데이터셋은 양과 다양성을 중시하며, 인공지능이 현실의 복잡하고 불완전한 면모를 이해하도록 돕기 위해 '나쁜' 사진이나 흐릿한 사진까지 포함하는 경우가 많습니다.
예술 사진은 창작자와 감상자, 두 인간을 이어주는 다리 역할을 하며 공감이나 경외감을 불러일으키는 순간을 공유하게 합니다. 하지만 데이터셋은 그 사진을 단순히 숫자로 이루어진 행렬로 취급합니다. 알고리즘에게 일몰은 아름다운 것이 아니라, '야외 자연광'이라는 레이블과 일치하는 특정 빈도의 붉은색과 주황색 픽셀일 뿐입니다.
예술 작품의 경우, 맥락은 종종 해당 매체의 역사나 작가의 삶이 됩니다. 하지만 데이터 세트의 경우, 맥락은 엄격하게 구조적인 것입니다. GPS 좌표, 타임스탬프, 객체 태그와 같은 메타데이터는 데이터 세트의 핵심이며, 시각적 경험을 소프트웨어에서 검색 가능하고 기능적인 도구로 만들어 줍니다.
AI 데이터셋은 학습에 '훌륭한' 예술 작품이 필요하지 않습니다.
실제로 데이터 세트에 포함된 고품질의 구도 좋은 사진은 저품질 스냅샷보다 모델이 깊이, 조명 및 질감을 훨씬 더 잘 이해하는 데 도움이 됩니다.
사진을 데이터셋으로 활용하는 것은 새로운 개념입니다.
1800년대부터 사진은 디지털 AI가 존재하기 훨씬 이전부터 의료 기록, 천문 지도 제작, 경찰 기록 보관소 등의 데이터 세트로 사용되어 왔습니다.
예술가는 자신의 작품을 데이터 세트로 사용할 수 없습니다.
많은 현대 예술가들은 이제 자신의 개인 아카이브를 기반으로 자체 AI 모델을 훈련시켜 자신의 스타일을 반영하는 새롭고 독특한 '합성' 예술 작품을 생성합니다.
데이터 이미지는 본질적으로 지루하다.
때로는 위성 이미지나 수천 장의 스트리트 뷰 사진처럼 방대한 데이터 세트가 뜻밖의, 잊히지 않을 아름다움을 드러내기도 합니다.
영감을 주거나, 복잡한 메시지를 전달하거나, 지속적인 유산을 남기고자 할 때는 '예술' 관점을 선택하세요. 기술적인 문제를 해결하거나, 시각적 작업을 자동화하거나, 전 세계 이미지에서 광범위한 패턴을 이해해야 할 때는 '데이터셋' 관점을 채택하세요.
현대 미디어 환경에서는 인간의 관심을 희소한 상품으로 여겨 수익 창출의 대상으로 삼는 '관심 경제'와, 건강한 민주주의를 유지하기 위해 신중하고 이성적인 소통에 의존하는 '시민 담론' 사이에 심각한 긴장 관계가 존재합니다. 전자는 바이럴 마케팅을 통한 빠른 참여를 중시하는 반면, 후자는 인내심 있고 포용적인 참여를 요구합니다.
두 분야 모두 디지털 이미지를 해석하는 것과 관련이 있지만, 시각적 스토리텔링은 인간의 경험과 공감대를 형성하는 감정적인 서사와 순서를 구성하는 데 중점을 두는 반면, 자동 이미지 라벨링은 컴퓨터 비전을 활용하여 프레임 내의 특정 객체 또는 속성을 식별하고 분류하여 데이터를 구성하고 검색 가능하게 만드는 데 중점을 둡니다.
특정 정치적 편향을 강화하기 위해 만들어진 뉴스와 중립성에 기반한 보도 사이의 차이를 이해하는 것은 현대 미디어 리터러시에 필수적입니다. 편향적인 메시지는 특정 이념적 의제나 서사를 우선시하는 반면, 객관적인 보도는 어느 편에도 서지 않고 검증 가능한 사실을 제시하여 시청자가 제공된 증거에 기반하여 스스로 결론을 내릴 수 있도록 합니다.