การเรียนรู้การแสดงผลในภาพถ่ายดาวเทียมคืออะไร?
การเรียนรู้แบบแทนข้อมูล (Representation learning) เป็นสาขาหนึ่งของการเรียนรู้เชิงลึก (Deep learning) ที่โครงข่ายประสาทเทียมเรียนรู้ที่จะเข้ารหัสภาพถ่ายดาวเทียมให้เป็นเวกเตอร์ที่มีขนาดกะทัดรัดและให้ข้อมูลโดยไม่ต้องอาศัยคุณลักษณะที่ออกแบบด้วยมือ โมเดลต่างๆ เช่น โครงข่ายประสาทแบบคอนโวลูชัน (Convolutional networks), วิชั่นทรานส์ฟอร์เมอร์ (Vision transformers) และเฟรมเวิร์กแบบกำกับตนเอง (Self-supervised frameworks) เช่น SimCLR หรือ MAE ค้นพบรูปแบบโดยตรงจากพิกเซล โดยมักใช้คลังข้อมูลขนาดใหญ่จาก Sentinel-2, Landsat หรือกลุ่มดาวเทียมเชิงพาณิชย์
ลักษณะงานฝีมือทั่วไปที่ใช้ในการสำรวจระยะไกลมีอะไรบ้าง?
ตัวชี้วัดที่ใช้กันทั่วไป ได้แก่ ดัชนีสเปกตรัม เช่น NDVI สำหรับพืชพรรณ NDWI สำหรับแหล่งน้ำ และ NDBI สำหรับพื้นที่สิ่งปลูกสร้าง การวัดพื้นผิว เช่น ความคมชัดของ GLCM และการตอบสนองของตัวกรองกาบอร์ จะจับโครงสร้างเชิงพื้นที่ ในขณะที่คุณลักษณะทางสัณฐานวิทยาจะอธิบายรูปร่างของวัตถุ โดยทั่วไปแล้ว ข้อมูลเหล่านี้จะถูกป้อนเข้าสู่ตัวจำแนกประเภท เช่น Random Forests, Support Vector Machines หรือ gradient-boosted trees
วิธีการใดเหมาะสมกว่าสำหรับชุดข้อมูลดาวเทียมขนาดเล็ก?
การสร้างคุณลักษณะด้วยมือมักได้ผลดีกว่าเมื่อข้อมูลที่มีป้ายกำกับมีน้อย เพราะคุณลักษณะเหล่านั้นได้เข้ารหัสความหมายทางกายภาพไว้แล้ว และลดความจำเป็นในการใช้ชุดข้อมูลฝึกฝนขนาดใหญ่ การเรียนรู้การแสดงผลยังคงช่วยได้ผ่านการเรียนรู้แบบถ่ายโอน โดยที่แบบจำลองที่ได้รับการฝึกฝนล่วงหน้าบนคลังข้อมูลขนาดใหญ่จะถูกปรับแต่งเพิ่มเติมบนชุดข้อมูลเป้าหมายขนาดเล็ก
การเรียนรู้การแสดงผลและคุณลักษณะที่สร้างขึ้นด้วยมือสามารถผสานรวมกันได้หรือไม่?
ใช่แล้ว และวิธีการแบบผสมผสานนี้กำลังได้รับความนิยมมากขึ้นเรื่อยๆ นักวิจัยมักจะนำข้อมูลฝังตัวที่เรียนรู้มาเชื่อมต่อกับดัชนีแบบดั้งเดิม เช่น NDVI หรือตัวบ่งชี้พื้นผิว ก่อนที่จะป้อนเข้าสู่ตัวจำแนกประเภท ซึ่งเป็นการผสมผสานพลังการค้นหารูปแบบของเครือข่ายประสาทเทียมเชิงลึกเข้ากับพื้นฐานทางกายภาพของคุณลักษณะที่ออกแบบโดยผู้เชี่ยวชาญ
โมเดลการเรียนรู้เชิงลึกของดาวเทียมต้องการข้อมูลมากแค่ไหน?
ขึ้นอยู่กับงาน แต่โดยทั่วไปแล้วโมเดลแบบมีผู้กำกับดูแล (supervised models) จำเป็นต้องใช้ภาพที่มีป้ายกำกับหลายพันถึงหลายล้านภาพเพื่อให้ได้ประสิทธิภาพที่ดี ส่วนวิธีการแบบมีผู้กำกับดูแลด้วยตนเอง (self-supervised methods) จะลดความต้องการนี้ลงอย่างมากโดยการฝึกฝนล่วงหน้าด้วยภาพที่ไม่มีป้ายกำกับ ซึ่งบางครั้งอาจใช้ภาพย่อยหลายร้อยล้านภาพจากภารกิจต่างๆ เช่น Sentinel-2
มีแบบจำลองฐานรากดาวเทียมที่เปิดเผยต่อสาธารณะหรือไม่?
มีหลายโมเดลที่เปิดให้ใช้งานแล้ว เช่น โมเดล Prithvi ของ NASA, SatMAE ของ IBM และ NASA รวมถึงตระกูล SatVision จากกลุ่มวิจัยต่างๆ Hugging Face รวบรวมโมเดลเหล่านี้ไว้มากมาย พร้อมด้วยโค้ดสำหรับการฝึกฝนเบื้องต้นและตัวอย่างการปรับแต่งสำหรับงานต่างๆ เช่น การทำแผนที่น้ำท่วมและการจำแนกประเภทพืชผล
ทำไมนักวิทยาศาสตร์ยังคงใช้ NDVI ในเมื่อมีเทคโนโลยีการเรียนรู้เชิงลึกอยู่แล้ว?
ดัชนี NDVI นั้นเรียบง่าย รวดเร็ว มีความหมายเชิงกายภาพ และสามารถเปรียบเทียบได้จากข้อมูลในอดีตหลายทศวรรษ สำหรับการติดตามแนวโน้มของพืชพรรณ การประเมินภัยแล้ง หรือการรายงานทางการเกษตร ดัชนีที่ตีความได้มักจะดีกว่าแบบจำลองแบบกล่องดำ การเรียนรู้เชิงลึกช่วยเสริมมากกว่าที่จะมาแทนที่ดัชนีเหล่านี้ในขั้นตอนการทำงานหลายอย่าง
ต้องใช้ฮาร์ดแวร์อะไรบ้างในการฝึกฝนโมเดลการเรียนรู้การแสดงภาพดาวเทียม?
การฝึกฝนโมเดลพื้นฐานของดาวเทียมสมัยใหม่ตั้งแต่เริ่มต้นโดยทั่วไปแล้วต้องใช้ GPU ระดับสูงหลายตัว เช่น NVIDIA A100 หรือ H100 ซึ่งมักใช้เวลาหลายวันหรือหลายสัปดาห์ การปรับแต่งโมเดลที่ได้รับการฝึกฝนมาก่อนแล้วนั้นมีราคาถูกกว่ามาก และบางครั้งสามารถทำได้บน GPU สำหรับผู้บริโภคเพียงตัวเดียว หรือแม้แต่โน้ตบุ๊กสำหรับระบบคลาวด์
คุณประเมินอย่างไรว่าวิธีการใดได้ผลดีกว่ากัน?
มาตรฐานการวัดผลอย่าง EuroSAT, BigEarthNet, SEN12MS และ IEEE Data Fusion Contest ให้ชุดข้อมูลที่มีป้ายกำกับและตัวชี้วัดที่สม่ำเสมอ เช่น ความแม่นยำโดยรวม คะแนน F1 และค่าเฉลี่ย Intersection over Union นอกจากนี้ยังมีการใช้การตรวจสอบแบบไขว้ การศึกษาการตัดทอน และการเปรียบเทียบกับฐานข้อมูลที่ใช้งานอยู่ เช่น Copernicus Global Land Service เป็นเรื่องปกติเช่นกัน
งานฝีมือแบบดั้งเดิมจะหายไปในทศวรรษหน้าหรือไม่?
ไม่น่าเป็นไปได้ ในขณะที่การเรียนรู้การแสดงผลจะได้รับความนิยมมากขึ้นเรื่อยๆ แต่คุณลักษณะที่สร้างขึ้นด้วยมือจะให้ความสามารถในการตีความและรากฐานทางกายภาพที่แบบจำลองเชิงลึกทำได้ยาก คาดว่าไปป์ไลน์แบบไฮบริด ซึ่งการแสดงผลที่เรียนรู้และดัชนีที่ออกแบบโดยผู้เชี่ยวชาญทำงานร่วมกัน จะครองตลาดการสำรวจระยะไกลในระดับการผลิตไปอีกหลายปีข้างหน้า