پیشبینی مبتنی بر نمودار در مقابل تحلیل سریهای زمانی سنتی
این مقایسه، تغییر از نگاه به جریانهای داده منفرد به صورت جداگانه به مدلسازی آنها به عنوان یک شبکه به هم پیوسته از تأثیرات را بررسی میکند. در حالی که روشهای سنتی بر خود-اصلاحی تاریخی متکی هستند، رویکردهای مبتنی بر نمودار از وابستگیهای مکانی و رابطهای بین متغیرهای متعدد برای پیشبینی نتایج آینده با دقت زمینهای بسیار بالاتر استفاده میکنند.
برجستهها
مدلهای سنتی به گذشته نگاه میکنند؛ مدلهای نموداری به همسایهها «از پهلو» نگاه میکنند.
روشهای گراف، مشکل «سیلوهای داده» را با ادغام جریانهای مرتبط حل میکنند.
آمار کلاسیک همچنان استاندارد طلایی برای برنامهریزی ساده و کوچک کسب و کار است.
شبکههای عصبی نسل بعدی (GNN) میتوانند با دیدن اتصالاتی که ممکن است انسانها از دست بدهند، رویدادهایی مانند نوسانات برق را پیشبینی کنند.
پیشبینی مبتنی بر نمودار چیست؟
یک روش پیشبینی مدرن با استفاده از شبکههای عصبی گراف (GNN) برای مدلسازی دادههای چند متغیره به عنوان گرهها و لبهها.
این روش در ثبت وابستگیهای «مکانی-زمانی» که در آنها رفتار یک متغیر توسط متغیرهای همسایهاش تعیین میشود، عالی عمل میکند.
این مدل میتواند ساختار گراف زیربنایی را حتی اگر روابط فیزیکی به صراحت تعریف نشده باشند، یاد بگیرد.
این روش به طور گسترده در سیستمهای با پیچیدگی بالا مانند پیشبینی جریان ترافیک، شبکههای برق و لجستیک زنجیره تأمین استفاده میشود.
با در نظر گرفتن سریهای زمانی به عنوان گره، «نفرین ابعاد» رایج در مجموعه دادههای چند متغیره عظیم را کاهش میدهد.
گوگل مپس به طور مشهوری از شبکههای عصبی مصنوعی (GNN) برای بهبود دقت تخمین زمان رسیدن (ETA) تا ۵۰٪ در برخی مناطق استفاده کرد.
تحلیل سریهای زمانی سنتی چیست؟
تکنیکهای آماری کلاسیک بر تجزیه یک توالی واحد از دادهها به روند، فصلی بودن و نویز تمرکز داشتند.
مدلهای اصلی مانند ARIMA و هموارسازی نمایی به شدت به فرض «ایستایی» دادهها متکی هستند.
این روش عمدتاً بر خودهمبستگی تمرکز دارد، که رابطه بین یک متغیر و مقادیر گذشته آن است.
این مدلها قابلیت تفسیر بالایی دارند و به تحلیلگران کمک میکنند تا به راحتی توضیح دهند که چرا یک پیشبینی خاص ایجاد شده است.
آنها معمولاً در مقایسه با جایگزینهای یادگیری عمیق، به قدرت محاسباتی و دادههای بسیار کمتری نیاز دارند.
Prophet که توسط متا توسعه داده شده است، یک تکامل مدرن محبوب است که تعطیلات و دادههای از دست رفته را از طریق مدلسازی افزایشی مدیریت میکند.
جدول مقایسه
ویژگی
پیشبینی مبتنی بر نمودار
تحلیل سریهای زمانی سنتی
تمرکز اصلی
روابط بین سریها
الگوهای درون سری
پیچیدگی دادهها
بالا (چند متغیره/پیوندی)
کم تا متوسط (تک متغیره)
تفسیرپذیری
پایین (طبیعت جعبه سیاه)
بالاتر (پارامترهای آماری)
هزینه محاسباتی
بالا (نیازمند پردازنده گرافیکی)
کم (روی پردازندههای استاندارد اجرا میشود)
مورد استفاده ایدهآل
ترافیک/شبکههای هوشمند شهری
فروش خرده فروشی/موجودی انبار
مقیاسپذیری
مقیاسهایی با چگالی شبکه
ترازو با تعداد سری
رسیدگی به کمک فنرها
از طریق شبکه پخش میشود
از طریق عبارات خطا ثبت شده است
مقایسه دقیق
انزوا در مقابل اتصال
تحلیل سریهای زمانی سنتی با هر جریان داده مانند یک دونده تنها در یک مسیر برخورد میکند و فقط به سرعت گذشته آنها نگاه میکند تا سرعت آیندهشان را حدس بزند. پیشبینی مبتنی بر نمودار، کل ورزشگاه را میبیند و میفهمد که اگر دونده در لاین یک زمین بخورد، احتمالاً باعث میشود دونده در لاین دو منحرف شود. این توانایی در مدلسازی اثرات موجی، روشهای نموداری را برای سیستمهایی که موجودیتها از نظر فیزیکی یا منطقی به هم متصل هستند، بسیار برتر میکند.
تلهی ایستایی
مدلهای کلاسیک مانند ARIMA اغلب با دادههای «غیر ایستا» - اطلاعاتی که در آنها میانگین یا واریانس در طول زمان تغییر میکند - مشکل دارند و نیاز به تبدیلهای پیچیدهای مانند تفاضلگیری دارند. شبکههای عصبی گراف بسیار انعطافپذیرتر هستند و از لایههای یادگیری عمیق خود برای هضم الگوهای غیرخطی و تغییرات ناگهانی بدون نیاز به تثبیت کامل دادهها از قبل استفاده میکنند. این امر آنها را برای دادههای نامنظم و آشفته موجود در محیطهای صنعتی دنیای واقعی کاربردیتر میکند.
تقاضای منابع و بهرهوری
یک بدهبستان قابل توجه در «قیمت دقت» وجود دارد. مدلهای سنتی را میتوان در عرض چند ثانیه روی یک لپتاپ ساده مستقر کرد و برای پیشبینیهای تجاری سریع و «به اندازه کافی خوب» عالی هستند. با این حال، سیستمهای مبتنی بر نمودار برای مدیریت گرهها و لبهها به سختافزار تخصصی و یک خط لوله داده پیشرفته نیاز دارند. در حالی که آنها بینش عمیقتری ارائه میدهند، هزینه آموزش و نگهداری این مدلها اغلب آنها را برای متغیرهای ساده و مستقل بیش از حد میکند.
شفافیت و اعتماد
وقتی یک مدل سنتی، کاهش ۱۰ درصدی فروش را پیشبینی میکند، یک تحلیلگر میتواند برای توضیح دلیل آن به یک ضریب فصلی خاص یا یک روند میانگین متحرک اشاره کند. مدلهای نموداری در «فضاهای پنهان» عمل میکنند و تشخیص دلیل دقیق یک پیشبینی را بسیار دشوارتر میکنند. این ماهیت «جعبه سیاه» میتواند در صنایعی مانند امور مالی یا مراقبتهای بهداشتی، که در آنها ذینفعان اغلب درک «چرایی» را به اندازه «چه چیزی» در اولویت قرار میدهند، یک مانع باشد.
مزایا و معایب
پیشبینی مبتنی بر نمودار
مزایا
+جلوههای موجی پیچیده را ثبت میکند
+دادههای غیرخطی را مدیریت میکند
+دقت چند متغیره برتر
+روابط پنهان را میآموزد
مصرف شده
−از نظر محاسباتی گران است
−نیاز به مجموعه دادههای عظیم
−تفسیرش سختتره
−پیچیدگی در پیادهسازی
سریهای زمانی سنتی
مزایا
+سریع و سبک
+شفافیت بالای مدل
+با دادههای کوچک کار میکند
+خودکارسازی آسان
مصرف شده
−نادیده گرفتن نفوذ خارجی
−روندهای خطی را فرض میکند
−در هنگام شوک سیستم از کار میافتد
−مهندسی ویژگی دستی
تصورات نادرست رایج
افسانه
پیشبینی مبتنی بر نمودار همیشه دقیقتر از ARIMA است.
واقعیت
نه لزوماً. اگر جریانهای داده شما واقعاً مستقل باشند - مانند فروش محصولات غیرمرتبط در کشورهای مختلف - یک مدل ساده ARIMA اغلب با اجتناب از «نویز» غیرضروری ناشی از ارتباطات نامربوط، از یک مدل گراف پیچیده بهتر عمل میکند.
افسانه
برای استفاده از پیشبینی نموداری به یک نقشه فیزیکی نیاز دارید.
واقعیت
شبکههای عصبی نسل جدید (GNN) در واقع میتوانند یک نمودار را «استنتاج» کنند. حتی اگر نقشهای از ارتباطات نداشته باشید، مدل میتواند نحوهی حرکت متغیرها را با هم بررسی کند و شبکهی داخلی خود از روابط را برای بهبود پیشبینیهایش بسازد.
افسانه
یادگیری عمیق، آمار سنتی را منسوخ کرده است.
واقعیت
در بسیاری از زمینههای تجاری، سادگی و سرعت آمار سنتی پیروز میشود. اکثر داشبوردهای «بلادرنگ» هنوز از هموارسازی کلاسیک یا Prophet استفاده میکنند زیرا نتایج پایداری را بدون تأخیر بالای یادگیری عمیق ارائه میدهند.
افسانه
دادههای بیشتر همیشه مدلهای نموداری را بهتر میکنند.
واقعیت
مدلهای گراف به شدت به «لبههای نویزی» حساس هستند. اگر به آنها اتصالاتی بدهید که در واقع بر یکدیگر تأثیری ندارند، دقت مدل میتواند در واقع کاهش یابد، زیرا تلاش میکند در تصادفات تصادفی معنایی پیدا کند.
سوالات متداول
چه زمانی باید از Prophet به یک شبکه عصبی گراف (Graph Neural Network) مهاجرت کنم؟
وقتی پیشبینیهای «فردی» شما به طور مداوم توسط عوامل خارجی که نمیتوانید آنها را در نظر بگیرید، خراب میشوند، باید این اقدام را در نظر بگیرید. اگر زمان تحویل را پیشبینی میکنید و متوجه میشوید که تأخیر در یک انبار همیشه بر پنج انبار دیگر تأثیر میگذارد، یک رویکرد نموداری به شما کمک میکند تا آن آلودگی متقابل را به روشی مدلسازی کنید که Prophet به سادگی نمیتواند.
آیا پیشبینی نموداری برای بازار سهام بهتر است؟
این نویدبخش اما دشوار است. در حالی که سهام قطعاً به هم پیوسته هستند، «اختلال» در بازارهای مالی آنقدر زیاد است که مدلهای نموداری اغلب به تطابقهای موقت بیشبرازش میدهند. اکثر سیستمهای مالی موفق از یک رویکرد ترکیبی استفاده میکنند که مدلهای سنتی نوسان را با تحلیل احساسات مبتنی بر نمودار از شبکههای اجتماعی ترکیب میکند.
بخش «مکانی» پیشبینی مکانی-زمانی چیست؟
مؤلفه «مکانی» به موقعیت یا رابطه نقاط داده اشاره دارد. در پیشبینی ترافیک، این فاصله فیزیکی بین حسگرهای جادهای است. در یک موتور پیشنهاد، ممکن است «فاصله» بین دو کاربر بر اساس سلیقههای مشابه آنها باشد. اساساً یک «مکان» به «زمان» سریهای زمانی اضافه میکند.
آیا میتوانم از پیشبینی نموداری استفاده کنم اگر فقط یک جریان داده داشته باشم؟
از نظر فنی، خیر. روشهای مبتنی بر نمودار برای تشکیل یک «گراف» حداقل به دو موجودیت مرتبط نیاز دارند. اگر فقط یک جریان داده دارید، بهتر است به مدلهای سنتی تک متغیره مانند Holt-Winters یا LSTM که بهطور خاص برای بررسی عمیق یک توالی واحد طراحی شدهاند، پایبند باشید.
این مدلها چگونه رویدادهای «قوی سیاه» را مدیریت میکنند؟
مدلهای سنتی معمولاً این موارد را به عنوان دادههای پرت در نظر میگیرند و نادیده میگیرند، که میتواند خطرناک باشد. مدلهای نموداری کمی بهتر هستند زیرا ممکن است شوک را از یک گوشه شبکه شروع کنند و شما را از نحوه گسترش آن به بقیه آگاه کنند، اگرچه هیچ مدلی در پیشبینی رویدادهای بیسابقه کامل نیست.
نگهداری کدام یک در محیط تولید آسانتر است؟
مدلهای سنتی بسیار آسانتر هستند. آنها قطعات متحرک کمتری دارند، به نظارت کمتری برای «رانش دادهها» نیاز دارند و میتوانند در عرض چند ثانیه دوباره آموزش داده شوند. مدلهای گراف نیاز به «بررسی سلامت» مداوم توپولوژی شبکه دارند. اگر نحوه اتصال موجودیتهای شما تغییر کند، ممکن است کل مدل به یک بازسازی کامل نیاز داشته باشد.
آیا پیشبینی نموداری برای مدیریت زنجیره تأمین مفید است؟
بله، این یکی از قویترین موارد استفاده آن است. از آنجا که زنجیرههای تأمین، شبکههایی واقعی از گرهها (کارخانهها) و لبهها (مسیرهای حمل و نقل) هستند، مدلهای گراف کاملاً مناسب پیشبینی این هستند که چگونه کمبود یک ماده اولیه واحد، هفتهها بعد در کل فرآیند تولید سرایت خواهد کرد.
برای پیشبینی مبتنی بر نمودار به چه نرمافزاری نیاز دارم؟
شما معمولاً به چارچوبهای مبتنی بر پایتون مانند PyTorch Geometric یا Deep Graph Library (DGL) نیاز خواهید داشت. برخلاف آمار سنتی که تقریباً در هر صفحه گسترده یا ابزار BI پایه موجود است، پیشبینی نمودار تقریباً به طور کامل در قلمرو خطوط لوله یادگیری ماشین با کد سفارشی قرار دارد.
حکم
برای معیارهای ساده کسب و کار که در آنها قابلیت تفسیر و سربار کم اولویتهای اصلی شما هستند، تحلیل سریهای زمانی سنتی را انتخاب کنید. وقتی سیستمهای پیچیده و به هم پیوسته را مدیریت میکنید که در آنها روابط بین متغیرها به اندازه خود نقاط داده مهم هستند، به پیشبینی مبتنی بر نمودار روی آورید.