Comparthing Logo
یادگیری ماشینیپیش‌بینیعلم دادهتحلیل‌ها

پیش‌بینی مبتنی بر نمودار در مقابل تحلیل سری‌های زمانی سنتی

این مقایسه، تغییر از نگاه به جریان‌های داده منفرد به صورت جداگانه به مدل‌سازی آنها به عنوان یک شبکه به هم پیوسته از تأثیرات را بررسی می‌کند. در حالی که روش‌های سنتی بر خود-اصلاحی تاریخی متکی هستند، رویکردهای مبتنی بر نمودار از وابستگی‌های مکانی و رابطه‌ای بین متغیرهای متعدد برای پیش‌بینی نتایج آینده با دقت زمینه‌ای بسیار بالاتر استفاده می‌کنند.

برجسته‌ها

  • مدل‌های سنتی به گذشته نگاه می‌کنند؛ مدل‌های نموداری به همسایه‌ها «از پهلو» نگاه می‌کنند.
  • روش‌های گراف، مشکل «سیلوهای داده» را با ادغام جریان‌های مرتبط حل می‌کنند.
  • آمار کلاسیک همچنان استاندارد طلایی برای برنامه‌ریزی ساده و کوچک کسب و کار است.
  • شبکه‌های عصبی نسل بعدی (GNN) می‌توانند با دیدن اتصالاتی که ممکن است انسان‌ها از دست بدهند، رویدادهایی مانند نوسانات برق را پیش‌بینی کنند.

پیش‌بینی مبتنی بر نمودار چیست؟

یک روش پیش‌بینی مدرن با استفاده از شبکه‌های عصبی گراف (GNN) برای مدل‌سازی داده‌های چند متغیره به عنوان گره‌ها و لبه‌ها.

  • این روش در ثبت وابستگی‌های «مکانی-زمانی» که در آن‌ها رفتار یک متغیر توسط متغیرهای همسایه‌اش تعیین می‌شود، عالی عمل می‌کند.
  • این مدل می‌تواند ساختار گراف زیربنایی را حتی اگر روابط فیزیکی به صراحت تعریف نشده باشند، یاد بگیرد.
  • این روش به طور گسترده در سیستم‌های با پیچیدگی بالا مانند پیش‌بینی جریان ترافیک، شبکه‌های برق و لجستیک زنجیره تأمین استفاده می‌شود.
  • با در نظر گرفتن سری‌های زمانی به عنوان گره، «نفرین ابعاد» رایج در مجموعه داده‌های چند متغیره عظیم را کاهش می‌دهد.
  • گوگل مپس به طور مشهوری از شبکه‌های عصبی مصنوعی (GNN) برای بهبود دقت تخمین زمان رسیدن (ETA) تا ۵۰٪ در برخی مناطق استفاده کرد.

تحلیل سری‌های زمانی سنتی چیست؟

تکنیک‌های آماری کلاسیک بر تجزیه یک توالی واحد از داده‌ها به روند، فصلی بودن و نویز تمرکز داشتند.

  • مدل‌های اصلی مانند ARIMA و هموارسازی نمایی به شدت به فرض «ایستایی» داده‌ها متکی هستند.
  • این روش عمدتاً بر خودهمبستگی تمرکز دارد، که رابطه بین یک متغیر و مقادیر گذشته آن است.
  • این مدل‌ها قابلیت تفسیر بالایی دارند و به تحلیلگران کمک می‌کنند تا به راحتی توضیح دهند که چرا یک پیش‌بینی خاص ایجاد شده است.
  • آنها معمولاً در مقایسه با جایگزین‌های یادگیری عمیق، به قدرت محاسباتی و داده‌های بسیار کمتری نیاز دارند.
  • Prophet که توسط متا توسعه داده شده است، یک تکامل مدرن محبوب است که تعطیلات و داده‌های از دست رفته را از طریق مدل‌سازی افزایشی مدیریت می‌کند.

جدول مقایسه

ویژگی پیش‌بینی مبتنی بر نمودار تحلیل سری‌های زمانی سنتی
تمرکز اصلی روابط بین سری‌ها الگوهای درون سری
پیچیدگی داده‌ها بالا (چند متغیره/پیوندی) کم تا متوسط (تک متغیره)
تفسیرپذیری پایین (طبیعت جعبه سیاه) بالاتر (پارامترهای آماری)
هزینه محاسباتی بالا (نیازمند پردازنده گرافیکی) کم (روی پردازنده‌های استاندارد اجرا می‌شود)
مورد استفاده ایده‌آل ترافیک/شبکه‌های هوشمند شهری فروش خرده فروشی/موجودی انبار
مقیاس‌پذیری مقیاس‌هایی با چگالی شبکه ترازو با تعداد سری
رسیدگی به کمک فنرها از طریق شبکه پخش می‌شود از طریق عبارات خطا ثبت شده است

مقایسه دقیق

انزوا در مقابل اتصال

تحلیل سری‌های زمانی سنتی با هر جریان داده مانند یک دونده تنها در یک مسیر برخورد می‌کند و فقط به سرعت گذشته آنها نگاه می‌کند تا سرعت آینده‌شان را حدس بزند. پیش‌بینی مبتنی بر نمودار، کل ورزشگاه را می‌بیند و می‌فهمد که اگر دونده در لاین یک زمین بخورد، احتمالاً باعث می‌شود دونده در لاین دو منحرف شود. این توانایی در مدل‌سازی اثرات موجی، روش‌های نموداری را برای سیستم‌هایی که موجودیت‌ها از نظر فیزیکی یا منطقی به هم متصل هستند، بسیار برتر می‌کند.

تله‌ی ایستایی

مدل‌های کلاسیک مانند ARIMA اغلب با داده‌های «غیر ایستا» - اطلاعاتی که در آن‌ها میانگین یا واریانس در طول زمان تغییر می‌کند - مشکل دارند و نیاز به تبدیل‌های پیچیده‌ای مانند تفاضل‌گیری دارند. شبکه‌های عصبی گراف بسیار انعطاف‌پذیرتر هستند و از لایه‌های یادگیری عمیق خود برای هضم الگوهای غیرخطی و تغییرات ناگهانی بدون نیاز به تثبیت کامل داده‌ها از قبل استفاده می‌کنند. این امر آن‌ها را برای داده‌های نامنظم و آشفته موجود در محیط‌های صنعتی دنیای واقعی کاربردی‌تر می‌کند.

تقاضای منابع و بهره‌وری

یک بده‌بستان قابل توجه در «قیمت دقت» وجود دارد. مدل‌های سنتی را می‌توان در عرض چند ثانیه روی یک لپ‌تاپ ساده مستقر کرد و برای پیش‌بینی‌های تجاری سریع و «به اندازه کافی خوب» عالی هستند. با این حال، سیستم‌های مبتنی بر نمودار برای مدیریت گره‌ها و لبه‌ها به سخت‌افزار تخصصی و یک خط لوله داده پیشرفته نیاز دارند. در حالی که آنها بینش عمیق‌تری ارائه می‌دهند، هزینه آموزش و نگهداری این مدل‌ها اغلب آنها را برای متغیرهای ساده و مستقل بیش از حد می‌کند.

شفافیت و اعتماد

وقتی یک مدل سنتی، کاهش ۱۰ درصدی فروش را پیش‌بینی می‌کند، یک تحلیلگر می‌تواند برای توضیح دلیل آن به یک ضریب فصلی خاص یا یک روند میانگین متحرک اشاره کند. مدل‌های نموداری در «فضاهای پنهان» عمل می‌کنند و تشخیص دلیل دقیق یک پیش‌بینی را بسیار دشوارتر می‌کنند. این ماهیت «جعبه سیاه» می‌تواند در صنایعی مانند امور مالی یا مراقبت‌های بهداشتی، که در آن‌ها ذینفعان اغلب درک «چرایی» را به اندازه «چه چیزی» در اولویت قرار می‌دهند، یک مانع باشد.

مزایا و معایب

پیش‌بینی مبتنی بر نمودار

مزایا

  • + جلوه‌های موجی پیچیده را ثبت می‌کند
  • + داده‌های غیرخطی را مدیریت می‌کند
  • + دقت چند متغیره برتر
  • + روابط پنهان را می‌آموزد

مصرف شده

  • از نظر محاسباتی گران است
  • نیاز به مجموعه داده‌های عظیم
  • تفسیرش سخت‌تره
  • پیچیدگی در پیاده‌سازی

سری‌های زمانی سنتی

مزایا

  • + سریع و سبک
  • + شفافیت بالای مدل
  • + با داده‌های کوچک کار می‌کند
  • + خودکارسازی آسان

مصرف شده

  • نادیده گرفتن نفوذ خارجی
  • روندهای خطی را فرض می‌کند
  • در هنگام شوک سیستم از کار می‌افتد
  • مهندسی ویژگی دستی

تصورات نادرست رایج

افسانه

پیش‌بینی مبتنی بر نمودار همیشه دقیق‌تر از ARIMA است.

واقعیت

نه لزوماً. اگر جریان‌های داده شما واقعاً مستقل باشند - مانند فروش محصولات غیرمرتبط در کشورهای مختلف - یک مدل ساده ARIMA اغلب با اجتناب از «نویز» غیرضروری ناشی از ارتباطات نامربوط، از یک مدل گراف پیچیده بهتر عمل می‌کند.

افسانه

برای استفاده از پیش‌بینی نموداری به یک نقشه فیزیکی نیاز دارید.

واقعیت

شبکه‌های عصبی نسل جدید (GNN) در واقع می‌توانند یک نمودار را «استنتاج» کنند. حتی اگر نقشه‌ای از ارتباطات نداشته باشید، مدل می‌تواند نحوه‌ی حرکت متغیرها را با هم بررسی کند و شبکه‌ی داخلی خود از روابط را برای بهبود پیش‌بینی‌هایش بسازد.

افسانه

یادگیری عمیق، آمار سنتی را منسوخ کرده است.

واقعیت

در بسیاری از زمینه‌های تجاری، سادگی و سرعت آمار سنتی پیروز می‌شود. اکثر داشبوردهای «بلادرنگ» هنوز از هموارسازی کلاسیک یا Prophet استفاده می‌کنند زیرا نتایج پایداری را بدون تأخیر بالای یادگیری عمیق ارائه می‌دهند.

افسانه

داده‌های بیشتر همیشه مدل‌های نموداری را بهتر می‌کنند.

واقعیت

مدل‌های گراف به شدت به «لبه‌های نویزی» حساس هستند. اگر به آن‌ها اتصالاتی بدهید که در واقع بر یکدیگر تأثیری ندارند، دقت مدل می‌تواند در واقع کاهش یابد، زیرا تلاش می‌کند در تصادفات تصادفی معنایی پیدا کند.

سوالات متداول

چه زمانی باید از Prophet به یک شبکه عصبی گراف (Graph Neural Network) مهاجرت کنم؟
وقتی پیش‌بینی‌های «فردی» شما به طور مداوم توسط عوامل خارجی که نمی‌توانید آنها را در نظر بگیرید، خراب می‌شوند، باید این اقدام را در نظر بگیرید. اگر زمان تحویل را پیش‌بینی می‌کنید و متوجه می‌شوید که تأخیر در یک انبار همیشه بر پنج انبار دیگر تأثیر می‌گذارد، یک رویکرد نموداری به شما کمک می‌کند تا آن آلودگی متقابل را به روشی مدل‌سازی کنید که Prophet به سادگی نمی‌تواند.
آیا پیش‌بینی نموداری برای بازار سهام بهتر است؟
این نویدبخش اما دشوار است. در حالی که سهام قطعاً به هم پیوسته هستند، «اختلال» در بازارهای مالی آنقدر زیاد است که مدل‌های نموداری اغلب به تطابق‌های موقت بیش‌برازش می‌دهند. اکثر سیستم‌های مالی موفق از یک رویکرد ترکیبی استفاده می‌کنند که مدل‌های سنتی نوسان را با تحلیل احساسات مبتنی بر نمودار از شبکه‌های اجتماعی ترکیب می‌کند.
بخش «مکانی» پیش‌بینی مکانی-زمانی چیست؟
مؤلفه «مکانی» به موقعیت یا رابطه نقاط داده اشاره دارد. در پیش‌بینی ترافیک، این فاصله فیزیکی بین حسگرهای جاده‌ای است. در یک موتور پیشنهاد، ممکن است «فاصله» بین دو کاربر بر اساس سلیقه‌های مشابه آنها باشد. اساساً یک «مکان» به «زمان» سری‌های زمانی اضافه می‌کند.
آیا می‌توانم از پیش‌بینی نموداری استفاده کنم اگر فقط یک جریان داده داشته باشم؟
از نظر فنی، خیر. روش‌های مبتنی بر نمودار برای تشکیل یک «گراف» حداقل به دو موجودیت مرتبط نیاز دارند. اگر فقط یک جریان داده دارید، بهتر است به مدل‌های سنتی تک متغیره مانند Holt-Winters یا LSTM که به‌طور خاص برای بررسی عمیق یک توالی واحد طراحی شده‌اند، پایبند باشید.
این مدل‌ها چگونه رویدادهای «قوی سیاه» را مدیریت می‌کنند؟
مدل‌های سنتی معمولاً این موارد را به عنوان داده‌های پرت در نظر می‌گیرند و نادیده می‌گیرند، که می‌تواند خطرناک باشد. مدل‌های نموداری کمی بهتر هستند زیرا ممکن است شوک را از یک گوشه شبکه شروع کنند و شما را از نحوه گسترش آن به بقیه آگاه کنند، اگرچه هیچ مدلی در پیش‌بینی رویدادهای بی‌سابقه کامل نیست.
نگهداری کدام یک در محیط تولید آسان‌تر است؟
مدل‌های سنتی بسیار آسان‌تر هستند. آن‌ها قطعات متحرک کمتری دارند، به نظارت کمتری برای «رانش داده‌ها» نیاز دارند و می‌توانند در عرض چند ثانیه دوباره آموزش داده شوند. مدل‌های گراف نیاز به «بررسی سلامت» مداوم توپولوژی شبکه دارند. اگر نحوه اتصال موجودیت‌های شما تغییر کند، ممکن است کل مدل به یک بازسازی کامل نیاز داشته باشد.
آیا پیش‌بینی نموداری برای مدیریت زنجیره تأمین مفید است؟
بله، این یکی از قوی‌ترین موارد استفاده آن است. از آنجا که زنجیره‌های تأمین، شبکه‌هایی واقعی از گره‌ها (کارخانه‌ها) و لبه‌ها (مسیرهای حمل و نقل) هستند، مدل‌های گراف کاملاً مناسب پیش‌بینی این هستند که چگونه کمبود یک ماده اولیه واحد، هفته‌ها بعد در کل فرآیند تولید سرایت خواهد کرد.
برای پیش‌بینی مبتنی بر نمودار به چه نرم‌افزاری نیاز دارم؟
شما معمولاً به چارچوب‌های مبتنی بر پایتون مانند PyTorch Geometric یا Deep Graph Library (DGL) نیاز خواهید داشت. برخلاف آمار سنتی که تقریباً در هر صفحه گسترده یا ابزار BI پایه موجود است، پیش‌بینی نمودار تقریباً به طور کامل در قلمرو خطوط لوله یادگیری ماشین با کد سفارشی قرار دارد.

حکم

برای معیارهای ساده کسب و کار که در آنها قابلیت تفسیر و سربار کم اولویت‌های اصلی شما هستند، تحلیل سری‌های زمانی سنتی را انتخاب کنید. وقتی سیستم‌های پیچیده و به هم پیوسته را مدیریت می‌کنید که در آنها روابط بین متغیرها به اندازه خود نقاط داده مهم هستند، به پیش‌بینی مبتنی بر نمودار روی آورید.

مقایسه‌های مرتبط

آزادی جابجایی داده‌ها در مقابل محدودیت‌های مجموعه داده‌های ساختاریافته

این مقایسه فنی، بده‌بستان‌های عملیاتی بین داده‌های آزادی حرکت - که رفتارهای سیال و مهارنشده انسانی، دارایی یا مکانی را ثبت می‌کند - و محدودیت‌های مجموعه داده‌های ساختاریافته، طرح‌های اعتبارسنجی سفت و سختی که برای اعمال ثبات پایگاه داده استفاده می‌شوند، را ارزیابی می‌کند. تصمیم‌گیری بین آنها مستلزم ایجاد تعادل بین پیش‌بینی‌پذیری ساختاری در برابر بینش‌های غنی از فعالیت طبیعی و چندبعدی است.

آزمایش در مقیاس بزرگ در مقابل آزمایش مدل در مقیاس کوچک

انتخاب بین آزمایش آنلاین در مقیاس بزرگ و آزمایش مدل در مقیاس کوچک به معنای ایجاد تعادل بین اعتبارسنجی علّی خام در دنیای واقعی با تأیید الگوریتمی سریع و مقرون به صرفه است. در حالی که اجرای آزمایش‌های زنده در میان پایگاه‌های کاربری عظیم، تأثیر واقعی کسب و کار و واقعیت‌های رفتاری را آشکار می‌کند، آزمایش آفلاین در مقیاس کوچک، محیط کنترل‌شده و تکرارپذیر لازم برای تکرار سریع کد و دروازه‌های استقرار ایمن را فراهم می‌کند.

آمار کافی در مقابل نمایش داده‌های خام

این مقایسه فنی، تفاوت‌های عملیاتی بین آماره‌های کافی و نمایش داده‌های خام را تجزیه و تحلیل می‌کند. در حالی که داده‌های خام هر نکته ظریف مشاهده شده را حفظ می‌کنند، آماره‌های کافی آن مجموعه داده‌ها را به شکلی فشرده و بدون از دست دادن حتی یک ذره از اطلاعات مورد نیاز برای تخمین پارامترهای مدل شما، فشرده می‌کنند.

استخراج سیگنال آماری در مقابل تقویت نویز داده

در دنیای تحلیل‌های پرمخاطره، توانایی تشخیص الگوهای معنادار از نوسانات تصادفی، موفقیت را تعریف می‌کند. در حالی که استخراج سیگنال بر جداسازی بینش‌های عملی با استفاده از فیلترهای ریاضی دقیق تمرکز دارد، تقویت نویز زمانی رخ می‌دهد که تحلیلگران واریانس تصادفی را با روندهای قابل توجه اشتباه می‌گیرند و اغلب منجر به خطاهای استراتژیک پرهزینه و مدل‌های پیش‌بینی ناقص می‌شوند.

استخراج سیگنال از داده‌های پرت در مقابل فیلتر نویز

در حالی که فیلتر نویز، نوسانات تصادفی سطح پایین را حذف می‌کند تا روند اصلی مجموعه داده‌ها را روشن کند، استخراج سیگنال از داده‌های پرت به طور فعال به دنبال نقاط داده‌ای شدید و ایزوله می‌گردد که ناهنجاری‌های پنهان، خطاهای بحرانی سیستم یا پیشرفت‌های ارزشمند را آشکار می‌کنند. دانستن زمان اعمال هر تکنیک، مانع از آن می‌شود که به طور تصادفی ارزشمندترین بینش‌های داده‌ای خود را از دست بدهید.