আউটলায়ার থেকে সিগন্যাল নিষ্কাশন বনাম নয়েজ ফিল্টারিং
নয়েজ ফিল্টারিং একটি ডেটাসেটের মূল প্রবণতা স্পষ্ট করার জন্য নিম্ন-স্তরের এলোমেলো ওঠানামা দূর করে, অন্যদিকে আউটলায়ার থেকে সিগন্যাল এক্সট্র্যাকশন সক্রিয়ভাবে চরম, বিচ্ছিন্ন ডেটা পয়েন্টগুলো খুঁজে বের করে যা লুকানো অসঙ্গতি, গুরুতর সিস্টেম ত্রুটি বা উচ্চ-মূল্যের যুগান্তকারী আবিষ্কার প্রকাশ করে। কখন কোন কৌশল প্রয়োগ করতে হবে তা জানা থাকলে আপনি ভুলবশত আপনার সবচেয়ে মূল্যবান ডেটা ইনসাইটগুলো নষ্ট করা থেকে বিরত থাকতে পারবেন।
হাইলাইটস
নয়েজ ফিল্টারিং ব্যাপক পারিপার্শ্বিক কোলাহল সামাল দেয়, অপরদিকে আউটলায়ার এক্সট্র্যাকশন বিচ্ছিন্ন চরম স্পাইকগুলোকে লক্ষ্য করে।
ফিল্টারগুলো প্রায় প্রতিটি ডেটা পয়েন্টকে সামান্য পরিবর্তন করে, অন্যদিকে আউটলায়ার টুলগুলো গভীর অনুসন্ধানের জন্য নির্দিষ্ট পয়েন্টগুলোকে চিহ্নিত করে।
নয়েজ বা কোলাহল সঠিকভাবে পরিচালনা করতে না পারলে মডেলের নির্ভুলতা কমে যায়, কিন্তু আউটলায়ার বা ব্যতিক্রমী মান সঠিকভাবে পরিচালনা করতে না পারলে একটি প্রতিষ্ঠান গুরুতর নিরাপত্তা ঝুঁকি সম্পর্কে অন্ধ হয়ে যেতে পারে।
সাধারণত ত্রুটিপূর্ণ পরিমাপের ফলেই নয়েজ তৈরি হয়, অপরদিকে আউটলায়ার কোনো বিরল ঘটনার সম্পূর্ণ নির্ভুল পরিমাপকে নির্দেশ করতে পারে।
আউটলায়ার থেকে সংকেত নিষ্কাশন কী?
গুরুত্বপূর্ণ অসঙ্গতি বা লুকানো সুযোগ উন্মোচনের জন্য চরম ও বিরল তথ্যবিন্দু শনাক্ত ও বিশ্লেষণ করার প্রক্রিয়া।
এটি বিশেষভাবে নিম্ন-কম্পাঙ্কের, উচ্চ-মাত্রার ডেটা বৈচিত্র্যের উপর দৃষ্টি নিবদ্ধ করে, যা প্রতিষ্ঠিত প্যাটার্নকে ভেঙে দেয়।
সিস্টেম ত্রুটির পরিবর্তে চরম ডেটা পয়েন্টগুলোকে উচ্চ-মূল্যের তথ্যের প্রাথমিক বাহক হিসেবে বিবেচনা করে।
এটি আইসোলেশন ফরেস্ট, লোকাল আউটলায়ার ফ্যাক্টর এবং মাহালানোবিস ডিসটেন্সের মতো বিশেষায়িত অ্যালগরিদমগুলোর ওপর ব্যাপকভাবে নির্ভর করে।
এটি আর্থিক জালিয়াতি পর্যবেক্ষণ, সাইবার আক্রমণ শনাক্তকরণ এবং বিরল রোগ নির্ণয়ের প্রযুক্তিগত ভিত্তি তৈরি করে।
ডেটাসেট থেকে অনন্য অসঙ্গতিগুলোকে মসৃণ করে বাদ দেওয়ার পরিবর্তে সেগুলোকে সংরক্ষণ ও অধ্যয়ন করাই এর লক্ষ্য।
শব্দ ফিল্টারিং কী?
একটি ডেটাসেটের অন্তর্নিহিত প্রবণতাকে আলাদা করার জন্য এলোমেলো, অর্থহীন পটভূমিগত পরিবর্তনগুলিকে পদ্ধতিগতভাবে অপসারণ করা।
ডেটা সংগ্রহের সময় স্বাভাবিকভাবে ঘটে যাওয়া উচ্চ-কম্পাঙ্ক ও স্বল্প-মাত্রার পরিবর্তনগুলোকে লক্ষ্য করে।
ধরে নেওয়া হয় যে, ট্রেন্ড লাইনের চারপাশের সামান্য ওঠানামায় কোনো অর্থপূর্ণ তথ্য থাকে না।
সাধারণত মুভিং অ্যাভারেজ, কালম্যান ফিল্টার এবং লো-পাস ফিল্টারের মতো গাণিতিক স্মুথিং কৌশল ব্যবহার করা হয়।
অডিও রেকর্ডিং পরিষ্কার করতে, IoT সেন্সর স্ট্রিম স্থিতিশীল করতে এবং ডিজিটাল ছবির স্বচ্ছতা বাড়াতে এটি অপরিহার্য।
সামগ্রিক ভ্যারিয়েন্স এবং ওভারফিটিং হ্রাস করার মাধ্যমে স্ট্যান্ডার্ড মেশিন লার্নিং মডেলগুলোর পারফরম্যান্স উন্নত করে।
তুলনা সারণি
বৈশিষ্ট্য
আউটলায়ার থেকে সংকেত নিষ্কাশন
শব্দ ফিল্টারিং
প্রাথমিক উদ্দেশ্য
চরম তথ্য বিচ্যুতির মধ্যে মূল্যবান লুকানো সত্য আবিষ্কার করুন
মূল প্রবণতা তুলে ধরতে পটভূমির অর্থহীন বৈচিত্র্যগুলো অপসারণ করুন।
ডেটা বৈচিত্র্য লক্ষ্য
নিম্ন-কম্পাঙ্কের, ব্যাপক স্পাইক এবং অসঙ্গতি
উচ্চ-ফ্রিকোয়েন্সি, ক্ষুদ্র-মাপের এলোমেলো ওঠানামা
বিচ্যুতির চিকিৎসা
তাদেরকে আলাদা করে পুঙ্খানুপুঙ্খভাবে তদন্ত করে
সেগুলোকে মসৃণ করে, গড় করে, অথবা সম্পূর্ণরূপে মুছে দেয়।
ক্রেডিট কার্ড জালিয়াতি বা সরঞ্জামের ত্রুটি শনাক্ত করা
অবিচ্ছিন্ন অডিও বা তাপমাত্রা সেন্সর ফিড স্থিতিশীল করা
অপপ্রয়োগের ঝুঁকি
ব্যাপক প্রবণতা উপেক্ষা করার ফলে সামগ্রিক চিত্রটি দেখতে ব্যর্থ হওয়া।
ভুলবশত গুরুত্বপূর্ণ সাফল্য বা প্রাথমিক সতর্কীকরণ সংকেত মুছে ফেলা
বিস্তারিত তুলনা
মূল বিশ্লেষণাত্মক লক্ষ্য
আউটলায়ার থেকে সিগন্যাল নিষ্কাশনের লক্ষ্য হলো বিরল ও চরম ডেটা পয়েন্ট শনাক্ত করা, কারণ এগুলো প্রায়শই নিরাপত্তা লঙ্ঘন বা সিস্টেম ব্যর্থতার মতো গুরুত্বপূর্ণ ঘটনাকে নির্দেশ করে। এর সম্পূর্ণ বিপরীতে, নয়েজ ফিল্টারিং ডেটার ওঠানামাকে অবাঞ্ছিত আবর্জনা হিসেবে গণ্য করে, যা প্রকৃত অন্তর্নিহিত প্রবণতাকে অস্পষ্ট করে দেয়। প্রথমটি যেখানে খড়ের গাদায় সূঁচ খোঁজে, দ্বিতীয়টি সেখানে কেবল মেঝের ধুলো ঝেড়ে ফেলে।
অ্যালগরিদমিক পদ্ধতি
নয়েজ ফিল্টারিং সাধারণত গাণিতিক স্মুথিং ফাংশনের উপর নির্ভর করে, যা কাছাকাছি থাকা ডেটা পয়েন্টগুলোকে একত্রিত করে, যেমন লো-পাস বা মুভিং অ্যাভারেজ ফিল্টার। আউটলায়ার থেকে সিগন্যাল বের করার জন্য প্রক্সিমিটি, ডেনসিটি বা ট্রি-ভিত্তিক মেশিন লার্নিং ব্যবহার করা হয়, যা দল থেকে দূরে থাকা পয়েন্টগুলোকে আলাদা করে। এর মানে হলো, ফিল্টারিং ডেটাকে একসাথে মিশিয়ে সামঞ্জস্য খুঁজে বের করে, অন্যদিকে আউটলায়ার নিষ্কাশন ইচ্ছাকৃতভাবে ডেটাকে ভেঙে বিদ্রোহী পয়েন্টগুলোকে খুঁজে বের করে।
ডেটার পরিমাণ এবং অখণ্ডতার উপর প্রভাব
নয়েজ ফিল্টারিং আপনার সম্পূর্ণ ডেটাসেটের মান পরিবর্তন করে সামগ্রিক চিত্রটিকে আরও পরিচ্ছন্ন ও সামঞ্জস্যপূর্ণ করে তোলে। অন্যদিকে, আউটলায়ার এক্সট্র্যাকশন আপনার ডেটার সিংহভাগকে অপরিবর্তিত রাখে এবং মোট নমুনার মাত্র এক শতাংশের ভগ্নাংশের উপর দৃষ্টি নিবদ্ধ করে। একটি ফিল্টার প্রয়োগ করলে স্বাভাবিকভাবেই আপনার ডেটাসেটের ভ্যারিয়েন্স কমে যায়, যেখানে আউটলায়ার খোঁজার ক্ষেত্রে সত্য উদঘাটনের জন্য উচ্চ ভ্যারিয়েন্সকে গ্রহণ করা হয়।
ব্যবসায়িক এবং বিশ্লেষণাত্মক মূল্য
নয়েজ ফিল্টারিং প্রচলিত ব্যবসায়িক পূর্বাভাস মডেলগুলোর ভবিষ্যদ্বাণীমূলক নির্ভুলতা বাড়িয়ে এবং ড্যাশবোর্ডকে পাঠযোগ্য রেখে কার্যকারিতা প্রদান করে। ব্যতিক্রমী ডেটা থেকে সংকেত আহরণ করা বিপর্যয়কর ঝুঁকি বা বাজারের আচরণের আকস্মিক ও লাভজনক পরিবর্তনের জন্য একটি আগাম সতর্কীকরণ রাডার হিসেবে কাজ করে কার্যকারিতা যোগায়। একটি আপনার দৈনন্দিন কার্যক্রমকে মসৃণভাবে সচল রাখে, আর অন্যটি আপনার ব্যবসাকে আকস্মিক ধ্বংসের হাত থেকে রক্ষা করে।
সুবিধা এবং অসুবিধা
আউটলায়ার থেকে সংকেত নিষ্কাশন
সুবিধাসমূহ
+লুকানো পদ্ধতিগত হুমকি উন্মোচন করে
+অত্যন্ত লাভজনক অসঙ্গতিগুলি চিহ্নিত করে
+অনন্য কাঁচা ডেটা সংরক্ষণ করে
+স্বয়ংক্রিয় জালিয়াতি প্রতিরক্ষার ক্ষমতা
কনস
−ভুল অ্যালার্মের উচ্চ ঝুঁকি
−নির্দিষ্ট বিষয়ে গভীর জ্ঞান থাকা প্রয়োজন।
−বৃহৎ পরিসরে গণনাগতভাবে ব্যয়বহুল
−মারাত্মকভাবে বিকৃত ডেটা নিয়ে সংগ্রাম
শব্দ ফিল্টারিং
সুবিধাসমূহ
+ডেটা ভিজ্যুয়ালাইজেশনকে ব্যাপকভাবে সরল করে তোলে
+স্ট্যান্ডার্ড মডেল প্রশিক্ষণ উন্নত করে
+অ্যালগরিদমে ওভারফিটিং বন্ধ করে
+গাণিতিকভাবে স্থাপন করা সহজ
কনস
−প্রকৃত আবিষ্কার মুছে ফেলতে পারে
−বাস্তব জগতের আকস্মিক পরিবর্তনকে ভোঁতা করে দেয়
−যথেচ্ছ সীমা নির্ধারণ করা প্রয়োজন।
−মূল কাঁচা মান বিকৃত করে
সাধারণ ভুল ধারণা
পুরাণ
একটি ডেটাসেটের প্রতিটি আউটলায়ারই হলো নয়েজ, যা মুছে ফেলা প্রয়োজন।
বাস্তবতা
এই মানসিকতা একটি বিশ্লেষণ প্রকল্পকে নষ্ট করে দিতে পারে। যদিও কিছু ব্যতিক্রমী মান ডেটা এন্ট্রির ভুলের কারণে ঘটে, তবে অনেক ব্যতিক্রমী মানই অসাধারণ ঘটনার সম্পূর্ণ নির্ভুল বিবরণ, যেমন একজন অতি-ধনী গ্রাহকের কেনাকাটা বা হঠাৎ বিদ্যুৎ গ্রিড বিকল হয়ে যাওয়া, যা থেকে ব্যবসার বিষয়ে ব্যাপক অন্তর্দৃষ্টি লাভ করা যায়।
পুরাণ
নয়েজ ফিল্টারিং এবং আউটলায়ার ডিটেকশন মূলত একই প্রিপ্রসেসিং ধাপ।
বাস্তবতা
এদের উদ্দেশ্য বিপরীত। নয়েজ ফিল্টারিং পুরো ডেটাসেট জুড়ে সমানভাবে কাজ করে এলোমেলো ও ছোটখাটো তারতম্যগুলোকে প্রশমিত করে, অন্যদিকে আউটলায়ার ডিটেকশন মূল ডেটাকে অক্ষত রেখে বিশেষভাবে বড় ও স্থানীয় বিচ্যুতিগুলো খুঁজে বের করে।
পুরাণ
আউটলায়ারগুলো সামলানোর জন্য মুভিং এভারেজ ফিল্টার ব্যবহার করা একটি সম্পূর্ণ নিরাপদ উপায়।
বাস্তবতা
একটি সাধারণ মুভিং অ্যাভারেজ ফিল্টার চরম মান দ্বারা ব্যাপকভাবে বিকৃত হয়। কোনো আউটলায়ারকে আলাদা করার পরিবর্তে, মুভিং অ্যাভারেজ তার প্রভাব পার্শ্ববর্তী ডেটা পয়েন্টগুলোতে ছড়িয়ে দেয়, যা অন্যথায় ত্রুটিমুক্ত ডেটা সারিগুলোকে নষ্ট করে দেয়।
এমনকি সর্বাধুনিক মডেলগুলোও 'গার্বেজ-ইন, গার্বেজ-আউট' নিয়মের শিকার হয়। অতিরিক্ত পারিপার্শ্বিক কোলাহলের কারণে অ্যালগরিদমগুলো সম্পূর্ণ কাল্পনিক প্যাটার্ন শিখে ফেলে, যা প্রোডাকশনে প্রয়োগ করার সময় সেগুলোর নির্ভুলতা নষ্ট করে দেয়।
সচরাচর জিজ্ঞাসিত প্রশ্নাবলী
একজন বিশ্লেষক কীভাবে বুঝবেন যে একটি বিশাল আকস্মিক বৃদ্ধি একটি মূল্যবান ব্যতিক্রমী ডেটা, নাকি এটি কেবল সিস্টেমের গোলমাল?
উভয়ের মধ্যে পার্থক্য করতে ঐতিহাসিক প্রেক্ষাপটের সাথে পরিসংখ্যানগত বৈধতার সমন্বয় প্রয়োজন। নয়েজ সাধারণত প্রত্যাশিত সীমার মধ্যে একটি অবিচ্ছিন্ন, উচ্চ-কম্পাঙ্কের কম্পন হিসাবে দেখা দেয়, যেখানে একটি মূল্যবান আউটলায়ার হলো সেই সীমানা থেকে একটি নাটকীয় বিচ্যুতি যা অন্যান্য ভেরিয়েবলের সাথে যৌক্তিক সামঞ্জস্য বজায় রাখে। উদাহরণস্বরূপ, যদি একটি তাপমাত্রা সেন্সর তাৎক্ষণিকভাবে পঞ্চাশ ডিগ্রি লাফিয়ে ওঠে কিন্তু পার্শ্ববর্তী সেন্সরগুলো চাপের আকস্মিক বৃদ্ধি নিশ্চিত করে, তবে আপনি একটি নয়েজি বৈদ্যুতিক হেঁচকির পরিবর্তে একটি প্রকৃত, গুরুত্বপূর্ণ আউটলায়ার দেখছেন।
আউটলায়ার থেকে সিগন্যাল নিষ্কাশনের আগে নাকি পরে নয়েজ ফিল্টারিং করা হয়?
একটি স্ট্যান্ডার্ড ডেটা পাইপলাইনে, ব্রড নয়েজ ফিল্টার প্রয়োগ করার আগে আপনার প্রায় সবসময়ই আউটলায়ারগুলো সামলানো উচিত। যদি আপনি প্রথমে একটি স্মুদিং ফিল্টার চালান, তাহলে চরম মানগুলো পার্শ্ববর্তী ডেটার সাথে মিশে যাওয়ার ঝুঁকি থাকে, যা আউটলায়ারটির স্বতন্ত্র বৈশিষ্ট্যকে স্থায়ীভাবে মুছে ফেলে। ডেটা সম্পূর্ণ কাঁচা থাকা অবস্থায় চরম মানগুলোকে আলাদা করলে, গভীরতর বিশ্লেষণের জন্য তাদের সঠিক বৈশিষ্ট্যগুলো সংরক্ষিত থাকে।
জালিয়াতি শনাক্তকরণের জন্য তৈরি কোনো ডেটাসেটে ভুলবশত নয়েজ ফিল্টারিং প্রয়োগ করলে কী হবে?
এর ফলাফল নিরাপত্তার জন্য মারাত্মক হতে পারে। প্রতারণামূলক লেনদেনগুলোকে চরম ব্যতিক্রমী বলে মনে হয়, কারণ এগুলো একজন ব্যবহারকারীর স্বাভাবিক খরচের অভ্যাস থেকে তীব্রভাবে বিচ্যুত হয়। আপনি যদি আগে থেকেই একটি কঠোর নয়েজ ফিল্টার বা স্মুদিং অ্যালগরিদম প্রয়োগ করেন, তবে তা এই তীব্র বিচ্যুতিগুলোকে স্তিমিত করে দেবে, ফলে প্রতারণামূলক লেনদেনগুলো দৈনন্দিন মুদিখানার কেনাকাটার সাথে পুরোপুরি মিশে যাবে এবং আপনার শনাক্তকরণ মডেলগুলো অকেজো হয়ে পড়বে।
বহুচলকীয় আউটলায়ার থেকে সিগন্যাল বের করার জন্য কোন নির্দিষ্ট অ্যালগরিদমগুলো সবচেয়ে ভালো?
একই সাথে একাধিক ডাইমেনশন নিয়ে কাজ করার সময়, প্রচলিত এক-চলকীয় Z-স্কোর ব্যর্থ হয়, কারণ একটি পয়েন্ট স্বতন্ত্র চার্টে স্বাভাবিক দেখালেও, একত্রিত করলে তা অদ্ভুত মনে হতে পারে। এর সমাধান করতে, ডেভেলপাররা লোকাল আউটলায়ার ফ্যাক্টরের মতো ডেনসিটি-ভিত্তিক অ্যালগরিদম অথবা আইসোলেশন ফরেস্টের মতো আইসোলেশন-ভিত্তিক টুল ব্যবহার করেন। এক্ষেত্রে মাহালানোবিস ডিসট্যান্সও চমৎকার, কারণ এটি আপনার ভেরিয়েবলগুলোর মধ্যকার পারস্পরিক সম্পর্ককে বিবেচনায় রেখে পরিমাপ করে যে একটি পয়েন্ট মূল ক্লাস্টার থেকে কতগুলো স্ট্যান্ডার্ড ডেভিয়েশন দূরে অবস্থিত।
অতিরিক্ত নয়েজ ফিল্টারিং কি ডেটাসেটে কৃত্রিম আউটলায়ার তৈরি করতে পারে?
হ্যাঁ, অতিরিক্ত ফিল্টারিং আপনার ডেটাতে অদ্ভুত আর্টিফ্যাক্ট তৈরি করতে পারে। যখন আপনি কঠোর থ্রেশহোল্ড সহ জটিল গাণিতিক ফিল্টার ব্যবহার করেন, তখন স্মুদিং প্রক্রিয়াটি ডেটা স্ট্রিমে আকস্মিক, প্রকৃত পরিবর্তনের কাছাকাছি কৃত্রিম তরঙ্গ বা রিংগিং এফেক্ট তৈরি করতে পারে। এই অ্যালগরিদমিকভাবে তৈরি তরঙ্গগুলোকে পরবর্তী আউটলায়ার ডিটেকশন টুলগুলো সহজেই প্রকৃত কাঠামোগত অসঙ্গতি হিসেবে ভুল চিহ্নিত করতে পারে।
আউটলায়ারগুলো সম্পূর্ণরূপে মুছে ফেলা ভালো, নাকি গাণিতিক স্কেলিং ব্যবহার করে সেগুলোকে রূপান্তর করা ভালো?
এগুলোকে বাদ দেওয়া আপনার একেবারে শেষ উপায় হওয়া উচিত, যা কেবল তখনই করা উচিত যখন আপনি প্রমাণ করতে পারবেন যে একটি আউটলায়ার আসলে একটি নির্জলা ভুল, যেমন একটি ভাঙা সেন্সর বা টাইপের ভুল। যদি ডেটা পয়েন্টটি বাস্তব হয়, তবে এটিকে রেখে দেওয়া এবং লগ স্কেলের মতো একটি নন-লিনিয়ার রূপান্তর ব্যবহার করা অনেক ভালো, অথবা এমন শক্তিশালী পরিসংখ্যানিক মডেলে চলে যাওয়া উচিত যা স্বাভাবিকভাবেই চরম মানগুলোর মোকাবিলা করতে পারে, যেমন ট্রি-বেসড মডেল বা কোয়ান্টাইল রিগ্রেশন।
ইঞ্জিনিয়াররা নয়েজ কমানোর জন্য সিম্পল মুভিং অ্যাভারেজের পরিবর্তে কেন কালম্যান ফিল্টার ব্যবহার করেন?
সিম্পল মুভিং অ্যাভারেজ অতীতের দিকে তাকায়, যা আপনার মেট্রিক্সে একটি সুস্পষ্ট ল্যাগ তৈরি করে এবং আকস্মিক, প্রকৃত কাঠামোগত পরিবর্তনগুলোকে পুরোপুরি অস্পষ্ট করে দেয়। একটি কালম্যান ফিল্টার দুটি ধাপে অনুমান ও যাচাই করার একটি প্রক্রিয়ার মাধ্যমে এটি এড়ায়: এটি পদার্থবিদ্যা বা প্রবণতার উপর ভিত্তি করে সিস্টেমের পরবর্তী অবস্থা অনুমান করে, সেটিকে আগত নয়েজি পরিমাপের সাথে তুলনা করে এবং কোনো ল্যাগ ছাড়াই রিয়েল টাইমে একটি সর্বোত্তম আপোস গণনা করে।
ডেটার পরিমাণ কীভাবে নয়েজ এবং আউটলায়ারকে আলাদা করার পদ্ধতিকে পরিবর্তন করে?
বিশাল ডেটাসেটের ক্ষেত্রে নয়েজ বা কোলাহল নিয়ন্ত্রণ করা সহজ হয়ে যায়, কারণ লক্ষ লক্ষ সারির উপর একত্রিত হলে এলোমেলো ওঠানামাগুলো একে অপরকে বাতিল করে দেয়। তবে, বিশাল আকার আউটলায়ার বা ব্যতিক্রমী ডেটা খুঁজে বের করাকে উল্লেখযোগ্যভাবে আরও জটিল করে তোলে; আপনি নিছক সুযোগের কারণে আরও অনেক অনন্য, বিরল ঘটনার সম্মুখীন হবেন, যার জন্য এমন অত্যন্ত দক্ষ অ্যালগরিদম প্রয়োজন যা আপনার সার্ভার পরিকাঠামোকে অতিরিক্ত চাপে না ফেলে রৈখিকভাবে সম্প্রসারিত হতে পারে।
রায়
অগোছালো, কম্পনশীল সেন্সর ডেটা পরিষ্কার করতে অথবা একটি স্পষ্ট দিকনির্দেশক প্রবণতা দেখার জন্য বিশৃঙ্খল টাইম-সিরিজকে স্থিতিশীল করতে নয়েজ ফিল্টারিং বেছে নিন। আর্থিক জালিয়াতি, সিস্টেম হ্যাকিং বা চিকিৎসা সংক্রান্ত অস্বাভাবিকতার মতো বিরল, উচ্চ-ঝুঁকিপূর্ণ ঘটনার সন্ধানে থাকলে আউটলায়ার থেকে সিগন্যাল এক্সট্র্যাকশন বেছে নিন, যেখানে চরম ডেটা পয়েন্টটিই পুরো সেটের সবচেয়ে মূল্যবান অংশ।