پرنسپل اجزاء اور واحد اقدار مکمل طور پر آزاد تصورات ہیں۔
وہ ڈیٹا سینٹرنگ کے ذریعے گہرائی سے جڑے ہوئے ہیں۔ جب ڈیٹا میٹرکس کا اوسط گھٹا دیا جاتا ہے، تو اس کی واحد قدریں اصل اجزاء کے ساتھ متغیرات کے مربع جڑوں کے براہ راست متناسب ہوتی ہیں۔
جب کہ ڈیٹا سائنسدانوں کو جہتی کمی میں اکثر دونوں اصطلاحات کا سامنا کرنا پڑتا ہے، پرنسپل اجزاء ڈیٹاسیٹ میں زیادہ سے زیادہ تغیر کی سمتوں کو بیان کرتے ہیں، جب کہ واحد اقدار میٹرکس کے سڑنے کے دوران ان جیومیٹرک محوروں کے ساتھ پیمانے کی شدت کو ناپتی ہیں۔ PCA اور SVD جیسے الگورتھم میں مہارت حاصل کرنے کے لیے ان کے ریاضیاتی پل کو سمجھنا ضروری ہے۔
آرتھوگونل ویکٹر جو زیادہ سے زیادہ تغیرات کی سمتوں کی طرف اشارہ کرتے ہیں، اعلی جہتی ڈیٹا کو آسان اور کم کرنے میں مدد کرتے ہیں۔
ایک واحد ویلیو میٹرکس کی اخترن اندراجات، لکیری تبدیلی کے مطلق پیمانے کے عوامل کی نمائندگی کرتی ہیں۔
| خصوصیت | پرنسپل اجزاء | واحد اقدار |
|---|---|---|
| ریاضی کی اصل | Covariance میٹرکس eigenvectors | میٹرکس سڑن (SVD) عوامل |
| ہندسی تشریح | زیادہ سے زیادہ تغیر کی ہدایات | پرنسپل محور کی لمبائی پیمائی کرنا |
| ڈیٹا کی ضرورت | شماریاتی معنی کے لیے وسط مرکز والے ڈیٹا کی ضرورت ہے۔ | کسی بھی صوابدیدی مستطیل یا مربع میٹرکس پر لاگو ہوتا ہے۔ |
| Eigenvalues سے تعلق | covariance میٹرکس کی eigenvalues کے برابر | میٹرکس پروڈکٹ کی eigenvalues کے مربع جڑوں کے برابر |
| بنیادی درخواست | جہت میں کمی اور خصوصیت نکالنا | میٹرکس الٹا، چھدم الٹا حساب، اور کم درجہ کا تخمینہ |
| پیمانے پر انحصار | ڈیٹا کو شفٹنگ یا اسکیلنگ کرکے نمایاں طور پر تبدیل کیا گیا۔ | مخصوص میٹرکس کی موروثی خاصیت جو گلتی جا رہی ہے۔ |
| جسمانی تشریح | ڈیٹا کلاؤڈ بیضوی کے محور | تبدیل شدہ یونٹ کے دائرے کے کھینچنے والے عوامل |
پرنسپل اجزاء ان مخصوص سمتوں کی نمائندگی کرتے ہیں جہاں ڈیٹا سب سے زیادہ مختلف ہوتا ہے، ایک بہتر کوآرڈینیٹ سسٹم کے لیے نئے محور کے طور پر کام کرتا ہے۔ اس کے برعکس، واحد قدریں اسکیلر مقداریں ہیں جو یہ ظاہر کرتی ہیں کہ میٹرکس ان محوروں کے ساتھ کتنی جگہ کو پھیلا یا سکیڑتا ہے۔ جب کہ ایک آپ کو ڈیٹا کلاؤڈ کی واقفیت دیتا ہے، دوسرا خود تبدیلی کی شدت کی پیمائش کرتا ہے۔
روایتی طور پر پرنسپل اجزاء کو تلاش کرنے کے لیے، آپ کو ڈیٹاسیٹ کے ہم آہنگی میٹرکس کے ایجین ویکٹرز کی گنتی کرنی چاہیے۔ واحد قدریں Singular Value Decomposition سے ابھرتی ہیں، جہاں کوئی بھی میٹرکس تین الگ الگ جزو میٹرکس میں تقسیم ہوتا ہے۔ جب آپ وسط کو گھٹا کر اپنے ڈیٹا کو مرکز کرتے ہیں، تو ایک واحد قدر کا مربع نمونہ سائز مائنس ون سے تقسیم کیا جاتا ہے جو اس بنیادی جزو کے تغیر کے بالکل برابر ہوتا ہے۔
اگر آپ اپنے ڈیٹا کو وسط یا معیاری بنانا بھول جاتے ہیں تو بنیادی اجزاء ڈرامائی طور پر تبدیل ہو جاتے ہیں، کیونکہ شماریاتی تغیر اصل نقطہ اور متغیر پیمانے پر بہت زیادہ انحصار کرتا ہے۔ واحد اقدار، تاہم، فراہم کردہ خام میٹرکس کی ایک بنیادی الجبری خاصیت ہیں۔ وہ شماریاتی مفروضوں کی پرواہ نہیں کرتے ہیں جب تک کہ صارف جان بوجھ کر پہلے ایک مرکزی ہم آہنگی کی طرح میٹرکس نہ بنائے۔
ڈیٹا تجزیہ کار سادہ دو جہتی پلاٹوں پر پیچیدہ، اعلیٰ جہتی ڈیٹاسیٹس کو دیکھنے کے لیے بنیادی اجزاء پر انحصار کرتے ہیں۔ دوسری طرف، کمپیوٹر وژن انجینئرز کم درجے کے میٹرکس کے قریب کے ذریعے امیج کمپریشن اور سفارشی نظاموں کے لیے واحد اقدار کا استعمال کرتے ہیں۔ SVD دراصل PCA کے پیچھے ترجیحی عددی انجن ہے کیونکہ واحد قدروں کا حساب لگانا درستگی کے نقصان سے بچتا ہے جو کوویریئنس میٹرکس بناتے وقت ہوتا ہے۔
پرنسپل اجزاء اور واحد اقدار مکمل طور پر آزاد تصورات ہیں۔
وہ ڈیٹا سینٹرنگ کے ذریعے گہرائی سے جڑے ہوئے ہیں۔ جب ڈیٹا میٹرکس کا اوسط گھٹا دیا جاتا ہے، تو اس کی واحد قدریں اصل اجزاء کے ساتھ متغیرات کے مربع جڑوں کے براہ راست متناسب ہوتی ہیں۔
پرنسپل اجزاء تلاش کرنے کے لیے آپ کو ہمیشہ کوویرینس میٹرکس کی گنتی کرنی چاہیے۔
جدید سافٹ ویئر شاذ و نادر ہی کوویریئنس میٹرکس کا حساب لگاتا ہے کیونکہ اس میں عددی راؤنڈنگ کی غلطیاں آتی ہیں۔ اس کے بجائے، الگورتھم SVD کو ڈیٹا میٹرکس پر براہ راست چلاتے ہیں، بنیادی اجزاء کو کہیں زیادہ محفوظ اور موثر طریقے سے نکالتے ہیں۔
واحد اقدار منفی ہو سکتی ہیں اگر ڈیٹا منفی ارتباط کو ظاہر کرتا ہے۔
واحد اقدار تعریف کے لحاظ سے ایک ہم آہنگی میٹرکس سے eigenvalues کی مثبت مربع جڑیں ہیں۔ وہ ہمیشہ غیر منفی حقیقی اعداد ہوتے ہیں، اصل اعداد و شمار میں ارتباط سے قطع نظر، لمبائی یا پھیلانے والے عوامل کی نمائندگی کرتے ہیں۔
تمام ڈیٹا پوائنٹس میں ایک مستقل قدر شامل کرنے سے واحد اقدار اور بنیادی اجزاء یکساں طور پر بدل جاتے ہیں۔
ڈیٹا کو مستقل طور پر منتقل کرنے سے واحد قدریں بدل جاتی ہیں کیونکہ خام میٹرکس کے اندراجات بدل جاتے ہیں۔ تاہم، چونکہ پرنسپل اجزاء کوویریئنس میٹرکس پر انحصار کرتے ہیں، جو فطری طور پر اوسط کو گھٹا دیتا ہے، اس لیے ڈیٹا کو منتقل کرنے سے پرنسپل اجزاء مکمل طور پر تبدیل نہیں ہوتے ہیں۔
پہلا پرنسپل جزو ہمیشہ تمام قیمتی معلومات حاصل کرتا ہے۔
پہلا جزو صرف ایک محور کے ساتھ زیادہ سے زیادہ تغیر کو پکڑتا ہے۔ اگر آپ کا ڈیٹا کروی طور پر تقسیم کیا گیا ہے یا اہم غیر لکیری نمونوں پر مشتمل ہے، تو ایک واحد لکیری جزو سب سے اہم ڈھانچے کو مکمل طور پر کھو سکتا ہے۔
جب آپ کا بنیادی مقصد تغیر کی بنیاد پر شماریاتی ڈیٹاسیٹ کی خصوصیات کی تشریح، تصور، یا کم کرنا ہو تو بنیادی اجزاء کا انتخاب کریں۔ جب آپ کو لکیری نظاموں کو حل کرنے، میٹرکس کو کمپریس کرنے، یا شماریاتی پری پروسیسنگ کے بارے میں فکر کیے بغیر مستحکم عددی کمپیوٹیشن کرنے کی ضرورت ہو تو واحد اقدار کا انتخاب کریں۔
جبکہ اسکیلرز اور ویکٹر دونوں ہمارے اردگرد کی دنیا کی مقدار درست کرتے ہیں، بنیادی فرق ان کی پیچیدگی میں ہے۔ اسکیلر طول و عرض کی ایک سادہ پیمائش ہے، جب کہ ایک ویکٹر اس سائز کو ایک مخصوص سمت کے ساتھ جوڑتا ہے، جو اسے جسمانی خلا میں حرکت اور قوت کو بیان کرنے کے لیے ضروری بناتا ہے۔
جبکہ حقیقی اعداد ان تمام اقدار کو گھیرے ہوئے ہیں جنہیں ہم عام طور پر طبعی دنیا کی پیمائش کے لیے استعمال کرتے ہیں—پورے عدد سے لے کر لامحدود اعشاریہ تک—پیچیدہ اعداد خیالی اکائی $i$ کو متعارف کروا کر اس افق کو بڑھاتے ہیں۔ یہ اضافہ ریاضی دانوں کو ان مساواتوں کو حل کرنے کی اجازت دیتا ہے جن کا کوئی حقیقی حل نہیں ہے، جس سے ایک دو جہتی نمبر کا نظام تشکیل پاتا ہے جو جدید طبیعیات اور انجینئرنگ کے لیے ضروری ہے۔
جب کہ الجبرا عمل کے تجریدی اصولوں اور نامعلوم کو حل کرنے کے لیے علامتوں کی ہیرا پھیری پر توجہ مرکوز کرتا ہے، جیومیٹری خلا کی طبعی خصوصیات کو دریافت کرتی ہے، بشمول سائز، شکل، اور اعداد و شمار کی رشتہ دار پوزیشن۔ ایک ساتھ مل کر، وہ ریاضی کی بنیاد بناتے ہیں، منطقی تعلقات کو بصری ڈھانچے میں ترجمہ کرتے ہیں۔
جب کہ الگورتھمک نسل ریاضی کے ڈھانچے، ثبوت، اور مقررہ اصولوں پر مبنی خام ڈیٹا کو تیزی سے تیار کرنے کے لیے بے پناہ کمپیوٹنگ طاقت کا فائدہ اٹھاتی ہے، انسانی تشریح ان نتائج کو سمجھنے کے لیے ضروری وجدان، سیاق و سباق اور تصوراتی فریم ورک فراہم کرتی ہے، جو جدید ریاضی میں ایک گہرے سمبیوسس کو اجاگر کرتی ہے۔
امکان اور اعدادوشمار ایک ہی ریاضی کے سکے کے دو رخ ہیں، جو مخالف سمتوں سے آنے والی غیر یقینی صورتحال سے نمٹتے ہیں۔ اگرچہ امکان معلوم ماڈلز کی بنیاد پر مستقبل کے نتائج کے امکان کی پیشین گوئی کرتا ہے، اعداد و شمار ان ماڈلز کی تعمیر یا تصدیق کے لیے ماضی کے ڈیٹا کا تجزیہ کرتے ہیں، بنیادی سچائی کو تلاش کرنے کے لیے مشاہدات سے پیچھے ہٹ کر مؤثر طریقے سے کام کرتے ہیں۔