Comparthing Logo
ریاضیڈیٹا سائنسلکیری الجبرامشین لرننگ

پرنسپل اجزاء بمقابلہ واحد اقدار

جب کہ ڈیٹا سائنسدانوں کو جہتی کمی میں اکثر دونوں اصطلاحات کا سامنا کرنا پڑتا ہے، پرنسپل اجزاء ڈیٹاسیٹ میں زیادہ سے زیادہ تغیر کی سمتوں کو بیان کرتے ہیں، جب کہ واحد اقدار میٹرکس کے سڑنے کے دوران ان جیومیٹرک محوروں کے ساتھ پیمانے کی شدت کو ناپتی ہیں۔ PCA اور SVD جیسے الگورتھم میں مہارت حاصل کرنے کے لیے ان کے ریاضیاتی پل کو سمجھنا ضروری ہے۔

اہم نکات

  • پرنسپل اجزاء اعداد و شمار کے تغیر کی مقامی واقفیت کا تعین کرتے ہیں، جبکہ واحد اقدار پیمانے کا حکم دیتے ہیں۔
  • ایک براہ راست ریاضیاتی پل ان کو صرف اس وقت جوڑتا ہے جب بنیادی ڈیٹا میٹرکس صحیح طریقے سے وسط مرکز ہو۔
  • SVD واحد اقدار کا براہ راست حساب لگاتا ہے، جو بنیادی اجزاء کو تلاش کرنے کے لیے زیادہ عددی طور پر مستحکم راستہ فراہم کرتا ہے۔
  • پرنسپل اجزاء ایک دوسرے کے لیے آرتھوگونل ہونے چاہئیں، جبکہ واحد اقدار سختی سے غیر منفی حقیقی اعداد ہیں۔

پرنسپل اجزاء کیا ہے؟

آرتھوگونل ویکٹر جو زیادہ سے زیادہ تغیرات کی سمتوں کی طرف اشارہ کرتے ہیں، اعلی جہتی ڈیٹا کو آسان اور کم کرنے میں مدد کرتے ہیں۔

  • وہ ڈیٹاسیٹ کے ہم آہنگی میٹرکس کے ایگین ویکٹرز سے براہ راست مطابقت رکھتے ہیں۔
  • اعداد و شمار میں سب سے زیادہ ممکنہ تغیر کے لیے پہلا پرنسپل جز ہے۔
  • اس کے بعد آنے والا ہر جزو اپنے پہلے والے اجزاء کے لیے سختی سے آرتھوگونل ہے، صفر ارتباط کو یقینی بناتا ہے۔
  • وہ ڈیٹا اسکیلنگ پر بہت زیادہ انحصار کرتے ہیں، جس سے وسط مرکز کو ایک اہم پری پروسیسنگ مرحلہ ہوتا ہے۔
  • انجینئرز معلومات کو محفوظ رکھتے ہوئے انہیں اعلی جہتی خالی جگہوں کو نیچے کی جہت تک پروجیکٹ کرنے کے لیے استعمال کرتے ہیں۔

واحد اقدار کیا ہے؟

ایک واحد ویلیو میٹرکس کی اخترن اندراجات، لکیری تبدیلی کے مطلق پیمانے کے عوامل کی نمائندگی کرتی ہیں۔

  • ان کا شمار میٹرکس کی ایگین ویلیوز کے مثبت مربع جڑوں کے طور پر کیا جاتا ہے جسے اس کے ٹرانسپوز سے ضرب دیا جاتا ہے۔
  • ہر اصلی میٹرکس، چاہے مربع ہو یا مستطیل، واحد قدروں کا ایک منفرد مجموعہ رکھتا ہے۔
  • وہ روایتی طور پر SVD میں سگما میٹرکس کے اخترن کے ساتھ نزولی ترتیب میں ترتیب دیے جاتے ہیں۔
  • صفر کی واحد قدر بتاتی ہے کہ میٹرکس درجہ کی کمی یا واحد ہے۔
  • وہ اکائی کے دائرے میں لکیری تبدیلی کی وجہ سے ہندسی کھینچنے یا مسخ ہونے کی مقدار بتاتے ہیں۔

موازنہ جدول

خصوصیت پرنسپل اجزاء واحد اقدار
ریاضی کی اصل Covariance میٹرکس eigenvectors میٹرکس سڑن (SVD) عوامل
ہندسی تشریح زیادہ سے زیادہ تغیر کی ہدایات پرنسپل محور کی لمبائی پیمائی کرنا
ڈیٹا کی ضرورت شماریاتی معنی کے لیے وسط مرکز والے ڈیٹا کی ضرورت ہے۔ کسی بھی صوابدیدی مستطیل یا مربع میٹرکس پر لاگو ہوتا ہے۔
Eigenvalues سے تعلق covariance میٹرکس کی eigenvalues کے برابر میٹرکس پروڈکٹ کی eigenvalues کے مربع جڑوں کے برابر
بنیادی درخواست جہت میں کمی اور خصوصیت نکالنا میٹرکس الٹا، چھدم الٹا حساب، اور کم درجہ کا تخمینہ
پیمانے پر انحصار ڈیٹا کو شفٹنگ یا اسکیلنگ کرکے نمایاں طور پر تبدیل کیا گیا۔ مخصوص میٹرکس کی موروثی خاصیت جو گلتی جا رہی ہے۔
جسمانی تشریح ڈیٹا کلاؤڈ بیضوی کے محور تبدیل شدہ یونٹ کے دائرے کے کھینچنے والے عوامل

تفصیلی موازنہ

بنیادی تعریف اور تصور

پرنسپل اجزاء ان مخصوص سمتوں کی نمائندگی کرتے ہیں جہاں ڈیٹا سب سے زیادہ مختلف ہوتا ہے، ایک بہتر کوآرڈینیٹ سسٹم کے لیے نئے محور کے طور پر کام کرتا ہے۔ اس کے برعکس، واحد قدریں اسکیلر مقداریں ہیں جو یہ ظاہر کرتی ہیں کہ میٹرکس ان محوروں کے ساتھ کتنی جگہ کو پھیلا یا سکیڑتا ہے۔ جب کہ ایک آپ کو ڈیٹا کلاؤڈ کی واقفیت دیتا ہے، دوسرا خود تبدیلی کی شدت کی پیمائش کرتا ہے۔

ریاضی کا حساب کتاب

روایتی طور پر پرنسپل اجزاء کو تلاش کرنے کے لیے، آپ کو ڈیٹاسیٹ کے ہم آہنگی میٹرکس کے ایجین ویکٹرز کی گنتی کرنی چاہیے۔ واحد قدریں Singular Value Decomposition سے ابھرتی ہیں، جہاں کوئی بھی میٹرکس تین الگ الگ جزو میٹرکس میں تقسیم ہوتا ہے۔ جب آپ وسط کو گھٹا کر اپنے ڈیٹا کو مرکز کرتے ہیں، تو ایک واحد قدر کا مربع نمونہ سائز مائنس ون سے تقسیم کیا جاتا ہے جو اس بنیادی جزو کے تغیر کے بالکل برابر ہوتا ہے۔

ڈیٹا پری پروسیسنگ کے لیے حساسیت

اگر آپ اپنے ڈیٹا کو وسط یا معیاری بنانا بھول جاتے ہیں تو بنیادی اجزاء ڈرامائی طور پر تبدیل ہو جاتے ہیں، کیونکہ شماریاتی تغیر اصل نقطہ اور متغیر پیمانے پر بہت زیادہ انحصار کرتا ہے۔ واحد اقدار، تاہم، فراہم کردہ خام میٹرکس کی ایک بنیادی الجبری خاصیت ہیں۔ وہ شماریاتی مفروضوں کی پرواہ نہیں کرتے ہیں جب تک کہ صارف جان بوجھ کر پہلے ایک مرکزی ہم آہنگی کی طرح میٹرکس نہ بنائے۔

صنعت میں عملی ایپلی کیشنز

ڈیٹا تجزیہ کار سادہ دو جہتی پلاٹوں پر پیچیدہ، اعلیٰ جہتی ڈیٹاسیٹس کو دیکھنے کے لیے بنیادی اجزاء پر انحصار کرتے ہیں۔ دوسری طرف، کمپیوٹر وژن انجینئرز کم درجے کے میٹرکس کے قریب کے ذریعے امیج کمپریشن اور سفارشی نظاموں کے لیے واحد اقدار کا استعمال کرتے ہیں۔ SVD دراصل PCA کے پیچھے ترجیحی عددی انجن ہے کیونکہ واحد قدروں کا حساب لگانا درستگی کے نقصان سے بچتا ہے جو کوویریئنس میٹرکس بناتے وقت ہوتا ہے۔

فوائد اور نقصانات

پرنسپل اجزاء

فوائد

  • + ڈیٹا ویژولائزیشن کے لیے بہترین
  • + کثیر الجہتی کو ختم کرتا ہے۔
  • + مؤثر طریقے سے شور کو کم کرتا ہے۔
  • + مشین لرننگ ماڈلز کو آسان بناتا ہے۔

کونس

  • براہ راست جسمانی معنی کی کمی ہے۔
  • باہر جانے والوں کے لیے انتہائی حساس
  • سخت پری پروسیسنگ کی ضرورت ہے۔
  • معلومات کا نقصان ہوتا ہے۔

واحد اقدار

فوائد

  • + کسی بھی میٹرکس پر کام کرتا ہے۔
  • + عددی لحاظ سے انتہائی مستحکم
  • + کم درجے کے قریب قریب کے لیے بہترین
  • + میٹرکس رینک کو فوری طور پر ظاہر کرتا ہے۔

کونس

  • خلاصہ ریاضیاتی تصور
  • بڑے میٹرکس کے لیے حسابی طور پر مہنگا ہے۔
  • موروثی شماریاتی سیاق و سباق کی کمی ہے۔
  • تشریح کے لیے لکیری الجبرا کی ضرورت ہوتی ہے۔

عام غلط فہمیاں

افسانیہ

پرنسپل اجزاء اور واحد اقدار مکمل طور پر آزاد تصورات ہیں۔

حقیقت

وہ ڈیٹا سینٹرنگ کے ذریعے گہرائی سے جڑے ہوئے ہیں۔ جب ڈیٹا میٹرکس کا اوسط گھٹا دیا جاتا ہے، تو اس کی واحد قدریں اصل اجزاء کے ساتھ متغیرات کے مربع جڑوں کے براہ راست متناسب ہوتی ہیں۔

افسانیہ

پرنسپل اجزاء تلاش کرنے کے لیے آپ کو ہمیشہ کوویرینس میٹرکس کی گنتی کرنی چاہیے۔

حقیقت

جدید سافٹ ویئر شاذ و نادر ہی کوویریئنس میٹرکس کا حساب لگاتا ہے کیونکہ اس میں عددی راؤنڈنگ کی غلطیاں آتی ہیں۔ اس کے بجائے، الگورتھم SVD کو ڈیٹا میٹرکس پر براہ راست چلاتے ہیں، بنیادی اجزاء کو کہیں زیادہ محفوظ اور موثر طریقے سے نکالتے ہیں۔

افسانیہ

واحد اقدار منفی ہو سکتی ہیں اگر ڈیٹا منفی ارتباط کو ظاہر کرتا ہے۔

حقیقت

واحد اقدار تعریف کے لحاظ سے ایک ہم آہنگی میٹرکس سے eigenvalues کی مثبت مربع جڑیں ہیں۔ وہ ہمیشہ غیر منفی حقیقی اعداد ہوتے ہیں، اصل اعداد و شمار میں ارتباط سے قطع نظر، لمبائی یا پھیلانے والے عوامل کی نمائندگی کرتے ہیں۔

افسانیہ

تمام ڈیٹا پوائنٹس میں ایک مستقل قدر شامل کرنے سے واحد اقدار اور بنیادی اجزاء یکساں طور پر بدل جاتے ہیں۔

حقیقت

ڈیٹا کو مستقل طور پر منتقل کرنے سے واحد قدریں بدل جاتی ہیں کیونکہ خام میٹرکس کے اندراجات بدل جاتے ہیں۔ تاہم، چونکہ پرنسپل اجزاء کوویریئنس میٹرکس پر انحصار کرتے ہیں، جو فطری طور پر اوسط کو گھٹا دیتا ہے، اس لیے ڈیٹا کو منتقل کرنے سے پرنسپل اجزاء مکمل طور پر تبدیل نہیں ہوتے ہیں۔

افسانیہ

پہلا پرنسپل جزو ہمیشہ تمام قیمتی معلومات حاصل کرتا ہے۔

حقیقت

پہلا جزو صرف ایک محور کے ساتھ زیادہ سے زیادہ تغیر کو پکڑتا ہے۔ اگر آپ کا ڈیٹا کروی طور پر تقسیم کیا گیا ہے یا اہم غیر لکیری نمونوں پر مشتمل ہے، تو ایک واحد لکیری جزو سب سے اہم ڈھانچے کو مکمل طور پر کھو سکتا ہے۔

عمومی پوچھے گئے سوالات

آپ ایک واحد قدر کو پرنسپل جزو کے تغیر میں کیسے تبدیل کرتے ہیں؟
اگر آپ کے پاس نمونوں کی دی گئی تعداد کے ساتھ اوسط مرکز والا ڈیٹا میٹرکس ہے، تو آپ واحد قدر کو مربع کرتے ہیں اور اسے نمونے کے سائز مائنس ون سے تقسیم کرتے ہیں۔ یہ ریاضیاتی عمل کوویریئنس میٹرکس کی عین مطابق قیمت حاصل کرتا ہے، جو اس مخصوص پرنسپل جز کے ذریعے حاصل کردہ تغیر کی نمائندگی کرتا ہے۔
کیا آپ SVD استعمال کیے بغیر PCA انجام دے سکتے ہیں؟
جی ہاں، آپ کوویریئنس میٹرکس کا واضح طور پر حساب لگا کر اور پھر کلاسیکل ایگینڈیکمپوزیشن کے ذریعے اس کے ایجین ویکٹرز کو تلاش کر کے بنیادی اجزاء تلاش کر سکتے ہیں۔ تاہم، یہ نقطہ نظر عددی طور پر کم مستحکم ہے اور SVD طریقہ کے مقابلے میں فلوٹنگ پوائنٹ کی غلطیوں کا زیادہ خطرہ ہے، یہی وجہ ہے کہ SVD صنعت کا معیار ہے۔
ڈیٹا سینٹرنگ پرنسپل اجزاء کے لیے اتنا اہم کیوں ہے؟
پی سی اے کا مقصد ڈیٹا کلاؤڈ کے مرکز کے ارد گرد تغیر کو زیادہ سے زیادہ کرنا ہے۔ اگر آپ ڈیٹا کے مطلب کو اصل کی طرف منتقل نہیں کرتے ہیں، تو پہلا پرنسپل جزو صرف اصل سے ڈیٹا کلسٹر کے مرکز کی طرف اشارہ کرے گا، تغیر کی اندرونی ہندسی ساخت کو حاصل کرنے میں ناکام رہے گا۔
کیا ہوتا ہے اگر ایک میٹرکس کی واحد قدر صفر ہے؟
صفر واحد قدر کا مطلب ہے کہ میٹرکس میں درجہ کی کمی ہے اور اسے الٹا نہیں کیا جا سکتا۔ ہندسی طور پر، اس کا مطلب یہ ہے کہ لکیری تبدیلی کم از کم ایک جہت کو مکمل طور پر چپٹا کر دیتی ہے، حجم کو ایک ہوائی جہاز یا لائن میں سمٹتی ہے۔
کیا پرنسپل اجزاء eigenvectors جیسے ہیں؟
ان کا قریبی تعلق ہے لیکن اصطلاحات میں الگ ہے۔ پرنسپل اجزاء نئے محوروں کے ساتھ اصل متوقع ڈیٹا پوائنٹس ہیں، حالانکہ بہت سے پریکٹیشنرز اس اصطلاح کو بول چال میں بنیادی سمتوں کا حوالہ دینے کے لیے استعمال کرتے ہیں، جو حقیقتاً ہم آہنگی میٹرکس کے ایجین ویکٹر ہیں۔
امیج کمپریشن، پی سی اے یا ایس وی ڈی کے لیے کون سا بہتر ہے؟
SVD کو عام طور پر ترجیح دی جاتی ہے اور تصویر کمپریشن کے لیے ایک تکنیک کے ذریعے زیادہ سیدھی ہوتی ہے جسے لو-رینک اپروکسیمیشن کہا جاتا ہے۔ چونکہ ایک تصویر پہلے سے ہی آزاد مشاہدات کے شماریاتی نمونے کی بجائے پکسلز کا ایک ساختی میٹرکس ہے، اس لیے SVD فائل کے سائز کو بغیر کسی رکاوٹ کے کم کرنے کے لیے کم سے کم اہم واحد اقدار کو تراشتا ہے۔
مجھے ایک ماڈل میں کتنے پرنسپل اجزاء رکھنے چاہئیں؟
ایک عام نقطہ نظر ایک سکری پلاٹ کو دیکھنا یا واحد اقدار کا استعمال کرتے ہوئے مجموعی وضاحت شدہ تغیرات کا حساب لگانا ہے۔ زیادہ تر ڈیٹا سائنسدانوں کا مقصد مخصوص پروجیکٹ کے شور کی سطح پر منحصر ہے، کل تغیرات کے 80% سے 95% تک کو حاصل کرنے کے لیے کافی اجزاء کو برقرار رکھنا ہے۔
اگر آپ میٹرکس کو منتقل کرتے ہیں تو کیا واحد اقدار تبدیل ہوتی ہیں؟
نہیں، میٹرکس کو منتقل کرنے سے اس کی واحد اقدار میں کوئی تبدیلی نہیں آتی۔ میٹرکس اور اس کے ٹرانسپوز کی غیر صفر واحد قدریں مکمل طور پر ایک جیسی رہتی ہیں کیونکہ ان کے متعلقہ کراس پروڈکٹ میٹرکس کی ایگین ویلیوز بالکل یکساں ہیں۔
eigenvalue اور واحد قدر میں کیا فرق ہے؟
Eigenvalues کی وضاحت صرف مربع میٹرس کے لیے کی جاتی ہے اور یہ پیچیدہ اعداد ہو سکتے ہیں، جس کی نمائندگی کرتے ہوئے سمت تبدیل کیے بغیر ویکٹر کی پیمائش کیسے کی جاتی ہے۔ واحد قدریں کسی بھی میٹرکس پر لاگو ہوتی ہیں، ہمیشہ حقیقی اور غیر منفی ہوتی ہیں، اور تبدیلی کے تحت یونٹ کے دائرے کے زیادہ سے زیادہ پھیلاؤ کی نمائندگی کرتی ہیں۔

فیصلہ

جب آپ کا بنیادی مقصد تغیر کی بنیاد پر شماریاتی ڈیٹاسیٹ کی خصوصیات کی تشریح، تصور، یا کم کرنا ہو تو بنیادی اجزاء کا انتخاب کریں۔ جب آپ کو لکیری نظاموں کو حل کرنے، میٹرکس کو کمپریس کرنے، یا شماریاتی پری پروسیسنگ کے بارے میں فکر کیے بغیر مستحکم عددی کمپیوٹیشن کرنے کی ضرورت ہو تو واحد اقدار کا انتخاب کریں۔

متعلقہ موازنہ جات

اسکیلر بمقابلہ ویکٹر مقدار

جبکہ اسکیلرز اور ویکٹر دونوں ہمارے اردگرد کی دنیا کی مقدار درست کرتے ہیں، بنیادی فرق ان کی پیچیدگی میں ہے۔ اسکیلر طول و عرض کی ایک سادہ پیمائش ہے، جب کہ ایک ویکٹر اس سائز کو ایک مخصوص سمت کے ساتھ جوڑتا ہے، جو اسے جسمانی خلا میں حرکت اور قوت کو بیان کرنے کے لیے ضروری بناتا ہے۔

اصلی بمقابلہ کمپلیکس نمبر

جبکہ حقیقی اعداد ان تمام اقدار کو گھیرے ہوئے ہیں جنہیں ہم عام طور پر طبعی دنیا کی پیمائش کے لیے استعمال کرتے ہیں—پورے عدد سے لے کر لامحدود اعشاریہ تک—پیچیدہ اعداد خیالی اکائی $i$ کو متعارف کروا کر اس افق کو بڑھاتے ہیں۔ یہ اضافہ ریاضی دانوں کو ان مساواتوں کو حل کرنے کی اجازت دیتا ہے جن کا کوئی حقیقی حل نہیں ہے، جس سے ایک دو جہتی نمبر کا نظام تشکیل پاتا ہے جو جدید طبیعیات اور انجینئرنگ کے لیے ضروری ہے۔

الجبرا بمقابلہ جیومیٹری

جب کہ الجبرا عمل کے تجریدی اصولوں اور نامعلوم کو حل کرنے کے لیے علامتوں کی ہیرا پھیری پر توجہ مرکوز کرتا ہے، جیومیٹری خلا کی طبعی خصوصیات کو دریافت کرتی ہے، بشمول سائز، شکل، اور اعداد و شمار کی رشتہ دار پوزیشن۔ ایک ساتھ مل کر، وہ ریاضی کی بنیاد بناتے ہیں، منطقی تعلقات کو بصری ڈھانچے میں ترجمہ کرتے ہیں۔

الگورتھمک جنریشن بمقابلہ انسانی تشریح

جب کہ الگورتھمک نسل ریاضی کے ڈھانچے، ثبوت، اور مقررہ اصولوں پر مبنی خام ڈیٹا کو تیزی سے تیار کرنے کے لیے بے پناہ کمپیوٹنگ طاقت کا فائدہ اٹھاتی ہے، انسانی تشریح ان نتائج کو سمجھنے کے لیے ضروری وجدان، سیاق و سباق اور تصوراتی فریم ورک فراہم کرتی ہے، جو جدید ریاضی میں ایک گہرے سمبیوسس کو اجاگر کرتی ہے۔

امکان بمقابلہ شماریات

امکان اور اعدادوشمار ایک ہی ریاضی کے سکے کے دو رخ ہیں، جو مخالف سمتوں سے آنے والی غیر یقینی صورتحال سے نمٹتے ہیں۔ اگرچہ امکان معلوم ماڈلز کی بنیاد پر مستقبل کے نتائج کے امکان کی پیشین گوئی کرتا ہے، اعداد و شمار ان ماڈلز کی تعمیر یا تصدیق کے لیے ماضی کے ڈیٹا کا تجزیہ کرتے ہیں، بنیادی سچائی کو تلاش کرنے کے لیے مشاہدات سے پیچھے ہٹ کر مؤثر طریقے سے کام کرتے ہیں۔