در بیشتر مسائل عملی مشاهدات بصورت تعداد زیادی متغیرهای همبسته میباشند برای تحلیل اینگونه مشاهدات به دنبال روشهای آماری هستیم که بدون اینکه اطلاعاتی را از دست داده باشیم بعد مسأله را تا حد قابل ملاحظهای کاهش دهیم در حقیقت با کنار گذاشتن متغیرهای با واریانس پایین و توجه به متغیرهای با واریانس بالا میتوانیم به راحتی مسأله را در یک زیر فضایی با بعد کمتر مورد مطالعه قرار دهیم.
بردار تصادفی X را با بردار میانگین و ماتریس کواریانس یک بردار p بعدی در نظر می گیریم. مولفههای اصلی x عبارتند از ترکیبات خطی استاندارد شده مولفه های x که بر حسب واریانس ها ویژگیهای خاصی دارند.
وزنهایی که در مولفه های اصلی به بردار تصادفی x مربوط میشوند و دقیقاً بردارهای ویژه استاندارد شده ماتریس کواریانس x هستند ریشههای ماتریس مشخصه کواریانس برابر مولفههای اصلی میباشند و بزرگترین ریشه برابر واریانس اولین مولفه اصلی است. برای X هیچ توزیعی فرض نمیکنیم تنها شرط لازم برای تحلیل مولفههای اصلی این است که متغیرهای اصلی همبستگی معنیداری داشته باشند.
چنانچه مولفههای بردار X هم بعد یا هم واحد نباشند میتوان مقادیر ویژه متناظر با ماتریس همبستگی بردار را بدست آورد بکار بردن ماتریس همبستگی باعث استاندارد شدن متغیرها نسبت به واحد واریانس میگردد/.
بطور کلی اگر بردار X یک بردار تصادفی P متغیر باشد برای بدست آوردن مولفههای اصلی آن چنین عمل میکنیم.
ابتدا مقادیر ویژه مربوط به ماتریس کواریانس یا ماتریس همبستگی P را محاسبه می کنیم
I ماتریس P بعدی همانی و یک ماتریس قطری باشد آنگاه
اگر مولفه اصلی متناظر با متغیر باشد آنگاه
= درصد تغییرات iمین مولفه به کل تغییرات
پس از تعیین مقادیر ویژه بردارهای ویژه متناظر با هر یک از مقادیر محاسبه میگردد.
مقدار اهمیت k مین متغیر اولیه یعنی را در iمین مولفه اصلی یعنی اندازه میگیرد.
ضریب همبستگی بین مولفههای و متغیر برابر است با
واریانس K مین متغیر x است.
مقادیر ویژه مربوط به ماتریس همبستگی نمونه را محاسبه کرده و داریم:
شامل 18 صفحه فایل word قابل ویرایش
دانلود مقاله مولفههای اصلی Principle component