تحلیل دادههای آماری
متقاضیان وام بانک آلمانی
ارائهدهنده: امیرحسینکاظمنژاد / استاد راهنما: جناب آقای دکتر رحمانی / دانشگاه علموصنعت ایران
۱- بررسی و شناخت جامعهی آماری
۲- بررسی نکات جالب توجه
۲- بررسی موارد مشکوک
۳- پیداکردن عوامل موثر بر موفقیت
۴- مدلسازی
۵- روابط بین سایر متغیرها
۶- خوشهبندی افراد شکستخورده
۷- جمعبندی و نتیجهگیری
نقشه
لیست متغیرهای موجود
۱- موجودی حساب جاری
۲- موجودی حساب سپرده
۳- سابقهی خوشحسابی
۴- هدف از وام
۵- سابقهی کاری
۶- وضعیت تاهل
۷- ضامنها
۸- ارزشمند ترین کالا
۹- سایر وامهای در حال اجرا
۱۰- مسکن
۱۱- شغل
۱۲- جنسیت
۱۳- صاحب خط تلفن
۱۴- کارگر خارجی
۱۵- مبلغ وام
۱۶- مدت زمان بازپرداخت وام
۱۷- درصد از حقوق
۱۸- مدتزمان سکونت در محل فعلی
۱۹- سن
۲۰- تعداد حساب
۲۱- تعداد افراد وابسته
اسمی
عددی
بررسی تکی متغیرها
سن
نزدیک به ۷۰ درصد جامعه سنی کمتر از ۳۶ سال دارند.
بالاتر رفتن سن کمکی چندانی به خوشحساببودن نمیکند.
بررسی تکی متغیرها
مدت زمان سکونت در آدرس فعلی
بررسی تکی متغیرها
تعداد نفرات وابسته به هر فرد
بررسی تکی متغیرها
تعداد حسابهای همزمان
٪۶۵ از افراد تنها یک حساب در این بانک دارند.
بررسی تکی متغیرها
مبلغ وام گرفتهشده
بازهی ۱۳۰۰ تا ۲۰۰۰ و بازهی ۵۸۰۰ تا ۷۰۰۰ بیشترین محبوبیت را داشتهاند؛
که به ترتیب برای خرید رادیو/تلوزیون و خودرو استفاده شدهاند.
بررسی تکی متغیرها
مدت زمان بازگشت پول
بیشتر وامها ۱ساله و ۲ساله هستند.
بررسی تکی متغیرها
درصد بازپرداخت از حقوق
بررسی تکی متغیرها
موجودی حساب جاری
۱. بدون اکانت: ٪۳۹.۴
۲. صفر و کمتر: ٪۲۷.۴
۳. بین صفر و ۲۰۰: ٪۲۶.۹
۴. بیشتر از ۲۰۰: ٪۶.۳
بیش از نیمی از جامعه «کمتر از ۲۰۰ DM» در حساب جاریشان دارند.
افرادی که حساب جاری ندارند، نسبت به بقیه خوشحسابتر بودند.
بررسی تکی متغیرها
موجودی حساب سپرده
۱. کمتر از ۱۰۰: ٪۶۰.۳
۲. حساب نامشخص: ٪۱۸.۳
۳. بین ۱۰۰ و ۵۰۰: ٪۱۰.۳
۴. بین ۵۰۰ و هزار: ٪۶.۳
۵. بیشتر از هزار: ٪۴.۸
تنهای ۲۰ درصد از مردم، حسابی با موجودی بیشتر ۱۰۰DM در این بانک دارند.
پولدارها خوشحسابترند! افرادی که بیشاز ۱۰۰۰DM در حساب سپردهشان دارند به نسبت بقیه خوشحسابتر هستند.
بررسی تک متغیرها
شغل
۱. کارمند رسمی: ٪۶۳
۲. بیمهارت - ساکن: ٪۲۰
۳. مدیر - پستهای بالا: ٪۱۴.۸
۴. بیکار - غیر ساکن: ٪۲.۲
بررسی تک متغیرها
مدت زمان ماندن در شغل فعلی
۱. ۱ تا ۴ سال: ٪۳۳.۹
۲. بیشاز ۷ سال: ٪۲۵.۳
۳. ۴ تا ۷ سال: ٪۱۷.۴
۴. کمتر از ۱: ٪۱۷.۲
۵. بیکار: ٪۶.۲
بررسی تک متغیرها
مدت زمان ماندن در شغل فعلی
بررسی تک متغیرها
شغل
۷۸ درصد جامعه شاغل هستند ولی ۲۰.۲ درصد از آنها هیج مهارتی ندارند.
۸۱٪ از افراد صاحب شغل را کارمندان تشکیل میدهند.
مدیران بیشترین وفاداری به شغل خود را دارند.
۴۵ نفر از کارمندان و مدیران، بیکار هستند!!
بیکارها بیشترین میانگین سنی را دارند.
بررسی تک متغیرها
وضعیت مسکن
۱. صاحب خانه: ٪۷۱.۳
۲. خانهی اجارهای: ٪۱۷.۹
۳. خانهی سازمانی: ٪۱۴.۸
بررسی تک متغیرها
وضعیت مسکن
نزدیک ٪۱۵ از مردم هیچ پولی بابت هزینهی مسکن نمیپردازند.
افرادی که خانهی رایگان دارند، نسبت به بقیه مدت زمان بیشتری ساکن بودهاند.
صاحبخانهها کمتر از بقیه در مکان فعلیشان مانده بودند.
بررسی تک متغیرها
جنسیت و وضعیت تاهل
بررسی تک متغیرها
تعداد نفرات وابسته به هر فرد
بیشاز نصف جامعه را مردهای مجرد تشکیل میدهند. (٪۹۱ از مردها مجرد هستند.)
تعداد خانمهای مجردی که وام گرفتهاند، صفر است.
مردان مجرد سرپرست افراد بیشتری هستند!
مردان مجرد پیرتر از مردان متاهل هستند.
بررسی تک متغیرها
هدف دریافت وام
بررسی تک متغیرها
هدف دریافت وام
بررسی تک متغیرها
هدف دریافت وام
بیشترین مبالغ به ترتیب برای خودروی دست دو، کسبوکار و تحصیلات است.
مردم برای خرید خودروی دست دو، هزینهی بیشتری نسبت خودروی نو و حتی کسبو کار طلب میکنند.
متقاضیان وام برای تحصیلات، بد حسابترین دستهبودند، جالب است بدانید میانگین سنی این افراد نزدیک به ۴۰ است.
بررسی تک متغیرها
با ارزشترین دارایی
۱. ماشین و غیره: ٪۳۳.۲
۲. املاک: ٪۲۸.۲
۳. بیمه عمر: ٪۲۳.۲
۴. هیچی/ ناشناخته: ٪۱۵.۴
صاحبان ملک نسبتا خوشحسابتراند.
بررسی تک متغیرها
سابقهی خوش حسابی
۱. تا الآن سر وقت: ٪۵۳
۲. حساب بحرانی: ٪۲۹.۳
۳. تاخیر در گذشته: ٪۸.۸
۴. سر وقت در این بانک: ٪۴.۹
۵. سروقت: ٪۴
نزدیک به ٪۶۳ جامعه تا به حال سابقهی خوبی از خود به جا گذاشتند.
سابقهی خوب رابطهی معکوسی با خوشحسابی دارد.
بررسی تک متغیرها
کارگر خارجی
۱. خارجی: ٪۹۶.۳
۲. بومی: ٪۳.۷
تنها ٪۱.۳ بدحسابها بومی هستند.
بررسی تک متغیرها
خط تلفن
۱. ندارد: ٪۵۹.۶
۲. دارد: ٪۴۰.۴
٪۱۳ بومیها تلفن دارند، در حالی که این عدد برای خارجیها ٪۴۱ است.
بررسی تک متغیرها
وضعیت ضامن
۱. ندارد: ٪۹۰.۷
۲. دارد: ٪۵.۲
۲. دو نفری: ٪۴.۱
وامهای ۲ نفری عموما به شکست میانجامد.
بررسی تک متغیرها
سایر وامهای همزمان
تقریبا ٪۱۹ افراد، وام درحال اجرای دیگری، به غیر از این بانک دارند.
۱- بررسی و شناخت جامعهی آماری
۲- بررسی نکات جالب توجه
۲- بررسی موارد مشکوک
۳- پیداکردن عوامل موثر بر موفقیت
۴- مدلسازی
۵- روابط بین سایر متغیرها
۶- خوشهبندی افراد شکستخورده
۷- جمعبندی و نتیجهگیری
نقشه
بررسی نکات جالب توجه
عوامل موثر بر مبلغ وام - متغیرهای عددی
نتیجه: فقط رابطهی نسبتا قوی با مدت زمان وام وجود دارد.
بررسی نکات جالب توجه
عوامل موثر بر مبلغ وام - متغیرهای غیر عددی
بررسی نکات جالب توجه
عوامل موثر بر مبلغ وام - متغیرهای غیر عددی
بررسی نکات جالب توجه
عوامل موثر بر مبلغ وام - متغیرهای غیر عددی
مدیران به طور میانگین ۲ برابر مبلغ بیشتری دریافت کردهاند.
نتایج:
افراد صاحبخانه کمترین مبلغ وام را نسبت به اقشار دیگر دریافت کردهاند.
افرادی که برای مسکن هزینه نمیکنند، بیشترین مبلغ وام را گرفتهاند، جالب است بدانید همین قشر نیز بیشترین درصد شکست را بین سایرین دارند.
هرچه ارزش دارایی کم میشود، مبلغ وام بالا میرود.
بررسی نکات جالب توجه
بررسی اهداف متقاضیان
افراد کمتر از ۲۶ سال:
افراد بیشتر از ۳۹ سال:
رادیو/تلویزیون کالای مورد علاقهی کمسنترها و خودروی نو مورد علاقه مسنتر هاست.
نتایج:
مسنترها علاقهی بیشتری به آموزش نشان دادند.
بررسی نکات جالب توجه
بررسی اهداف متقاضیان
علایق مدیران: خودرو
علایق کارمندان: رادیو/تلوزیون - خودرو نو
علایق بیمهارتها: رادیو/تلوزیون - خودرو نو
علایق بیکارها: خودرو نو
بررسی نکات جالب توجه
بررسی اهداف متقاضیان
بررسی نکات جالب توجه
بررسی اهداف متقاضیان
هرچه ارزش دارایی بالا میرود تمایل به آموزش و تحصیلات کاهش مییابد.
نتایج:
صاحبان املاک و صاحبان خودرو تمایل بیشتری برای بهبود کسبوکار داشتند.
صاحبان املاک کمترین تمایل برای خرید خودروی دست۲ را دارند.
۱- بررسی و شناخت جامعهی آماری
۲- بررسی نکات جالب توجه
۲- بررسی موارد مشکوک
۳- پیداکردن عوامل موثر بر موفقیت
۴- مدلسازی
۵- روابط بین سایر متغیرها
۶- خوشهبندی افراد شکستخورده
۷- جمعبندی و نتیجهگیری
نقشه
بررسی موارد مشکوک
بررسی وضعیت خانهها و دارایی
چرا ٪۶۷ کسانی که خانه دارند، با ارزشترین دارای خود را چیزی غیر از ملک معرفی کردند؟
سوال:
بررسی موارد مشکوک
بررسی وضعیت خانهها و دارایی
۸۳٪ از این افراد از مدیران و کارمندان هستند.
نتایج:
نزدیک به ٪۳۰ آنان از زنان غیر مجرد هستند.
۴۰٪ آنان سابقهی بانکی خرابی دارند.
بررسی موارد مشکوک
بررسی وضعیت مشاغل
چرا ۴۵ نفر از افرادی که شغل خود را کارمند یا مدیر معرفی کردند، هیچ سابقهی کاری ندارند؟
سوال:
(این افراد نرخ شکستی برابر با ٪۴۰ دارند)
بررسی موارد مشکوک
موارد مشکوک
1
2
3
4
بررسی موارد مشکوک
موارد مشکوک
1.
بررسی موارد مشکوک
موارد مشکوک
2.
بررسی موارد مشکوک
موارد مشکوک
3.
بررسی موارد مشکوک
موارد مشکوک
4.
۱- بررسی و شناخت جامعهی آماری
۲- بررسی نکات جالب توجه
۲- بررسی موارد مشکوک
۳- پیداکردن عوامل موثر بر موفقیت
۴- مدلسازی
۵- روابط بین سایر متغیرها
۶- خوشهبندی افراد شکستخورده
۷- جمعبندی و نتیجهگیری
نقشه
عوامل موثر بر موفقیت
متغیرهای اسمی
عوامل موثر بر موفقیت
متغیرهای اسمی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای غیر عددی
عوامل موثر بر موفقیت
متغیرهای اسمی - مقدار chi square
chi square | attribute |
---|---|
123.721 | checking_acc |
39.099 | saving_acc |
61.691 | history |
33.356 | purpose |
18.368 | employ |
5.699 | sex |
9.605 | marage |
6.645 | debators |
23.72 | property |
12.839 | plans |
18.2 | housing |
1.885 | job |
1.33 | telephone |
6.737 | foreign_worker |
عوامل موثر بر موفقیت
متغیرهای اسمی - نتایج
عوامل موثر:
۱- موجودی حساب جاری (+)
۲- سابقه خوشحسابی (-)
۳- حساب سپرده (+)
۴- هدف
۵- با ارزشترین دارایی (+)
۶- سابقهی شغلی (+)
عوامل موثر بر موفقیت
متغیرهای عددی
عوامل موثر:
۱- مدت زمان (-)
۲- میزان وام (-)
۳- سن (+)
۴- درصد از درآمد (-)
۵- تعداد حسابها (+)
۱- بررسی و شناخت جامعهی آماری
۲- بررسی نکات جالب توجه
۲- بررسی موارد مشکوک
۳- پیداکردن عوامل موثر بر موفقیت
۴- مدلسازی
۵- روابط بین سایر متغیرها
۶- خوشهبندی افراد شکستخورده
۷- جمعبندی و نتیجهگیری
نقشه
مدلسازی
متغیرها
متغیر های ورودی:
تمامی متغیرهای ذکرشده در ابتدا
متغیر هدف:
وضعیت خوشحسابی
مدلسازی
بررسی دقت الگوریتمها به روش k-fold
k = 10
Testing Accuracy | Training Accuracy | |
---|---|---|
71.7% | 99.36% | SVM |
75.7% | 78.556% | LSVM |
70.5% | 92.878% | Random-Tree |
72.9% | 74.857% | Tree-As |
58.9% | 61.378% | CR-Tree |
72.8% | 83.333% | Bayes |
71.4% | 80.2% | KNN |
مدلسازی
بررسی الگوریتمها - SVM
مدلسازی
بررسی الگوریتمها - SVM - تلاش برای بهبود
دقت جدید: ۷۳.۷٪
۱- بررسی و شناخت جامعهی آماری
۲- بررسی نکات جالب توجه
۲- بررسی موارد مشکوک
۳- پیداکردن عوامل موثر بر موفقیت
۴- مدلسازی
۵- روابط بین سایر متغیرها
۶- خوشهبندی افراد شکستخورده
۷- جمعبندی و نتیجهگیری
نقشه
روابط سایر متغیرها
سایر متغیر
روابط سایر متغیرها
سایر متغیر
هرچه موجودی حساب جاری بیشتر -> موجوی حساب سپرده بالاتر
نتایج:
هرچه سابقهی بانکی بدتر -> تعداد حسابها بیشتر
هرچه هزینه برای مسکن بالاتر -> میزان سکونت کمتر
۱- بررسی و شناخت جامعهی آماری
۲- بررسی نکات جالب توجه
۲- بررسی موارد مشکوک
۳- پیداکردن عوامل موثر بر موفقیت
۴- مدلسازی
۵- روابط بین سایر متغیرها
۶- خوشهبندی افراد شکستخورده
۷- جمعبندی و نتیجهگیری
نقشه
خوشهبندی
افراد شکستخورده
متغیر های ورودی:
۱- سابقهی شغلی
۲- وضعیت تاهل
۳- با ارزشترین دارایی
۴- وضعیت مسکن
۵- شغل
۶- مدتزمان سکونت
۷- تعداد حسابها
خوشهبندی
افراد شکستخورده
خوشهبندی
افراد شکستخورده - اهمیت متغیرها
خوشهبندی
افراد شکستخورده
دستهها:
مسکن | دارایی | تاهل | سابقه شغلی | زمان سکونت | |
---|---|---|---|---|---|
دسته ۱ | صاحبخانه | ملک | مردان مجرد + غیر مجرد | ۱ تا ۴ سال | ۲.۴ سال |
دسته ۲ | صاخبخانه + اجارهای | خودرو | زنان غیر مجرد | ۴ سال | ۲.۸ سال |
دسته ۳ | خانهی رایگان | هیچ / نامشخص | فقط مردان مجرد | بیش از ۷ سال | ۳.۵ سال |
۱- بررسی و شناخت جامعهی آماری
۲- بررسی نکات جالب توجه
۲- بررسی موارد مشکوک
۳- پیداکردن عوامل موثر بر موفقیت
۴- مدلسازی
۵- روابط بین سایر متغیرها
۶- خوشهبندی افراد شکستخورده
۷- جمعبندی و نتیجهگیری
نقشه
جمعبندی و نتیجهگیری
۱- موجودی حساب جاری (+)
۲- سابقه بانکی (-)
۳- حساب سپرده (+)
۴- هدف
۵- با ارزشترین دارایی (+)
۶- سابقهی شغلی (+)
۱- مدت زمان (-)
۲- میزان وام (-)
۳- سن (+)
۴- درصد از درآمد (-)
۵- تعداد حسابها (+)
عوامل موثر بر خوشحسابی یا بدحسابی
با استفاده از این عوامل، مدلهای موجود میتوان خوشحساب بودن را با دقت بیشاز ٪۷۰ محاسبه کرد.
گذشتهی افراد نمیتواند معیار خوبی برای پیشبینی خوش حسابی باشد، اموال حال حاضر و پتانسیل مالی تاثیرگذاری بیشتری دارند.
جمعبندی و نتیجهگیری
هدفوام، شغل و با ارزشترین دارای (احتمالا تاثیر غیر مستقیم) بیشترین تاثیر را داشتهاند
عوامل موثر بر مبلغ وام
بیشترین تاثیر از طرف مبلغ وام میباشد
عوامل موثر بر زمان بازپرداخت
سپاس از توجه شما
German Bank
By Amirhossein Kazemnejad
German Bank
- 678