گستره کاربرد داده کاوی در درگاه پرداخت ePayBank.ir
امروزه ، داده کاوی یک ضرورت برای مدیران پیشرو تلقی می شود و آنها باید به سمتی بروند تا بتوانند از داده های اطرافشان بهتر و بیشتر بهره مند شوند و به دانش لازم برای اجرایی کردن اهداف خود دست یابند. بسیاری از موضوعاتی که در اطراف ما وجود دارند، به خوبی دیده نشده اند و کاملا استفاده نمی شوند. برای این کار باید از مدل ها و سیستم های خاصی برخوردار باشیم، اگر چه بسیاری از قوانین برای ما تقریبا مبهم است. در اطراف خود شاهد اقداماتی هستیم که به خوبی نمی دانیم این اتفاقات به خاطر چیست و از کجا ناشی شده اند و کدامیک از عوامل میتوانند موجب انجام درست کارها شوند. وقتی عوامل اطراف ما ناشناخته هستند یا تعدد آنها خیلی زیاد است باید از واقعیت های اطراف خود، مدل ها یا الگوهایی را طراحی کنیم. پرسش این است که کدامیک از رویکردهای مدل سازی به سمت رویکرد ها و مدل های مبتنی بر داده حرکت کرده است؟ مثلا اگر بتوانیم اطلاعات مربوط به خیابان های اصلی و فرعی را در حوزه ترافیک در اختیار داشته باشیم، میتوانیم مدل هایی را برای ساماندهی بهتر ترافیک بسازیم. البته عواملی وجود دارند که کاملا در اختیار ما نیستند و نمیتوان تمام آنها را در مدل ها لحاظ کرد اما میتوان شرایط موجود و واقعیات اطراف را در مدل ها اعمال کرد و براساس آنها به مضووعات پرداخت و خروجی حاصل از این رویکرد را مطالعه نمود.
مدل های داده کاوی روند فعالیت ها و عملرکد ها را گسترده می سازند و دستاوردهای زیادی را در اختیار درگاه پرداخت ePayBank.ir قرار می دهند طوری که دیگر نباید نگران عوامل بسیار متفاوتی باشیم که در اطرافمان وجود دارند. اینکه مساله امروز ما مساله معیشتی است یا نه، یا اینکه بزه کاری عامل طلاق است یا برعکس یا اساسا فقر عامل هردو است، نباید نگران باشیم که کدام عوامل مستقل هستند و کدام وابسته، بلکه با مدل های این حوزه میتوان شرایط اطراف در جامعه را مانیتور کرده و واقعیت های اجتماعی را کشف کرد. بر این اساس است که در بسیاری موارد خروجی ها، مبنایی برای تصمیم گیری ها قرار می گیرند.
کاربرد های داده کاوی
در گذشته ای نه چندان دور، اعتقاد بر این بود که در هر سال، داده های اطراف ما دوبرابر می شوند. اما امروز شاهد هستیم که داده ها لحظه به لحظه در حال تغییر و افزایش هستند. چشمان خود را ببندید و تصور کنید که هر داده ای که در اطراف خود دارید یک برگ کاغذ است. در این صورت، زیرانبوهی از کاغذهای اطراف غرق شده اید. ما در داشتن داده ها بسیار غنی هستیم. اما در استفاده از دانش درون داده ها کاملا فقریم.
ما می دانیم که امروز در کشور، مجموعه عظیمی از داده ها در حال جمع آوری است که هزینه های هنگفتی برای جمع آوری و نگه داشت آنها می شود. این Data housing بسیار ضروری است. مثلا ما باید بدانیم در یک بانک چه پولی از کجا به کجا رفته است، چه وام هایی پرداخت شده است و چه کسانی وام های خود را پس داده اند یا نه. تمام این اطلاعات و سایر اطلاعات بسیاری از حوزه ها باید ثبت و ضبط شود. چون بانک باید بدرستی بداند که چه اتفاقاتی رخ می دهد و تعداد بستانکاران و بدهکاران چقدر است و بسیاری اطلاعات دیگر، اما حجم عظیم هزینه هایی که متقبل می شویم تا گنجی ازاطلاعات را به دست اوریم، صرفا برای استفاده عملیاتی نیست، بلکه برای ساتفاده های تحلیلی است مثلا کدامیک از مشتریان خوش حساب و کدامیک بد حساب هستند؟
مهم این است که رویکردهای ما همراه با سعی و خطا نباشد، بلکه بجای داشتن اطلاعات گنگ، به کمک اطلاعات شفاف و درست، عملکردی بسیار قاطع و درست داشته باشیم، مثلا آیا می دانیم که میان مشتریانی که به سمت ما می آیند چه اتفاقی می افتد؟ یا آیا میتوانیم فردای خود را پیش بینی کنیم و برای آن برنامه داشته باشیم؟ آیا میتوانیم شرایطی را برای خود ایجاد کنیم تا بسیار فعال حرکت کنیم؟ به طور کلی، آیا میتوان برنامه ای تنظیم کرد تا به این اهداف دست یابیم؟
قطعا برای تنظیم چنین برنامه ای نیاز به داده و بعضا اطلاعات است. به همین علت است که پلیس راهنمایی و رانندگی کشور مرتب داده های حوزه کاری خود را جمع آوری می کند تا میزان تصادفات در سطح کشور مطلع باشد و برای کاهش آنها برنامه ریزی نماید و برنامه مدونی را برای آینده پیش بینی کند. مثلا برنامه مدونی را برای رانندگان پیش از وقوع تصادف تنظیم کند. تمام این برنامه ریزی ها انجام نمی شود مگر اینکه متکی بر جمع آوری داده ها و تحلیل آنها باشد، امروز، مدل های داده کاوی بسیار هوشمند شده اند، در مدل های مربوط به مترو در کشورهای توسعه یافته طوری برنامه ریزی شده که متروها با توجه به شرایط جمعیتی و براساس یک جدول زمانی آمد و شد می کنند. چون نوعی هوش داده کاوی آن را هدایت می کند که برخوردار از تمام داده های رفت و آمد شهری و حتی کشور است. مگر هوش انسانی میتواند چنین تنظیم و عملکردی داشته باشد؟ اما BRT موجود در شهر تهران، در تابستان همان طور رفت و آمد می کند که در فصلی که دانشگاه ها هنوز تعطیل نشده بودند و جمعیت زیادتر بود، در مترو میبینید صبح ها واگن خانم ها خالی است اما واگن آقایان بسیار فشرده است و در ساعت 11 این جریان برعکس است. چرا؟ چون اطلاعات مربوط به ساتفاده مردم از مترو به خوبی مطالعه و تحلیل نشده است. در صورتی که داده های آن بسیار مهیا و فراهم است. کافی است کارت های مترو به اطلاعات دموگرافیک شهرداری متصل شود.
در سال 2012 در شهر رم نوعی مدیریت تقاضا اجرا شد، به این شکل که با بسیاری از شهروندان شهر رم صحبت شد تا اجازه بدهند به کمک شرکت مخابرات و از طریق موبایل، مسیرهایی را که طی روز رفته اند رصد شود تا به کمک این اطلاعات، زمان اوج سفر ها را محاسبه کرده و مسیرهای رفت و آمد ترافیکی را کنترل و تسهیل کنند و از این طریق موفق به کاهش 20 درصدی ترافیک شهری شده اند.
در سال 2012 در شهر بوستون، کنسرت بزرگی برگزار شد و پلیس آن شهر از قبل اطلاعات تمام مسیرهایی را که به آن کنسرت ختم می شد در اختیار داشت و می دانست حمل و نقل آن مسیر چگونه است؛ مثلا چه تعدادی با خودرو شخصی و چه تعدادی با موتورسیکلت و یا اتوبوس و یا مترو خود را به کنسرت می رسانند و برای تمام این حالات برنامه ریزی قبلی صورت گرفته بود تا میزان ترافیک به حداقل ممکن برسد.
در شهر نیویورک با همین رویکرد توانسته اند 45 درصد جرم را کاهش دهند، طوری که در منطقه منهتن در ساعت 12 شب امنیت بسیار خوبی برقرار شده است.
برنامه ریزی در زمان اوج مصرف انرژی را در نظر بگیرید. میتوان برای زمان اوج مصرف انرژی طوری برنامه ریزی کرد تا صرفه جویی لازم انجام شود، اما خللی برای مصرف کنندگان ایجاد نشود. اینها تماما رویکردهای ملموسی هستند که توسط داده کاوی و تحلیل داده های اطراف در حوزه ها و تبدیل آنها به برنامه انجام می شوند.
اینکه قیمت محصولات کشاورزی در کشور مرتبا تغییر می کند و یکباره گران می شود به علت نبود یک برنامه ریزی درست براساس مدلهای ناشی از داده کاوی در حوزه کشاورزی است که اطلاعات مربوط به میزان مصرف محصولات کشاورزی و نیز شرایط تولید محصولات به طور روزانه تهیه نمی شود و فاقد مدل های درست، برنامه ریزی در کشاورزی است. این مدل ها در حوزه های فرهنگی، اجتماعی، پزشکی ، انرژی و … نیز کاربردهای بسیاری میتواند داشته باشد.
در برخی از کشورها از داده کاوی در انتخابات ریاست جمهوری استفاده کاربردی شده و به موفقیت های بزرگی در این حوزه دست یافته اند. در اصل، پشت صحنه انتخاباتف متخصصانی به کمک رایانه های خود به تحلیل رای دهندگان می پردازند و وضعیت رای دهندگان را تجزیه و تحلیل می کنند.
بی تردید گسترده داده کاوی، روز به روز در حال افزایش است. این افزایش در سطح مشتریان، مباحث مدیریتی و حوزه های دولتی بسیار مسهود شده است. یقینا باید گفت که آنجا که امکان استفاده از داده کاوی وجود داشته باشد اما نشود خطا است.
خوشبختانه تعداد دانشجویانی که در مقطع دارشناسی ارشد تز پایان نامه های خود را به ویژه در حوزه صنعت به داده کاوی اختصاص می دهند رو به افزایش است. این نشان می دهد که تحول داده کاوی در کشور در حال رخداد است. اخیرا یکی از بانک های بخش خصوصی، معاونت داده کاوی را در ساختار سازمانی خود ایجاد کرده است که یک رخداد بزرگ محسوب می شود.
مدل سازی
داده کاوی جدید ترین و برترین روش حل مساله است. آنجا که داده نداشته باشیم یا داده ها کم باشند یا مجبور باشیم از نمونه Sample استفاده کنیم از روش های سنتی استفاده می شود، اما اگر داده ها وجود داشته باشند باید از داده کاوی بهره مند شد.
فرض های ساده کننده در داده کاوی جایی ندارد. اینکه دانشجویی در ترم چند در فلان دانشگاه ، مشروط شده و دانشجوی دیگری در یک دانشگاه دیگر همین وضعیت را دارد، این دو پدیده از نگاه روش های سنتی، مستقل از یکدیگر فرض می شوند، اما امروزه در داده کاوی اعتقاد بر این است که ما اجازه نداریم این دو را مستقل از یکدیگر بدانیم بلکه ممکن است این دو اتفاق به یکدیگر مرتبط یا وابسته باشند. چرا که همه چیز به همه چیز مرتبط است. احتمال اینکه برای این دو دانشجو یک اتفاق خانوادگی رخ داده باشد که موجب افت تحصیلیشان شده است، محتمل است. بشر، در گذشته قطعا این مسائل را متوجه بود اما امکان بکارگیری این احتمالات یا فرض ها را نداشت و براساس فرض های ساده، زندگی میکرد. به همین علت، دانش فنی لازم را کسب نمی کرد اما امروز چون فرضیات بشر از سادگی خارج شده اند، آن دانش پنهان به دست می آید. امروزه بشر، کارها را یک بار برای همیشه انجام می دهد زیرا در فضای یادگیری و یاددهی قرار گرفته است. یعنی هر داده جدیدی که کشف می شود، هوض اضافه تری در سیستم ایجاد می کند و مدل ها و سیستم ها را مرتب تر و منظم تر می سازد. ما دیگر حق نداریم رضایتمندی مشتریان را با رضایتمندی کارکنانمان نامربوط تلقی کنیم. چنین تحلیل هایی باید همزمان صورت گیرد.
مساله کیفیت و تولید محصولات درجه یک، دو و سه، به مسایل انسانی ما ربط دارد. ما نمیتوانیم اینها را مستقل از یکدیگر فرض کنیم. این مساله در صنعت این گونه است که وقتی قصد داریم مساله کیفیت را در تولید حل کنیم آن را با متغیرهای کیفیتی حل می کنیم و ممکن است به نظر بیاید که ارتباطی با مسایل انسانی ندارد، اما مربوط است.
داده کاوی معتقد است تمام داده ها باید در یک نقطه یکپارچه شوند و به موضوعات، جامع نگاه شود. با داده کاوی همه هم نظر می شوند و سیاست های مخالف یکدیگر امکان وقوع نمی یابند.
ما مدلهای بومی خود را می سازیم و نیازی نیست آنها را وارد کنیم. در اعتبارسنجی، تمام داده ها تحلیل می شوند و مدل مرتبط با آن، تنظیم و طراحی می شود و این مدل تنها مختص تحلیل کننده داده ها است.
بشر دیروز به نمونه های بیرونی روی می آورد و بیشتر از سمپل ها بهره می جست و سعی داشت بر تعداد آنها بیفزاید، اما بشر امروز، سعی بر این دارد که هر روز بر داده های خود بیفزاید و از سمپل های خود بکاهد. سازمان های موفق از اینکه بر داده های خود می افزایند لذت می برند و خرسند هستند و نیازی به مدل ها و نمونه های قبلی ندارند، بلکه آنها داده های خود را تحلیل می کنند و مدل های کاملا واقعی را برای خود ایجاد می کنند.
در دانشگاه بوستون یک پروژه داده کاوی انجام شد که توسط یک ربات مبتنی بر داده کاوی صورت گرفت. تفاوت این ربات داده کاوی با ربات های سنتی در هوشمند بودن آن بود. میتوانیم این ربات را به مثابه یک سازمان فرض کنیم که در شرایط مختلف و جریانات گوناگون، بقای خود را حفظ می کند و سقوط نمی کند و خود را در هر شرایطی تنظیم می کند. چنین سازمانی برای همه شرایط آمادگی لازم را دارد.این سازمان هوشمند است و هوشمندانه تمام جریانات و اتفاقات احتمالی یا ممکن را کنترل می کند. چنین سازمانی مبتنی بر داده کاوی حرکت می کند و آن ها را می یابد. سپس به تحلیل آنها می پردازد و براساس آنها عمل می کند. این گونه سازمانها، نسبت به داده های اطراف خود حساس هستند و آنها را به طور مستمر و آرام مورد مطالعه قرار داده و لحظه به لحظه محیط خود را مورد تحلیل قرار می دهند و بر بقای خود می افزایند. سازمان های موفق هوشمندی خود را بر مبنای رصد عوامل، داده ها و اطلاعات موجود در اطراف خود به دست می آورند که با تکرار این عملکرد از سقوط خود جلوگیری می کنند. یک سازمان هوشمند به محض مواجهه با بحران ها، داده های مربوط را دریافت کرده و تحلیل می کند و واکنش های هوشمندانه ای را از خود نشان می دهند تا بر بحران ها فایق آیند. چنین سازمان هایی مدام بر یادگیری خود می افزایند.
وقتی آتش سوزی رخ می دهد سنگ که جزو جامدات است، مجبور به ایستادن است چون راهی جز ایستادن ندارد اما وقتی کنار یک حیوان آتش سوزی رخ می دهد او به طور غریزی می فهمد که باید فرار کند. او براساس فرض های از پیش تعیین شده فرار می کند.
اما در مورد انسان، وقتی که در شرایط یک آتش سوزی قرار می گیرد، ابتدا فکر می کند و هوشمندانه تصمیم می گیرد که آیا باید بایستد و آتش را خاموش کند یا باید فرار کند. فرض کنید تصمیم می گیرد که بایستد و آتش را خاموش کند، لحظه به لحظه که آتش گسترده تر می شود، هر لحظه تصمیم او نیز تغییر می کند که آیا هنوز بمانم و یا اساسا میتوانم بمانم؟ پس، بر سعی خود می افزاید. او مرتبا و در لحظه نوع تصمیمات خود را تغییر می دهد و کنترل می کند و آن قدر پیش می رود تا به درست یا اشتباه بودن تصمیم خود می رسد. تا آنجا که ممکن است بایستد و حتی کشته شود. یا برعکس، به شکل درستی موفق به نجات خود از آتش شود. بنابراین، هر اتفاقی که برای او می افتد، یک اطلاعات جدید به بانک اطلاعات او افزوده می شود و یک تجربه نیز به تجارب قبلی او اضافه می شود.
در سازمان ها براساس فرض های از پیش تعیین شده می دانند که مثلا در یک بانک اگر فردی در لیست سیاه قرار دارد نباید دیگر به او وام داد. یک سازمان میتواند داده های مثلا جرم را بگیرد و سیستم، آنها را تجزیه و تحلیل کند و خود سیستم نیز به آن سازمان نوع واکنش ها را در مقابل جرم نشان می دهد و سازمان متوجه می شود که جرم ها در کجاها ممکن است اتفاق بیفتند تا قبل از وقوع جرم، در محل حاضر شود. این همان فضایی است که در داده کاوی دنبال می شود. با همین روش بود که مسئولان در شهر نیویورک میزان جرم را تا 45 درصد کاهش داده اند. این یک سیستم فعال aCTIVE است اما در سیستم عای غیر فعال pASSIVE براساس افزایش میزان جرم ها متوجه می شوند که مثلا یک روان گردان جدید وارد جامعه شده است.
سیستم های غیرفعال، بسیار هزینه گرا هستند. مثلا وقتی ندانیم مشتری ما چه می خواهد، همه نوع جنس را برای او می آوریم و وقتی ندانیم کدام چهارراه پرترافیک تر است باید برای همه چهارراه ها پلیس بگذاریم. وقتی ندانیم که امروز چه میزان فروش خواهیم داشت، از کالای خود، بیش از نیازمان انبار می کنیم که مبادا مشتری به ما مراجعه کند و جنس نداشته باشیم، در نتیجه نمی دانیم چه اتفاقی قرار است برای فروش کالاهای ما بیفتد.
در بسیاری از فروشگاههای نیویورک به درستی می دانند وقتی مشتری وارد فروشگاه می شود، چه نوع مشتری است، چه میخواهد و تا چه میزان خرید خواهد کرد و دفعه بعد، کی دوباره به فروشگاه خواهد امد. این یک داده کاوی هوشمند است که از این طریق، مشتریان خود را مرتب و با درصدی خطا، مانیتور می کنند.
ده ثروتمند بزرگ آمریکا، تمام ثروت خود را از داده کاوی کسب کرده اند. شرکت های Google , Amazon , FaceBook , EBay,FedEx , وال مارت تماما براساس داده کاوی به موفقیت های چشمگیر دست یافته اند. آنها از Data mining بسیار بهره برده اند.
امروز، بدون ابزارهای مدرن نمیتوان دنیای پیچیده را اداره کرد. شرکت هواپیمایی FedEx نمیتواند ادعا کند که بدون پیش بینی آینده مسافران خود را هر 24 ساعت در سراسر دنیا جا به جا می کند. شرکت تویوتا اگر پیش بینی برای آینده نداشته باشد نمیتواند محصول صفر خود را به بازار ارایه کند و در فرودگاه شیکاگو بدون استفاده از دانش های نوین نمیتواند هر 40 ثانیه یک هواپیما فرود بیاید یا پرواز کند. در یک کشور عربی فروشگاه های پیتزافروشی مدعی هستند که اگر در عرض 20 دقیقه یک پیتزا به مشتری خود ارایه نکنند، مشتری میتواند 25% قیمت پیتزا را تخفیف بگیرد و اگر این زمان 30 دقیقه شود، پیتزا را رایگان به مشتری ارایه می کند. پشتوانه این ادعا بر سیستم های مبتنی بر داده کاوی متکی است.
شبکه اجتماعی FaceBook چیزی ندارد جز Data Mining که براساس آن حجم عظیمی از اطلاعات را به کاربران سراسر جهان به فروش می رسانند. امروزه ، فوتبال دنیا با داده کاوی اداره می شود و این طور نیست که فقط گفته شود مثلا یک بازیکن چند میلیون دلار ارزش دارد؟ بلکه آمارهایی که در طی برگزاری یک مسابقه فوتبال به تماشاچیان ارایه می شود تماما براساس داده ها است یعنی وقتی به تماشاچیان اعلام می شود که یک تیم چند دقیقه در زمین تیم مقابل بوده است یا بازیکنی که تعویض می شود چند کیلومتر دویده است و حالا به بیرون از بازی می رود یا دروازه بان تیم A چند بار توپ را گرفته است یا فلان فوروارد چند بار خطا کرده است یا چند گل زده است. تمام این اطلاعات تحلیل شده اند و سیستم به مربیان پیشنهادهایی ارایه می کند که چگونه بازیکنان خود را برای بازی های بعدی انتخاب کنند. این سیستم پیشنهاددهنده مبتنی بر داده کاوی عمل می کنند.
امروز داده کاوی در دوخت لباس هم نقش دارد. مثلا سایز Large یا Small در امریکای شمالی به عنوان اندازه های بومی آن کشور تعریف و طراحی شده است. ما نیز میتوانیم با داده کاوی اندازه های خود را طراحی و بومی کنیم.
امروز، در 200 شهر دنیا، شهرهای هوشمند شکل گرفته اند که همه براساس پروژه های داده کاوی هستند. این شهرها در حوزه های مدیریت شهری بسیار مدرن، طراحی شده اند. اما واقعا چگونه میتوان تصمیمی گرفت که روی میلیون ها نفر اثر بگذارد.
- پروژه داده کاوی (40)
- پایان نامه داده کاوی (27)
- درخت تصمیم (18)
- درخت تصمیم در داده کاوی (13)
- درخت تصمیم گیری (13)