مقالات و تازه ها صفحه اول

چهار شنبه, 26 دي 1403 | Wednesday, January 15, 2025





 
دسته بندی

داده کاوی و کاربرد آن در حسابرسی

دکتر حسین کثیری _خدیجه موسوی فر

زمان انتشار مطلب : دو شنبه, 31 تير 1398

داده کاوي عبارت از اقتباس يا استخراج دانش از مجموعه اي بسيار حجيم از داده ها به عبارت ديگر داده کاوي فرآيندي است، که با استفاده از تکنيک هاي هوشمند، دانش را از مجموعه هايي از داده ها استخراج مي کند که تحليل هاي ساده آماری قادر به انجام آن نيستند. داده کاوي از الگوريتم هاي بسيار پيچيده رياضي جهت تقسيم بندي داده ها و پيشگيري رويدادها استفاده مي کند. داده کاوي فرايند مرتب سازي, طبقه بندي و خوشه بندي داده هاي حجيم و آشکارسازي اطلاعات مرتبط با هم مي باشد. داده کاوي تنها محدود به داده هاي عددي نيست، بلکه علاوه بر آن در مورد داده هاي متني، تصويري ،صوتي و هر نوع داده ديگر نيز کاربرد دارد(شهرابی، جمال وشکورنیا، ونوس). داده کاوي ابزاري سودمند است که در اختيار تمام شرکت ها مي باشد. داده کاوي و کشف دانش ابزارهاي هوشمند هستند، که به جمع آوري و پردازش داده ها و بهره مندي از آن ها منجر مي شود.

داده کاوی و کاربرد آن در حسابرسی
داده کاوی و کاربرد آن در حسابرسی
دکتر حسین کثیری-خدیجه موسوی فر
مقدمه
امروزه رسوایی جهانی شرکت ها و هم چنین ورشکستگی موسسات این سوال را مطرح که ایا تکنیک های حسابرسی انجام شده بروز بوده و با شرایط کنونی انطباق دارد و یا این که استفاده از تکنیک های حسابرسی بروز به نحو مطلوب انجام نمی شود(koskivaara2007).
در سال های اخیر با توجه به افزایش مبادلات تجاری و اقتصادی پیشرفت تکنولوژی اطلاعات و انباشه شدن داده های مالی، تکنیک های داده کاوی، به منظور استفاده بهینه و کارا از این داده ها رواج یافت.در دنیای افتصادی امروز با افزایش روز افزون  تقاضا برای ارائه اطلاعات قابل اتکا، نیاز به حسابرسانی با کفایت جهت اعتباردهی به گزارش ها و اطلاعات ارائه شده امری حیاتی به نظر می رسد.حسابرسی جزء لاینفک از فرایند گزارشگری مالی است، که با اعتبار بخشی به اطلاعات ارائه شده نقش مهمی در قضاوت و تصمیم گیری اگاهانه استفاده کنندگان دارد.حسابرسان در راستای افزایش کارایی از فناوری های جدید استفاده می کنند که یکی از مهم ترین راه های افزایش کارایی در حسابرسی استفاده از تکنیک های جدید داده کاوی به منظور پیش بینی نوع اظهارنظر حسابرس است.تکنیک های پیشرفته حسابرسی می تواند مانع از دستکاری حساب ها، توسط شرکت ها و تقلب مدیریت شود.

تعريف داده کاويَ
داده کاوي عبارت از اقتباس يا استخراج دانش  از مجموعه اي بسيار حجيم از داده ها به عبارت ديگر داده کاوي فرآيندي است، که با استفاده از تکنيک هاي هوشمند، دانش را از مجموعه هايي از داده ها استخراج مي کند که تحليل هاي ساده آماری   قادر به انجام آن نيستند. داده کاوي از الگوريتم هاي بسيار پيچيده رياضي جهت تقسيم بندي داده ها و پيشگيري رويدادها استفاده مي کند. داده کاوي فرايند مرتب سازي, طبقه بندي و خوشه بندي داده هاي حجيم و آشکارسازي اطلاعات  مرتبط با هم مي باشد. داده کاوي تنها محدود به داده هاي عددي نيست، بلکه علاوه بر آن در مورد داده هاي متني، تصويري ،صوتي و هر نوع داده ديگر نيز کاربرد دارد(شهرابی، جمال وشکورنیا، ونوس).
داده کاوي ابزاري سودمند است که در اختيار تمام شرکت ها مي باشد. داده کاوي و کشف دانش ابزارهاي هوشمند هستند، که به جمع آوري و پردازش داده ها و بهره مندي از آن ها منجر مي شود.
داده کاوی فرایندی است، که با نگرشی نو به مسئله استخراج اطلاعات از داده های حجیم پرداخته و به کمک مجموعه ای از روش های آماری و مدل سازی می تواند الگوها و روابط پنهان موجود در داده ها را در کم ترین زمان ممکن و با دقتی بالا تشخیص دهد(مشکانی،علی،ناظمی،عبدالرضا).
چن و کان دو (chen&kuando)، داده کاوی را به عنوان روشی برای کشف حقیقت، از درون پایگاه داده ها تعریف می کنند. به بیان دیگر آن ها داده کاوی را فرایند کشف الگوهای مفید از درون مقدارهای عظیم داده های موجود در یک پایگاه داده می داند. به بیان خلاصه داده کاوی را می توان به عنوان شکلی از کشف اطلاعات یا علوم در نظر گرفت، که به منظور حل مشکلات اساسی در یک حوزه خاص به کار می رود. 
در طول دهه های گذشته انفجار داده ها و گسترش بیش از حد آن ها و اطلاعات ارزشمندی که در این حجم انبوه داده ها پنهان بود، باعث شد تا داده کاوی توجه زیادی را به خود جلب کند. همچنین تلاش شد به کمک داده کاوی داده ها به اطلاعات ارزشمند تبدیل شود، تا بنگاه های تجاری و سایر استفاده کنندگان از جمله حسابرسان بتوانند، جهت کسب حداکثر منافع از آن سود ببرند. 
اهداف داده کاوی
مهم ترین هدف های مربوط به داده کاوی را می توان در قالب دو هدف به صورت زیر خلاصه کرد(2002sirkulvadhana).
1-تایید و رسیدگی:از این روش به منظور تایید یا رد مفروضات در نظر گرفته شده یا به منظور تشریح شرایط یا رویدادها مشاهده شده استفاده می شود. محدودیت این هدف آن است که مفروضات، شرایط یا  رویدادهای مشاهده شده ممکن است، تحت تاثیر آگاهی و دانش تحلیل گر نیز قرار گیرد.
2 -کشف:در این روش فرد به دنبال شناسایی خودکار الگوهای نا شناخته گذشته است. یعنی با تحلیل داده های گذشته الگو و روند داده ها را کشف می کند تا بتوان با استفاده از آن اطلاعات ارزشمندی در مورد نحوه عمل و شکل داده ها از آینده به دست آورد.
هر دوی این هدف ها منجر به یک نتیجه کلی خواهد شد که به آن محصول نهایی داده کاوی گفته می شود و آن کشف الگوی است که می توان برای پیش بینی روند های آینده از آن بهره گرفت.


داده کاوي و داده هاي مالي
در دنياي تجارت نيز داده هاي مالي به عنوان سرمايه راهبرد مطرح هستند. داده هاي مالي توسط موسساتي مثل بانک ها، بورس اوراق بهادار، سازمان هاي مالياتي و غيره جمع آوري و نگه داري مي شود. روش هاي داده کاوي در داده هاي مالي مي تواند، در حل مشکلات طبق بندي و پيش بيني و تسهيل فرايند تصميم گيري به کار رود و نمونه هايي از مسائل طبقه بندي مالي شامل ورشکستگي شرکت ها و تخمين ريسک اعتباري، گزارش تداوم فعاليت درماندگي مالي و پيش بيني عملکرد واحد تجاري مي باشد. بدين ترتيب دامنه اهميت داده کاوي در امور مالي و حسابداري مي تواند طيفي گسترده از کشف تقلب تا افزايش سود آوري واحد تجاري باشد. اهميت داده کاوي توسط بسياري از سازمان هاي حرفه اي تشخيص داده شده است. انجمن حسابداران رسمي امريکا داده کاوي را به عنوان يکي از 10 فناوري برتر براي آينده معرفي کرده است. همچنين انجمن حسابداران داخلي آمريکا نيز اين فناوري را در فهرست يکي از 4 اولويت تحقيقاتي خود گنجانده است. 
مراحل داده کاوي
با نگاهي اجمالي به مراحل داده کاوي در برگیرنده 6 مرحله زیر است(2002sirkulvadhana).
1-شناخت محیط تجاری شرکت: این شناخت شامل تعیین هدف تجاری شرکت، بررسی وضعیت کنونی، تحلیل امکان اجرای داده کاوی و زمینه سازی اولیه آن است.
2-شناخت داده ها: هدف از اجرای این مرحله کسب شناخت در مورد داده هایی است، که می بایست تحلیل شوند. در این مرحله ماهیت داده ها باید به منظور تعیین تکنیک های مناسب و الگوهای مورد انتظار بررسی شوند.  
3-اماده سازی داده ها:یکی از مهم ترین نگرانی هایی که در مورد استفاده از این روش وجود دارد کیفیت داده ها است. هدف از اجرای این مرحله اطمینان یابی نسبت به آماده بودن داده ها از تمام جنبه ها برای تحلیل است. این مرحله شامل انتخاب داده ها ی مربوط، حذف داده های ناقص و ناسازگار، یکپارچه سازی داده ها از طریق ترکیب داده ها جمع آوری شده از منابع چند گانه در قالب یک شکل استاندارد است. علاوه بر این تبدیل داده های استاندارد شده به داده های قابل پردازش و در نهایت بررسی نهایی و حذف داده های زائد نیز در این مرحله انجام می شود.
  
4-مدل سازی:هدف از اجرای این مرحله تعیین مدلی است، که بتواند داده های آماده شده را به نحوه بهتری توصیف کند. این مرحله شامل تعیین روش ها و تکنیک های داده کاوی، طراحی مدل، ساخت مدل، آزمون مدل، اعتبار دهی و بررسی و بازبینی آن است.
5 -ارزیابی:پس از اجرای تکنیک ها و روش های داده کاوی نتایج مورد ارزیابی قرار می گیرد. این ارزیابی باید با توجه به هدف های تجاری انجام شود، یعنی تا چه اندازه مدل طراحی شده پاسخ نیاز و هدف مورد نظر است. چنان چه نتیجه ها مطلوب بود، مرحله بعد انجام می شود و در غیر این صورت می بایست به مرحله قبل رفت و مدل بهینه را جستجو کرد. 

6 -تعمیم:در این مرحله نتیجه بدست آمده، به کل فرآیند تجاری تعمیم داده می شود.

ﺍﺑﺰﺍﺭﻫﺎﻱ  ﺩﺍﺩﻩ ﻛﺎﻭﻱ
ﺍﺑﺰﺍﺭﻫﺎﻱ ﺩﺍﺩﻩ ﻛﺎﻭﻱ ﻧﺮﻡ ﺍﻓﺰﺍﺭﻫﺎﻳﻲ ﻫﺴــﺘﻨﺪ ﻛﻪ ﺑﻪ ﻛﺎﺭﺑﺮﺍﻥ ﺍﺟﺎﺯﻩ ﺍﺳــﺘﺨﺮﺍﺝ ﺍﻃﻼﻋــﺎﺕ ﺍﺯ ﺩﺍﺩﻩ ﻫﺎ ﺭﺍ ﻣﻲ ﺩﻫﻨــﺪ .ﺍﻳــﻦ ﺍﺑﺰﺍﺭﻫﺎ ﺗﻮﺍﻧﺎﻳﻲ ﮔﺮﺩﺁﻭﺭﻱ ﺩﺍﺩﻩ ﻫﺎ ﻭ ﻛﺎﺭﺑــﺮﺩ ﺁﻥ ﻫﺎ ﺑﻪ ﻣﻨﻈﻮﺭ ﺗﺼﻤﻴﻢ ﮔﻴﺮﻱ ﺩﺭ ﺧﺼﻮﺹ ﻣﺼﺮﻑ ﻛﻨﻨﺪﻩ ﺧﺎﺹ ﻳﺎ ﮔﺮﻭﻫﻲ ﺍﺯ ﻣﺼﺮﻑ ﻛﻨﻨﺪﮔﺎﻥ ﺭﺍ، ﺑﻪ ﺳﺎﺯﻣﺎﻥ ﻫﺎ ﻭ ﺍﻓﺮﺍﺩ ﻣﻲ ﺩﻫﻨﺪ .ﺍﺳﺘﺨﺮﺍﺝ ﺩﺳﺘﻲ ﺩﺍﺩﻩ ﻫﺎ ﺍﺯ ﺻﺪﻫﺎ ﺳﺎﻝ ﭘﻴﺶ ﻭﺟﻮﺩ ﺩﺍﺷﺘﻪ ﺍﺳﺖ .ﺍﻳﻦ ﺩﺭ ﺣﺎﻟﻲ ﺍﺳﺖ ﻛﻪ ﻣﺎﺷﻴﻨﻲ ﺷﺪﻥ ﻓﺮﺁﻳﻨﺪ ﺩﺍﺩﻩ ﻛﺎﻭﻱ ﺍﺯ ﻫﻨﮕﺎﻡ ﻭﺭﻭﺩ ﻛﺎﻣﭙﻴﻮﺗﺮ ﺷﺎﻳﻊ ﺷﺪﻩ ﺍﺳﺖ .ﻫﺪﻑ ﻧﻬﺎﻳﻲ ﺍﻳﻦ ﺍﺑﺰﺍﺭﻫﺎ ﻇﺎﻫﺮ ﺳﺎﺧﺘﻦ ﺍﻟﮕﻮﻫﺎﻱ ﭘﻨﻬﺎﻥ ﺑﻪ ﻫﺮﺣﺎﻝ ﺍﺑﺰﺍﺭﻫﺎﻱ ﺩﺍﺩﻩ ﻛﺎﻭﻱ ﻣﻲ ﺗﻮﺍﻧﺪ ﺷﺎﻣﻞ ﻧﺮﻡ ﺍﻓﺰﺍﺭﻫﺎﻯ ﺯﻳﺮ ﺑﺎﺷﺪ:) ﺩﻛﺘﺮ ﻣﺤﺴﻦ ﺩﺳﺘﮕﻴﺮ،ﻣﺮﺗﻀﻰ ﺷﻔﻴﻌﻰ ﺳﺮﺩﺷﺖ،1390 )
1-Data to knowledge
2-sas
3-clementine
4-Intelligent-miner
5-Insightful miner
6-weka
7-microsoft excel
8-ACL
برای حسابرســی صورت های مالی، نرم افزار های  -1اکسل  -2ای ســی ال-3  کیس ویر وآیدیا جزء کاربردی ترین ابزارهای مورد استفاده برای بررســی اطلاعات صاحبكار می باشند. این ابزارها، در واقع برای جستجو و استخراج داده ها، استفاده می شود و تجزیه و تحلیل داده ها را با انواع آمارهای توصیفی و تعداد محــدودی از روش هــای آماری، انجام می دهد. نرم افزارهای ای ســی ال و کیس ویر و آیدیا، شامل ابزارهایی می باشند که بــرای رویه هــای حسابرســی بعدی، نمونه سازی می کنند. به این نرم افزارها و نرم افزارهای مشابه مرســوم، «فنون حسابرسی به کمک رایانه » گفته می شــود.
حسابرس پس از انجام هر گونــه تجزیه و تحلیل در رسیدگی های مربوط به داده ها، با کمک این نرم افزارهــا تصمیم می گیرد که می خواهد چه اطلاعاتی را اســتخراج کنــد. به عنوان نمونه، اگر حســابرس در کنترل های داخلی شــرکتی، نیاز به کنتــرل امضای چک های  بیشتر از 5000 دلار داده شده به فروشندگان را دارد، او یكــی از ایــن ابزارهــا را برای استخراج شماره چک ها و اطلاعات مربوط  به تمام چک هــای بین 4900 و 4999 دلار مورد اســتفاده قرار می دهد. استخراج چنین اطلاعاتی به این علت صورت می گیرد زیرا حسابرس معتقد اســت این ریسک وجود دارد کــه کلاهبــردار یــا تقلب کننده چک جعلی زیر5000 دلار بنویسد و به مدیر مالی گزارش ندهد. حســابرس پس از آن، برای تعیین چک های فاقــد کنترل هاي داخلي یا جعلی، به بررســی و تعیین موقعیت چک ها  و اســناد پشتوانه آنها مي پردازد.coderre 2009))
در واقع با بــه کارگیری این نرم افزارها، کارایــی و بهــره وری حسابرســی، کاهش نمی یابــد. نرم افزارهای اســتخراج داده ها، ابزارهای حسابرســی قدرتمندی محسوب می شــوند. نرم افزارهای ای سی ال و کیس ویر می تواند در شناسایی الگوهای داده های مشــكوک در پایگاه های اطلاعاتی مشتری اثربخش باشــد. این ابزارها، اساســا برای جســتجوی داده ها و ابزارهای اســتخراج برای تبدیل حجم انبوه اطلاعات صاحبكار به حجــم کمتر و قابــل کنترل تر اطلاعات مورد اســتفاده قرار می گیرد. حسابرس پس از اســتخراج، تجزیه و تحلیل یا تحقیقاتی (اغلب به طور دستی) در ارتباط با نمونه های استخراج شده از جمعیت، انجام می دهد که این کار به میزان آموزش و تجربه حسابرس برای شناســایی موارد مشــكوک استخراج شده بســتگی دارد که نیازمند بررسی های اضافی می باشد.( آزاده مسلم زاده گتابی)
ﺭﻭﺵ ﻫﺎﻱ ﺩﺍﺩﻩ ﻛﺎﻭﻱ
 ﺍﻫﺪﺍﻑ ﺩﺍﺩﻩ ﻛﺎﻭﻱ ﺷﺎﻣﻞ ﭘﻴﺶ ﺑﻴﻨﻲ ﻭ ﺗﻮﺻﻴﻒ  ﻳﺎ ﺗﺮﻛﻴﺒﻲ ﺍﺯ ﺁﻧﻬﺎﺳﺖ. ﻫﺪﻑ "ﭘﻴﺶ ﺑﻴﻨﻲ "ﺗﻤﺮﻛﺰﺑــﺮ ﺭﻭﻱ ﺩﻗــﺖ ﺩﺭ ﺗﻮﺍﻧﺎﻳﻲ ﭘﻴﺶ ﺑﻴﻨﻲ ﺑﻮﺩﻩ ﻭ "ﺗﻮﺻﻴﻒ "ﺑﺮ ﺩﺭﻙ ﻓﺮﺁﻳﻨﺪ ﺗﻮﻟﻴــﺪ ﺩﺍﺩﻩ ﻫﺎ ﺗﻤﺮﻛﺰ ﺩﺍﺭﺩ .ﺩﺭ ﭘﻴﺶ ﺑﻴﻨﻲ ﺗﺎ ﺯﻣﺎﻧﻲ ﻛﻪ ﻣﺪﻝ ﻗﺪﺭﺕ ﭘﻴﺶ ﺑﻴﻨﻲ ﺩﺍﺭﺩ، ﻛﺎﺭﺑﺮ ﺗﻮﺟﻬﻲ ﺑﻪ ﺍﻳﻦ ﻧﺪﺍﺭﺩ ﻛﻪ ﻣﺪﻝ ﺍﻧﻌﻜﺎﺱ ﺩﻫﻨﺪﻩ ﻭﺍﻗﻌﻴﺖ ﺍﺳﺖ؛ ﻣﺜﻼ ﻣﺪﻟﻲ ﻛﻪ ﺷﺎﺧﺺ ﻫﺎﻱ ﻣﺎﻟﻲ ﺭﺍ ﺑﻪ ﺷﻜﻞ ﻏﻴﺮ ﺧﻄﻲ ﺗﺮﻛﻴﺐ ﻣﻲ ﻛﻨﺪ ﺗﺎ ﻧﺮﺥ ﺗﺒﺎﺩﻝ ﺍﺭﺯ ﺭﺍ ﭘﻴﺶ ﺑﻴﻨﻲ ﻧﻤﺎﻳﺪ .ﺍﺯ ﺳﻮﻳﻲ ﺩﻳﮕﺮ ﻣﺪﻝ ﺗﻮﺻﻴﻔﻲ ﺑﻪ ﻣﺜﺎﺑﻪ ﻭﺍﻗﻌﻴﺖ ﺗﻔﺴﻴﺮ ﻣﻲ ﺷﻮﺩ .ﺑﺮﺍﻯ ﻣﺜﺎﻝ ﻣﺪﻟﻲ ﻛﻪ ﻣﺘﻐﻴﺮﻫﺎﻱ ﺍﻗﺘﺼﺎﺩﻱ ﻭ ﺟﻤﻌﻴﺘﻲ ﺭﺍ ﺑﻪ ﭘﻴﺸﺮﻓﺖ ﻫﺎﻱ ﺁﻣﻮﺯﺷﻲ ﻣﺮﺗﺒﻂ ﻣﻲ ﺳﺎﺯﺩ، ﺑﻪ ﻋﻨﻮﺍﻥ ﻣﺒﻨﺎﻳﻲ ﺑﺮﺍﻱ ﺗﻮﺻﻴﻪ ﻫﺎﻱ ﺳﻴﺎﺳﺖ ﺍﺟﺘﻤﺎﻋﻲ ﺗﻮﺻﻴﻒ ﻣﻲ ﺷﻮﺩ .ﺩﺭ ﻋﻤﻞ، ﺍﻏﻠﺐ ﻛﺎﺭﺑﺮﺩ ﻫﺎﻱ ﺍﻛﺘﺸﺎﻑ ﺩﺍﻧﺶ  ﺑﻪ ﺩﺭﺟﻪ ﺍﻱ ﺍﺯ ﻫﺮ ﺩﻭ ﻣﺪﻝ ﺳﺎﺯﻱ ﺗﻮﺻﻴﻔﻲ ﻭ ﭘﻴﺶ ﺑﻴﻨﻲ ﻧﻴﺎﺯ ﺩﺍﺭﻧﺪ.( ﺩﻛﺘﺮ ﻣﺤﺴﻦ ﺩﺳﺘﮕﻴﺮ،ﻣﺮﺗﻀﻰ ﺷﻔﻴﻌﻰ ﺳﺮﺩﺷﺖ،1390 )
ﺑﻪ ﻫﺮ ﺗﺮﺗﻴﺐ، ﺍﻫﺪﺍﻑ ﺩﺍﺩﻩ ﻛﺎﻭﻱ ﺑﺎ ﺍﺳــﺘﻔﺎﺩﻩ ﺍﺯ ﺭﻭﺵ ﻫﺎﻱ ﺩﺍﺩﻩ ﻛﺎﻭﻱ، ﻣﺤﻘﻖ ﻣﻲ ﺷــﻮﻧﺪ .ﺍﺻﻄﻼﺡ و ﺭﻭﺵ ﻫﺎﻱ ﺩﺍﺩﻩ ﻛﺎﻭﻱ ﺩﺭ ﻭﺍﻗﻊ ﺑﻴﺎﻧﮕﺮ ﺟﻤﻊ ﻛﺜﻴﺮﻱ ﺍﺯ ﺍﻟﮕﻮﺭﻳﺘﻢ ﻫﺎ  و ﻓﻨﻮﻥ ﺍﺳــﺖ ﻛﻪ ﺍﺯ ﻋﻠﻮﻣﻲ ﻣﺎﻧﻨﺪ ﺁﻣﺎﺭ، ﻳﺎﺩﮔﻴﺮﻱ ﻣﺎﺷــﻴﻦ، ﭘﺎﻳﮕﺎﻩ ﺩﺍﺩﻩ ﻭﺗﺠﺴﻢ ﺍﺳﺘﻨﺘﺎﺝ ﺷﺪﻩ ﺍﻧﺪ .ﺑﺮﺧﻲ ﺍﺯ ﺍﻳﻦ ﺭﻭﺷﻬﺎ ﺩﺭ ﻣﻮﺭﺩ ﺩﺍﺩﻩ ﻫﺎﻱ ﻣﺎﻟﻲ ﺑﻪ ﻛﺎﺭ ﺭﻓﺘﻪ ﺍﻧﺪ .ﺭﻭﺷــﻬﺎﻱ ﺩﺍﺩﻩ ﻛﺎﻭﻱ ﻣﺸــﻬﻮﺭﻱ ﻛﻪ ﺩﺭ ﺍﻳﻦ ﻣﻘﺎﻟﻪ ﻣﻌﺮﻓﻲ ﺧﻮﺍﻫﻨﺪ ﺷﺪ  ﺷــﺎﻣﻞ ﺷــﺒﻜﻪ ﻫﺎﻱ ﻋﺼﺒﻲ،رگرسیون  لجستیگ،ﺍﻟﮕﻮﺭﻳﺘﻢ ﻫﺎﻱ ژﻧﺘﻴﻚ، ﺩﺭﺧﺘﺎﻥ ﺗﺼﻤﻴﻢ، ﻧﻈﺮﻳــﻪ ﻣﺠﻤﻮﻋﻪ ﺍﻭﻟﻴﻪ،ﺍﺳــﺘﺪﻻﻝ ﻣﺒﺘﻨﻲ ﺑﺮ ﻣﻮﺭﺩ)ﺍﺳــﺘﺪﻻﻝ ﻣﻮﺭﺩﮔﺮﺍ( ،نیوبیز،پارت ﻫﺴﺘﻨﺪ .ﺑﺪﻳﻬﻲ ﺍﺳﺖ ﻛﻪ ﺍﻳﻦ ﻓﻬﺮﺳــﺖ ﺍﺯ ﺭﻭﺵ ﻫﺎ، ﻓﻬﺮﺳــﺘﻲ ﻛﺎﻣﻞ ﻧﺒﻮﺩﻩ ﻭﺗﺮﺗﻴﺒﻲ ﺑﺮﺍﻱ ﺍﻭﻟﻮﻳﺖ ﺑﻨﺪﻯ ﺩﺭ ﻛﺎﺭﺑﺮﺩ ﺍﻳﻦ ﺭﻭﺵ ﻫﺎ ﭘﻴﺸﻨﻬﺎﺩ ﻧﻤﻲ ﺷﻮﺩ.(علیخانزاده،1385)
شبکه های عصبی:
شبکه های عصبی مانند مغز انسان عمل میکنند و ساختاری شبیه به آن دارند. مغز به عنوان سیستم پردازش اطلاعات از عناصراصلی ساختاری به نام نرون تشکیل شده است.شبکه های عصبی مصنوعی نیز شامل مجموعه ای از نرون های متصل به هم است که به هریک از این مجموعه نرونها یک لایه گفته می شود.نرون یا گره کوچکترین واحد پردازش اطلاعات است که اساس عملکرد شبکه های عصبی را تشکیل می دهد.
شتبکه های عصبی به رغم تنوع از ساختار مشابهی برخوردار است.یک شبکه عصبی معمولا از 3 لایه ورودی،پنهان،خروجی تشکیل شده است. لایه ورودی فقط اطلاعات را دریافت و مشابه متغیر مستقل عمل می کند لذا تعداد نرونهای آن بستگی به تعداد متغیرهای وابسته دارد اما برخلاف  لایه ورودی و خروجی،لایه پنهان هیچ مفهومی را نشان نمی دهد و صرفا نتیجه ای میانی در فرآیند محاسبه ارزش خروجی است اما از اهمیت خاصی در فرآیند آموزش برخوردار است.( دکتر امید پورحیدری،زینب اعظمی،1389)
از معایب شبکه های عصبی این است که تفسیر روشی است که این شبکه ها به تصمیمات خود می رسند،بسیار دشوار است.          ﺍﺯ ﺩﻳﮕﺮ ﺍﻧﺘﻘﺎﺩﻫﺎﻱ ﻭﺍﺭﺩﻩ ﺑﺮ ﺷﺒﻜﻪ ﻫﺎﻱ ﻋﺼﺒﻲ ﻣﻲ ﺗﻮﺍﻥ ﺑﻪ ﺗﻌﺪﺍﺩﻯ ﺍﺯ ﻋﻮﺍﻣﻞ ﻧﻈﻴﺮ ﺗﻮﭘﻮﻟﻮژﻱ ﺷﺒﻜﻪ ﺍﺷﺎﺭﻩ ﻛﺮﺩ ﻛﻪ ﺑﺎﻳﺪ ﺑﻪ ﻃﻮﺭ ﺗﺠﺮﺑﻲ، ﺗﻌﺮﻳﻒ ﺷﻮﻧﺪ .ﺷﺒﻜﻪ ﻫﺎﻯ ﻋﺼﺒﻰ ﻣﺼﻨﻮﻋﻰ ﺑﺮ ﺧﻼﻑ ﺭﻭﺵ ﻫﺎﻯ ﺁﻣﺎﺭﻱ ﻛﻼﺳــﻴﻚ، ﻣﻔﺮﻭﺿﺎﺗﻲ ﺩﺭ ﺧﺼﻮﺹ ﻭﻳﮋﮔﻲ ﻫﺎﻱ ﺗﻮﺯﻳﻊ ﺩﺍﺩﻩ ﻫﺎ ﻭ ﻣﺘﻐﻴﺮﻫﺎﻱ ﻣﺴــﺘﻘﻞ ﻭﺭﻭﺩﻱ ﻧﺪﺍﺭﻧﺪ (ﺩﻛﺘﺮ ﻣﺤﺴﻦ ﺩﺳﺘﮕﻴﺮ،ﻣﺮﺗﻀﻰ ﺷﻔﻴﻌﻰ ﺳﺮﺩﺷﺖ1390 )
شبکه‌های عصبی بیشتر برای تقلبهای کارت اعتباری، بیمه خودرو و تقلبهای شرکتی به کار می‌روند (Ngai et al., 2010). چن و دو (Chen & Du, 2009) با استفاده از شبکه‌های عصبی مصنوعی، 68 شرکت فعال در بورس تایوان را مورد مطالعه قرار دادند. آنان با استفاده از داده‌های مالی و غیرمالی، یک مدل بحران مالی تدوین کردند. نتایج مطالعه‌ آنان نشان می‌دهد که شبکه‌های عصبی مصنوعی بهتر از روشهای سنتی آماری، بحران مالی را پیش‌بینی می‌کنند.

درخت ﺗﺼﻤﻴﻢ:
درﺧﺖ ﺗﺼﻤﻴﻢ در ﺣﻘﻴﻘﺖ ﻳﻚ ﮔﺮاف ﺑـﺎ ﺳـﺎﺧﺘﺎر   درﺧ  ﺖ اﺳﺖ ﻛﻪ ﻫﺮ رأس آن ﻧﺸﺎن دﻫﻨﺪه ﻳﻚ آزﻣـﻮن ﻳﺎ ﻣﻘﺎﻳﺴﻪ ﻣﻘﺪار ﻳﻚ ﻣﺘﻐﻴﺮ ﻣﻲ  ﺑﺎﺷﺪ و  ﻳﺎل ﻫـﺎﻳﻲ ﻛـﻪ از آن رأس ﺧﺎرج ﻣﻲ ﺷﻮد، ﻧﺸﺎن دﻫﻨﺪه ﺗﺼـﻤﻴﻤﻲ اﺳـﺖ ﻛﻪ در ﻣﻘﺎﺑﻞ ﻫﺮ ﻧﺘﻴﺠﻪ ﺑﺪﺳﺖ آﻣـﺪه از آزﻣـﻮن ﮔﺮﻓﺘـﻪ ﻣﻲ ﺷﻮد . در اﻳﻦ روش ﺗﻼش می ﺷﻮد ﺗﺎ ﻣﺸﺎﻫﺪات ﺑـﻪ زﻳﺮﮔﺮوه ﻫﺎﻳﻲ ﺗﻘﺴﻴﻢ ﺷﻮﻧﺪ . از ﺟﻤﻠﻪ  مزﻳـﺖ ﻫـﺎي اﻳـﻦ روش ﻣﺴﺘﻘﻞ ﺑﻮدن   آن از ﭼﮕـﻮﻧﮕﻲ ﺗﻮزﻳـﻊ داده ﻫـﺎ و واﺑﺴــﺘﮕﻲ ﻣﺘﻐﻴﺮﻫــﺎي ورودي ﻣــﻲﺑﺎﺷـد . در ﺣﻘﻴﻘــﺖ، درﺧﺖ ﺗﺼﻤﻴﻢ ﻳﻚ ﻣﺪل ﻣﻔﻬﻮﻣﻲ ﺳﺎده را ﺑﺎ اﺳﺘﻔﺎده از ﺗﻌﺪادي ﺗﺼﻤﻴﻢ ﺳﺎده اﻳﺠﺎد ﻣﻲ ﻛﻨﺪ .  الگوریتم یادگیری در این روش بسیار سریع است(بریمن و همکاران 1984)
ﻣﻬﻢ ﺗﺮﻳﻦ ﺧﺼﻮﺻﻴﺖ ﺩﺭﺧﺖ ﻫﺎﻱ ﺗﺼﻤﻴﻢ، ﻗﺎﺑﻠﻴﺖ ﺁﻧﻬﺎ ﺩﺭ ﺷﻜﺴﺘﻦ ﻓﺮﺁﻳﻨﺪ ﭘﻴﭽﻴﺪﻩ ﺗﺼﻤﻴﻢ ﮔﻴﺮﻱ ﺑﻪ ﻣﺠﻤﻮﻋﻪ ﺍﻯ ﺍﺯ ﺗﺼﻤﻴﻤﺎﺕ ﺳﺎﺩﻩ ﺗﺮ ﺍﺳﺖ ﻛﻪ ﺑﺮﺍﺣﺘﻲ ﻗﺎﺑﻞ ﺗﻔﺴﻴﺮ ﻫﺴﺘﻨﺪ .( ﻳﺰﺩﺍﻧﻲ ﻭ ﻛﻨﮕﺎﻭﺭﻱ،1383) 
رگرسیون لجستیک:
امروزه در بیشتر پژوهش ها با استفاده از چندین عامل، در پی رسیدن به هدفی خاص هستیم، به نحوی که مقدار بهینه حاصل شود. در آمار با روش های مختلف رگرسیون به انجام این چنین کارهایی پرداخته و نتایج تحلیل می شود. در رگرسیون به وسیله متغیرهای مستقل، متغیر پاسخ (متغیر هدف)،  برآورد می شود. رگرسیون لجستیک حالت خاصی از رگرسیون است و در مواردی که متغیر پاسخ، دو یا چند گزینه ای (وجود دو یا چند حالت متفاوت برای متغیر پاسخ) است، به کار می رود.  رگرسیون لجستیک یک مدل ریاضی است که میتواند برای توصیف رابطه چندین متغیر X با یک متغیر وابسته دو حالتی یا چند حالتی به عنوان Yمورد استفاده قرار گیرد. منظور از متغیر دو حالتی، متغیری است که فقط دارای دو جواب می باشد، مانند مرده یا زنده بودن، حاضر  یا غایب بودن و رابطه داشتن یا رابطه نداشتن. اغلب برای این متغیرها از کدهای صفر و یک استفاده می شود، کد یک را برای حالت مثبت بودن آن خاصیت و کد صفر برای منفی بودن آن به کار میرود.(محمد حسین ستایش،حسن فتاحی نافچی،سمیره عباسپور،میثم روستایی ،1393)
ژﻧﺘﻴﻚ ﺍﻟﮕﻮﺭﻳﺘﻢ:
ﺍﻳﻦ ﺍﻟﮕﻮﺭﻳﺘﻢ ﺑﺮ ﭘﺎﻳﻪ ﻓﺮﺿﻴﻪ ﺗﻜﺎﻣﻞ ﺩﺍﺭﻭﻳﻦ ﺑﻮﺩﻩ ﻭ ﻛﺎﺭﺑﺮﺩ ﺁﻥ ﺑﺮ ژﻧﺘﻴﻚ ﻃﺒﻴﻌﻲ ﺍﺳﺘﻮﺍﺭ ﺍﺳﺖ .ﺍﺻﻮﻝ ﺍﻭﻟﻴﻪ ﺍﻟﮕﻮﺭﻳﺘﻢ ژﻧﺘﻴﻚ ﺗﻮﺳﻂ ﻫﻠﻨﺪ  ﻭ ﻫﻤﻜﺎﺭﺍﻥ ﺩﺭ ﺳﺎﻝ1962  ﺍﺭﺍﻳﻪ ﺷﺪﻩ ﺍﺳﺖ .ﺑﺮ ﺍﻳﻦ ﺍﺳﺎﺱ ﻣﻮﺟﻮﺩﺍﺕ ﺩﺍﺭﺍﻯ ﺳﺎﺯﮔﺎﺭﻱ ﺑﻴﺸﺘﺮ ﺑﺎ ﻣﺤﻴﻂ، ﺑﺎ ﻣﻴﺰﺍﻥ ﺑﺎﻻﺗﺮﻱ ﺯﻧﺪﻩ ﻣﺎﻧﺪﻩ ﻭ ﺗﻮﻟﻴﺪ ﻣﺜﻞ ﻣﻲ ﻛﻨﻨﺪ، ﺩﺭ ﻧﺘﻴﺠﻪ ﺷﺎﻧﺲ  ﺣﻀﻮﺭ ﺁﻧﻬﺎ ﺩﺭ ﻧﺴﻞ ﻫﺎﻱ ﺑﻌﺪﻱ ﺑﻴﺸﺘﺮ ﺍﺳﺖ(ﻣﻮﺳﻲ ﺯﺍﺩﮔﺎﻥ ﻭ ﺫﻛﺮﻱ،1387)                  ﻛﺎﺭﺑﺮﺩ ﺍﻟﮕﻮﺭﻳﺘﻢ ژﻧﺘﻴﻚ، ﻣﺴﺘﻠﺰﻡ ﺑﻴﺎﻥ ﻫﺮ ﻳﻚ ﺍﺯ ﭘﺎﺳﺦ ﻫﺎﻯ  ﻳﻚ ﻣﺴﺌﻠﻪ ﺧﺎﺹ، ﺩﺭ ﻗﺎﻟﺐ ﻳﻚ ﺭﺷﺘﻪ ﺍﺯ ﺍﻋﺪﺍﺩ ﻣﻰ ﺑﺎﺷﺪ .ﺑﻪ ﻫﺮ ﻳﻚ ﺍﺯ ﺍﻳﻦ ﺭﺷﺘﻪ ﻫﺎ ﻛﻪ ﺩﺭ ﻭﺍﻗﻊ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩ ﻳﻜﻲ ﺍﺯ ﺟﻮﺍﺏ ﻫﺎﻱ ﻣﺴﺌﻠﻪ ﺧﻮﺍﻫﺪ بودد ﻛﺮﻭﻣﻮﺯﻡ ﻭ ﺑﻪ ﺍﻋﺪﺍﺩ ﺗﺸﻜﻴﻞ ﺩﻫﻨﺪﻩ ﺁﻥ ﻧﻴﺰ ژﻥ ﮔﻮﻳﻨﺪ .ﺍﻟﮕﻮﺭﻳﺘﻢ ژﻧﺘﻴﻚ ﺑﺎ ﺗﻌﺪﺍﺩﻱ ﺍﺯ ﺟﻮﺍﺏ ﻫﺎﻱ  ﮔﻮﻧﺎﮔﻮﻥ ﺁﻏﺎﺯ ﻣﻲ ﺷــﻮﺩ ﻛﻪ ﺟﻤﻌﻴﺖ ﻧﺴــﻞ ﺍﻭﻟﻴﻪ ﺭﺍ ﺗﺸــﻜﻴﻞ ﻣﻲ ﺩﻫﻨﺪ .ﺗﻌﺪﺍﺩ ﺍﻳﻦ ﺟﻮﺍﺑﻬﺎ ﺩﺭ ﺗﻜﺮﺍﺭﻫﺎ وﻧﺴﻞ ﻫﺎﻱ ﺑﻌﺪﻱ ﺛﺎﺑﺖ ﻫﺴﺘﻨﺪ، ﻭﻟﻲ ﻛﻴﻔﻴﺖ ﺁﻥ ﻫﺎ ﺑﻪ ﺗﺪﺭﻳﺞ ﺑﻬﺒﻮﺩ ﻣﻲ ﻳﺎﺑﺪ .ﺩﺭ ﻫﺮ ﻧﺴﻞ ﺟﻮﺍﺏ ﻫﺎ ﺑﻪ ﻛﻤﻚ ﺗﺎﺑﻊ ﻫﺪﻑ ﺳﻨﺠﻴﺪﻩ ﺷﺪﻩ ﻭ ﺑﺮ ﺁﻥ ﺍﺳﺎﺱ، ﻧﺴﻞ ﺑﻌﺪ ﺷﻜﻞ ﻣﻲ ﮔﻴﺮﺩ .ﺑﺪﻳﻦ ﺗﺮﺗﻴﺐ ﺑﺮﺍﻱ ﺗﻮﻟﻴﺪ ﻧﺴﻞ ﺑﻌﺪ ﺗﻌﺪﺍﺩﻱ ﺍﺯ ﺟﻮﺍﺏ ﻫﺎ ﻣﺴﺘﻘﻴﻤﺎ ﺑﻪ ﻧﺴﻞ ﺑﻌﺪﻯ ﻣﻨﺘﻘﻞ ﻣﻲ ﺷﻮﺩ ﻭ ﺑﺮﺧﻲ ﺩﻳﮕﺮ ﺍﺯ ﺟﻮﺍﺏ ﻫﺎ ﺑﺎ ﺍﻳﺠﺎﺩ ﺟﻬﺶ ﺩﺭ ﻛﺮﻭﻣﻮﺯﻭﻡ ﺁﻥ ﻫﺎ، ﺑﻪ ﺟﻮﺍﺏ ﻫﺎﻱ ﺩﻳﮕﺮﻱ ﺗﺒﺪﻳﻞ ﺷﺪﻩ ﻭ ﺑﻪ ﻧﺴﻞ ﺑﻌﺪ ﺧﻮﺩ، ﻣﻨﺘﻘﻞ ﻣﻲ ﮔﺮﺩﻧﺪ .ﺩﺭ ﻭﺍﻗﻊ ﺍﻟﮕﻮﺭﻳﺘﻢ ژﻧﺘﻴﻚ، ﺟﺴﺘﺠﻮ ﺩﺭ ﻋﻠﻢ ﺭﺍﻳﺎﻧﻪ ﺑﺮﺍﻱ ﻳﺎﻓﺘﻦ ﺭﺍﻩ ﺣﻞ ﺑﻬﻴﻨﻪ ﻭ ﻣﺴﺎﺋﻞ ﻣﺮﺗﺒﻂ ﺑﺎ ﺟﺴﺘﺠﻮ ﺍﺳﺖ.) ﺩﻛﺘﺮ ﻣﺤﺴﻦ ﺩﺳﺘﮕﻴﺮ،ﻣﺮﺗﻀﻰ ﺷﻔﻴﻌﻰ ﺳﺮﺩﺷﺖ،1390 )
ﻧﻈﺮﻳﻪ مجموعه اولیه: 
ﺗﺌﻮﺭﻱ مجموعه اولیه در سال 1991 به وسیله پالاک ارایه گردید ﻧﻈﺮﻳﻪ مجموعه اولیه ﺗﻌﻤﻴﻤﻲ از نظر به دوتایی می باشد که از نظریات معروف در ریاضیات بازه هست.( ﻋﺮﺑﺎﻧﻲ،کلانتری،1381)
 ﺍﮔﺮﭼﻪ ﻣﺴﺌﻠﻪ ﻛﻤﻴﺖ ﺍﻧﺪﺍﺯﻩ ﮔﻴﺮﻱ، ﻛﻴﻔﻴﺖ ﻳﺎﺩﮔﻴﺮﻱ ﻭ ﻛﻤﺎﻝ ﺩﺍﻧﺶ ﻧﺎﻇﺮﺍﻥ ﺩﺭ ﻣﻮﺍﺟﻬﻪ ﺑﺎ ﺍﻃﻼﻋﺎﺕ ﻧﺎﻗﺺ ﻫﻨﻮﺯ ﺑﻪ ﻃﻮﺭ ﻛﺎﻣﻞ ﺣﻞ ﻧﺸﺪﻩ ﺍﺳﺖ، ﺍﻣﺎ ﺩﺭ ﻫﺮ ﺣﺎﻝ ﻧﻈﺮﻳﻪ ﻣﺠﻤﻮﻋﻪ ﺍﻭﻟﻴﻪ، ﺍﺑﺰﺍﺭ ﻗﺪﺭﺗﻤﻨﺪﻯ ﺑﺮﺍﻯ ﺍﺳــﺘﺨﺮﺍﺝ ﺩﺍﻧﺶ ﺍﺯ ﺍﻃﻼﻋﺎﺕ ﭘﺮ ﺍﺑﻬﺎﻡ ﻭ ﻧﺎﻗﺺ ﻣﻲ ﺑﺎﺷــﺪ .ﺍﻳﻦ ﻧﻈﺮﻳﻪ ﻣﻲ ﺗﻮﺍﻧﺪ ﺑﺮﺍﻱ ﺷﺮﺡ ﻭﺍﺑﺴﺘﮕﻲ ﺑﻴﻦ ﺻﻔﺎﺕ ﻭ ﺑﻪ ﻣﻨﻈﻮﺭ ﺳﻨﺠﺶ ﻣﻴﺰﺍﻥ ﺍﻫﻤﻴﺖ ﺻﻔﺎﺕ ﻭ ﺍﺭﺗﺒﺎﻁ ﺑﺎ ﺩﺍﺩﻩ ﻫﺎﻱ ﻣﺘﻨﺎﻗﺾ ﻧﻴﺰ ﺑﻪ ﻛﺎﺭ ﺑﺮﺩﻩ شود(kirkdos and et.al،2004)
ﺍﺳﺘﺪﻻﻝ ﻣﺒﺘﻨﻲ ﺑﺮ ﻣﻮﺭﺩ: 
 ﺍﺳــﺘﺪﻻﻝ ﻣﺒﺘﻨﻲ ﺑﺮ ﻣﻮﺭﺩ، ﺣﻞ ﻣﺴﺌﻠﻪ ﺑﻪ ﺭﻭﺵ ﺍﺳﺘﻨﺘﺎﺟﻲ است این روش بر اساس استفاده از ﭘﺎﺳــﺦ ﻣﺴــﺎﺋﻞ ﻗﺒﻠﻲ، ﺑﺮﺍﻱ ﺣﻞ ﻣﺴﺎﺋﻞ ﻣﺸﺎﺑﻪ ﺟﺪﻳﺪ، ﺷﻜﻞ ﮔﺮﻓﺘﻪ ﺍﺳﺖ .ﺍﺳﺘﺪﻻﻝ ﻣﺒﺘﻨﻲ ﺑﺮ ﻣﻮﺭﺩ، ﺑﻪ ﻋﻨﻮﺍﻥ ﺭﻭﺷﻲ ﺷﻨﺎﺧﺘﻪ ﻣﻲ ﺷﻮﺩ ﻛﻪ ﺍﺯ ﻧﺤﻮﻩ ﺭﻓﺘﺎﺭ ﺍﻧﺴﺎﻥ ﻫﺎ ﺩﺭ ﺑﺮﺧﻮﺭﺩ ﺑﺎ ﻣﺴﺎﺋﻞ ﺟﺪﻳﺪ ﺍﻟﮕﻮﺑﺮﺩﺍﺭﻱ ﻛﺮﺩﻩ است(ﻓﺎﺋﺰ ﻭ ﻗﺪﺳﻲ ﭘﻮﺭ ﻭ ﻏﻀﻨﻔﺮﻱ، 1385) ﺑﻪ ﺍﻳﻦ ﺗﺮﺗﻴﺐ ﻛﻪ ﺍﺯ ﺗﺠﺮﺑﻴﺎﺕ ﻛﺴﺐ ﺷﺪﻩ ﺩﺭ ﺣﻞ ﻣﺴﺎﺋﻞ گذشته به عنوان راهنمای برای حل ﻣﺴاﺌل ﺟﺪﻳﺪ  ﺑﻬﺮﻩ ﻣﻲ ﺑﺮﺩ (ﺩﻛﺘﺮ ﻣﺤﺴﻦ ﺩﺳﺘﮕﻴﺮ،ﻣﺮﺗﻀﻰ ﺷﻔﻴﻌﻰ ﺳﺮﺩﺷﺖ،1390 )
ﺣﻞ ﻣﺴﺌﻠﻪ ﺑﻪ ﺭﻭﺵ CBR در برگیرنده ی 4 عمل عمده است:
1-ﺑﺎﺯﻳﺎﺑﻲ ﻣﻮرد مشابه بازیابی شده با ﻣﺴﺌﻠﻪ ﺟﺪﻳﺪ
2-ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﭘﺎﺳﺦ ﻣﺴﺌﻠﻪ ﻣﺸﺎﺑﻪ ﺑﺎﺯﻳﺎﺑﻲ ﺑﺮﺍﻱ ﺗﻬﻴﻪ ﭘﺎﺳﺦ ﭘﻴﺸﻨﻬﺎﺩﻱ ﺑﺮﺍﻱ ﻣﺴﺌﻠﻪ ﺟﺪﻳﺪ 
3-بازبینی در پاسخ پیشنهادی در  صورت وجود مغایرت در شرایط ﻣﺴﺌﻠﻪ ﺟﺪﻳﺪ و ﻣﺴاﺌل بازیابی شده
4-نگهه داری مورد جدید،ﻣﺴﺌﻠﻪ ﺟﺪﻳﺪ و پاسخ آن برای استفاده در آیند 

نیو بیز:
یک روش یادگیری بسیار عملی، روش یادگیری بیزی می باشد. این روش راه حلهای عملی مفیدی را ارائه می کند. روش استدلال بیزی بر پایه احتمالات برای استنتاج کردن است. اساس این روش بر این اصل استوار است که برای هر کمیتی یک توزیع احتمال وجود دارد که با مشاهده یک داده جدید و استدلال در مورد توزیع احتمال آن می توان تصمیمات بهینه ای را اتخاذ نمود. روش مزبور در انجام دسته بندی کارایی قابل مقایسه ای با شبکه های عصبی و درخت تصمیم دارد.(محمد حسین ستایش،حسن فتاحی نافچی،سمیره عباسپور،میثم روستایی ،1393)
.
پارت:
پارت یک کلاس برای تولید یک لیست تصمیم است. از الگوریتم پارت برای شناسایی دانش، الگو و همچنین برای شناسایی قوانین مختلف استفاده می شود. .(محمد حسین ستایش،حسن فتاحی نافچی،سمیره عباسپور،میثم روستایی ،1393)

پیشینـــه پــژوهش:
پیشینه داخلی:
سجادی وهمکاران(1387) در پژوهشی به بررسی عوامل موثر بر گزارش مشروط حسابرسی پرداختند. نتایج حاکی از آن است که نسبت جاری و نسبت حساب های دریافتنی به دارایی بر گزارش مشروط حسابرسی اثر دارد، همچنین بین گزارش مشروط حسابرسی سال قبل و نوع موسسه ی حسابرسی، با گزارش مشروط سال جاری ارتباط معناداری وجود دارد. 
ستایش و همکاران (1388) به بررسی رابطه بین نسبت های مالی و غیر مالی با نوع اظهار نظر حسابرس پرداختند. نتایج حاصل از این پژوهش نشان می دهد که توزیع متغیرهای مستقل شرکت ها با اظهارنظرهای متفاوت، در اکثر موارد یکسان نیست. همچنین نتایج بیانگر این است که از میان تمام متعیرهای مالی و غیر مالی، نوع عملکرد بیشترین رابطه را با نوع اظهار نظر حسابرس دارد. 
احمدپور و همکاران (1389) در پژوهشی به بررسی تاثیر متغیرهای مالی و غیر مالی بر صدور اظهارنظر مشروط حسابرسی پرداختند.  نتایج این پژوهش نشان مي دهد که متغیرهای مالي بیشترین تاثیر را بر صدور اظهارنظر مشروط دارد. 
پورحیدری و اعظمی (1389) در پژوهشي به شناسایي نوع اظهارنظر حسابرسان با استفاده از شبکه هاي عصبي پرداختند. نتایج نشان مي دهد که شبکه عصبي عملکرد بهتري در شناسایي نوع گزارش حسابرس دارد و رگرسیون لجستیک الگوي نامتوازني در شناسایي انواع اظهارنظر حسابرس ارائه می کند.
کمالیان و همکاران(1389) در پژوهشي به تبیین مهمترین عوامل موثر بر رتبه افشاي اطلاعات شرکت هاي پذیرفته شده در بورس اوراق بهادار تهران با رویکرد داده کاوي پرداختند. با توجه به مطالعات انجام شده در سایر کشورها و شرایط حاکم بر بازار سرمایه ایران،19 عامل انتخاب شد و با استفاده از رویکرد داده کاوي، عواملي که بیشترین تکرار را در مجموعه دارند، مشخص شده است. 
امینی و همکاران(1390) عوامل موثر بر صدور گزارش مشروط حسابرسی  را با استفاده از شبکه های عصبی پرسپترون چند لایه، شناسایی کردند. نتایج پژوهش نشان می دهد که نسبت سود پس از مالیات به فروش  مهم ترین عامل موثر بر صدور گزارش مشروط حسابرسی است.
انواریرستمی و همکاران (1390) در پژوهشي براي تعیین محرك هزینه در سیستم هاي هزینه یابي بر مبناي فعالیت، از روش داده کاوي و تحلیل عاملي استفاده کردند. نتایج بیانگر آن است که به کارگیري موفق روش ارائه شده، تائیدي بر سودمندي و اثربخشي نتایج به کارگیري روش پیشنهادي براي سیستم بانکي است.
عباسي و همکاران (1391) در پژوهشي با عنوان «لزوم توسعه به كارگيري روش هاي داده كاوي د حسابداري و حسابرسی» بيان كردند كه امروزه پژوهشگران با توجه به توان بالاي فناوری داده كاوي و هوش مصنوعی در پردازش پایگاه هاي داده هاي بزرگ و یافتن الگوهاي پيچيده و غيرخطی در آنها، از روش هاي آماري به سمت روش هاي هوش مصنوعی پيش می روند. نتایج آنها نشان می دهد كه استفاده از روش ها و روش هاي داده كاوي حتی به حسابرسان این امکان را می دهد تا با استفاده از حداقل زمان و هزینه، گزارشی را ارائه كنند كه مستند به روش هاي علمی بوده و از اتکاپذیري و اطمينان بالایی برخوردار باشد. بنابراین، لزوم توسعه و به كارگيري روش هاي داده كاوي در حوزه علوم مالی را، ضرورتی اجتناب ناپذیر دانستند.
باقرپور ولاشاني و همکاران (1391) در پژوهشي با عنوان «پيش بيني گزارش حسابرس مستقل در ایران رویکرد داده كاوي» با استفاده از سه روش داده كاوي شامل درخت تصميم، شبکه هاي عصبي مصنوعي و رگرسيون لجستيک به پيش بيني گزارش حسابرس مستقل پرداختند. نتایج پژوهش حاكي از آن است كه ميانگين دقت مدل حاصل از تکنيک درخت تصميم از دو روش دیگر بيشتر بوده و این روش توانسته است گزارش حسابرسي را با ميانگين 88.64% پيش بيني كند.

پیشینه خارجی:
کیسی و همکاران(1998) در پژوهشی به بررسی ارتباط بین ارقام مالی، متغیرهای سازمان حسابرسی و گزارش مشروط حسابرسی در شرکت های کوچک پرداختند. نتایج پژوهش حاکی است که با استفاده از تحلیل لجستیک چند متغیره و اطلاعات صورت های مالی، میتوان بندهای شرط موجود در گزارش حسابرسی شرکت های کوچک را پیش بینی کرد. همچنین نتایج نشان می دهد که اگر شرکتی گزارش مشروط دریافت کند احتمال بیشتری وجود دارد که سالهای بعد نیز گزارش مشروط دریافت کند. پ
کارکلو و همکاران(2003) با استفاده از شبکه عصبي مصنوعي به پیشبیني اظهارنظر حسابرسان  پرداختند. نتیجه پژوهش آنان نشان داد که شبکه عصبي مصنوعي، نوع گزارش حسابرس را در آینده پیشبیني می کند و همین امر سرمایه گذاران، اعتباردهندگان و دیگر ذي نفعان را در خرید و فروش سهام شرکت ها راهنمایي مي کند. 
ایرلند (2003) به ارزیابی گزارش های حسابرسی منتشر شده و ویژگیهای مورد مشاهده شرکت ها از جمله اندازه ی موسسه حـسابرسی در شـرکت های بریتانیایی پرداخت. نتایج حاکی از این امر است که شرکت هایی با کمبود نقدینگی و سطح بالایی از ریسک مالی، در مقایسه با سایر شرکت ها بیشتر در معرض دریافت گزارش مشروط حسابرس قرار میگیرند.
اسپاتیس(2003 ) در پژوهشی به بررسی توانایی پیش بینی نوع اظهار نظر حسابرس با استفاده از 2003 اطلاعات مالی و غیرمالی پرداخت. نتایج این پژوهش حاکی است که اقلام صورت های مالی، توانایی پیش بینی اظهارنظر مشروط را دارند.
گیگر و همکاران (2006 ) در پژوهشی نحوه تصمیم گیری و قضاوت حسابرسان در شرایط مختلف را مطالعه کردند.در این پژوهش،694 شرکت ورشکسته در بازه ی زمانی 2001-1991 بررسی شدند. نتایج نشان می دهد حسابرسان در مورد شرکت هایی که با علائم درماندگی مالی روبرو هستند، بدون توجه به سطح خطر قابل قبول حسابرسی، گزارش عدم اظهار نظر صادر می کنند.
کرکس و همکاران (2007 ) از سه تکنیک طبقه بندی داده کاوی برای توسعه ی مدل های شناسایی  گزارش مشروط استفاده کردند. نتایج نشان می دهد که از بین نسبت های مورد بررسی شاخص درماندگی مالی و نسبت سودآوری، به عنوان مهم ترین عوامل موثر بر پیش بینی نوع اظهار نظر حسابرس شناسایی شد. 
کایرکس و همکاران (2007)  در پژوهشي با عنوان «روش هاي داده كاوي براي تشـخيص صورت های مالی جعلي» به بررسي اثربخشي روش های داده کاوی در 76شركت توليدي یوناني براي شناسایي شركت هایي كه صورت هاي مالي جعلي منتشر می كنند پرداختند. آنها بيان كردند كه در تشخيص تقلب مدیریت، حسابرسان مي توانند با استفاده از روش-هاي داده كاوي در كارشان تسهيل ایجاد كنند. آنها در پژوهش خود سودمندي درخت هاي تصميم گيري شبکه هاي عصبي و شبکه هاي باور بيزین را در شناسایي صورت هاي مالي جعلي بررسي كردند.
چن و همکاران (2009) در پژوهشی با عنوان«استفاده از روش های داده کاوی و شبکه های مصنوعی براي پيش بيني مـدل اضـطراب مالي» از شبکه هاي عصبی مصنوعی براي پيش بينی تقلب استفاده كردند و نشان دادند كه شبکه هاي عصبی مصنوعی از دقت بالایی در كشف تقلب برخوردارند.
بهیمنی و همکاران(2009) به بررسی تداوم فعالیت از دیدگاه حسابرس پرداختند. در این پژوهش با توجه به متغیرهای مالی و غیرمالی، احتمال دریافت اظهارنظر تعدیل شده را پشبینی کردند. ابهام در تداوم فعالیت گزارش حسابرسان بررسی شد و بیان کردند که شرکت های دریافت کننده این گزارشها، مدت زمان بیشتری برای دریافت وام باید سپری کنند.
راویسانکار و همکاران  (2011)در پژوهشي با عنوان «تشخيص تقلب در صورت هاي مالي و متغيرهاي  انتخاب شده با استفاده از روش هاي داده كاوي» به شناسایي شركت هایي كه به تقلب در صـورت هاي مالي متوسـل می شوند پرداختند. آنـها روش هاي داده كاوي را بر روي مـجموعه اي از داده هاي شركت ها در دو مرحله آزمون كردند در مرحله اول با انتخاب 18 ویژگي، شبکه هاي عصبي احتمالاتي از بین تمامی روش ها برتر بود و در مرحله دوم نیز با انتخاب 10 ویژگی، شبکه های عصبي احتمالاتي و برنامه نویسي حاشيه دقت برابر نسبت به سایر روش ها برتر بودند.
اولسون و همکاران (2012) در پژوهشی از تجزیه و تحلیل داده کاوی جهت پیش بینی ورشکستگی  شرکت ها استفاده کردند. نتیجه پژوهش آنان نشان داد که هزینه استفاده از داده کاوی در مقایسه با الگوهای شبکه عصبی مصنوعی، ماشین بردار پشتیبان، درخت تصمیم و رگرسیون لجستیک بیشتر است ولی استفاده از آن باعث کاهش خطای بالقوه در امر پیش بینی می شود.


کابرد داده کاوی در حسابرسی :
درسال های گذشته حسابرسان  پی به افزایش شدید حجم معاملات و پیچیدگی داده ها ی مالی و غیر مالی شرکت های صاحبکار برده اند . به منظور حسابرسی این شرکتها حسابرسان پی در پی باید با داده های حجیم و ساختارپیچیده این داده ها سرو کار داشته باشند.در نتیجه حسابرسان بیش از این نمیتوانند تنها به ابزار های گزارشگری یا خلاصه کردن فرایند حسابرسی متکی باشند. ابراز های دیگری نظیر داده کاوی به طور خوکار اطلاعات را از میان حجم زیادی از داده ها  استخراج می کند می تواند مفید باشد .اگرچه استفاده از فنون داده کاوی درفرایند حسابرسی در واقعه زمینه  نسبتا جدیدی  می باشد.اما با توجه به رویداد اخیر از جمله سقوط انرون و آرتور اندرسن نشان دهنده مشکلات قابل توجهی در فرایند حسابرسی است.از طرفی دیگر داده کاوی نشان داده است که در بسیاری از کابرد های تجاری مرتبط با  حسابرسی ازجمله پیش بینی ورشکستگی، تداوم فعالیت ومضیقه مالی ، کشف تقلب ، پیش بینی عملکرد واحد تجاری ،ارزیابی ریسک اعتباری دارای مزیت های فراوانی خواهد بود.
1-پیش بینی ورشکستگی:
یکی از مسایلی که می تواند سرمایه گذاران را در تصمصم گیری کمک کند وجود ابزار ها و مدل های مناسب برای ارزیابی شرایط مالی ووضیعت  شرکت هاست. یکی از این ابزار ها، مدل پیش بینی ورشکستگی شرکت هاست . سرمایه  گذاران همواره در پی این هستند تا با امکان پیش بینی ورشکستگی شرکت ها از سوخت اصل و فرع پول خود جلوگیری کنند. بنابراين پيش بيني ورشكستگي شركتها يكي از موضوعات اساسي براي كشورها، سرمايهگذاران، سهامداران، مشتريان و ... است.
روشهاي مختلفي اعم از روشهاي آماري و داده كاو ي را ميتوان براي پيش بيني ورشكستگي
به كار گرفت. روشهاي آماري و كلاسيك سابقه طولاني در پيش بين ورشكستگي شركتها دارند در
حالي كه روشهاي داده كاوي و هوش مصنوعي به تازگي در اين زمينه مورد ا  سفاده قرار ميگيرند.
پیش بینی ور شکستگی مهم  ترین و مشهور ترین کابرد روش های داده کاوی در داده های مالی می باشد . ورشکستگی باعث خسارت های اقتصادی برای مدیران و سرمایه گذاران و اعتبار دهندگان و تمامی ذی نفعان می شود. و هزینه های اجتماعی زیادی هم در بر خواهد داشت wermter AND et.al)  (2007,
پیش بینی ورشکستگی توسط  داده های صورت مالی نخستین  بار ازآثار التمن سر چشمه گرفته است . التمن استدلال می کند ورشکستگی فرآیندی بلند مدت است،از این رو صورت های مالی،می تواند حاوی هشدار هایی از رخداد یک ورشکستگی قریب الوقوع باشند. وی با به کارگیری تحلیل تشخیصی چند گانه مدلی را برای پیش بینی ورشکستگی شرکت ها ایجاد کرد. در همین حال بسیاری از محققان نیز مدل های جایگزین را با استفاده از فنون آماری گسترش می دادند.

واگل وهمکاران(2017) 120 شرکت را با داده کاوی مورد بررسی و تجریه و تحلیل قرار دادند و نشان دادند که شبکه های عصبی به عنوان بهترین  مدل برای پیش بینی ورشکستگی شرکت ها توجیه می شود و ان ها یافتند که استفاده مناسب وانتخاب تکنیک های داده کاوی به افزایش دقت پیش بینی مدل کمک می کند .سازمان های مالی  می توانند ار این مدل ها ی پیش بینی بهره مند شوندزیرا به ان ها اجازه می دهدکه موفقیت کسب و کار را د راینده پیش بینی و بر این اساس تصمصم بگیرند.

السون و همکاران(2011)تلاش کردند تا با استفاده از روش های داده کاوی ورشکستگی را پیش بینی کنند و ان ها ب این نتیجه رسیدندک بین روش های داده کاوی درخت های تصمیم گیری نسبت به شبکه های عصبی و ماشین های بردار پشتیبانی نسبتا دقیق تر بودند.
اهنگری (2011) در مطالعه ای برروی نسبت های مالی 114شرکت پذیرفته شد بورس اوراق بهادار با استفاده از الگوریتم های مختلف دریافت که الگوریتم های اماری،الگوریتم های ضعیف تری نسبت به الگوریتم های هوش مصنوعی می باشندو قدرت پیش بینی شرکت ها  ورشکسته و سالم دربین الگوریتم هوش مصنوعی بالاتر است نکته قابل ذکردیگر اینکه  شاخص  مالی نسبت حقوق صاحبان سهام به مجموع بدهی ها در سه دوره نسبت به سایر متغییر های مالی مورد استفاده از اهمیت فوق العاده بیشتری در تعیین وضعیت شرکت ها به لحاظ ورشکستگی دارد.
سنتوس و همکاران (2006) با استفاده از رویکرد استفاده از  نسبت های حسابداری(که  شامل  روش های آماری کلاسیک مانند تجزیه و تحلیل های تشخیصی یا مدل های رگرسیون لجستیک است. به تجزیه و تحلیل تکامل چندین شاخص مالی طی یک دوره سه ساله است. در مجموع شامل 16 مدل بود پرداختند . اینها در الگوریتم داده کاوی (مثلا شبکه های عصبی مصنوعی یا درخت تصمیم گیری )،داده های مورد استفاده (همه سه سال یا فقط آخرین) و ویژگی های ورودی پذیرفته شده (مانند همه مقادیر حسابداری یا فقط مهمترین آنها) با هم متفاوتند. این آزمایش ها با استفاده از استودیوی توسعه کسب و کار جدید Microsoft SQL Server انجام شد. نتایج بسیار خوب با عملکردی بین 86 تا 99 درصد برای تمامی 16 مدل به دست آمد.

شین و لی( 2002 )نیز مدلی مبتنی بر الگوریتم ژنتیک پیشنهاد دادند. آنها بر این واقعیت تاکید کردند که بر خلاف شبکه های عصبی مصنوعی ،الگوریتم های ژنتیک می توانند قوانینی قابل فهم ایجاد کنند. در این مورد ، الگوریتم های ژنتیک به منظور یافتن آستانه های یک یا چند متغیر در بالا یا پایین سطحی به کار رفتند که موقعیت یک واحد تجاری را بحرانی می سازد. این مدل از ساختار قادهمند بهره می برد که دارای 5 شرط است که هر کدام به یک متغیر خارج 9 نسبت مالی ،اشاره دارد. این شرایط با عملکرد عطف منطقی ،ترکیب خواهد شد. مجموعه دادها مرکب از 264 شرکت موفق و 264 شرکت ناموفق بوده و 9 نسبت مالی به عنوان متغیر های ورودی انتخاب گردیدند. 90 درصد نمونه به عنوان مجموعه آموزشی و 10 درصد نیز به منظور اعتبار سنجی به کار رفته اند. دقت کلی روش مزبور در حد 80 درصد گزارش شد.

لین و مک (2001) تلاش کردند تا با استفاده از 4 روش متفاوت،ورشکستگی شرکتها را پیش بینی نمایند. 2 مورد از این  روشها،روشهای آماری)تحلیل تشخیصی و رگرسیون لجستیک(و دو مورد دگر نیز از فنون یادگیری ماشین )درختان تصمیم گیری و شبکه های عصبی( بوده اند. همچنین آنها بر اساس روش های پیش گفته،الگوریتمی ترکیبی را نیز پیشنهاد کردند. نمونه مورد استفاده شامل 1133 شرکت تجاری انگلیسی بوده است. 690 شرکت موفق و 106 شرکت ناموفق به عنوان مجموعه آموزشی و 289 شرکت ناموفق و 48 شرکت موفق به عنوان مجموعه آزمایشی استفاده شدند. تلاشی برای تطبیق کمپانی های موفق و ناموفق صورت نگرفت.
37 مورد از نسبت های مالی،برگرفته از ترازنامه و صورت سود و زیان به عنوان متغیر های ورودی انتخاب شد. دو روش انتخاب ویژگی بکار رفته،متغییر های ورودی را با اعمال قضاوت انسان به 4 و با اعمال تحلیل واریانس به 15 مورد کاهش داده است. نتایج حاصل از روشهای شبکه های عصبی مصنوعی و درختان تصمیم برای هر دو انتخاب ویژگی مبتنی بر قضاوت انسان و تحلیل واریانس،قابل قبول تر از دیگر روش ها بوده است. سرانجام نویسندگان مقاله،الگوریتمی ترکیبی را پیشنهاد می کنند که رای گیری وزن دار طبقه بندی کننده های مختلف را به کار می برد.

2-پیش بینی تداوم فعالیت و درماندگی مالی:
فرض تداوم فعالیت بیانگر این است که واحد تجاری میتواند به فعالیت خود برای مدت نامحدودی ادامه دهد لیکن تداوم فعالیت واحد تجاری ممکن است به دلایل زیادی از جمله جریان های نقدی منفی ناشی از عملیات با تردید مواجه  شود.
بر  اساس استاندارد59 حسابرسی حسابرس بايد توانايي صاحبكار خود رادر مورد امكان ادامه فعاليت حداقل يك سال بعد از تاريخ ترازنامه ارزيابي كند.چنان چه نشانه هايي از وجود مشكلات مالي ديده شود كه احتمالا منجر به ورشكستگي خواهد شد، حسابرس می بايد در خصوص تداوم فعاليت صاحبكار اظهارنظر كند. ارزيابي وضعيت تداوم فعاليت شرکتها كارچندان ساد هاي نيست. (, kirdos andet.al2004 )
درماندگی مالی که گاهی به ورشکستگی می انجامد ب حالتی اطلاق می شود که شرکت تواند به تعهداتش را در قبال اعتبار دهندگان عمل کند.به همین جهت پیش بینی درماندگی مالی از لحاظ اقتصادی بسیار مهم است زیرا هزینه ها ی زیادی برا شرکت ها ،اعتبار دهندگان ،سهامداران و در سطح کلان بر اقتصاد کل تحمیل می کند.از جمله هزینه های درماندگی مالی می توان به هزینه های فرصت از دست رفته شرکت ها در مواردی چون فروش از دست رفته ،کاهش سود اوری و زیان از دست دادن موقعیت های بازار است که منجر به بدتر شدن توانایی شرکت در پرداخت بدهی ها می شود.(چن و مرویل 1999:فیشر و مارتن2005)
از دیگر هزینه های درماندگی می توان به هزینه های بالای تامین مالی اشاره کرد در چنین شرایطی جذب سرمایه از طریق وام های کوتاه مدت اگر غیرممکن نباشد گران ودشوار خواهد بود از این رو اقدامات به موقع مدیران برای پیش بینی درماندگی مالی اجتناب ناپذیر خواهد بود.
مطالعات زیادی در این باره انجام شده است یکی از اولین مطالعات در این زمینه توسط میناکر و اسمیت درسال1935،درباره کفایت نسبت های مالی به عنوان عامل پیش بینی کننده مشکلات مالی بود. این دو با مطالعات خود به این نتیجه رسیدند که نسبت های مالی شاخص های خوبی برای پیش بینی درماندگی مالی است.
کاه (2004) در بررسی موردی ،پیش بيني تداوم فعاليت رو ش هايي نظير شبكه هاي عصبي مصنوعي، درختان تصميم و رگرسيون لجستيك را بايكديگر مقايسه كرده است. نمونه مورد استفاده شامل 165 شركت داراي فعاليت و 165 شركت فاقد فعاليت بوده است. 6نسبت مالي برگزيده به عنوان متغيرهاي ورودي انتخاب شدند. نهايتاً، نتايج نشان مى دهد روش درختان تصميم نسبت به دو روش ديگر از عملكرد بهتري برخوردار بوده است.
بهیمنی و همکاران(۲۰۰۹) به بررسی تداوم فعالیت از دیدگاه حسابرس پرداختند .در این پژوهش با توجه به متغییر های مالی و غیر مالی ،احتمال دریافت اظهار نظر تعدیل شده را بررسی کردند. ابهام در فعالیت را در گزارش حسابرسان بررسی شد وبیان کردند که شرکت های دریافت کننده این گزارش ها باید مدت زمان بیشتری را برای دریافت وام سپری کنند.
لی و تو (2010)دریافتند که مدل SVM با دقت بالاتر و نرخ خطای پایین تر درمانددگی مالی را پیش بینی می کند

کردستانی و همکاران (۱۳۹۰) نیز از مبنای تعیین ورشکستگی (ماده 141قانون تجارت) جهت پیش بینی درماندگی مالی استفاده نمود و با استفاده از ازمون کای اسکور نشان دادند که تفاوت معنی داری در میزان وقوع درماندگی مالی میان شرکت ها با ترکیبات متفاوت جریان های نقدی در یک ،دو و سه سال قبل از درماندگی مالی وجود دارد.

منصور فر و همکاران(۱۳۹۴) در تحقیق خود به این نتیجه رسید که ترکیبات جریان های نقدی می تواند درماندگی الی  را پیش بینی کند ولی از انجا که درماندگی مالی متاثر از عومل متعددی غیر از جریان های نقدی نیز می باشد می توان با افزودن سایر عوامل دقت و درصد پیش بینی را افزایش داد.

3-کشف تقلب صورت های مالی:
تقلب از پديده هاي رايج و متداول در كسب و كار است و طبق بخش استانداردهاي24 حسابرسي ايران عمل فريبكارانه يك يا چند نفر از مديران ،كاركنان يا اشخاص ثالث براي برخورداري از مزيتي ناروا عبارتست از هرگونه اقدام عمدي يا غيرقانوني . بنابراين پيشگيري با كشف تقلب هاي با اهميت در صورتهاي مالي، همواره كانون توجه سرمايه گذاران، قانونگذاران، استاندارد گذاران، مديران و حسابرسان بوده است.
در سالهای اخیر با افزایش تقلب های مالی در سراسر دنیا و متضرر شدن سازمان ها و باپیامد ان، همگان را بر آن داشته است که چگونه می توان راهی برای رهای از آن پیدا کرده  با همین منظور مدیران سازمان ها و بنگاه های مالی به دنبال روش های برای کاهش در سازمان های خود می باشند کشف تقلب روز به روز اهمیت فراوانی پیدا کرده و تکنیک های داده کاوی می توانند روش های مؤ ثری برای حل ای مشکل عمده باشند.

راويسانكار و همكاران(2011)در پژوهشي با عنوان «تشخيص تقلب در صورت هاي مالي و متغيرهاي
انتخاب شده با استفاده از روش هاي داده كاوي » به شناسايي شركت هايي كه به تقلب در صورت هاي
مالي متوسل می شوند پرداختند. آنها روش هاي داده كاوي را بر روي مجموعه اي از داده هاي شركت ها
در دو مرحله آزمون كردند. در مرحله اول با انتخاب ۱۸ ويژگي، شبكه هاي عصبي احتمالاتي از بين تمامي روش ها برتر بود و در مرحله دوم نيز با انتخاب ۱۰ ويژگي، شبكه های عصبي احتمالاتي و برنامه نويسي ژنتيك با حاشيه دقت برابر نسبت به ساير روش ها برتر بودند

گراو و باسيليكو (2008) با استفاده از الگوي آماري پروبيت، نشان دادند كه عوامل مالي و عوامل راهبری شركتي در شناسايي تقلب در گزارشگري مالي مؤثرند

اسپاتيس (2002) از دو مدل براي شناسايي تحريف صور تهاي مالي از طريق داده هاي قابل دسترس عمومي استفاده كرد. متغيرهاي ورودي براي نخستين مدل شامل ۹ نسبت مالي بوده و براي دمین مدل امتیاز z به عنوان متغيرهاي ورودي به منظور تطبيق رابطه ميان درماندگى مالي و دستكاري ارقام مالي، اضافه گرديد. اين روش از رگرسيون لجستيكي بهره مي برد. داد ه هاي نمونه مركب از ۳۸ مورد تحريف صور تهاي مالي و ۳۸ مورد عدم تحريف بوده است. نتايج هر دو مدل نشان داد سه متغير، با ضريبِ معنا داري وارد مدل شد ه اند.
4-پیش بینی عملکرد واحد تجاری:
تحقيقات بسيار زيادي در سال‌هاي اخير در مورد ماهيت و روش اندازه‌گيري عملکرد شرکت ‌ها انجام شده است. نتايج اين تحقيقات از آن جهت ارزشمند است که مي‌توان وضعيت فعلي شرکت ‌ها را درک نمود و چالش‌هاي آينده در زمینه اندازه‌گيري عملکرد را مورد بررسي قرار داد. امروزه صاحب‌نظران حوزه مديريت بر اهميت مدل‌هاي ارزيابي عملکرد به‌عنوان يکي از معتبرترين شاخص‌هاي توسعه‌يافتگي شرکت ‌ها تأکيد مي‌ورزند. از اين رو، يکي از دغدغه‌هاي اساسي شرکت ‌هاي امروزي، دستيابي به يک شيوه ارزيابي کارا و انعطاف‌پذير است تا با آن بتوان کليه ابعاد عملکردي شرکت را مورد بررسي قرار داد. اگر اندازه‌گيري عملکرد را فرايند کمّي‌سازي کارايي و اثربخشي يک فعاليت تعريف کنیم، از جمله راه‌هاي تجزيه و تحليل گزارش‌هاي مالي که از طريق آن مي‌توان حجم بالاي اطلاعات موجود در گزارش‌هاي مالي را خلاصه نمود و همزمان جنبه‌هاي مختلف فعاليت شرکت را مورد بررسي قرار داد، تهيه نسبت‌هاي مالي از اطلاعات گزارش‌هاي مالي است. نسبت‌هاي مالي، بيان‌کننده ارتباط بين دو يا چند رقم از ارقام صورت‌هاي مالي است که به صورت جزئي از کل يا درصدي از آن بيان مي‌شود. زماني که يک نسبت محاسبه مي‌گردد، مي‌توان گفت که عدد به‌دست آمده، محصول يک رابطه رياضي و همبستگي آماري دو يا چند متغير در مقطع خاصي از زمان است(تقی زاده،1390(
با وجود چالش های ناشی از تفکیک مالکیت از مدیریت وتضاد منافع بین گروههای ذی نفع ،شاهد هستیم از معیارهای حسابداری نظیر سود هر سهم ،نسبت بازدهی حقوق صاحبان سهام و یا بازدهی سرمایه گذاری به منظور ارزیاب عملکرد واحدهای تجاری استفاده می شود)ایزدی نیا ، (1384)
لم  (2003) مدلی را به منظور پیش بینی نرخ بازده خقوق سهامداران عادی بکار گرفته است. وی از شبکه های عصبی پس انتشار خطا در این خصوص استفاده کرد.بردار ورودی شامل 15 نسبت مالی و یک متغیر از نوع تحلیل تکنیکال بود.

5-ارزیابی ریسک اعتباری:

تجربه و تحلیل ریسک اعتباری به واسطه افزایش تعداد شرکت های ورشکسته و پیشنهاد های رقابتی اعتبار دهندگان ،تبدیل به یکی از محبوب ترین حوزه های مالی شده است.روش های داده کاوی به منظور تسهیل پیش بینی ریسک اعتباری می تواند به کار برده شود.)هانگ و همکارن ، 2003)
تجزیه و تحلیل رتبه بندی ریسک اعتباری را با استفاده از ماشین بردار پشتیبان که یک روش یادگیری ماشین است ،اجرا کردند.دو مجموعه داده مورد استفاده دراین   ،شامل 74 شرکت کره ای و دیگری شامل 265 شرکت آمریکایی بوده است. برای هر مجموعه داده ،پنج نوع رتبه بندی تعریف شد.همچنین ،دو مدل برای داده های شرکت های کره ای و دو مدل نیز برای شرکت های آمریکایی هر کدام با یک بردار ورودی به کار رفت. ماشین بردار پشتیبان و شبکه های عصبی پس از انتشار خطا ،برای اهداف پیش بینی رتبه بندی اعتبار استفاده شدند.مدل گارسون نیز برای اندازه گیری اهمیت نسبی ارزش های ورودی استفاده گردید..

از دیگر کاربرد های داده کاوی می توان به کار برد آن در پیش بینی نوع اظهار نظر حسابرس اشاره کرد
      توسعه و رشد فناوری و تغییرات آن و به کار گیری ان در علوم مختلف وپیچیدگی روز افزون فعالیت های اقتصادی باعث شده که حسابرسان هم به منظور افزایش کارایی روش های حسابرسی از فناوری جدید استفاده کنند از جمله مهم ترین راه های افزایش کارایی حسابرسی استفاده از داده کاوی به منظور پیش بینی نوع اظهار نظر حسابرس می باشد.
اظهار نظر در حسابرسی به مجموعه قضاوت حرفه ای،تصمیم گیری ها و توجیه های حسابرس به صورت فشرده به عنوان یک نظر کارشناسی و حرفه ای حسابرس گفته می شود.(حساس یگانه ،۱۳۸۵) استاندارد حسابرسی شماره ۷۰۰ بیان می کند که حسابرس باید درباره اینکه ایا صورت های مالی،از تمام جنبه های با اهمیت ، طبق استاندارد های حسابداری ، به نحو مطلوب تهیه شده است یا خیر اظهار نظر کند
کارکلو و همکاران (۲۰۰۳)با استفاده از شبکه های عصبی مصنوعی به پیش بینی اظهار نظر حسابرسان پرداختند. نتیجه پژوهش ان ها نشان داد که شبکه های عصبی مصنوعی ،نوع اظهار نظر حسابرس را در اینده پیش بینی می کنند و همین امر سرمایه گذاران ،اعتبار دهندگان و سایر ذی نفعان را در خرید و فروش سهام در اینده کمک می کند.
افستاتیوس و همکاران (۲۰۰۷ )با استفاده از نمونه ای شامل۴۵۰ شرکت ایرلندی و انگلیسی از سه روش داده کاوی شامل پرسپترون چندلایه،درخت تصمیم و شبکه بیزین برای طبق بندی اظهار نظر حسابرسان استفاده نمودند نتایج این پژوهش نشان دهنده عملکرد بالای شبکه بیزین نسبت به سایر روش ها می باشد.
موانع و چالش‌ها :
با وجود مزاياي فراوان كه داده‌كاوي براي مديريت دانش سازمان‌ها و دست‌يابي به دانش براي تصميم‌گيري سازماني دارد، اين حوزه با موانع و چالش‌هايي روبه‌روست كه عبارتند از: 
1- فقدان داده براي پشتيباني تجزيه و تحليل 
2- قدرت محدود محاسبه براي به دست آوردن محاسبات رياضي مورد نياز الگوريتم‌هاي داده‌كاوي 
3- عدم مطلوبيت و جذابيت بيشتر الگوها 
4-خطر وجود داده‌هاي آلوده و كسب نتايج كاملا غلط 
5-تمركز بيش از حد بر الگوريتم‌ ها
6-هزينه نسبتا گران سرمايه‌گذاري در همه حوزه‌ها 
7-عدم پوشش كامل همه حوزه‌ها 

نتیجه گیری:
فناوری داده کاوی، با توجه به این که زمینه جدیدی  است، اما نشان داده که در فرایند تصمیم گیری  امور مالی کاربرد فروانی دارد كاربرد رو شهاى داده كاوي با توجه به مطالعات مرتبط و ماهيت آنها، مى تواند طيف گسترده ای شامل پيش بيني ورشكستگي، تخمين ريسك اعتباري، وضعيت تداوم فعاليت، درماندگی مالي، پیش بيني عملكرد واحد تجاري و تقلب مديريت را در برگيرد.که پیش بینی ور شکستگی مشهور ترین و پرکاربرد ترین ان است.
همچنين، رو شهاي داده کاوی به كار رفته، در تحقيقات مختلف نيز شامل شبكه هاي عصبي مصنوعى، الگوريتم ژنتيك، درخت تصميم گيري، نظريه مجموعه اوليه، استدلال مبتني بر مورد و برنامه نويسي رياضي هستند. بر اساس بررسى هاى صورت گرفته، روش شبكه هاي عصبي مصنوعى تاكنون يكى از محبوب ترين رو ش هاى داد ه كاوى بوده است. امید است که با ارتقا روش ها و مدل های مورد استفاده در داده کاوی ،داده کاوی یکی از ابزار های پرکاربرد  تصمیم گیری در امور مالی شود.






منابع :

1-شهرابی جمال و شکورنیا ونوس کنفرانس IDMCO7 امیر کبیر2007
2-مشکانی علی,ناظمی عبدالرضا 1388 مقدمه ای بر داده کاوی چاپ اول بهار انتشارات فردوسی
ازاده مسلم زاده گتابی «روش های داده کاوی برای کشف تقلب در صورت های مالی ‌»
دکتر محسن دستگیر ، مرتضی سر دشت (1390) « فناوری داده کاوی رویکرد نوین در حوزه مالی »
دکتر امید پور حیدری ،زینب اعظمی (1389) «شناسایی نوع اظهار نظر حسابرسان با استفاده از شبکه های اعصبی »
محمد حسین شتایش،حسن فتاحی نافچی،سمیره عباس پور ،میثم روستایی(1393)« ارایه رویکرد نوین بر صدور گزارش حسابرسی با استفاه از داده کاوی»
پگاه ملک پور علمداری، میهن حسین نژاد ، اشکان جعفری (1392) «مروری بر مفهوم داده کاوی و کاربرد ان در حوزه های مختلف»
محمد حسین ستایش ، فهیمه ابراهیمی ، سید مجتبی سیف ،مهی ساری خانی (1391) « پیش بینی نوع اظهار نظر حسابرسان با استفاده از داده کاوی»



chen wei-sen and yin-kuandu using neural networks and data mining teehniques for the financial dis trese prediction model expert systems with applications vol .36 2009 pp 4075-4086         
-sirkulvadhana supatcharee date mining as a financial auditing tool m.sc thesis in accounting Swedish school of economice and business administration 2002    
Koskivaara,Eija and Barbro Back Artificial neural network Assistant ANNA for continuous Auditing and montoring of Financial Data journal of Emerging Technologies in Accounting vol.4 2007 pp.29-45                          

مجموعه آموزش های کوتاه ویدئویی

قسمت اول : شناخت و ارزیابی سیستم کنترل های داخلی در سطح سازمان