بررسی سودمندی طبقه‌بندی‌کنندۀ جنگل‌های تصادفی و روش انتخاب متغیر ریلیف در پیش‌بینی بحران مالی: مطالعۀ شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دانشگاه شیراز

2 شیراز- بلوار پاسداران- خیابان کمیل- بعد از کوچه 8- منزل ششم

چکیده

پژوهش حاضر به پیش‌بینی بحران مالی شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران با استفاده از طبقه‌بندی‌کنندۀ غیرخطی جنگل‌های تصادفی می‌پردازد. در این راستا، پس از بررسی متون پژوهش و شناسایی 69 متغیر پیش‌بین اولیه، از روش انتخاب متغیر ریلیف برای شناسایی متغیرهای پیش‌بین بهینه استفاده شد. یافته‌های تجربی مربوط به بررسی 95 شرکت - سال سالم (بدونِ درماندگی مالی) و 95 شرکت - سال (درماندۀ مالی) پذیرفته‌شده در بورس اوراق بهادار تهران در سال‌های 1380 تا 1392 بیانگر عملکرد بهتر جنگل‌های تصادفی نسبت به رگرسیون لجستیک است. به بیان دیگر، در صورت استفاده از این طبقه‌بندی‌کننده، به‌طور معناداری، میانگین دقت افزایش و خطای نوع اول و دوم کاهش می‌یابد. افزون بر این، یافته‌های پژوهش بیانگر سودمندی روش انتخاب متغیر ریلیف در پیش‌بینی بحران مالی است. به عبارت دیگر، در صورت استفاده از متغیرهای منتخب روش ریلیف (نسبت به استفاده از 69 متغیر اولیه)، به‌طور معناداری، میانگین دقت افزایش وخطای نوع اول و دوم کاهش می‌یابد.
 

کلیدواژه‌ها


عنوان مقاله [English]

The Usefulness of Random Forest Classifier and Relief Features Selection in Financial Distress Prediction: Empirical Evidence of Companies Listed on Tehran Stock Exchange

نویسندگان [English]

  • Mohammad-Hossein Setayesh 1
  • mostafa kazemnezhad 1
  • mohammad hallaj 2
1 Associate professor of Accounting, Shiraz University
2 شیراز- بلوار پاسداران- خیابان کمیل- بعد از کوچه 8- منزل ششم
چکیده [English]

The Purpose of this research is investigating the usefulness of random forest classifier and relief features selection in financial distress prediction of companies listed on Tehran Stock Exchange. In this regard, through reviewing literature, 69 predictive features (variables) were specified as the initial features based on the popularity in the literature and the availability of the necessary data. By using relief method, optimal variables were selected from initial variables. In overall, the experimental results of investigating 95 financially distressed and 95 non-financial distressed in 2002 to 2014, indicated that random forest outperforms the logistic regression. In other words, the application of this classifier, increases the mean of accuracy, and reduces the occurrence of type I and type II errors. Furthermore, the results confirmed the usefulness of relief method in predicting financial distress. . In other words, using selected variables of this feature selection method (relative to using 69 initial variables) increases the mean of accuracy, and reduces the occurrence of type I and type II errors

کلیدواژه‌ها [English]

  • Random Forest Classifier
  • Relief Features Selection method
  • Financial Distress Prediction

ابریشمی، حمید. (1387). مبانی اقتصادسنجی. جلددوم، چاپ پنجم، تهران: انتشارات دانشگاه تهران.

2- پناهی، حسین، اسدزاده، احمد و علیرضاجلیلی مرند. (1393). پیش‌بینی پنج‌سالۀ ورشکستگی مالی برای شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران. تحقیقات مالی، دورۀ 16، شمارۀ 1، صص. 57-76.

3- پورحیدری، امید و مهدی کوپایی حاجی. (1389). پیش‌بینی بحران مالی شرکت‌ها با استفاده از مدل مبتنی بر تابع تفکیکی خطی. پژوهش‌های حسابداری مالی، سال دوم، شمارۀ اول، صص. 33-46.

4- چالاکی، پری و مرتضی یوسفی. (1391). پیش‌بینی مدیریت سود با استفاده از درخت تصمیم‌گیری. مطالعات حسابداری و حسابرسی، شمارۀ 1، صص. 110-123.

5- حسینی، سیدمحسن و زینبرشیدی. (1392). پیش‌بینی ورشکستگی شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران با استفاده از درخت تصمیم و رگرسیون لجستیک. پژوهش‌های حسابداری مالی، سال پنجم، شمارۀ 17، صص. 105-128.

6- دستگیر، محسن، حسینزاده، علی‌حسین، خدادادی، ولی و سیدعلی واعظ. (1391). کیفیت سود در شرکت‌های درماندۀ مالی. پژوهش‌های حسابداری مالی، شمارۀ 4، صص. 1-16.

7- راعی، رضا و سعید فلاح‌پور. (1383). پیش‌بینی درماندگی مالی شرکت‌ها با استفاده از شبکه‌های عصبی مصنوعی. تحقیقات مالی، شمارۀ 17. صص. 39-69.

8- راعی، رضا و سعید فلاح‌پور. (1387). کاربرد ماشین‌‌بردار پشتیبان در پیش‌بینی درماندگی مالی شرکت‌ها با استفاده از نسبت‌های مالی. بررسی‌های حسابداری و حسابرسی، دورۀ 15، شمارۀ 53. صص. 17-34.

9- رهنمای رودپشتی، فریدون، علیخانی، راضیه و مهدی مرانجوری. (1388).بررسی کاربرد مدلهای پیش‌بینی ورشکستگی آلتمنوفالمر در شرکتهای پذیرفته شده در بورس اوراق بهادار تهران. بررسی‌های حسابداری و حسابرسی، دورۀ16، شمارۀ 55. صص. 19-34.

10- سعیدی، علی و آرزو آقایی. (1388). پیش‌بینی درماندگی مالی شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران با استفاده از شبکه‌های بیز. بررسی‌های حسابداری و حسابرسی، دورۀ 16، شمارۀ 56. صص. 59- 78.

11- سلیمانی امیری، غلامرضا. (1382). نسبت‌های مالی و پیش‌بینی بحران مالی شرکت‌ها در بورس اوراق بهادار تهران. تحقیقات مالی، شمارۀ 15. صص. 121- 136.

12- فدایی‌نژاد، محمداسماعیل و رسول اسکندری. (1390). طراحی و تبیین مدل پیش‌بینی ورشکستگی شرکت‌ها در بورس اوراق بهادار تهران. تحقیقات حسابداری و حسابرسی، شمارۀ 9، صص. 38-55.

13- محمودآبادی، حمید والهه برزگر. (1388). بررسی نحوه توزیع آماری نسبت‌های مالی در شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران. پیشرفتهای حسابداری دانشگاه شیراز، دورۀ اول، شمارۀ اول، پیاپی 3/57، صص. 171-189.

14-. مکیان، سید نظام‌الدین، المدرسی، سید‌محمدتقی و سلیم کریمی‌تکلو. (1389). مقایسۀ مدل‌ شبکه‌های عصبی مصنوعی با روش‌های رگرسیون لوجستیک و تحلیل ممیزی در پیش‌بینی ورشکستگی شرکت‌ها. فصلنامۀ پژوهش‌های اقتصادی، سال دهم، شمارۀ دوم. ص‌ص. 141- 161.‌

15- موسوی‌شیری، محمود و محمدرضا طبرستانی. (1388). پیش‌بینی درماندگی مالی با استفاده از تحلیل پوششی داده‌ها. تحقیقات حسابداری، شمارۀ دوم. صص. 158- 187.

16- مؤمنی، منصور و علی فعال‌قیومی. (1386). تحلیلهای آماری با استفاده از SPSS. چاپ اول، تهران: انتشارات کتاب نو.

17- مهرانی، ساسان، مهرانی، کاوه، منصفی، یاشار و غلامرضا کرمی. (1384). بررسی کاربردی الگوهای پیش‌بینی ورشکستگی زیمسکی و شیراتا در شرکت‌های پذیرفته شده در بورس اوراق بهادار تهران. بررسی‌های حسابداری و حسابرسی، سال دوازدهم، شمارۀ٤١. صص.١٣١-١05.

18- نیکبخت، محمدرضا و مریم شریفی. (1389). پیش‌بینی ورشکستگی مالی شرکت‌های بورس اوراق بهادار تهران با استفاده از شبکه‌های عصبی مصنوعی. مدیریت صنعتی، دورۀ 2، شمارۀ 4. صص. 163- 180.

19- Altman, E. I. (1968). Financial Ratios, Discriminant Analysis, and the Prediction ofCorporate Bankruptcy.Journal of Finance, Vol. 23, No. 4, Pp. 589-609.

20- Atiya, A. F. (2001). Bankruptcy Prediction for Credit Risk Using Neural Networks: A Survey and New Results. IEEE Transactions on Neural Networks, Vol. 12, No. 4, Pp. 929-935.

21- Back, B., Laitinen, T., Sere, K (1996). Neural network and genetic algorithm for bankruptcy prediction, Expert Systems with Applications, Vol. 11, No. 4, Pp. 407–413.

22- Barniv, R., Anurag, A., and R. Leach (1997). Predicting the outcome following bankruptcy filing: A three state classification using NN, International Journal of Intelligent Systems in Accounting, Finance and Management, Vol. 6, Pp.177–194.

23- Beaver, W. (1966). Financial Ratios as Predictors of Failure. Journal of Accounting Research, Vol. 4, Pp. 71-111.

24- Bougen, P. D., and J. C. Drury. (1980). UK Statistical Distributions of Financial Ratios. Journal of Business, Finance and Accounting, Vol. 7, No. 1, Pp. 39- 47.

25- Breiman, L. (2001). Random Forests. Machine Learning. Vol. 45, No. 1, Pp. 5-32.

26- Bryant, S.M. (1997). A case-based reasoning approach to bankruptcy prediction modeling, Intelligent Systems in Accounting, Finance and Management, Vol. 6, Pp. 195–214.

27- Deakin, E. (1972). A Discriminant Analysis of Predictors of Business Failure. Journal of Accounting Research, Vol. 10, No. 1, Pp. 167-179.

28- DeTienne, K. B., DeTienne, D. H., and S. A. Joshi. (2003). Neural Networks as Statistical Tools for Business Researchers. Organizational Research Methods, Vol. 6, No. 2, Pp. 236-265.

29- Dimitras, A. I., Slowinski, R., Susmaga, R., and C. Zopounidis (1999). Business failure prediction using rough sets, European Journal of Operational Research, Vol. 114, Pp. 263-280.

30- Drury, J. C. (1978). Financial Ratio Distribution for 1976: A Note. Journal of Management Studies, Vol. 15, No. 2, Pp. 241–254.

31- Etemadi, H., Anvary Rostamy, A. A., and H. Farajzadeh Dehkordi. (2009). A Genetic Programming Model for Bankruptcy Prediction: Empirical Evidence from Iran. Expert Systems with Applications, Vol. 36, No. 2, Pp. 3199–3207.

32- Fernandez- Castro, A., and P. Smith. (1994). Toward a general nonparametric model of corporate performance. Omega: The International Journal of Management Science, Vol. 22, No. 3, Pp. 237-249.

33- Foster, G. (1986).Financial Statement Analysis.Prentice-Hall.Inc, New Jersey.

34- Frecka, T. J. and W. S. Hopwood. (1983). The Effects of Outliers on the Cross-Sectional Distributional Properties of Financial Ratios. The Accounting Review, Vol. 58, No. 1, Pp. 115-128.

35- Hall, M. A. (2000). Correlation-Based Feature Selection for Discrete and Numeric Class Machine Learning. In Proceedings of the Seventeenth international Conference on Machine Learning (June 29 - July 02). P. Langley, Ed. Morgan Kaufmann Publishers, San Francisco, CA, Pp. 359-366.

36- Hoglund, H. (2012). Detecting Earnings Management with Neural Networks. Expert Systems with Applications, Vol. 39, Pp. 9564-9570.

37- Hu, Y. C. (2010). Analytic Network Process for Pattern Classification Problems Using Genetic Algorithms. Information Sciences, Vol.180, Pp. 2528–2539.

38- Jabeur, S. B. and Y. Fahmi. (2014). Default Prediction for Small-Medium Enterprises in France: A comparative approach. South African Journal of Business Management, 40 (1), Pp. 21-32

39- Jardin, P. (2010). Predicting Bankruptcy Using Neural Networks and Other Classification Methods: The Influence of Variable Selection Techniques on Model Accuracy. Neurocomputing, Vol. 73, Pp. 2047–2060.

40- Jones, S., and D. A. Hensher (2004). Predicting firm financial distress: A mixed logit model, Accounting Review, Vol. 79, No. 4, Pp. 1011-1038.

41- Karels, G. V., and A. J. Prakash. (1987). Multivariate normality and forecasting of business bankruptcy, Journal of Business Finance & Accounting,Vol. 14, No. 4, Pp. 573-593.

42- Kim, M., and D. Kang. (2010). Ensemble with Neural Networks for Bankruptcy Prediction. Expert Systems with Applications, Vol. 37, Pp. 3373–3379.

43- Kohavi, R. (1995). A Study of Cross-Validation and Bootstrap for Accuracy Estimation and Model Selection. IJCAI'95 Proceedings of the 14th international joint conference on Artificial intelligence, Pp. 1137-1143.

44- Leano, H. J. (2004). Discriminant Analysis, Factor Analysis and Linear Regression Analysis to Classify Financially Distressed Firms and Predict Bankruptcy Using Financial Ratios and Macroeconomic Predictors. M. A Thesis, Lamar University.

45- Lee, K. C., Han, I., and Y. Kwon (1996). Hybrid neural network models for bankruptcy predictions, Decision Support Systems, Vol. 18, Pp. 63–72

46- Liang, D., Tsai, C. H., and H. T. Wu. (2015). The effect of feature selection on financial distress prediction. Knowledge-Based Systems, Vol. 73, Pp. 289–297.

47- Lindenbaum, M., Markovitch, S., and D. Rusakov. (2004).Selective Sampling for Nearest Neighbor Classifiers. Machine Learning, Vol. 2, Pp. 125-152.

48- Lo, S. C. (2010). The Effects of Feature Selection and Model Selection on the Correctness of Classification, Proceedings of the 2010 IEEE IEEM, pp. 989-993.

49- McKee, T. E. (2003). Rough sets bankruptcy prediction models versus auditor signaling rates, Journal of Forecasting, Vol. 22, Pp. 569–589.

50- Mendes-Moreia, J., Soares, C., Jorge, A. M.; and J. F. D. Sousa. (2012). Ensemble Approaches for Regression: A Survey. ACM Computing Surveys, Vol. 45, No. 1, pp. 1- 40.

51- Min, J. H. and Y. Lee. (2005). Bankruptcy Prediction Using Support Vector Machine with Optimal Choice of Kernel Function Parameters. Expert Systems with Applications, Vol. 28, Pp. 603–614.

52- Mukkamala, S., Tilve, G. D., Sung, A. H., Ribeiro, B., and A. S. Vieira. (2006). Computational Intelligent Techniques for Financial Distress Detection. International Journal of Computational Intelligence Research, Vol. 2, No. 1, Pp. 60-65.

53- Odom, M. D. and R. Sharda. (1990). A Neural Network Model for Bankruptcy Prediction. IJCNN International Joint Conference on Neural Networks, Vol. 2, Pp. 163-168.

54- Ohlson, J. A. (1980). Financial Ratios and the Probabilistic Prediction of Bankruptcy. Journal of Accounting Research, Vol. 18, No. 1, Pp. 109- 131.

55- Robnik-Sikonja, M., and I. Kononenko. (1997). An Adaptation of Relief for Attribute Estimation in Regression. Machine Learning, Proceedings of 14th International Conference on Machine Learning (ICML'97), Pp. 296–304.

56- Ryu, Y. U., and W.T. Yue (2005). Firm bankruptcy prediction: Experimental comparison of isotonic separation and other classification approaches, IEEE Transactions On Systems, Management and Cybernetics-Part A: Systems and Humans, Vol. 35, No. 5, Pp. 727–737.

57- Sarkar, S. and R. S. Sriram. (2001). Bayesian Models for Early Warning of Bank Failures. Management Science, Vol. 47, No. 11, Pp. 1457-1475.

58- Shin, K. S. and Y. J. Lee. (2002). A genetic algorithm application in bankruptcy prediction modeling. Expert Systems with Applications, Vol. 23, No. 3, Pp. 321–328.

59- Shin, K., and Lee, T. S., and H. Kim. (2005). An Application of Support Vector Machines in Bankruptcy Prediction Model. Expert Systems with Applications, Vol. 28, Pp. 127–135.

60- Sun, J., Jia, M., and H. Li. (2011). AdaBoost Ensemble for Financial Distress Prediction: An Empirical Comparison with Data from Chinese Listed Companies. Expert Systems with Applications, Vol. 38, No. 8, Pp. 1- 8.

61- Tsai, C. (2009). Feature Selection in Bankruptcy Prediction. Knowledge-Based Systems, Vol. 22, No. 2, Pp. 120–127.

62- Wang, G., Ma, J., and S. Yang. (2014). An improved boosting based on feature selection for corporate bankruptcy prediction. Expert Systems with Applications, Vol. 41, No. 5, Pp. 2353-2361.

63- Williamson, R. W. (1984). Evidence on the Selective Reporting of Financial Ratios. The Accounting Review, Vol. 59, No. 2, Pp. 296-298.

64- Yang, Z., You, W., and Ji. G. (2011). Using Partial Least Squares and Support Vector Machines for Bankruptcy Prediction. Expert Systems with Applications, Vol. 38, No. 7, Pp. 8336–8342

65- Yeh, C. C., Chi, D. j., and Y. R. Lin. (2014). Going-Concern prediction Using Hybrid Random Forests and Rough Set Approach. Information Sciences, Vol. 254, Pp. 98–110.