Explaining the Earnings Management Prediction Model Using the Hybrid of Machine Learning Methods

Document Type : Original Article

Authors

1 PhD Student in Accounting, Faculty of Economics and Administrative Sciences, University of Mazandaran, Babolsar, Iran.

2 Professor, Department of Accounting, Faculty of Economics and Administrative Sciences, University of Mazandaran, Babolsar, Iran.

Abstract

Knowledge of earnings management is essential for users of accounting information due to performance evaluation, profitability forecasting, and determining the true value of the company. The purpose of this research is to provide a model to diagnose accrual-based earnings management and real earnings management through performance evaluation of machine learning methods including decision tree, support vector machine, k-nearest neighbor, deep learning, and combining them with feature selection methods based on relief and principal component analysis. To achieve this goal, 180 companies admitted to the Tehran Stock Exchange were selected as a statistical sample from 2010 to 2021. Also, to test the hypotheses, the criteria of average accuracy and type I and type ΙΙ errors were used. The results show that the performance of accrual-based earnings management forecasting methods based on the relief-based feature selection model is better than the feature selection model based on principal component analysis. This result was confirmed in all prediction methods. However, the results did not show the superiority of the relief-based feature selection model over the principal component analysis-based feature selection model in predicting real earnings management. Also, the findings showed that accrual earnings management can be more accurately predicted than real earnings management. The research results can be of interest to investors, creditors, financial analysts, and auditors. Incorporating machine learning methods can help identify potential earnings management activities.
 Introduction
Earnings management can be described as the discretion utilized by managers to provide generally accepted accounting principles (GAAP)-based financial reports that can affect the relevance and reliability of the presented accounting information. EM can be performed either (1) through deviations from normal business practices to purposefully manipulate earnings; this is called real earnings management (Roychowdhury, 2006), and it affects cash flow from operating activities; or (b) by manipulating reported earnings through accruals, that is accrual-based earnings management, to achieve a suitable earnings figure. As a corporation's earnings are used by different financial statement users (such as shareholders, creditors, and financial analysts) to gauge its performance, detection of earnings management can be interesting and crucial for them. In this context, this study attempts to present prediction tools that aid in detecting earnings management activities. For this purpose, six machine learning methods have been discussed to predict earnings management.
Methods & Material
A  sample of  180  companies listed on the  Tehran  Stock  Exchange during the period  2010-2021  was selected for testing hypotheses. The performance of each machine learning method at predicting accrual-based earnings management and real earnings management was evaluated based on three criteria: type Ι error, type ΙΙ error, and average accurac.
Finding
The results show that the performance of accrual-based earnings management forecasting methods based on the relief-based feature selection model is better than the feature selection model based on principal component analysis. This result was confirmed in all prediction methods. However, the results did not show the superiority of the relief-based feature selection model over the principal component analysis-based feature selection model in predicting real earnings management. Also, the findings showed that accrual earnings management can be more accurately predicted than real earnings management.
Conclusion & Results
Earnings management would affect accounting data, in particular, the earnings reported in accounting other than the actual earnings of an enterprise. Therefore, the prediction of earnings management is still an issue of great importance. The purpose of this research is to use machine learning methods such as decision tree, support vector machine, k-nearest neighbor, and deep learning to predict earnings management. Also, this research relies on feature selection to identify the most optimal features for use in the prediction model. Even though the determinants of earnings management have been studied for a long time, the ability of these factors to predict earnings management has received less attention.
The results show that the combination of feature selection based on relief with each of the forecasting methods provides a more accurate performance for predicting accruals earnings management than the feature selection based on principal components analysis. However, the results did not show the superiority of the relief-based feature selection model over the principal component analysis-based feature selection model in predicting real earnings management. Also, the findings showed that accrual earnings management can be more accurately predicted than real earnings management. In addition, the results indicated that the most important features for prediction are related to the auditor's features in the first place and then to the features of the company's ownership structure. In other words, investors should pay a lot of attention to the features of the auditor and the ownership structure of companies in predicting earnings management. Based on the obtained results, the hybrid method based on deep learning and relief feature selection has the highest prediction accuracy (89/62) among other hybrid methods for forecasting accruals earnings management, and the hybrid method based on deep learning and principal component analysis feature selection has the highest prediction accuracy (82/65) among other hybrid methods for forecasting real earnings management.
The findings of this study can expedite earnings management detection for financial statement users by improving earnings management prediction accuracy. These results may be applied to reduce investment risks and losses and increase investment benefits for investors and creditors if they are better able to predict misleading financial reports due to earnings management. In summary, the results of this study suggest tools to decision makers that help in predicting earnings management with relatively high accuracy.
 

Keywords

Main Subjects


شرکت‌های بزرگ سعی در جذب سرمایه از سرمایه‌گذاران و اعتباردهندگان با افشای منظم عملکرد مالی خود از طریق گزارش سود و با برآورده ‌کردن پیش‌بینی‌های سود تحلیلگران مالی دارند (Degeorge et al., 1999). برای برآوردن صحیح انتظارات ذی‌نفعان مختلف (مانند سرمایه‌گذاران، اعتباردهندگان و تحلیلگران مالی) و جلوگیری از هر گونه عواقب نامطلوب ناشی از دست ‌دادن این انتظارات مانند افت قیمت سهام و نقض قراردادهای بدهی (Braswell & Daniels, 2017)، مدیریت یک سازمان ممکن است تلاش کند عمداً بر سود گزارش‌شده در صورت‌های مالی تأثیر بگذارد (Rodriguez-Ariza et al., 2016). این روش به‌ طور کلی به‌ عنوان مدیریت سود شناخته می‌شود. با این ‌حال، مدیریت سود ممکن است به از دست ‌دادن شهرت (Rodriguez-Ariza et al., 2016) یا حتی دعاوی حقوقی (Gunny, 2010) منجر شود؛ زیرا ممکن است به ‌عنوان شاخصی از فساد مدیریت یا تلاش برای گمراه‌ کردن سرمایه‌گذاران در نظر گرفته شود. انرون و ورلدکام دو مورد از فاجعه‌بارترین موارد مدیریت سود فرصت‌طلبانه را نشان می‌دهند که به کلاهبرداری و بزرگ‌ترین ورشکستگی در تاریخ ایالات متحده منجر شدند (Jiraporn et al., 2008; Tort, 2013; Bajra & Cadez, 2018). اگرچه مدیریت سود معمولاً به دلیل تأثیر بد آن بر کیفیت سود به ‌عنوان یک مفهوم منفی در نظر گرفته می‌شود، برخی از پژوهشگران به جنبه‌های مثبت مدیریت سود نیز اشاره کرده‌اند (Bajra & Cadez, 2018; Jiraporn et al., 2008; Tort, 2013). مدیریت سود را می‌توان: (1) از طریق انحراف از رویه‌های تجاری عادی برای دست‌کاری هدفمند سود انجام داد، که مدیریت سود واقعی نامیده می‌شود (Roychowdhury, 2006) و جریان نقدی حاصل از فعالیت‌های عملیاتی را تحت‌تأثیر قرار می‌دهد؛ یا (2) با دست‌کاری سود گزارش‌شده از طریق اقلام تعهدی برای دست‌یابی به رقم سود مناسب انجام داد، که مدیریت سود مبتنی بر اقلام تعهدی نامیده می‌شود. به طور کلی، مدیریت سود وضعیت مالی واقعی شرکت و حقایقی را که ذی‌نفعان حق دانستن آن را دارند، پنهان می‌کند.

از آنجا ‌که سود یک شرکت توسط استفاده‌کنندگان مختلف از صورت‌های مالی (مانند سهام‌داران، اعتباردهندگان و تحلیلگران مالی) برای سنجش عملکرد آن استفاده می‌شود، تشخیص مدیریت سود می‌تواند برای آن‌ها جالب و حیاتی باشد. در واقع، ایجاد ابزارهایی برای پیش‌بینی و جلوگیری از وقوع چنین دست‌کاری‌هایی سودمند است (Jiraporn et al., 2008; Tort, 2013; Bajra & Cadez, 2018). در این زمینه، این پژوهش تلاش می‌کند تا ابزارهای پیش‌بینی را ارائه کند که به شناسایی فعالیت‌های مدیریت سود کمک می‌کنند. برای این منظور، با استفاده از شش روش‌ یادگیری ماشین، پیش‌بینی مدیریت سود بررسی شده است.

توانایی پیش‌بینی مدیریت سود برای ناظران شرکت‌ها مانند حسابرسان مهم است؛ زیرا به آن‌ها اجازه می‌دهد تا سطوح ریسک و روش‌های آزمون حسابرسی خود را برای فعالیت‌های احتمالی مدیریت سود تعدیل کنند (Hammami & Hendijani Zadeh, 2022). مقاله‌ای که توسط حسابداران حرفه‌ای خبرۀ کانادا و انجمن حسابداران رسمی آمریکا منتشر شد به توانایی الگوریتم‌های یادگیری ماشین در کشف تقلب و در عین ‌حال، افزایش کارایی و بهره‌وری آن‌ها در کشف تقلب اشاره می‌کند (CPA Canada and AICPA, 2019). علاوه بر این، پژوهش میلنر و برگ (2017) به مزایای داده‌کاوی و یادگیری ماشین اشاره می‌کند که می‌تواند برای مثال توسط حسابرسان مالیاتی برای شناسایی خطاها، برآورد ریسک حسابرسی و حتی پیشنهاد راهبردهای مالیاتی کارآمد استفاده شود. همچنین، آن‌ها بیان می‌کنند قانون‌گذاران و مقامات مالیاتی می‌توانند با استفاده از یادگیری ماشین برای یافتن اختلاف در بازده گزارش‌شده منتفع شوند (Milner & Berg, 2017). داده‌کاوی، به ‌عنوان یک جنبۀ کلیدی تجزیه‌وتحلیل داده، رویه‌ای است که داده‌های خام، بزرگ و نامفهوم را به دانش منظم، قابل ‌درک و پیش‌بینی تبدیل می‌کند (Gupta & Modise, 2012). استفاده از یک رویکرد داده‌کاوی با استفاده از روش‌های یادگیری ماشین برای شناسایی مدیریت سود نسبت به روش‌های آماری مرسوم (مانند تجزیه‌وتحلیل تمایزی چندگانه، لاجیت و پروبیت، رگرسیون و روش‌های آماری تک‌متغیره) مزیت دارد؛ زیرا داده‌کاوی برخلاف رویکردهای مرسوم، به مفروضات محدودکننده‌ای مانند وجود خطی ‌بودن و نرمال بودن متغیرها و چولگی داده‌ها که معمولاً در داده‌های مالی دنیای واقعی نقض می‌شوند، محدود نمی‌شود (Höglund, 2012).

به‌ طور کلی، پژوهش حاضر از چندین جنبه می‌تواند حائز اهمیت باشد: اول، در بیشتر پژوهش‌های انجام‌شدۀ خارجی و داخلی در حوزۀ پیش‌بینی مدیریت سود (از جمله Hammami & Hendijani Zadeh, 2022؛ Chen & Shen, 2020؛ قادری و همکاران، 1397؛ صالحی و فرخی پیله‌رود، 1397؛ سعید مقدم و همکاران، 1396؛ Ezazi et al., 2013 ؛Najari et al., 2014 ؛ گرد و همکاران، 1394) از متغیرهای نسبت مالی و برخی از ویژگی هیئت‌مدیره و حسابرس استفاده شده است و سایر ویژگی‌ها از جمله ساختار مالکیت، ویژگی‌های مدیرعامل و سایر متغیرهای تأثیرگذار مورد توجه قرار نگرفته‌اند؛ از این رو، پژوهش حاضر به دنبال بررسی جامع عوامل تأثیرگذار بر پیش‌بینی مدیریت سود است. بر این اساس، متغیرهایی که در پژوهش حاضر استفاده شده‌اند، هم از نظر نوع و هم از نظر نحوۀ انتخاب متغیرهای پیش‌بین بهینه، با متغیرهای پژوهش‌های قبلی متفاوت هستند. دوم، با توجه ‌به اهمیت موضوع مدیریت سود، پژوهشگران زیادی مشتاق بودند تا عوامل تعیین‌کنندۀ مدیریت سود را به ‌منظور شناسایی عواملی که به طرزی جالب توجه بر این شیوه‌ها تأثیر می‌گذارند، بررسی کنند. با این‌ حال، تسای و چیو (2009) استدلال می‌کنند مطالعات قبلی در این زمینه بر همبستگی بین ویژگی خاص شرکت، حاکمیت شرکتی، مالکیت، سایر عوامل و مدیریت سود تأکید بیشتری دارند (Tsai & Chiou, 2009) و توانایی این عوامل به طور مستقیم برای پیش‌بینی مدیریت سود بررسی نشده است؛ بنابراین، آن‌ها تأکید کردند ساخت مدل پیش‌بینی مدیریت سود با استفاده از عوامل مختلف برای اطمینان از دریافت گزارش عملکرد مالی دقیق و قابل ‌اعتماد سهام‌داران شرکت مهم است؛ از این ‌رو، پژوهش حاضر تلاش می‌کند تا ابزارهای پیش‌بینی را ارائه کند که به شناسایی فعالیت‌های مدیریت سود کمک می‌کنند. برای رسیدن به این هدف، از رویکرد داده‌کاوی با استفاده از روش‌های یادگیری ماشین استفاده شده است. سوم، پژوهش حاضر اولین پژوهش در ایران (با بهترین دانش ما) در حوزۀ کاربرد روش‌های مختلف یادگیری ماشین است که هر دو نوع مدیریت سود را در یک پژوهش در نظر می‌گیرد؛ در نتیجه، دقت پیش‌بینی را در بین دو نوع مدیریت سود مقایسه می‌کند. علاوه بر این، برخی از روش‌های یادگیری ماشین از جمله یادگیری عمیق و  k- نزدیک‌ترین همسایه برای اولین ‌بار در پژوهش‌های پیش‌بینی مدیریت سود استفاده شده‌اند. همچنین، با استفاده از دو نوع روش انتخاب ویژگی، از یک‌ طرف، امکان مقایسۀ روش‌های انتخاب ویژگی با هم فراهم می‌شود و از طرف دیگر، می‌توان متغیرهایی (ویژگی‌هایی) را شناسایی کرد که اطلاعات بیشتری دارند و قدرت پیش‌بینی بیشتری برای پیش‌بینی مدیریت سود دارند.

 

مبانی نظری و پیشینۀ پژوهش

مدیریت سود

مدیران به طور مداوم برای دست‌یابی به انتظارات سود سهام‌داران و تحلیلگران مالی تحت ‌فشار هستند؛ زیرا عدم تحقق این اهداف پیامدهایی نامطلوب دارد (Braswell & Daniels, 2017). در این زمینه، مدیریت سود روشی رایج است که توسط مدیران برای برآورده‌ کردن انتظارات عملیاتی و عملکرد تجاری ذی‌نفعان استفاده می‌شود (Braswell & Daniels, 2017). هیلی و والن (1999) به مدیریت سود به ‌عنوان فرایندی اشاره می‌کنند که توسط مدیران برای تأثیرگذاری بر محتوای صورت‌های مالی به دلیل ملاحظات و انگیزه‌های مالی استفاده می‌شود (Healy & Wahlen, 1999). باجرا و کادز (2018) بیان کردند مدیریت سود به اقدامات مدیریتی برای افزایش (کاهش) درآمدها یا سودها برای دسته‌های مختلف سهام از طریق تاکتیک‌های حسابداری تهاجمی اشاره دارد (Bajra & Cadez, 2018). شن و چیه (2007) اظهار داشتند مدیریت سود تغییر اطلاعات اقتصادی و عملکرد گزارش‌شدۀ شرکت‌ها برای گمراه‌ کردن ذی‌نفعان به‌ منظور کاهش مداخلۀ خارجی یا محافظت از مزایای کنترل مالکیت داخلی است (Shen & Chih, 2007). به طور خلاصه، مدیریت سود را می‌توان به عنوان اختیاری برای مدیران به ‌منظور ارائۀ گزارش‌های مالی مبتنی بر اصول عمومی پذیرفته‌شدۀ حسابداری که می‌تواند بر مربوط بودن و قابلیت اطمینان اطلاعات حسابداری ارائه‌شده تأثیر بگذارد، توصیف کرد. اگر ذی‌نفعان استفادۀ فرصت‌طلبانه از اختیارات یادشده را کشف کنند، این امر ممکن است به دعاوی حقوقی (Gunny, 2010) یا از دست ‌دادن شهرت (Rodriguez-Ariza et al., 2016) منجر شود.

در ادبیات اخیر برای ‌مثال (Roychowdhury, 2006; McVay, 2006; Cohen & Zarowin, 2010)، مدیریت سود به سه نوع مدیریت سود اقلام تعهدی، مدیریت سود واقعی و تغییر طبقه‌بندی، دسته‌بندی ‌شده است. رویچودوری (2006) تأکید می‌کند مدیریت ممکن است از دو روش برای مدیریت سود گزارش‌شده استفاده کند (Roychowdhury, 2006). اول، سود شرکت را می‌توان با استفاده از روش حسابداری اقلام تعهدی، که به عنوان مدیریت سود تعهدی شناخته می‌شود، مدیریت کرد. این دست‌کاری اعداد حسابداری هیچ تأثیر مستقیمی بر جریان نقدی شرکت ندارد (نوبخت و برادران حسن‌زاده، 1396). دوم، مدیریت ممکن است اعداد حسابداری را با استفاده از فعالیت‌های تجاری واقعی، که به عنوان مدیریت سود واقعی شناخته می‌شود، مدیریت کند. مدیریت سود واقعی بر جریان‌های نقدی شرکت‌ها تأثیر می‌گذارد؛ زیرا مدیران اعداد سود را با استفاده از اقدامات اقتصادی واقعی مدیریت می‌کنند (Roychowdhury, 2006). نتایج پژوهش برخی از پژوهشگران نشان می‌دهد مدیران بیشتر تمایل به مدیریت سود واقعی نسبت به مدیریت سود اقلام تعهدی دارند؛ زیرا آن‌ها مدیریت سود واقعی را به عنوان یک گزینۀ کم‌خطر و غیرقابل حدس توسط حسابرسان می‌بینند(Roychowdhury, 2006; Zang, 2012).

پژوهش‌های پیشین عوامل تعیین‌کنندۀ مختلف تأثیرگذار بر مدیریت سود را بررسی کرده‌اند. برای ‌مثال، سطوح پایین‌تر مدیریت سود با سطوح پایین‌تر عدم تقارن اطلاعات (Schipper, 1989)، کیفیت حسابرسی بالاتر (Cohen et al., 2008؛ شاه مرادی و طباطبایی نسب، 1400) ، عملکرد مسئولیت اجتماعی شرکتی بالاتر (Pyo & Lee, 2013)، قدرت سیستم قانونی (Francis et al., 2016) و رتبه‌بندی ریسک اعتباری بهتر ( Kim, 2014& Ge) مرتبط است. فان و همکاران (2019) این موضوع را بررسی کردند که چگونه حضور مدیران زن در هیئت‌مدیره بر مدیریت سود بانک‌ها تأثیر می‌گذارد. با استفاده از احتمال انتصاب مدیران زن توسط هیئت‌مدیره (بر اساس شاخص Blau تنوع جنسیتی)، آن‌ها یک رابطۀ U شکل معکوس بین حضور مدیران زن در هیئت‌مدیره و مدیریت سود بانک‌ها پیدا کردند (Fan et al., 2019). نتایج پژوهش دارابی و اژدری (1397) بیانگر رابطۀ مثبت و معنادار بین حضور زنان در بین اعضای هیئت‌مدیره و مدیریت سود واقعی است. لاسود و همکاران (2017) دریافتند بانک‌هایی که مالکیت متمرکزتری دارند از مفاد ضرر وام اختیاری برای مدیریت سود خود استفاده می‌کنند (Lassoued et al., 2017). پژوهشگران همچنین دریافتند مالکان دولتی و نهادی مدیریت سود را تشویق می‌کنند (دارابی و اژدری، 1397)؛ در حالی که مالکان خانوادگی این عمل را کاهش می‌دهند (Lassoued et al., 2017). دئو و همکاران (2017) در نمونه‌ای از شرکت‌های چینی به بررسی نقش نظارتی مدیران بیرونی در بازدارندگی مدیریت سود اقلام تعهدی پرداختند. یافته‌های آنها نشان می‌دهد که مدیریت سود اقلام تعهدی به طور معنادار و منفی با حضور و نسبت مدیران بیرونی در هیئت مدیره شرکت‌ها مرتبط است. آنها همچنین دریافتند که مدیریت سود اقلام تعهدی در شرکت‌های دولتی نسبت به سایر شرکت‌ها کمتر مشخص است (Du et al., 2017). عارف‌منش و عموزادی ریزی (1399) در پژوهش خود دریافتند اندازه و درصد اعضای غیرموظف هیئت‌مدیره به‌ترتیب تأثیر منفی و مثبت معناداری بر مدیریت سود تعهدی دارند و درصد مالکیت نهادی و مالکیت دولتی تأثیر مثبت و معنا‌دار بر مدیریت‌ سود واقعی دارد؛ اما بر مدیریت سود تعهدی تأثیر معناداری ندارد. همچنین، در شرکت‌های دولتی، اندازه و استقلال هیئت‌مدیره و تمرکز مالکیت رابطه‌ای مثبت و معنادار با مدیریت سود تعهدی دارند و درصد سرمایه‌گذاران نهادی رابطه‌ای منفی و معنادار با مدیریت سود تعهدی دارد.

لوپز و وگا (2019) دریافتند حسابرسی‌های انجام‌شده توسط شرکت‌هایی با مدت زمان تخصص در صنعت طولانی‌تر با سطوح پایین‌تر مدیریت سود اقلام تعهدی و سطوح بالاتر مدیریت سود اقلام واقعی مرتبط است (Lopez & Vega, 2019). قلی‌پور خانقاه و همکاران (1400) در پژوهشی نتیجه گرفتند اندازه و استقلال حسابرس رابطه‌ای مثبت و معنادار با مدیریت سود دارد؛ اما بین دورۀ تصدی و تخصص حسابرس با مدیریت سود رابطۀ معناداری مشاهده نشد. نتایج پژوهش نمازی و همکاران (1390)  و داغانی و همکاران (1398) بیانگر رابطۀ مثبت بین اندازه و دورۀ تصدی حسابرس با مدیریت سود است. علی و ژانگ (2015) تغییرات در انگیزه‌های مدیران عامل برای مدیریت سود گزارش‌شدۀ شرکت‌‌هایشان را در طول دورۀ تصدی خود بررسی کردند. آن‌ها دریافتند بیش‌نمایی سود در سال‌های اولیه بیشتر از سال‌های آخر خدمت مدیران عامل است و این رابطه برای شرکت‌هایی با نظارت بیرونی و داخلی بیشتر ضعیف‌تر است (Ali & Zhang, 2015). احمدپور و همکاران (1394) نشان دادند مدیران عامل با دورۀ تصدی بلندمدت در مقایسه با مدیران عامل با دورۀ تصدی کوتاه‌مدت گزارشگری جسورانه‌تری دارند. به علاوه، مدیران عامل با دورۀ تصدی بلندمدت در نیمۀ اول دورۀ تصدی خود در مقایسه با نیمۀ دوم، گزارشگری محافظه‌کارانه‌تری دارند. بوعزیز و همکاران (2020) نشان دادند بین دوگانگی و ملیت مدیرعامل با مدیریت سود اقلام تعهدی رابطه‌ای مثبت و معنادار وجود دارد. با این ‌حال، هیچ رابطۀ معناداری بین اعضای هیئت‌مدیره و تغییر مدیرعامل با مدیریت سود اقلام تعهدی یافت نشد (Bouaziz et al., 2020). نتایج پژوهش استا (1390) بیانگر این است که رابطۀ منفی معناداری بین مالکیت نهادی و مالکیت مدیریتی با مدیریت سود وجود دارد؛ اما بین مالکیت شرکتی و مدیریت سود رابطۀ مثبت و معناداری وجود دارد.

با وجود اهمیت تشخیص مدیریت سود، مطالعات کمی چگونگی تشخیص آن را بررسی کرده‌اند. حتی در میان این معدود، بیشتر آن‌ها از رویکردهای آماری مرسوم مانند تجزیه‌وتحلیل تمایزی چندگانه، تحلیل‌های لوجیت و پروبیت، رگرسیون و روش‌های آماری تک‌متغیره استفاده کرده‌اند (Haga et al., 2015; Höglund , 2012; Tsai, 2009). از آنجا ‌که رویکردهای آماری مرسوم مقید به مفروضاتی ساده و محدودکننده هستند که در دنیای واقعی داده‌های مالی نقض می‌شوند (مانند نرمال بودن متغیرهای مستقل و خطی ‌بودن و چولگی نقاط داده)، شک و تردیدهایی دربارۀ اعتبار و اثربخشی تشخیص مدیریت سود از طریق این رویکردهای آماری وجود دارد. راه‌حل برای این معضل را می‌توان در تکنیک‌های داده‌کاوی یافت که به مفروضات یادشده در بالا محدود نمی‌شوند و در نتیجه، آن‌ها را برای رسیدگی به مشکلات تشخیص مدیریت سود مناسب‌تر می‌کند. علاوه بر این، مطالعات قبلی انعطاف‌پذیری و عملکرد مناسب رویکردهای داده‌کاوی را در مواجهه با مجموعۀ داده‌های نامتعادل با مقادیر زیاد و ناقص نشان می‌دهد؛ نتیجه‌ای که برای رویکردهای آماری مرسوم قابل ‌اجرا نیست (Chye Koh & Kee Low, 2004; Liou, 2008)؛ بنابراین، پژوهش حاضر بر پیش‌بینی مدیریت سود اقلام تعهدی و مدیریت سود واقعی با استفاده از تکنیک‌های داده‌کاوی متمرکز است.

 

داده‌کاوی

داده‌کاوی فرایندی است که داده‌های خام را که ممکن است بسیار بزرگ، نامفهوم یا حتی ناقص باشند، به دانش تبدیل می‌کند؛ از این ‌رو، خروجی داده‌کاوی اطلاعات منظم، قابل ‌درک و بالقوۀ مفیدی است (Gupta & Modise, 2012). استفاده از داده‌کاوی برای تشخیص مدیریت سود می‌تواند بسیار سودمند باشد؛ زیرا امکان ساخت مدل‌های غیرخطی را می‌دهد که با مفروضات محدودکننده‌ای که در روش‌های آماری مرسوم و تحلیل‌های رگرسیونی مانند نرمال بودن و استقلال متغیرهای مستقل وجود دارند، محدود نمی‌شوند. رویکرد داده‌کاوی با موفقیت برای بسیاری از مسائل مالی در پژوهش‌های قبلی به کار گرفته شده است (e.g., Amani & Fadlalla, 2017; Chen et al., 2017; Fallahpour et al., 2017; Oreski & Oreski, 2014; Yu et al., 2014). در پژوهش حاضر، برای اجرای رویکرد داده‌کاوی از روش‌های یادگیری ماشین از جمله ماشین بردار پشتیبان، درخت تصمیم، k- نزدیک‌ترین همسایه و یادگیری عمیق برای پیش‌بینی مدیریت سود استفاده شده است. عملکرد عالی روش‌های یادشده به عنوان یک الگوریتم طبقه‌بندی در پژوهش‌هایی مانند مدل‌سازی ارزیابی ریسک اعتباری (Danenas & Garsva, 2012؛ میرغفوری و امین آشوری، 1394؛ محمدیان حاجی کرد و همکاران، 1395)، پیش‌بینی سری زمانی مالی (Tay & Cao, 2001)، پیش‌بینی حرکت بازار سهام و بازده سهام (Huang et al., 2005؛ ستایش و کاظم‌نژاد، 1398)، پیش‌بینی ورشکستگی شرکت (Veganzones & Séverin, 2018؛ حسینی و رشیدی، 1392)، پیش‌بینی درماندگی مالی (Ninh et al., 2018; Matin et al., 2019؛ نمازی و ابراهیمی، 1400)  و پیش‌بینی مدیریت سود (Hammami & Hendijani Zadeh, 2022؛ قادری و همکاران، 1397؛ صالحی و فرخی پیله‌رود، 1397؛ کاردان و همکاران، 1396) نشان داده شده است. در ادامه، روش‌های اشاره‌شده به طور مختصر شرح داده می‌شوند.

 

ماشین‌های بردار پشتیبان

ماشین‌های بردار پشتیبان روشی است که برای دسته‌بندی داده‌های خطی و غیرخطی استفاده می‌شود. به طور خلاصه، بردارهای پشتیبان به زبان ساده، مجموعه‌ای از نقاط در فضای nبُعدی داده‌ها هستند که مرز دسته‌ها را مشخص می‌کنند و مرزبندی و دسته‌بندی داده‌ها بر اساس آن‌ها انجام می‌شود و با جابه‌جایی یکی از آن‌ها، خروجی دسته‌بندی ممکن است تغییر کند. الگوریتم ماشین بردار پشتیبان این ابرصفحه را با کمک بردارهای پشتیبان و حاشیه‌ها پیدا می‌کند (اسماعیلی، 1393). به دلیل اینکه الگوریتم‌های ماشین‌های پشتیبان قابلیت مدل‌سازی کران‌های تصمیم‌گیری غیرخطی پیچیده را دارند، حتی سریع‌ترین آن‌ها نیز ممکن است دارای سرعت کمی در زمان آموزش باشند؛ اما صحت آن‌ها بسیار بالاست. افزون بر این، نسبت به دیگر روش‌ها کمتر دچار مشکل بیش‌پردازش داده‌ها می‌شوند (اسماعیلی، 1393). مطالعات قبلی برتری هسته‌های مختلف از جمله چندجمله‌ای[1]، تابع پایۀ شعاع[2] و تابع هستۀ سیگموئید[3] را نشان داده‌اند(Dash & Dash, 2016; Nair et al., 2010) و در میان آن‌ها، هستۀ تابع پایۀ شعاع محبوب‌ترین تابع است (Veganzones & Séverin, 2018).

 

درخت تصمیم

درخت تصمیم یک مدل طبقه‌بندی است که با استفاده از رویکرد یادگیری استقرایی ایجاد شده است. تفاوت آن با مدل‌های سنتی، از جمله تحلیل ممیزی چندگانه و لاجیت، در این واقعیت است که از محدودیت فرضیه‌های آماری عاری است و قواعد قضاوت درختی شکل می‌تواند بر اساس نتایج پس از بررسی متغیرهای گسسته و پیوسته شکل بگیرد (Viaene  et  al., 2005; Jan, 2018). علاوه بر این، همان‌طور که توسط چن و همکاران (2015) بیان شده است، نقاط قوت اصلی درخت تصمیم، توانایی آن در پردازش داده‌های ناقص و کشف روابط بالقوه بین متغیرهای ورودی و خروجی عظیم و پیچیده است (Chen et al., 2015). در حال حاضر، یکی از رایج‌ترین الگوریتم‌های درخت تصمیم‌گیری روش C5.0 است (Viaene  et  al., 2005).

C5.0 یک ساختار درختی مانند نمودار جریان است که توسط یک الگوریتم بازگشتی تقسیم و غلبه ساخته شده است که پارتیشنی از داده‌ها را تولید می‌کند. برای روش تقسیم گره ویژگی عددی پیوسته، C5.0 ابتدا اشیا را جمع‌آوری می‌کند و آن‌ها را بر اساس ویژگی مرتب می‌کند و سپس مقدار مشخصه را در نقطۀ میانی دو شی مجاور پیدا می‌کند که به آن نقطۀ برش می‌گویند. آن‌هایی که می‌توانند مقدار بهینه را پس از محاسبۀ تابع ارزیابی به دست آورند، می‌توانند از نقطۀ میانی صفت پیروی کنند تا تقسیم باینری کنند. مقادیر مشخصۀ معیوب و نامطمئن معمولاً با متداول‌ترین مقادیر مشخصه جایگزین می‌شوند یا با روش احتمال برآورد خوش‌بینانه حل می‌شوند (Chen & Howard, 2016).

 

k- نزدیک‌ترین همسایه

الگوریتم k- نزدیک‌ترین همسایه (KNN) روشی برای طبقه‌بندی اشیا بر اساس نزدیک‌ترین نمونه‌های آموزشی در فضای ویژگی است. k- نزدیک‌ترین همسایه نوعی یادگیری مبتنی بر نمونه یا یادگیری تنبل است که در آن تابع فقط به ‌صورت محلی تقریبی می‌شود و تمام محاسبات تا طبقه‌بندی به تعویق می‌افتند(Cover, 1986; Devroye, 1981). هنگامی که دانش قبلی یا اصلاً دانشی دربارۀ توزیع داده‌ها وجود نداشته باشد، k- نزدیک‌ترین همسایه اساسی‌ترین و ساده‌ترین تکنیک طبقه‌بندی است(Devroye, 1981; Devroye & Wagner, 1982). این قانون به‌سادگی کل مجموعۀ آموزشی را در حین یادگیری حفظ می‌کند و به هر پرسش y یک کلاس اختصاص می‌دهد که با اکثریت برچسب k نزدیک‌ترین همسایه‌های آن در مجموعۀ آموزشی نمایش داده می‌شود. قانون نزدیک‌ترین همسایه (NN) ساده‌ترین شکل KNN است که در آن K = 1 است.

k- نزدیک‌ترین همسایه به عنوان یک تکنیک داده‌کاوی دارای کاربردهایی گسترده‌ در طبقه‌بندی و همچنین رگرسیون است. برخی از کاربردهای k- نزدیک‌ترین همسایه در زمینه‌های استخراج متن، کشاورزی، مالی و پزشکی است (Imandoust & Bolandraftar, 2013). پیش‌بینی بازار سهام یکی از اصلی‌ترین وظایف مالی k- نزدیک‌ترین همسایه است. پیش‌بینی بازار سهام شامل کشف روندهای بازار، برنامه‌ریزی راهبردهای سرمایه‌گذاری، شناسایی بهترین زمان برای خرید سهام و تعیین سهام برای خرید است (Imandoust & Bolandraftar, 2013).

 

یادگیری عمیق

در سال 2006، هینتون و همکاران یادگیری عمیق را ارائه کردند که مبتنی بر مفهوم شبکۀ عصبی مصنوعی بود (Hinton et al., 2006). پس از آن، یادگیری عمیق به موضوعی مهم تبدیل شد که به یک رنسانس در پژوهش‌های شبکه‌های عصبی منجر شد؛ از این ‌رو، اصطلاح شبکه‌های عصبی نسل جدید نام گرفت. دلیل این امر آن است که شبکه‌های عصبی عمیق وقتی به‌درستی آموزش داده می‌شوند، در طیفی وسیع از مشکلات طبقه‌بندی و رگرسیون بسیار خوب عمل می‌کنند (Karhunen et al., 2015). شبکه‌های عصبی عمیق زیرشاخه‌ای از یادگیری ماشین را تشکیل می‌دهند. یادگیری عمیق از توپولوژی‌های شبکۀ عصبی به عنوان پایۀ خود استفاده می‌کند؛ در نتیجه، آن‌ها به عنوان شبکه‌های عصبی عمیق شناخته می‌شوند (Schmidhuber, 2015). الگوریتم‌های یادگیری عمیق از افزایش تولید داده، قدرت پردازش بهتر در حال حاضر و رشد هوش مصنوعی به عنوان یک سرویس سود می‌برند. حتی با جمع‌آوری داده‌های بسیار متنوع، بدون ساختار و متصل، یادگیری عمیق ماشین‌ها را قادر می‌سازد تا مسائل پیچیده را حل کنند. الگوریتم‌های یادگیری عمیق هرچه بیشتر یاد بگیرند، عملکردی بهتر دارند ( Ahmad et al., 2019; Janiesch et al., 2021). معروف‌ترین الگوریتم‌های یادگیری عمیق شامل شبکۀ عصبی بازگشتی (RNN)[4]، شبکۀ عصبی پیچشی (CNN)[5]، حافظۀ کوتاه‌مدت ماندگار (LSTM)[6]، شبکۀ باور عمیق (DBN)[7]، شبکۀ عصبی عمیق (DNN)[8] و یادگیری تقویتی عمیق (DRL)[9] هستند. در پژوهش حاضر از روش شبکۀ عصبی عمیق استفاده شده است.

در ادامه، برخی از پیشینه‌های داخلی و خارجی بررسی شده‌اند:

همامی و هندیجانی‌زاده (2022) پژوهشی تحت عنوان پیش‌بینی مدیریت سود از طریق طبقه‌بندی‌کننده‌های گروه یادگیری ماشین را انجام دادند. آن‌ها از سه تکنیک انتخاب ویژگی تکی (کسب اطلاعات، تجزیه‌وتحلیل مؤلفۀ اصلی و ریلیف) و سه تکنیک انتخاب ویژگی گروهی (بهینه‌سازی ازدحام ذرات، الگوریتم ژنتیک و کلونی زنبورهای مصنوعی) استفاده کردند. این تکنیک‌های انتخاب ویژگی با ماشین بردار پشتیبان ترکیب شده‌اند تا شش طبقه‌بندی‌کنندۀ گروهی تولید کنند. نتایج نشان داد روش ترکیبی کلونی زنبورهای مصنوعی و ماشین بردار پشتیبان بهترین عملکرد را برای پیش‌بینی مدیریت سود اقلام تعهدی و مدیریت سود واقعی دارد (Hammami & Hendijani Zadeh, 2022). جاسپرسن و همکاران (2021) در پژوهشی پیش‌بینی مدیریت سود از افشاهای کیفی را بررسی کردند. آن‌ها از مدل‌های یادگیری ماشینی نظارت‌شده برای پیش‌بینی مدیریت سود توسط بیمه‌گران اموال و تلفات از پرونده‌های مورد بحث و تحلیل مدیریت استفاده کردند. آن‌ها از یک الگوریتم جدید استفاده کردند که داده‌های متنی را مشروط به وضعیت مالی گزارش‌شدۀ شرکت تفسیر می‌کرد. نتایج نشان داد افشای کیفی می‌تواند مدیریت سود را پیش‌بینی کند که بیانگر این است که مدیران قادر به حذف همۀ پیام‌های فرعی از آن‌ها نیستند (Jaspersen et al., 2021).

چن و شن (2020) پژوهشی با عنوان تأثیر مدل پیش‌بینی مدیریت سود برای توسعۀ بازار سرمایه در کشور تایوان را انجام دادند. نتایج نشان داد مدل تشخیص مدیریت سود ایجادشده با استفاده از شبکۀ الاستیک و درخت تصمیم C5.0 بهترین عملکرد طبقه‌بندی را ارائه می‌دهد؛ به ‌طوری‌ که دقت متوسط پیش‌بینی آن به 32/97 درصد می‌رسد (Chen & Shen, 2020). در پژوهشی، دبوک و زارئور (2017) تشخیص دست‌کاری سود صورت‌های مالی با استفاده از یک لایۀ یادگیری ماشین را بررسی کردند. نتایج نشان داد مدل‌های ریاضی از مدل حسابرسان بهتر عمل می‌کنند. آن‌ها نرخ طبقه‌بندی استفاده‌شده با استفاده از مدل بنیش را 84/86 درصد و روش‌های حسابرسان را 53/60 درصد نشان دادند. یافته‌ها حاکی از آن است که روش‌های حسابرسان برای تشخیص دست‌کاری سود در صورت‌های مالی دشوار است (Dbouk & Zaarour, 2017).

چن و همکاران (2015) در پژوهشی با عنوان تشخیص مدیریت سود صنعت بیوتکنولوژی با استفاده از شبکه‌های بایس، تجزیه‌وتحلیل مؤلفه‌های اصلی، شبۀه عصبی مصنوعی پس از انتشار و درخت تصمیم، نشان دادند ترکیب روش غربالگری شبکۀ بایس با درخت تصمیم‌گیری بهترین عملکرد را با میزان دقت 51/98 درصد در تشخیص مدیریت سود نشان می‎دهد (Chen et al., 2015). در پژوهشی، نجاری و همکاران (2014) اقدام به پیش‌بینی مدیریت سود با استفاده از الگوریتم ماشین بردار پشتیبان کردند که نتایج پژوهش بیانگر آن است که الگوریتم یادشده توانایی مناسبی برای پیش‌بینی مدیریت سود دارد (Najari et al., 2014).

آزادی و همکاران (1400) پژوهشی با عنوان به‌کارگیری پدیدۀ تونلینگ برای افزایش توانایی پیش‌بینی مدیریت سود در مدل بنیش بر مبنای تکنیک شبکه‌های عصبی مصنوعی و الگوریتم بهینه‌سازی حرکت تجمعی ذرات را انجام دادند. نتایج حاصل از تحلیل مدل نشان داد کلیۀ نسبت‌های مالی بر پیش‌بینی مدیریت سود بنیش تأثیر معنادار داشته‌اند و بیشترین تأثیر در پیش‌بینی مدیریت سود بنیش را شاخص پدیدۀ تونلینگ INE و کمترین تأثیر را شاخص اهرم مالی داشته است. نتایج حاصل از برآورد شبکه‌های عصبی طراحی‌شده نشان داد استفاده از الگوریتم بهینه‌سازی تجمعی ذرات برای پیش‌بینی مدیریت سود برای شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران از عملکردی قابل قبول برخوردار است.

پورعلی و کوچکی تاجانی (1399) دقت پیش‌بینی دست‌کاری سود شرکت‌ها با استفاده از الگوریتم رقابت استعماری و الگوریتم ژنتیک را مقایسه کردند. نتایج این پژوهش نشان داد الگوریتم رقابت استعماری با دقت 93 درصد و خطای 7 درصد و الگوریتم ژنتیک با دقت 76 درصد و خطای 24 درصد توان پیش‌بینی ضرایب متغیرهای مدل دست‌کاری سود را داشته‌اند. همچنین، نتایج نشان‌دهندۀ این بود که توان پیش‌بینی دقت ضرایب مدل دست‌کاری سود توسط الگوریتم‌های رقابت استعماری و ژنتیک بیشتر از دقت پیش‌بینی مدل اولیۀ بنیش (Beneish, 1999) و مدل تعدیل‌شدۀ بنیش توسط کردستانی و تاتلی (1395) است.

قادری و همکاران (1397) در پژوهشی دقت شبکه‌های عصبی مصنوعی و الگوریتم بهینه‌سازی کلونی مورچگان در پیش‌بینی مدیریت سود را بررسی کردند. برای این منظور، از 28 متغیر تأثیرگذار بر مدیریت سود در قالب چهار گروه (مالی، مدیریتی، شرکتی و حسابرسی) در طی سال­های 1390 الی 1395 در 124 شرکت پذیرفته‌شدۀ بورس اوراق بهادار تهران استفاده شد. نتایج کلی حاصل از این پژوهش نشان داد روش شبکۀ عصبی مصنوعی و الگوریتم کلونی مورچگان در پیش­بینی مدیریت سود نسبت به روش خطی دقیق­تر و دارای سطح خطای کمتری است.

صالحی و فرخی پیله‌رود (1397) پیش‌بینی مدیریت سود با استفاده از شبکۀ عصبی و درخت تصمیم در چهار صنعت کشاورزی، دارویی، نساجی و فرآوردهای نفتی را بررسی کردند. نتایج حاصل از پژوهش آنان نشان داد مدیریت سود با متغیرهای اقلام تعهدی اختیاری دورۀ قبل، اقلام تعهدی غیراختیاری دورۀ قبل یا آستانۀ عملکرد و ریسک در چهار روش مدل‌های خطی، شبکۀ عصبی، درخت‌های  C5.0و Cart دارای بیشترین ارتباط است و دریافتند روش شبکۀ عصبی و درخت تصمیم‌گیری در پیش‌بینی مدیریت سود نسبت به روش خطی دقیق‌تر و دارای سطح خطای کمتری است. کاردان و همکاران (1396)، با بررسی دقت الگوریتم خطی ـ تکاملی ICDE و BBO و الگوریتم‌های غیرخطی SVR و CART در پیش‌بینی مدیریت سود، نشان دادند به ‌طور کلی الگوریتم‌های غیرخطی از دقت بیشتری نسبت به الگوریتم‌های خطی برخوردار هستند و الگوریتم رگرسیون پشتیبان، مدیریت سود را بهتر از سایر الگوریتم‌ها پیش‌بینی می‌کند.

آرسته و نصیرزاده (1395) دقت الگوریتم‌های تخمین‌گر بردار پشتیبان، تخمین‌گر حداقل درجه و شبکۀ عصبی فازی در کشف مدیریت سود را مقایسه کردند. جامعۀ آماری این پژوهش شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران طی سال‌های 1385 الی 1391 بود. نتایج بررسی فرضیه‌ها حاکی از آن است که الگوریتم تخمین‌گر بردار پشتیبان و تخمین‌گر حداقل درجه و شبکۀ عصبی فازی به‌ترتیب بیشترین دقت را در پیش‌بینی مدیریت سود را دارند. گرد و همکاران (1394)، با استفاده از الگوریتم‌های مورچگان و غذایابی باکتری، اقدام به پیش‌بینی مدیریت سود کردند. برای اندازه‌گیری مدیریت سود در این پژوهش از اقلام تعهدی اختیاری استفاده شده است. نتایج نشان از دقت زیاد پیش‌بینی مدیریت سود توسط این الگوریتم‌ها داشت.

 

فرضیه‌های‌ پژوهش

با توجه ‌به مبانی نظری و پیشینۀ تجربی، فرضیه‌ها به ‌صورت زیر تدوین شده‌اند:

فرضیۀ اول: عملکرد پیش‌بینی مدیریت سود اقلام تعهدی شرکت‌ها بر اساس الگوی روش‌ انتخاب ویژگی مبتنی بر ریلیف نسبت به روش‌ انتخاب ویژگی مبتنی بر تحلیل مؤلفه‌های اصلی بهتر است.

فرضیۀ دوم: عملکرد پیش‌بینی مدیریت سود واقعی شرکت‌ها بر اساس الگوی روش‌ انتخاب ویژگی مبتنی بر ریلیف نسبت به روش‌ انتخاب ویژگی مبتنی بر تحلیل مؤلفه‌های اصلی بهتر است.

فرضیۀ سوم: صحت پیش‌بینی مدیریت سود اقلام تعهدی نسبت به مدیریت سود واقعی بالاتر است.  

 

روش پژوهش

این پژوهش برحسب هدف، کاربردی و بر مبنای روش، استنباطی و از نوع همبستگی است. پژوهش حاضر از نظر ماهیت جزء پژوهش‌های اثباتی و از نظر نوع داده‌ها کمّی محسوب می‌شود. همچنین، از نظر جمع‌آوری اطلاعات و بررسی از نوع پس‌رویدادی (با استفاده از اطلاعات گذشته) است و بر اساس اطلاعات مندرج در صورت‌های مالی و گزارش هیئت‌مدیره انجام شد. برای تجزیه‌وتحلیل نهایی، به‌ منظور واکاوی داد‌ه‌ها از نرم‌افزارهای RapidMiner نسخۀ 10-9 و SPSS نسخۀ 26 استفاده شد. همچنین، برای آزمون فرضیه‌های پژوهش از معیارهای میانگین صحت پیش‌بینی و خطاهای نوع اول و دوم استفاده شد.

 

جامعۀ آماری و نمونۀ پژوهش

جامعۀ آماری پژوهش حاضر را شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران تشکیل می‌دهند. برای انتخاب نمونۀ آماری پژوهش از روش غربالگری استفاده خواهد شد. نمونۀ نهایی پژوهش شامل شرکت‌هایی است که حائز شرایط زیر باشند:

1- جزو صنایع واسطه‌گری، سرمایه‌گذاری، لیزینگ و بیمه نباشند.

2- داده‌های مدنظر آن‌ها در دسترس باشد.

3- طی دورۀ پژوهش، تغییر فعالیت یا سال مالی نداده و حذف نشده باشند.

4- ارزش دفتری حقوق صاحبان سهام آن­ها در دورۀ تحت بررسی مثبت باشد.

5- به دلیل ویژگی متفاوت صنایع به لحاظ شرایط اقتصادی و حجم فعالیت، تکنیک‌های مختلف مدیریت سود توسط مدیران با توجه ‌به شرایط هر یک از صنایع، به ‌منظور تعمیم بهتر نتایج مدیریت سود برای هر سال و در سطح هر صنعت به طور جداگانه محاسبه شد. برای این منظور، به گفتۀ ریچودری (2006) و کوتاری و همکاران (2005) تعداد شرکت‌های هر صنعت باید دست‌کم دارای 15 عضو باشد (Kothari et al., 2005; Roychowdhury, 2006). همچنین، بازۀ زمانی پژوهش پیش‌رو یک دورۀ 12ساله از سال 1389 تا 1400 را تشکیل می‌دهد.

با توجه ‌به شرایط بالا، در نهایت 180 شرکت انتخاب شدند که داده‌ها و اطلاعات مالی آن‌ها در تجزیه‌وتحلیل‌های انجام‌شده استفاده شد.

 

متغیر وابسته

در این پژوهش، از مدیریت سود واقعی و مدیریت سود اقلام تعهدی به عنوان متغیرهای وابسته استفاده و به‌ صورت زیر محاسبه می‌شوند:

 

مدیریت سود واقعی

به ‌منظور سنجش مدیریت سود واقعی، مطابق پژوهش رویچودهاری (2006)، کوهن و همکاران (2008) و کوهن و زاروین (2010) از جریان‌های نقدی عملیاتی غیرعادی، هزینه‌های تولید غیرعادی و هزینه‌های اختیاری غیرعادی استفاده شده است که به ‌صورت زیر اندازه‌گیری و محاسبه می‌شوند (Cohen et al., 2008; Cohen & Zarowin, 2010; Roychowdhury, 2006):

 

اندازه‌گیری جریان‌های نقد عملیاتی غیرعادی

از مدل (1) برای برآورد جریان‌های نقدی عملیاتی غیرعادی استفاده شده است؛ به ‌نحوی ‌که باقی‌ماندۀ مدل به عنوان معیار جریان‌های نقدی عملیاتی غیرعادی (AB_CASH) در نظر گرفته شده است.

 

 

 جریان‌های نقد عملیاتی شرکت i در پایان سال t؛  جمع کل دارایی‌های شرکت i در پایان سال t-1؛   فروش خالص شرکت i در طی سال t؛   تغییرات در فروش خالص شرکت i در پایان سال t که برابر است با فروش در سال t منهای فروش در سال t-1؛ : باقیماندۀ مدل.

 

اندازه‌گیری هزینه‌های تولید غیرعادی

هزینه‌های تولید غیرعادی از طریق مدل (2) برآورد شده‌اندغ به ‌نحوی ‌که باقیماندۀ مدل به عنوان معیار هزینۀ تولید غیرعادی (AB_COST) در نظر گرفته شده است. 

 

 

 

 هزینۀ تولید  شرکت i در پایان سال t که برابر است با بهای تمام‌شدۀ کالای فروش‌رفته + تغییرات در موجودی کالا؛ : باقیماندۀ مدل.

 

اندازه‌گیری هزینه‌های اختیاری غیرعادی

هزینه‌های اختیاری غیرعادی از طریق مدل (3) برآورد شده‌اند؛ به‌ نحوی ‌که باقیماندۀ مدل به عنوان معیار هزینۀ اختیاری غیرعادی (AB_EXP) در نظر گرفته شده است.

 

 

 

 هزینۀ اختیاری شرکت i در پایان سال t که برابر است با هزینه‌های فروش، اداری و عمومی؛ : باقیماندۀ مدل. حاصل جمع باقیماندۀ مدل‌های (1) تا (3) نشان‌دهندۀ مدیریت سود واقعی است.

 

مدیریت سود اقلام تعهدی

در پژوهش حاضر، اقلام تعهدی اختیاری (DA) به عنوان نمایندۀ‌ متغیر مدیریت سود اقلام تعهدی در نظر گرفته شده است که با استفاده از مدل (4) از طریق باقیماندۀ مدل جونز تعدیل‌شده توسط کوتاری و همکاران (2005) محاسبه می‌شود. این مدل عملکرد شرکت یعنی بازده دارایی‌ها را  شامل می‌شود و به دلیل تفاوت مدیریت سود با عملکرد، قابلیت اطمینان را افزایش می‌دهد (Kothari et al., 2005). علاوه بر این، این مدل می‌تواند مشکل ناهمسانی و مسائل نادرست تعیین‌شده را که در سایر مدل‌های اقلام تعهدی کل وجود دارد، کاهش دهد (Sun et al., 2010). اندازه‌گیری و محاسبۀ آن به ‌صورت زیر است:

 

 

 

 مجموع اقلام تعهدی است و تفاوت بین جریان نقدی ناشی از فعالیت‌های عملیاتی و سود خالص پس از مالیات است؛  تغییرات در حساب‌های دریافتنی شرکت i در پایان سال t که برابر است با حساب‌های دریافتنی در سال t منهای حساب‌های دریافتنی در سال t-1؛  اموال، ماشین‌آلات و تجهیزات شرکت i در پایان سال t؛  بازده دارایی‌های شرکت i در پایان سال t است که برابر است با نسبت سود خالص به مجموع دارایی‌های شرکت i در پایان سال t؛ : باقیماندۀ مدل که نشان‌دهندۀ اقلام تعهدی غیرعادی (اختیاری) است.

 

متغیر‌های پیش‌بین (مستقل)

در مرحلۀ اول، با بررسی ادبیات و پیشینه، حدود 160 متغیر پیش‌بین اولیه شناسایی شدند. از میان متغیرهای شناسایی‌شده، 64 متغیری که بیشتر در ادبیات مربوط به تبیین یا پیش‌بینی مدیریت سود استفاده شده بودند و داده‌های آن‌ها در دسترس بود، انتخاب شدند. در این راستا، سعی شد ویژگی‌هایی از جمله نسبت‌های مالی، شرکت، حسابرس، حاکمیت شرکتی، ساختار مالکیت، مدیریتی و کمیتۀ حسابرسی در نظر گرفته شوند. نگارۀ (1) نشان‌دهندۀ متغیرهای پیش‌بین استفاده‌شده است.

 

نگارۀ 1. متغیر‌های پیش‌بین (مستقل)

Table 1. Predictor variables (independent)

ردیف

ویژگی‌ها

نام متغیر

تعریف عملیاتی متغیر

1

نسبت‌های مالی

total assets Growth rate

نرخ رشد مجموع دارایی‌ها برابر با تغییر در کل دارایی‌ها تقسیم بر مجموع دارایی‌ها در پایان سال t-1

2

ROA

بازده دارایی‌ها برابر با سود خالص تقسیم بر کل دارایی‌ها

3

ROAgrowth rate

نرخ رشد بازده دارایی‌ها برابر با تغییر در بازده دارایی‌ها تقسیم بر بازده دارایی‌ها در سال t-1

4

ROE

بازده سرمایه برابر با سود خالص تقسیم بر ارزش دفتری حقوق صاحبان سرمایه

5

ROEgrowth rate

نرخ رشد بازده سرمایه برابر با تغییر در بازده سهام تقسیم بر بازده سهام در سال t-1

6

Total assets turnover

گردش مجموع دارایی‌ها برابر با فروش خالص تقسیم بر میانگین مجموع دارایی‌ها

7

Inventory turnover

گردش موجودی‌ها  برابر با بهای تمام‌شدۀ کالا تقسیم بر میانگین موجودی کالا

8

Accounts receivable turnover

گردش حساب‌های دریافتنی برابر با فروش خالص تقسیم بر میانگین حساب‌های دریافتنی

9

Sales-to-equity ratio

فروش خالص تقسیم بر ارزش دفتری حقوق صاحبان سرمایه

10

Debt ratio

نسبت مجموع بدهی‌ها به مجموع دارایی‌ها

11

Quick ratio

نسبت دارایی‌های آنی به بدهی‌های جاری

12

Current ratio

نسبت دارایی‌های جاری به بدهی‌های جاری

13

WC/TA

نسبت سرمایۀ در گردش به کل دارایی‌ها

14

Operating expenses ratio

نسبت هزینه‌های عملیاتی به فروش خالص

15

Operating profit margin

نسبت سود عملیاتی به فروش خالص

16

Profit margin

نسبت سود خالص به فروش خالص

17

Pre-taxincome-to-capital ratio

نسبت سود قبل از مالیات به سرمایه

18

Operating income-to-capital ratio

نسبت سود عملیاتی به سرمایه

19

PROFITV

نسبت سود سال جاری به سال قبل

20

Sales revenue growth rate

تغییر در فروش خالص تقسیم بر فروش خالص در پایان سال t-1

21

Operating profit margin growth rate

تغییر در حاشیۀ سود عملیاتی تقسیم بر حاشیۀ سود عملیاتی در پایان سال t-1

22

Net income growth rate

تغییر در سود خالص تقسیم بر سود خالص در پایان سال t-1

23

Equity growth rate

تغییر در ارزش دفتری حقوق صاحبان سهام تقسیم بر ارزش دفتری حقوق صاحبان سهام در پایان سال t-1

24

Operating cash flow ratio

نسبت جریان نقد عملیاتی به مجموع دارایی‌ها

25

SMOOTH

نسبت کیفیت برابر با نسبت سود خالص به جریان نقد عملیاتی

26

Times interest earned

نسبت سود قبل از بهره و مالیات به هزینۀ بهره

27

Debt-to-equity ratio

نسبت مجموع بدهی‌ها به ارزش دفتری حقوق صاحبان سرمایه

28

Earnings per share

سود هر سهم

29

Growth

نسبت ارزش بازار به ارزش دفتری

30

Loss

اگر سود گزارش‌شدۀ شرکت منفی باشد، برابر با یک و در غیر این صورت، برابر با صفر

31

ویژگی‌های شرکت

THOD

حد عملکرد برابر با اقلام تعهدی غیراختیاری شرکت i در سال t-1 منهای اقلام تعهدی غیراختیاری شرکت i در سال t-2

32

DAn-1

اقلام تعهدی اختیاری سال قبل شرکت

33

SHARVAR

فعالیت‌های تأمین مالی: اگر افزایش سرمایۀ شرکت بیشتر از 10 درصد باشد، برابر با یک و در غیر این صورت، برابر با صفر

34

Size firm

اندازۀ شرکت برابر با لگاریتم طبیعی مجموع دارایی‌ها

35

Capital-intensive activities

سرمایه‌بر بودن فعالیت برابر با نسبت خالص دارایی‌های ثابت مشهود به کل دارایی‌ها

36

AGE

تعداد سال‌هایی که شرکت در سازمان بورس اوراق بهادار پذیرفته شده است.

37

competition market

رقابت در بازار محصول  برابر با نسبت فروش شرکت به کل فروش صنعت

38

 

Liquidity rating

رتبۀ نقدشوندگی شرکت طبق تابلوی بورس به ‌صورت سالانه

39

Financial Distress

درماندگی مالی با استفاده از  فرمول z-score آلتمن محاسبه می‌شود، به پیروی از دمیرکان و پلات (Demirkan & Platt, 2009) شرکت‌هایی که امتیاز z-score آن‌ها کمتر از 81/1 باشد به عنوان شرکت‌هایی که با درماندگی مالی مواجه هستند طبقه‌بندی می‌شوند، برابر با یک و در غیر این صورت، برابر با صفر

40

FCF

جریان نقد آزاد برابر با جریان وجه نقد عملیاتی منهای بهرۀ پرداختی و سود سهام پرداختی به سهام‌داران ممتاز و عادی تقسیم بر جمع دارایی‌ها در سال t

41

ویژگی‌های حسابرسی

Auditor Size

اگر شرکت توسط مؤسسۀ حسابرسی و مفید راهبر حسابرسی شده باشد، برابر با یک و در غیر این صورت، برابر با صفر

42

OPINION Auditor

اگر گزارش حسابرس مقبول باشد، برابر با یک و در غیر این صورت، برابر با صفر

43

Auditor expertise

 

تخصص حسابرس برابر با سهم بازار مؤسسۀ حسابرسی در یک صنعت خاص

44

Auditor tenure

تعداد سال‌هایی که یک مؤسسۀ حسابرسی، حسابرس شرکت است

45

Change of auditor

اگر حسابرس نسبت به دورۀ قبل تغییر کرده باشد، برابر با یک و در غیر این صورت، برابر با صفر

46

حاکمیت شرکتی

Board Size

اندازۀ هیئت‌مدیره برابر با تعداد اعضای هیئت‌مدیره

47

Board Ind

استقلال هیئت‌مدیره برابر با نسبت تعداد اعضای غیرموظف به مجموع اعضای هیئت‌مدیره

48

Board gender diversity

تنوع جنسیتی هیئت‌مدیره: در صورتی‌ که یکی از اعضای هیئت‌مدیره زن باشد، برابر با یک و در غیر این صورت، برابر با صفر

49

Percentage of women directors

نسبت تعداد مدیران زن در هیئت‌مدیره به مجموع اعضای هیئت‌مدیره

50

CFO

اگر مدیر مالی شرکت زن باشد، برابر با یک و در غیر این صورت، برابر با صفر

51

FAMILY PERCENT

نسبت تعداد مدیران خانوادگی هیئت‌مدیره به مجموع اعضای هیئت‌مدیره

52

ساختار مالکیت

Institutional  Ownership

میزان سهام متعلق به سهام‌داران نهادی

53

Controlling  Ownership

مالکیت کنترلی برابر با درصد سهام متعلق به بزرگ‌ترین سهام‌دار عمده

54

Concentration Ownership

سهام‌داران عمده برابر با درصد سهام متعلق به سهام‌داران بالای 5 درصد

55

Concentration Ownership Number

تعداد مالکان بالای 5 درصد

56

GOVERNENT Ownership

درصد مالکیت سهام شرکت توسط دولت یا بنگاه‌های دولتی

57

CEO Ownership

میزان مالکیت سهام‌دار حقیقی یا حقوقی که اعضای هیئت‌مدیره نمایندۀ اوست

58

Family firms

اگر میزان سهام در دست سهام‌داران خانوادگی بیشتر از 20 درصد باشد، شرکت خانوادگی است و برابر با یک و در غیر این صورت، برابر با صفر

59

GOVer FIMR

اگر مجموع مالکیت دولت در یک شرکت بالای 50 درصد باشد، برابر با یک و در غیر این صورت، برابر با صفر

60

ویژگی‌های مدیریتی

Tenure CEO

دورۀ تصدی مدیرعامل

61

CEO changes

اگر مدیرعامل نسبت به دورۀ قبل تغییر کرده باشد، برابر با یک و در غیر این صورت، برابر با صفر

62

CEO  financial expertise

اگر اعضای هیئت‌مدیره تحصیلات مالی و حسابداری یا تجربۀ کاری مالی و حسابداری داشته باشند، برابر با یک و در غیر این صورت، برابر با صفر

63

کمیته حسابرسی

AC_size

اندازۀ کمیتۀ حسابرسی برابر با لگاریتم تعداد مدیران کمیتۀ حسابرسی شرکت

64

AC_independence

استقلال کمیتۀ حسابرسی برابر با تعداد مدیران غیرموظف تقسیم بر مجموع مدیران در کمیتۀ حسابرسی

 

 

انتخاب ویژگی

انتخاب ویژگی تکنیکی است که برای کاهش ابعاد بردار ویژگی در مجموعۀ داده‌های با ابعاد بالا به کار می‌رود (Oreski & Oreski, 2014)؛ یعنی ویژگی‌های نویزدار و اضافی (متغیرها) را برای یادگیری مدل در مجموعۀ داده‌های بزرگ که ویژگی‌های زیادی از متغیرها را در خود جای می‌دهند، حذف می‌کند. انتخاب ویژگی در مسائل با ابعاد بالا مانند مدیریت سود، تلاش می‌کند تا زیرمجموعه‌ای از ویژگی‌ها را تعیین کند که برای دست‌یابی به ‌دقت پیش‌بینی بهینه برای تشخیص مدیریت سود کمک می‌کنند. به طور خلاصه، هدف این تکنیک افزایش دقت پیش‌بینی و قدرت توضیحی مدل طبقه‌بندی و در عین ‌حال، کاهش هزینه‌های محاسباتی و پیچیدگی دست‌یابی به یک راه‌حل بهینه است (Oreski & Oreski, 2014). مطالعات قبلی اهمیت و برتری استفاده از انتخاب ویژگی همراه با الگوریتم‌های طبقه‌بندی را برای ایجاد طبقه‌بندی‌کننده‌های یادگیری گروهی برای غلبه بر مسائل مالی مختلف مانند پیش‌بینی ورشکستگی شرکت (Tian et al., 2015)، امتیازدهی اعتباری (Koutanaei et al., 2015) و مدیریت سود (Chen et al., 2015) نشان می‌دهند.

تکنیک‌های انتخاب ویژگی به دو رویکرد تقسیم می‌شوند: روش‌های فیلترینگ/تکی (Filtering) و روش‌های بسته‌بندی/گروهی/ترکیبی (Wrapper) (Li et al., 2014; Yu et al., 2014). تکنیک‌های فیلتر از یک تابع فیلتر برای رتبه‌بندی ویژگی‌ها و انتخاب زیرمجموعۀ بهینه از ویژگی‌ها بر اساس روش رتبه‌بندی با کاوش در فضای امکان‌پذیر در میان ویژگی‌ها استفاده می‌کنند؛ از این ‌رو، تکنیک‌های انتخاب ویژگی فیلتر مشخصات اولیۀ ویژگی‌ها را در نظر می‌گیرند و به طبقه‌بندی‌کنندۀ اصلی مدل پیش‌بینی (طبقه‌بندی) وابسته نیستند (Li et al., 2014; Yu et al., 2014). این عدم وابستگی به الگوریتم طبقه‌بندی اصلی روش یادگیری ماشین تکنیک‌های فیلتر کردن را سریع می‌کند (Oreski & Oreski, 2014).

در این پژوهش، از دو تکنیک انتخاب ویژگی مبتنی بر روش تکی از جمله ریلیف و تحلیل مؤلفه‌های اصلی برای انتخاب متغیرهای پیش‌بین بهینه برای پیش‌بینی مدیریت سود استفاده شده است. استفاده از رویکرد انتخاب ویژگی این امکان را فراهم می‌کند تا متغیرهای دارای محتوای اطلاعاتی بیشتر را برای تشخیص مدیریت سود شناسایی کنیم. 

 

ریلیف

انتخاب ویژگی ریلیف به عنوان یک روش مؤثر و ساده در ارزیابی کیفیت ویژگی‌ها شناخته شده است(Kira & Rendell, 1992; Wei et al., 2017) ، که در آن برای هر ویژگی، یک امتیاز وزنی بر اساس میزان تفاوت ارزش ویژگی با جفت‌های نمونۀ نزدیک‌ترین همسایه محاسبه می‌شود. این امتیاز بر اساس تفاوت بین ارزش ویژگی و جفت‌های نمونۀ همسایۀ مختلف تا زمانی که امتیاز ویژگی نهایی به دست آید، به تغییر ادامه می‌دهد(Kira & Rendell, 1992; Wei et al., 2017).

 

تحلیل مؤلفه‌های اصلی

انتخاب ویژگی تحلیل مؤلفه‌های اصلی با تبدیل متعامد ویژگی‌های همبسته به زیرمجموعه‌ای از ویژگی‌های غیرهمبسته، ویژگی‌های اضافی را که بسیار همبسته و مرتبط با سایر ویژگی‌ها هستند، حذف می‌کند (Geiger & Kubin, 2012; Roweis, 1998). مطالعات قبلی قدرت این تکنیک را در پژوهش‌های مختلف، مانند مشکل هماهنگ‌سازی گزارش‌های مالی (Robu & Istrate, 2015)، پیش‌بینی ورشکستگی شرکت‌ها (Tsai, 2009) و کشف تقلب مالی (Ngai et al., 2011) نشان می‌دهند.

 

 

 

روش اجرای پژوهش

پس از مشخص ‌شدن متغیرهای پیش‌بین بهینه به ‌وسیلۀ هر یک از روش‌های انتخاب ویژگی، از روش‌های یادگیری ماشین برای پیش‌بینی مدیریت سود استفاده شده است. به ‌منظور ارزیابی عملکرد هر یک از روش‌های یادگیری ماشین برای پیش‌بینی مدیریت سود از معیارهای ارزیابی میانگین صحت پیش‌بینی، خطاهای نوع اول و خطاهای نوع دوم استفاده می‌شود. به ‌عبارت ‌دیگر، میانگین صحت پیش‌بینی مدیریت سود و خطای نوع اول و دوم با استفاده از هر یک از روش‌های پیش‌بینی مقایسه می‌شود. برای ارزیابی عملکرد هر یک از روش‌های استفاده‌شده برای تشخیص مدیریت سود، از ماتریس دقت پیش‌بینی نشان‌داده‌شده در نگارۀ (2) استفاده می‌‌شود. در این ماتریس، خطای نوع اول به وضعیتی اشاره دارد که مدیریت سود واقعاً «بسیار رو به ‌پایین» یا «بسیار رو به ‌بالا» است؛ اما طبقه‌بندی‌کنندۀ وضعیت خروجی نادرست مدیریت سود جزئی را پیش‌بینی می‌کند. در مقابل، یک خطای نوع 2 نشان می‌دهد وضعیت مدیریت سود نسبتاً جزئی به‌اشتباه به عنوان بسیار رو به ‌بالا یا پایین طبقه‌بندی می‌شود. رابطه‌های (1) تا (3) به‌ترتیب فرمول‌های محاسبۀ خطای نوع اول، خطای نوع دوم و میانگین صحت پیش‌بینی را نشان می‌دهند. با توجه ‌به طبقه‌بندی درجۀ مدیریت سود اقلام تعهدی، خطای نوع اول بسیار مهم‌تر از خطای نوع دوم است؛ زیرا فعالیت‌های مدیریت سود بسیار رو به ‌بالا/پایین ممکن است برای شرکت‌ها و سهام‌داران پرریسک‌تر از مدیریت سود متوسط باشند.

 

 

(2)

 

 

 

 

 

نگارۀ 2. ماتریس صحت پیش‌بینی

Table 2. Prediction accuracy matrix

وضعیت مدیریت سود

وضعیت واقعی

وضعیت بسیار رو به ‌بالا یا بسیار رو به‌ پایین

وضعیت نسبتاً جزئی

وضعیت بسیار رو به ‌بالا یا بسیار رو به ‌پایین

وضعیت درست بسیار رو به ‌بالا یا بسیار رو به ‌پایین (TEUD)[10]

وضعیت نادرست بسیار رو به ‌بالا یا بسیار رو به‌ پایین (FEUD)[11]

وضعیت نسبتاً جزئی

وضعیت نادرست نسبتاً جزئی (FMUD)[12]

وضعیت درست نسبتاً جزئی (TMUD)[13]

 

در پژوهش حاضر، به ‌منظور بررسی تعمیم‌پذیری پیش‌بینی‌های انجام‌شده از روایی متقابل 10بخشی برای به‌ حداقل‌ رساندن خطای احتمالی پیش‌بینی طبقه‌بندی‌کننده‌ها استفاده شد. در این روش، مجموعۀ دادۀ مدیریت سود به 10 زیرمجموعۀ مساوی تقسیم می‌شود. همچنین، مجموعۀ داده به دو نمونۀ آموزش و آزمایش تقسیم می‌شود. هر تکرار با 9 زیرمجموعه که نقش مجموعۀ داده آموزشی را ایفا می‌کنند آغاز می‌شود و آخرین زیرمجموعه به عنوان مجموعۀ دادۀ آزمایشی در نظر گرفته می‌شود. این روش 10 بار تکرار می‌شود تا هر یک از 10 مجموعۀ دادۀ اولیه یک ‌بار نقش مجموعۀ دادۀ آزمایشی را ایفا کند. صحت پیش‌بینی کلی به عنوان میانگین در تمام 10 گروه محاسبه می‌شود. استفاده از روایی متقابل از بروز مشکل بیش‌برازش[14] و مشکلات مربوط به نتایج برون‌نمونه‌ای[15] جلوگیری می‌کند (Arlot & Celisse, 2010). روش اجرای پژوهش در شکل (1) ارائه شده است.

 

یافته‌های پژوهش

طبقه‌بندی درجۀ مدیریت سود اقلام تعهدی و مدیریت سود واقعی

در پژوهش حاضر، برای طبقه‌بندی درجۀ مدیریت سود اقلام تعهدی و مدیریت سود واقعی از گره گسسته‌سازی استفاده شده است. در این گره، از تکنیک میانگین و انحراف معیار برای گسسته‌سازی استفاده می‌شود که به این صورت عمل می‌کند: از مجموعۀ نمونه‌ها که در اینجا مدیریت سود است، میانگین و انحراف معیار آن‌ها را محاسبه می‌کند و سپس در مرحلۀ اول یک درجه از مقدار انحراف معیار را به مقدار میانگین اضافه می‌کند. مقدار میانگین به ‌علاوۀ یک درجه انحراف معیار را به عنوان سقف (مدیریت سود بسیار به سمت بالا) در نظر می‌گیرد و در مرحلۀ دوم، یک درجه از مقدار انحراف معیار را از مقدار میانگین کم می‌کند، مقدار میانگین منهای یک درجه انحراف معیار را به عنوان کف (مدیریت سود بسیار به سمت پایین) در نظر می‌گیرد. با این‌ حال، مقداری از مدیریت سود که بین سقف و کف باشد، رفتار مدیریت سود جزئی (اندک) تلقی می‌شود. آمار توصیفی مدیریت سود در نگارۀ (3) و فواصل طبقه‌بندی مدیریت سود اقلام تعهدی و مدیریت سود واقعی به‌ترتیب در نگاره‌های (4) و (5) ارائه شده‌اند.

نگارۀ 3. آمار توصیفی مدیریت سود

Table 3. Descriptive statistics of earnings management

نوع مدیریت سود

میانگین

انحراف معیار

میانگین + انحراف معیار

میانگین - انحراف معیار

مدیریت سود اقلام تعهدی

0053/0-

1386/0

1333/0

1439/0-

مدیریت سود واقعی

0025/0

1557/0

1582/0

1532/0-

 

نگارۀ 4. فواصل طبقه‌بندی مدیریت سود اقلام تعهدی

Table 4. Accrual earnings management categorization intervals

برچسب

فاصلۀ طبقه‌بندی

نام طبقه‌بندی

تعداد مشاهدات

1-

مدیریت سود بسیار رو به ‌پایین (مدیریت سود کاهنده)

1439/0- < AEM

173

0

مدیریت سود جزئی

1333/0AEM < > 1439/0-

1118

1

مدیریت سود بسیار ر وبه ‌بالا (مدیریت سود افزاینده)

1333/0 < AEM

173

 

نگارۀ 5. فواصل طبقه‌بندی مدیریت سود واقعی

Table 5. Real earnings management categorization intervals

برچسب

فاصلۀ طبقه‌بندی

نام طبقه‌بندی

تعداد مشاهدات

1-

مدیریت سود بسیار رو به ‌پایین (مدیریت سود کاهنده)

1532/0- < REM

169

0

مدیریت سود جزئی

1582/0 REM < > 1532/0-

1117

1

مدیریت سود بسیار رو به ‌بالا (مدیریت سود افزاینده)

1582/0 < REM

178

منبع: یافته‌های پژوهش

 

متغیرهای حاکمیت شرکتی

متغیرهای کمیته حسابرسی

متغیرهای ساختار مالکیت

متغیرهای مدیریتی

متغیرهای نسبت‌های مالی

متغیرهای حسابرسی

متغیرهای ویژگی شرکت 

متغیرهای اصلی

تحلیل مؤلفه‌های اصلی

ریلیف

متغیرهای پیش بین بهینه

گروه آموزش

گروه آزمون

درخت تصمیم

-Kنزدیک‌ترین همسایه

یادگیری عمیق

ماشین بردار پشتیبان

مقایسۀ نتایج و ارائۀ بهترین ابزار پیش بینی

 

شکل 1. روش اجرای پژوهش

Fi

gure 1. Research implementation method

 

 

انتخاب متغیرهای پیش‌بین بهینه

در این پژوهش، در مرحلۀ دوم، از روش‌های انتخاب ویژگی تحلیل مؤلفه‌های اصلی و ریلیف برای کاهش ابعاد داده‌ها و به‌ دست ‌آوردن متغیرهای مستقل بااهمیت استفاده شد. متغیرهای مستقل بهینۀ انتخاب‌شده با هر یک از روش‌ها به همراه وزن آن‌ها که حاکی از سطح اهمیت هر ویژگی است، در نگاره‌های (6) و (7) ارائه شده‌اند.

 

تحلیل مؤلفه‌های اصلی (PCA)

در این قسمت، پس از وارد کردن داده‌های به‌دست‌آمده از مراحل قبل، تابع PCA با آستانۀ واریانس 85 درصد را انتخاب می‌کنیم. نتایج حاصل از تابع PCA در نگارۀ‌ (6) ارائه شده است.

 

نگارۀ 6. واریانس و واریانس تجمیعی

Table 6. Variance and cumulative variance

مؤلفه

انحراف معیار

نسبت واریانس

واریانس تجمیعی

مؤلفه

انحراف معیار

نسبت واریانس

واریانس تجمیعی

PC1

875/2

131/0

131/0

PC16

079/1

018/0

659/0

PC2

369/2

089/0

220/0

PC17

044/1

017/0

676/0

PC3

002/2

064/0

284/0

PC18

023/1

017/0

693/0

PC4

798/1

051/0

335/0

PC19

009/1

016/0

709/0

PC5

596/1

040/0

376/0

PC20

003/1

016/0

725/0

PC6

566/1

039/0

415/0

PC21

997/0

016/0

741/0

PC7

482/1

035/0

449/0

PC22

974/0

015/0

756/0

PC8

360/1

029/0

479/0

PC23

971/0

015/0

771/0

PC9

333/1

028/0

507/0

PC24

960/0

015/0

786/0

PC10

274/1

026/0

533/0

PC25

939/0

014/0

800/0

PC11

248/1

025/0

558/0

PC26

934/0

014/0

813/0

PC12

227/1

024/0

581/0

PC27

916/0

013/0

827/0

PC13

150/1

021/0

602/0

PC28

900/0

013/0

840/0

PC14

107/1

019/0

622/0

PC29

886/0

012/0

852/0

PC15

089/1

019/0

641/0

 

 

 

 

منبع: یافته‌های پژوهش

 

 

با توجه ‌به واریانس تجمیعی به‌دست‌آمده در نگارهۀ (6)، روش تحلیل مؤلفه‌های اصلی به استخراج 29 عامل منجر شد که این عامل‌ها حدود 85 درصد از تغییرپذیری (واریانس) متغیرهای اولیه را نشان می‌دهند. به ‌عبارت ‌دیگر، می‌توان 64 متغیر اولیه را در 29 عامل کلی خلاصه و حدود 85 درصد از اطلاعات اولیه را نیز حفظ کرد. 

 

روش ریلیف

روش انتخاب متغیر ریلیف برای هر یک از ویژگی‌ها وزنی را تعیین و کلیۀ متغیرهای پیش‌بین را بر اساس وزن اختصاص‌یافته رتبه‌بندی می‌کند. در این پژوهش، مطابق پژوهش‌های قبلی حداقل وزن 15/0 به عنوان معیار انتخاب یک ویژگی در زیرمجموعۀ بهینۀ ویژگی‌ها به کار گرفته شد (Fallahpour et al., 2017; Koutanaei et al., 2015; Oreski & Oreski, 2014; Hammami & Hendijani Zadeh, 2022). بر این ‌اساس و به‌ منظور قابلیت مقایسۀ بهتر با روش تحلیل مؤلفه‌های اصلی، از 29 متغیر اول (بهتر) رتبه‌بندی‌شده در این روش استفاده می‌شود که این متغیرها نیز به‌ترتیب وزن اختصاص‌یافته و رتبه در نگارۀ (7) ارائه شده‌اند.

نگارۀ 7. وزن و رتبۀ ویژگی‌ها بر اساس روش ریلیف

Table 7. The weight and rank of the features based on the relief method

ردیف

ویژگی

وزن اختصاص‌یافته

مدیریت سود اقلام تعهدی

مدیریت سود واقعی

1

Auditor expertise

590/0

655/0

2

Auditor Size

548/0

417/0

3

Financial Distress

524/0

365/0

4

OPINION

504/0

492/0

5

Operating cash flow ratio

501/0

ـــ

6

CEO financial expertise

490/0

402/0

7

GOVer FIMR

457/0

538/0

8

FCF

427/0

ـــ

9

GOVERNENT Ownership

395/0

461/0

10

Controlling  ownership

386/0

290/0

11

Institutional  ownership

328/0

363/0

12

Capital-intensive activities

322/0

204/0

13

SHARVAR

298/0

164/0

14

CEO changes

289/0

274/0

15

Change of auditor

272/0

247/0

16

AGE

255/0

220/0

17

Family firms

253/0

334/0

18

Board gender diversity

247/0

257/0

19

CEO Ownership

246/0

224/0

20

Debt ratio

243/0

202/0

21

Concentration Ownership Number

202/0

226/0

22

WC/TA

195/0

160/0

23

ROA

185/0

161/0

24

Total assets turnover

183/0

163/0

25

Liquidity rating

182/0

159/0

26

Loss

182/0

211/0

27

Concentration Ownership

181/0

182/0

28

ROE

173/0

ـــ

29

Total assets growth rate

163/0

ـــ

30

Size firm

ـــ

165/0

31

AC_independence

ـــ

156/0

32

Board Ind

ـــ

153/0

33

Percentage of women directors

ـــ

150/0

منبع: یافته‌های پژوهش

همان‌طور که در نگارۀ (7) مشاهده می‌شود، بیشترین رتبۀ متغیرهای بهینۀ انتخاب‌شده مربوط به ویژگی‌های حسابرس و بعد از آن، مربوط به ویژگی‌های ساختار مالکیت شرکت‌ها است. در وهلۀ بعدی، متغیرهای مربوط به ویژگی نسبت‌های مالی حائز اهمیت هستند. به بیان دیگر، سرمایه‌گذاران باید توجه زیادی به ویژگی‌های حسابرس و ساختار مالکیت شرکت‌ها در پیش‌بینی مدیریت سود داشته باشند؛ این در حالی است که در پژوهش‌های قبلی انجام‌شده در حوزۀ پیش‌بینی مدیریت سود عمدتاً به نسبت‌های مالی توجه شده است.

 

نتایج آزمون فرضیه‌ها

فرضیۀ اول

بر اساس فرضیۀ اول پژوهش، پیش‌بینی می‌شود عملکرد پیش‌بینی مدیریت سود اقلام تعهدی بر اساس الگوی روش‌ انتخاب ویژگی مبتنی بر ریلیف نسبت به روش‌ انتخاب ویژگی مبتنی بر تحلیل مؤلفه‌های اصلی بهتر ‌باشد.

در ادامه، به ‌منظور آزمون فرضیۀ اول، نتایج هر یک از روش‌‌های ارائه‌شده در نگارۀ (8) را به طور جداگانه با هم مقایسه می‌کنیم. به منظور مقایسۀ هر یک از روش‌‌ها از میانگین صحت پیش‌بینی، خطای نوع اول و دوم استفاده می‌شود.

 

نگارۀ 8. عملکرد روش‌های مختلف پیش‌بینی مدیریت سود اقلام تعهدی

Table 8. The performance of different forecasting methods of accrual earnings management

SVM

Knn

DL

DT

روش معیار

 

PCA

relief

PCA

relief

PCA

relief

PCA

relief

روش انتخاب ویژگی

 

32/77

47/83

83/81

99/82

83/81

62/89

53/77

99/82

صحت پیش‌بینی

عملکرد روش پیش‌بینی

37/92

07/94

51/83

98/85

51/83

94/89

38/81

12/88

دقت پیش‌بینی

03/36

37/53

19/51

98/53

19/51

62/74

61/36

00/53

پوشش

0

0

63/13

91/9

63/13

91/9

0

50/5

خطای نوع اول

89/22

79/17

53/18

64/17

41/18

47/10

73/22

93/17

خطای نوع دوم

                     

منبع: یافته‌های پژوهش

 

بر اساس نگارۀ‌ (8)، با استفاده از روش‌ درخت تصمیم، در حالت استفاده از متغیرهای انتخاب‌شده در روش مبتنی بر ریلیف و تحلیل مؤلفه‌های اصلی، صحت پیش‌بینی به‌ترتیب برابر با 99/82 و 53/77 است. همچنین، خطای نوع اول (خطای نوع دوم) نیز به‌ترتیب برابر با 50/5 (93/17) و 0 (73/22) است. با استفاده از روش‌ یادگیری عمیق، در حالت استفاده از متغیرهای انتخاب‌شده در روش مبتنی بر ریلیف و تحلیل مؤلفه‌های اصلی، صحت پیش‌بینی به‌ترتیب برابر با 62/89 و 83/81 است. همچنین، خطای نوع اول (خطای نوع دوم) نیز به‌ترتیب برابر با 91/9 (47/10) و 63/13 (41/18) است. نتایج در نگارۀ‌ (8) نشان‌دهندۀ آن است که با استفاده از روش‌ K- نزدیک‌ترین همسایه، در حالت استفاده از متغیرهای انتخاب‌شده در روش مبتنی بر ریلیف و تحلیل مؤلفه‌های اصلی، صحت پیش‌بینی به‌ترتیب برابر با 99/82 و 83/81 است. همچنین، خطای نوع اول (خطای نوع دوم) نیز به‌ترتیب برابر با 91/9 (64/17) و 63/13 (53/18) است. با استفاده از روش‌ ماشین بردارهای پشتیبان، در حالت استفاده از متغیرهای انتخاب‌شده در روش مبتنی بر ریلیف و تحلیل مؤلفه‌های اصلی، صحت پیش‌بینی به‌ترتیب برابر با 47/83 و 32/77 است. همچنین، خطای نوع اول (خطای نوع دوم) نیز به‌ترتیب برابر با 0 (79/17) و 0 (89/22) است. با توجه ‌به عملکرد بهتر کلیۀ روش‌های پیش‌بینی مدیریت سود اقلام تعهدی با استفاده از متغیرهای انتخاب‌شده در روش‌ مبتنی بر ریلیف نسبت به عامل‌های استخراج‌شده در روش‌های تحلیل مؤلفه‌های اصلی، فرضیۀ اول پژوهش، مبنی بر بهتر بودن عملکرد پیش‌بینی مدیریت سود اقلام تعهدی شرکت‌ها بر اساس الگوی روش‌ انتخاب ویژگی مبتنی بر ریلیف نسبت به روش‌ انتخاب ویژگی مبتنی بر تحلیل مؤلفه‌های اصلی، تأیید می‌شود. نکتۀ دیگری که می‌توان به آن اشاره کرد این است که خطای نوع اول در همۀ روش‌های پیش‌بینی از خطای نوع دوم کمتر است. به ‌عبارت ‌دیگر، روش‌های پیش‌بینی، مدیریت سود اقلام تعهدی بسیار رو به ‌بالا یا پایین را کمتر به‌اشتباه در وضعیت مدیریت سود نسبتاً جزئی طبقه‌بندی می‌کنند.

 

فرضیۀ دوم

بر اساس فرضیۀ دوم پژوهش، پیش‌بینی می‌شود عملکرد پیش‌بینی مدیریت سود واقعی بر اساس الگوی روش‌ انتخاب ویژگی مبتنی بر  ریلیف نسبت به روش‌ انتخاب ویژگی مبتنی بر تحلیل مؤلفه‌های اصلی بهتر ‌باشد.

 

نگارۀ 9. عملکرد روش‌های مختلف پیش‌بینی مدیریت سود واقعی

Table 9. The performance of different forecasting methods of real earnings management

SVM

Knn

DL

DT

روش معیار

PCA

relief

PCA

relief

PCA

relief

PCA

relief

روش انتخاب ویژگی

84/76

35/78

65/82

04/82

65/82

26/80

78/76

35/78

صحت پیش‌بینی

عملکرد روش پیش‌بینی

55/88

63/92

69/78

22/84

69/78

48/67

73/82

08/87

دقت پیش‌بینی

00/35

09/39

59/53

69/50

59/53

50/56

66/34

42/39

پوشش

00/10

0

19/12

00/8

19/12

92/35

0

88/5

خطای نوع اول

24/23

10/22

82/17

69/18

18/10

09/17

33/23

02/22

خطای نوع دوم

منبع: یافته‌های پژوهش

 

بر اساس نگارۀ‌ (9)، با استفاده از روش‌ درخت تصمیم، در حالت استفاده از متغیرهای انتخاب‌شده در روش مبتنی بر ریلیف و تحلیل مؤلفه‌های اصلی، صحت پیش‌بینی به‌ترتیب برابر با 35/78 و 78/76 است. همچنین، خطای نوع اول (خطای نوع دوم) نیز به‌ترتیب برابر با 88/5 (0) و 02/22 (33/23) است. با استفاده از روش‌ یادگیری عمیق، در حالت استفاده از متغیرهای انتخاب‌شده در روش مبتنی بر ریلیف و تحلیل مؤلفه‌های اصلی، صحت پیش‌بینی به‌ترتیب برابر با 26/80 و 65/82 است. همچنین، خطای نوع اول (خطای نوع دوم) نیز به‌ترتیب برابر با 92/35 (19/12) و 09/17 (18/10) است.

نتایج در نگارهۀ (9) نشان‌دهندۀ آن است که با استفاده از روش‌ K- نزدیک‌ترین همسایه، در حالت استفاده از متغیرهای انتخاب‌شده در روش مبتنی بر ریلیف و تحلیل مؤلفه‌های اصلی، صحت پیش‌بینی به‌ترتیب برابر با 04/82 و 65/82 است. همچنین، خطای نوع اول (خطای نوع دوم) نیز به‌ترتیب برابر با 00/8 (19/12) و 69/18 (82/17) است. با استفاده از روش‌ ماشین بردارهای پشتیبان، در حالت استفاده از متغیرهای انتخاب‌شده در روش مبتنی بر ریلیف و تحلیل مؤلفه‌های اصلی، صحت پیش‌بینی به‌ترتیب برابر با 35/78 و 84/76 است. همچنین، خطای نوع اول (خطای نوع دوم) نیز به‌ترتیب برابر با 0 (00/10) و 10/22 (24/23) است. نتایج حاکی از آن است که در پیش‌بینی مدیریت سود واقعی، روش یادگیری عمیق و  K- نزدیک‌ترین همسایه با ترکیب با روش‌ تحلیل مؤلفه‌های اصلی بالاترین صحت پیش‌بینی را دارند؛ اما روش درخت تصمیم و ماشین بردارهای پشتیبان با ترکیب با روش ریلیف بالاترین صحت پیش‌بینی مدیریت سود واقعی را دارند؛ بنابراین، فرضیۀ دوم پژوهش تأیید نمی‌شود. نکته دیگری که می‌توان به آن اشاره کرد این است که خطای نوع اول به‌جز در روش یادگیری عمیق از خطای نوع دوم کمتر است. به ‌عبارت ‌دیگر، روش‌های پیش‌بینی، مدیریت سود واقعی بسیار رو به ‌بالا یا پایین را کمتر به‌اشتباه در وضعیت مدیریت سود نسبتاً جزئی طبقه‌بندی می‌کنند.

 

فرضیۀ سوم

بر اساس فرضیۀ سوم پژوهش، پیش‌بینی می‌شود صحت پیش‌بینی مدیریت سود اقلام تعهدی نسبت به مدیریت سود واقعی بالاتر است. نگارۀ (10) نشان‌دهندۀ مقایسۀ عملکرد روش‌های مختلف پیش‌بینی مدیریت سود با استفاده از ترکیب روش‌های یادگیری ماشین در 8 حالت است.

 

نگارۀ 10. مقایسۀ عملکرد روش‌های مختلف پیش‌بینی مدیریت سود

Table 10. Comparing the performance of different forecasting methods of earnings management

مدیریت سود واقعی

مدیریت سود اقلام تعهدی

روش ترکیبی یادگیری ماشین

26/80

62/89

Relife-DL

35/78

47/83

Relife-SVM

04/82

99/82

Relife-Knn

35/78

99/82

Relife-DT

65/82

83/81

PCA-DL

65/82

83/81

PCA-Knn

78/76

53/77

PCA-DT

84/76

32/77

PCA-SVM

منبع: یافته‌های پژوهش

 

همان‌طور که در نگارۀ (10) مشاهده می‌شود، صحت پیش‌بینی مدیریت سود اقلام تعهدی به‌جز در 2 مورد بالاتر از صحت پیش‌بینی مدیریت سود واقعی است و در 2 مورد که صحت پیش‌بینی مدیریت سود واقعی بالاتر از صحت پیش‌بینی مدیریت سود اقلام تعهدی است، اختلاف صحت پیش‌بینی زیاد نیست؛ بنابراین، می‌توان ادعا کرد صحت پیش‌بینی مدیریت سود اقلام تعهدی بالاتر از صحت پیش‌بینی مدیریت سود واقعی است؛ در نتیجه، فرضیۀ سوم پژوهش تأیید می‌شود. 

مطابق نتایج مندرج در نگارۀ (10)، مشاهده می‌شود روش ترکیبی Relife-DL بیشترین میانگین صحت پیش‌بینی (62/89) با خطای نوع اول (91/9) و خطای نوع دوم (47/10) را در میان سایر روش‌های ترکیبی برای پیش‌بینی مدیریت سود اقلام تعهدی دارد و به عنوان بهترین روش برای پیش‌بینی مدیریت سود اقلام تعهدی پیشنهاد می‌شود. همچنین، روش ترکیبی  PCA–DL بیشترین میانگین صحت پیش‌بینی (65/82) با خطای نوع اول (19/12) و خطای نوع دوم (18/10) را در میان سایر روش‌های ترکیبی برای پیش‌بینی مدیریت سود واقعی دارد و به عنوان بهترین روش برای پیش‌بینی مدیریت سود واقعی پیشنهاد می‌شود.

 

بحث و نتیجه‌گیری  

مدیریت سود بر داده‌های حسابداری، به ‌ویژه سود گزارش‌شده در حسابداری به‌غیر از سود واقعی یک شرکت، تأثیر می‌گذارد؛ بنابراین، پیش‌بینی مدیریت سود همچنان موضوعی بسیار مهم است. هدف پژوهش حاضر استفاده از روش‌های یادگیری ماشین از جمله درخت تصمیم، ماشین بردار پشتیبان، k- نزدیک‌ترین همسایه و یادگیری عمیق برای پیش‌بینی مدیریت سود است. همچنین، این پژوهش به انتخاب ویژگی برای شناسایی بهینه‌ترین ویژگی‌ها برای استفاده در مدل پیش‌بینی متکی است. با تکنیک انتخاب ویژگی بررسی شد که کدام ویژگی‌ها در پیش‌بینی مدیریت سود کارآمدتر هستند و کدام تکنیک انتخاب ویژگی، انتخاب ویژگی بهینه‌تری را ارائه می‌دهد.

بر اساس فرضیۀ اول، مشاهده شد عملکرد روش‌های پیش‌بینی مدیریت سود اقلام تعهدی بر اساس الگوی انتخاب ویژگی مبتنی بر ریلیف نسبت به الگوی‌ انتخاب ویژگی مبتنی بر تحلیل مؤلفه‌های اصلی بهتر است. این نتیجه در کلیۀ روش‌های‌ پیش‌بینی (یادگیری عمیق، K- نزدیک‌ترین همسایه، ماشین بردارهای پشتیبان، یادگیری تجمیعی آدابوست ماشین بردار پشتیبان) تأیید شد. این نتایج با یافته‌های همامی و هندیجانی‌زاده (2022) مطابقت ندارد و دلیل این امر ممکن است به جامعیت متغیرهای استفاده‌شده در پژوهش حاضر مربوط باشد؛ زیرا در پژوهش همامی و هندیجانی‌زاده (2022) فقط از متغیرهای نسبت مالی استفاده شده است (Hammami & Hendijani Zadeh, 2022).

بر اساس نتایج حاصل از آزمون فرضیۀ دوم، مشاهده شد در پیش‌بینی مدیریت سود واقعی، روش یادگیری عمیق و  K- نزدیک‌ترین همسایه با ترکیب با روش‌ تحلیل مؤلفه‌های اصلی بالاترین صحت پیش‌بینی را دارند؛ اما روش درخت تصمیم و ماشین بردارهای پشتیبان با ترکیب با روش ریلیف بالاترین صحت پیش‌بینی مدیریت سود واقعی را دارند. این نتایج با یافته‌های همامی و هندیجانی‌زاده (2022) مطابقت دارد (Hammami & Hendijani Zadeh,  2022).

همچنین، بر اساس فرضیۀ سوم، مشاهده شد مدیریت سود اقلام تعهدی را می‌توان با بیشتری بالاتری نسبت به مدیریت سود واقعی پیش‌بینی کرد. این نتایج، یافته‌های برخی از پژوهشگران که نشان دادند مدیران بیشتر تمایل به مدیریت سود واقعی نسبت به مدیریت سود اقلام تعهدی دارند، زیرا آن‌ها مدیریت سود واقعی را به عنوان یک گزینۀ کم‌خطر و غیرقابل حدس توسط حسابرسان می‌بینند، تأیید می‌کند (Roychowdhury, 2006; Zang, 2012).

همچنین، نتایج انتخاب ویژگی بر اساس الگوی ریلیف حاکی از آن بود که مهم‌ترین ویژگی‌ها برای پیش‌بینی در وهلۀ اول مربوط به ویژگی‌های حسابرس و بعد از آن، مربوط به ویژگی‌های ساختار مالکیت شرکت‌ها هستند. در وهلۀ بعدی، متغیرهای مربوط به ویژگی نسبت‌های مالی حائز اهمیت هستند. به بیان دیگر، سرمایه‌گذاران باید توجه زیادی به ویژگی‌های حسابرس و ساختار مالکیت شرکت‌ها در پیش‌بینی مدیریت سود داشته باشند. همچنین، به سازمان بورس و اوراق بهادار پیشنهاد می‌شود به ساختار مالکیت شرکت‌ها و ویژگی‌های حسابرس از جمله تحصص در صنعت و اندازۀ آن توجه ویژه کنند؛ این در حالی است که در پژوهش‌های قبلی انجام‌شده در حوزۀ پیش‌بینی مدیریت سود (برای مثال، Hammami & Hendijani Zadeh,  2022؛ Chen & Shen, 2020؛ Chen et al., 2015؛ Najari et al., 2014؛ قادری و همکاران، 1397؛ کاردان و همکاران، 1396؛ آرسته و نصیرزاده 1395؛)، عمدتاً به نسبت‌های مالی توجه شده است. بر اساس نتایج به‌دست‌آمده، روش ترکیبی یادگیری عمیق و انتخاب ویژگی ریلیف (Relife-DL) بیشترین میانگین صحت پیش‌بینی (62/89) را در میان سایر روش‌های ترکیبی برای پیش‌بینی مدیریت سود اقلام تعهدی دارد و روش ترکیبی یادگیری عمیق مبتنی و انتخاب ویژگی تحلیل مؤلفه‌های اصلی (PCA-DL) بیشترین میانگین صحت پیش‌بینی (65/82) را در میان سایر روش‌های ترکیبی برای پیش‌بینی مدیریت سود واقعی دارد.

یافته‌های این پژوهش می‌تواند تشخیص مدیریت سود را برای سرمایه‌گذاران شرکت‌های فعال در بورس اوراق بهادار و کاربران صورت‌های مالی با بهبود دقت پیش‌بینی مدیریت سود تسریع کند؛ از این رو، به سرمایه‌گذاران توصیه می‌شود متغیرهای مهم مالی و غیرمالی ارائه‌شده با استفاده از روش‌های انتخاب ویژگی به عنوان شاخص‌های تشخیص برای دست‌کاری سود را برای تصمیم‌گیری در زمینۀ سرمایه‌گذاری خود مدنظر قرار دهند. همچنین، به سرمایه‌گذاران پیشنهاد می‌شود هنگام تصمیم‌گیری بر اساس صورت‌های مالی، مدیریت سود را با توجه به انگیزه‌های مدیریت مورد توجه قرار دهند تا به  کاهش ریسک‌ها و زیان‌های سرمایه‌گذاری و افزایش مزایای سرمایه‌گذاری منجر شود.

نتایج یافته‌ها می‌تواند برای کارکنان حسابرسی (حسابرسان داخلی و خارجی) جالب باشد؛ زیرا به دلیل سرعت روش‌های داده‌کاوی در تشخیص مدیریت سود، حسابرسان با هزینه‌ای کمتر نسبت به روش‌های سنتی به عوامل تأثیرگذار بر تشخیص مدیریت سود دست می‌یابند؛ در نتیجه در زمان صرفه‌جویی می‌شود و در عین‌ حال، این روش اطلاعات بیشتری را فراهم می‌کند که این امر می‌تواند به حسابرسان در وظایف تحلیلی، تعیین ریسک حسابرسی (که بر طراحی برنامۀ حسابرسی تأثیر می‌گذارد) و رویه‌های حسابرسی کمک کند؛ بنابراین، به کارکنان حسابرسی و مؤسسه‌های حسابرسی توصیه می‌شود موضوع  مدیریت سود و انگیزه‌های مدیران برای دستکاری سود را مورد توجه قرار دهند و در تدوین برنامه‌های حسابرسی و اجرای روش‌های آن با استفاده از معیارهای مالی ارائه‌شده در پژوهش به گونه‌ای مناسب احتمال مدیریت سود را مدنظر قرار دهند و با استفاده از روش‌های یادگیری ماشین از افشای ناکافی یا حتی گمراه‌کنندۀ شرکت‌ها با استفادۀ گسترده از مدیریت سود در گزارشگری مالی جلوگیری کنند. 

به طور کلی، پژوهش حاضر می‌تواند مورد توجه سرمایه‌گذاران، اعتباردهندگان و قانون‌گذاران قرار گیرد. استفاده از روش‌های داده‌کاوی می‌تواند به سرمایه‌گذاران در شناسایی مدیریت سود بالقوه کمک کند تا (الف) هیئت‌مدیره را در انجام بهتر و مؤثر وظایف نظارتی خود تحت ‌فشار قرار دهند و (ب) از سرمایه‌گذاری در سهام شرکت‌هایی که به طور بالقوه ممکن است با افت قیمت هنگام آشکار شدن مدیریت سود توسط این شرکت‌ها به طور عمومی پیش بروند، اجتناب کنند. از طرفی، اعتباردهندگان می‌توانند از این روش‌ها به ‌منظور ارزیابی پروفایل ریسک اعتباری وام‌گیرندگان و احتمال نکول استفاده کنند. در نهایت، این پژوهش می‌تواند مرجعی برای افراد درگیر در پژوهش‌های دانشگاهی مرتبط با مدیریت سود، مدیران شرکت‌ها، انجمن حسابداران خبره، حسابداران رسمی و حسابرسان، سرمایه‌گذاران و تحلیلگران اوراق بهادار باشد.

طی انجام هر پژوهش، ابعادی گسترده‌تر و تازه‌تر از موضوع مشخص می‌شوند که می‌توانند نقطۀ آغازی برای پژوهش­های بعدی باشند؛ بنابراین، با توجه به نتایج حاصل از پژوهش، پیشنهادهای زیر برای پژوهش­های آتی ارائه می­شوند:

  1. استفاده از سایر مدل‌های پیش‌بینی مدیریت سود و مقایسۀ نتایج به دست آمده با نتایج پژوهش حاضر؛
  2. پیش‌بینی مدیریت سود در سطح صنایع با توجه به ویژگی‌های خاص هر صنعت؛
  3. پیش‌بینی مدیریت سود در شرکت­های مالی، سرمایه­گذاری و بانک­ها؛
  4. پیش‌بینی مدیریت سود با استفاده از سایر متغیرها از جمله متغیرهای کلان اقتصادی، ویژگی‌های شخصی مدیران عامل، ویژگی‌های بیشتر کمیتۀ حسابرسی، ساختار مالکیت و حاکمیت شرکتی.
  5. پیش‌بینی مدیریت سود با استفاده از روش‌های انتخاب ویژگی گروهی از جمله الگوریتم ژنتیک، الگوریتم بهینه‌سازی ازدحام ذرات و مقایسه با نتایج پژوهش حاضر.

[1] Polynomial

[2]  radius basic function

[3] sigmoid kernel function

[4] Recurrent Neural Networks

[5] Convolutional Neural Networks

[6] Long Short Term Memory

[7] Deep Belief Networks

[8] Deep Neural Networks

[9] Deep Reinforcement Learning

[10]  True extremely upward or downward

[11]  False extremely upward or downward

[12]  False moderately upward or downward

[13]  True moderately upward or downward

[14]  Overfitting

[15]  Out-of- Sample

احمدپور، احمد، اصابت طبری، عصمت، و طالب تبار آهنگر، میثم (1394). رابطۀ بین کیفیت سود و دورۀ تصدی مدیرعامل. پژوهش‌های تجربی حسابداری، 5(4)، 1-14. https://jera.alzahra.ac.ir/article_633.html#ar_info_pnl_cite
اسماعیلی، مهدی (برگرداننده) (1393). داده‌کاوی: مفاهیم و تکنیک‌ها (چاپ اول). تهران: انتشارات نیاز دانش.
اُستا، سهراب (1390). بررسی رابطۀ بین ساختار مالکیت و مدیریت سود.  پژوهش‌های حسابداری مالی، 3(2)، 93-106. https://far.ui.ac.ir/article_16915.html
آرسته، قاسم، و نصیرزاده، فرزانه (1395). مقایسۀ دقت الگوریتم‌های تخمین‌گر بردار پشتیبان، تخمین‌گر حداقل درجه و شبکۀ عصبی فازی در کشف مدیریت سود. پژوهش‌های تجربی حسابداری، 6(4)، 95-116. https://jera.alzahra.ac.ir/article_2632.html#ar_info_pnl_cite
آزادی، فرهاد، قنبری، مهرداد، جمشیدی نوید، بابک، و مسعودی، جواد (1400). به‌کارگیری پدیدۀ تونلینگ جهت افزایش توانایی پیش‌بینی مدیریت سود در مدل بنیش بر مبنای تکنیک شبکه‌های عصبی مصنوعی و الگوریتم بهینه‌سازی حرکت تجمعی ذرات. چشم انداز مدیریت مالی، 11(33)، 139-171. https://doi.org/10.52547/jfmp.11.33.139
پورعلی، محمدرضا، و کوچکی تاجانی، محدثه (1399). مقایسۀ دقت پیش‌بینی دست‌کاری سود شرکت‌ها با استفاده از الگوریتم رقابت استعماری و الگوریتم ژنتیک. اولین کنفرانس بین‌المللی چالش‌ها و راهکارهای نوین در مهندسی صنایع و مدیریت و حسابداری، ساری. https://civilica.com/doc/1045469   
حسینی، سید محسن، و رشیدی، زینب (1392). پیش‌بینی ورشکستگی شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران با استفاده از درخت تصمیم و رگرسیون لجستیک. نشریۀ پژوهشهای حسابداری مالی، 5(3)، 105-128. https://far.ui.ac.ir/article_16987.html
دارابی، رویا، و اژدری، فاطمه (1397). بررسی رابطۀ نظام راهبری و ویژگی‌های حسابرسی با مدیریت سود واقعی‌ شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران. حسابداری و منافع اجتماعی، 8(2)، 1-21. https://jaacsi.alzahra.ac.ir/article_3605.html#ar_info_pnl_cite
داغانی، رضا، حاجیان، نجمه، و طلوعی، کبری (1398). تأثیر ساختار مالکیتی و نظارتی هیئت‌مدیره و ویژگی‌های حسابرس بر مدیریت سود. پژوهشهای تجربی حسابداری، 9(4)، 299-326. https://doi.org/10.22051/jera.2018.20138.2019
ستایش، محمد حسین، و کاظم‌نژاد، مصطفی (1398). بررسی سودمندی روش‌های کاهش متغیرها در پیش‌بینی بازده سهام شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران. مطالعات تجربی حسابداری مالی، 16(63)، 83-107. https://doi.org/10.22054/qjma.2019.10647
سعید مقدم، مرضیه، جاوید، داریوش، و همت فر، محمود (1396). تشخیص مدیریت سود صنعت خودرو و ساخت قطعات با استفاده از ترکیب شبکه بیزین و درخت تصمیم ۵,۰ C.  فصلنامۀ حسابداری مالی، 9(36)، 102-126. http://qfaj.mobarakeh.iau.ir/article-1-1080-fa.html
شاه مرادی، نسیم، و طباطبایی نسب، زهره (1400). بررسی تأثیر کیفیت حسابرسی بر رابطۀ نااطمینانی اقتصادی و مدیریت سود ناشی از اقلام تعهدی در شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران. نشریۀ پژوهشهای حسابداری مالی، 13(1)، 67-86. https://doi.org/10.22108/far.2021.125552.1683
صالحی، مهدی، و فرخی پیله‌رود، لاله (1397). پیش‌بینی مدیریت سود با استفاده از شبکۀ عصبی و درخت تصمیم. پژوهش‌های حسابداری مالی و حسابرسی، 10(37)، 1-24. https://sanad.iau.ir/Journal/faar/Article/1073544
عارفمنش، زهره، و عموزادی ریزی، کبری (1399). بررسی نقش تعدیلکنندۀ نوع مالکیت دولتی بر رابطۀ بین سازوکارهای راهبری شرکت و مدیریت سود (واقعی و تعهدی) در شرکت‌های پذیرفتهشده در بورس اوراق بهادار تهران. پژوهشهای تجربی حسابداری، 10(1)، 115-137. https://doi.org/10.22051/jera.2019.19123.1942
قادری، اقبال، امینی، پیمان، محمدی ملقرنی، عطا، و نوروش، ایرج (1397). بررسی دقت شبکه‌های عصبی مصنوعی و الگوریتم بهینه‌سازی کلونی مورچگان در پیش‌بینی مدیریت سود. فصلنامۀ حسابداری مالی، 10(39)، 82-110.  http://qfaj.mobarakeh.iau.ir/article-1-1347-fa.html
قلیپور خانقاه، مهدی، جعفرپور، هومن، و صارمینیا، مهسا (1400). ارتباط کیفیت حسابرسی و مدیریت سود در شرکت های پذیرفتهشده در بورس اوراق بهادار تهران. دانش حسابداری و حسابرسی مدیریت، 10(40 )، 379-390. https://www.jmaak.ir/article_18285.html?lang=fa
کاردان، بیتا، قره‌خانی، بیتا، صالحی، مهدی، و منصوری، مرتضی (1396). بررسی دقت الگوریتم‌های خطی تکاملی BBO و icde  و الگوریتم‌های غیرخطی CVR و CART در پیشبینی سود. پژوهشهای حسابداری مالی، 9(31)، 77-95. https://doi.org/10.22108/far.2017.21776
کردستانی، غلامرضا و تاتلی، رشید. (1395). پیش‎بینی دستکاری سود: توسعۀ یک مدل. بررسی‏‌های حسابداری و حسابرسی، 23 (1)، 73-96. https://doi.org/10.22059/acctgrev.2016.57021
گرد، عزیز، وقفی، سید حسام، حبیب‌زاده بایگی، سید جواد، و خواجه‌زاده، سارا (1394). مقایسۀ دقت پیش‌بینی مدیریت سود با استفاده از الگوریتم‌های مورچگان و غذایابی باکتری. پژوهش‌های تجربی حسابداری، 5(1)، 181-203. https://doi.org/10.22051/jera.2015.2073
محمدیان حاجی کرد، امین، اصغرزاده زعفرانی، ملیحه، و امام دوست، مصطفی (1395). بررسی ریسک اعتباری مشتریان حقوقی با استفاده از مدل ماشین بردار پشتیبان و مدل هیبریدی الگوریتم ژنتیک - مطالعۀ موردی بانک تجارت. مهندسی مالی و مدیریت اوراق بهادار، 27، 17-32. https://sanad.iau.ir/Journal/fej/Article/1079259
میرغفوری، سیدحبیب اله، و امین آشوری، زهره (1394). ارزیابی ریسک اعتباری مشتریان بانک‌ها. کاوشهای مدیریت بازرگانی، 7(13)، 147-166. https://bar.yazd.ac.ir/article_655.html
نمازی، محمد، و ابراهیمی، شهلا (1400). پیش‌بینی درماندگی مالی شرکت‌های پذیرفته‌شده در فرابورس و بورس اوراق بهادار تهران با استفاده از ماشین بردار پشتیبان. راهبرد مدیریت مالی، 9(1)، 115-132. https://doi.org/10.22051/jfm.2020.25973.2077
نمازی، محمد، بایزیدی، انور، و جبارزاده کنگرلویی، سعید (1390). بررسی رابطۀ بین کیفیت حسابرسی و مدیریت سود شرکت‌های پذیرفته‌شده در بورس اوراق بهادار تهران. تحقیقات حسابداری و حسابرسی، 3(9)، 4-21. https://doi.org/10.22034/iaar.2011.104758
نوبخت، مریم، و برادران حسن‌زاده، رسول (1396). تأثیر جریان‎های نقد آزاد بر مدیریت سود واقعی و تصنعی. بررسی‏‌های حسابداری و حسابرسی، 24(3)، 421-440. https://doi.org/10.22059/acctgrev.2017.224708
References
Ahmad, J., Farman, H., & Jan, Z. (2019). Deep learning methods and applications. In Deep Learning: Convergence to Big Data Analytics; Springer Briefs in Computer Science (pp. 31–42). Springer, Singapore. https://doi.org/10.1007/978-981-13-3459-7_3
Ahmadpor, A., Esabat Tabari, E., & Talebtabar, M. (2015). Earnings Quality and CEO Tenure. Empirical Research in Accounting, 5(4), 1-14. https://jera.alzahra.ac.ir/article_633.html#ar_info_pnl_cite [In Persian]
Ali, A., & Zhang, W. (2015). CEO tenure and earnings management. Journal of Accounting and Economics, 59(1), 60–79. https://doi.org/10.1016/j.jacceco.2014.11.004
Amani, F. A., & Fadlalla, A. M. (2017). Data mining applications in accounting: A review of the literature and organizing framework. International Journal of Accounting Information Systems, 24, 32–58. https://doi.org/10.1016/j.accinf.2016.12.004
Arasteh, Gh., & Nassirzadeh, F. (2017). Capability of Models Support Vector Regression, Least Angle Regression and Adaptive Neural Fuzzy Inference System for Earnings Management. Empirical Research in Accounting, 6(4), 95-116. https://jera.alzahra.ac.ir/article_2632.html#ar_info_pnl_cite [In Persian]
Arefmanesh, Z., & Amozadi Rizi, K. (2020). Moderating Role of Ownership Type (state) in the Relationship between Corporate Governance Mechanisms and Earning Management (real, accrual). Empirical Research in Accounting, 10(1), 115-137. https://doi.org/10.22051/jera.2019.19123.1942 [In Persian]
Arlot, S., & Celisse, A. (2010). A Survey of Cross-Validation Procedures for Model Selection. Statistics Surveys, 4, 40-79. https://doi.org/10.1214/09-SS054
Azadi, F., Ghanbari, M., Jamshidi Navid, B., & Masodi, J. (2021). Presenting the developed model of Benish by using tunneling phenomena based on artificial neural network technique and particle swarm optimization algorithm to identifying profit manipulating companies. Financial Management Perspective, 11(33), 139-171. https://doi.org/10.52547/jfmp.11.33.139 [In Persian]
Bajra, U., & Cadez, S. (2018). The impact of corporate governance quality on earnings management: Evidence from European companies cross-listed in the US. Australian Accounting Review, 28(2), 152–166. https://doi.org/10.1111/auar.12176  
Beneish, M. D. (1999). The Detection of Earnings Manipulation. Financial Analysts Journal, 55 (5), 24-36. https://doi.org/10.2469/faj.v55.n5.2296
Bouaziz, D., Salhi, B., & Jarboui, A. (2020). CEO characteristics and earnings management: Empirical evidence from France. Journal of Financial Reporting and Accounting, 18, 77–110. https://doi.org/10.1108/JFRA-01-2019-0008
Braswell, M., & Daniels, R. B. (2017). Alternative earnings management techniques: What audit committees and internal auditors should know. The Journal of Corporate Accounting and Finance, 28(2), 45–54. https://doi.org/10.1002/jcaf.22239
Chen, F. H., Chi, D. J., & Wang, Y. C., (2015). Detecting biotechnology industry’s earnings management using Bayesian network principal component analysis back propagation neural network and decision tree. Economic Modelling, 46, 1-10. https://doi.org/10.1016/j.econmod.2014.12.035
Chen, F. H., & Howard, H. (2016). An alternative model for the analysis of detecting electronic industries earnings management using stepwise regression, random forest, and decision tree. Soft Computing, 20, 1945–1960. https://doi.org/10.1007/s00500-015-1616-6
Chen, S., & Shen, Z.-D. (2020). An effective enterprise earnings management detection model for capital market development. Journal of Economics, Management and Trade, 26(4), 77-91. https://doi.org/10.9734/jemt/2020/v26i430250 
Chen, Y.-J., Wu, C.-H., Chen, Y.-M., Li, H.-Y., & Chen, H.-K. (2017). Enhancement of fraud detection for narratives in annual reports. International Journal of Accounting Information Systems, 26, 32–45. https://doi.org/10.1016/j.accinf.2017.06.004
Chye Koh, H., & Kee Low, C. (2004). Going concern prediction using data mining techniques. Managerial Auditing Journal, 19(3), 462–476. https://doi.org/10.1108/02686900410524436
Cohen, D. A., Dey, A., & Lys, T. Z. (2008). Real and accrual‐based earnings management in the pre‐and post‐Sarbanes‐Oxley periods. The Accounting Review, 83(3), 757-787. https://doi.org/10.2308/accr.2008.83.3.757
Cohen, D. A., & Zarowin, P. (2010). Accruals-based and real earnings management activities around seasoned equity offerings. Journal of Accounting and Economics, 50(1), 2–19. https://doi.org/10.1016/j.jacceco.2010.01.002
Cover, T. M. (1986). Rates of convergence for nearest neighbor  procedures.  In  Proceedings of  the  Hawaii  International  Conference  on System  Sciences.  Univ.  Hawaii Press, Honolulu, 413–415. https://isl.stanford.edu/cover/papers/
paper009
Daghani, R., Hajian, N., & Toloyee, K. (2020). Effects of the Board's Ownership and Oversight Structure and Audit Characteristics On Earning Management. Empirical Research in Accounting, 9(4), 299-326. https://doi.org/10.22051/jera.2018.20138.2019 [In Persian]
Danenas, P., & Garsva, G. (2012). Credit risk evaluation modeling using evolutionary linear SVM classifiers and sliding window approach. Procedia Computer Science, 9, 1324–1333. https://doi.org/10.1016/j.procs.2012.04.145
Darabi, R., & Ajdari, F. (2018). Examination of the Relationship between Governance and Auditing Properties and Real Earnings Management of the Firms Listed in the Tehran Stock Exchange. Journal of Accounting and Social Interests, 8(2), 1-21. https://jaacsi.alzahra.ac.ir/article_3605.html#ar_info_pnl_cite [In Persian]
Dash, R., & Dash, P. K. (2016). A hybrid stock trading framework integrating technical analysis with machine learning techniques. The Journal of Finance and Data Science, 2(1), 42–57. https://doi.org/10.1016/j.jfds.2016.03.002
Dbouk, B., & Zaarour, I. (2017). Towards a machine learning approach for earnings manipulation detection. Asian Journal of Business and Accounting, 10(2), 215-251. https://ajba.um.edu.my/index.php/AJBA/article/view/9772
Degeorge, F., Patel J., & Zeckhauser, R. (1999). Earning Management to Exceed Thresholds. Journal of Business, 72(1), 1-33. https://doi.org/10.1086/209601
Demirkan, S. & Platt, H. (2009). Financial Status, Corporate Governance Quality, and the Likelihood of Managers Using Discretionary Accruals. Accounting Research Journal, 22 (2), 93-117.  https://doi.org/10.1108/ 10309610910987475
Devroye, L. (1981). On the equality of Cover and Hart in  nearest  neighbor  discrimination, IEEE Trans. Pattern Anal. Mach. lntell., 3, 75-78. https://doi.org/10.1109/tpami.1981.4767052
Devroye, L.,  &  Wagner, T. J.  (1982). Nearest 8 neighbor methods  in  discrimination, In Classification,  Pattern  Recognition  and Reduction  of  Dimensionality. In  Handbook  of Statistics (2;  pp. 193–197).  https://doi.org/10.1016/S0169-7161(82)02011-2
Du, X., Jian, W., & Lai, S. (2017). Do foreign directors mitigate earnings management? Evidence from China. The International Journal of Accounting, 52(2), 142–177. https://doi.org/10.1016/j.intacc.2017.04.002
Esmaeili, M. (Trans.) (2014). Data Mining: Concepts and Techniques (First Edition). Tehran: Niaz Danesh Publications. [In Persian]
Ezazi, M. E., Ghotbi, F. S., & Ghotbi, S. F. (2013). Predicting earning management using RBF, ICA, and SVM in firms listed in Tehran security exchange. Asian Journal of Management Research, 4(1), 208-220.‏ https://ajmjournal.com/Issues.aspx?VID=4&IID=1
Fallahpour, S., Lakvan, E. N., & Zadeh, M. H. (2017). Using an ensemble classifier based on sequential floating forward selection for financial distress prediction problem. Journal of Retailing and Consumer Services, 34, 159–167. https://doi.org/10.1016/j.jretconser.2016.10.002
Fan, Y., Jiang, Y., Zhang, X., & Zhou, Y. (2019). Women on boards and bank earnings management: From zero to hero. Journal of Banking & Finance, 107. https://doi.org/10.1016/j.jbankfin.2019.105607
Francis, B., Hasan, I., & Li, L. (2016). A cross-country study of legal-system strength and real earnings management. Journal of Accounting and Public Policy, 35(5), 477–512. https://doi.org/10.1016/j.jaccpubpol.2016.06.004
Imandoust, S. B., & Bolandraftar, M. (2013). Application of K-Nearest Neighbor (KNN) Approach for Predicting Economic Events: Theoretical Background. Journal of Engineering Research and Applications, 3(5), 605-610. https://www.ijera.com/pages/v3-no5.html
Ge, W., & Kim, J.-B. (2014). Real earnings management and the cost of new corporate bonds. Journal of Business Research, 67(4), 641–647. https://doi.org/10.1016/j.jbusres.2013.01.021
Geiger, B. C., & Kubin, G. (2012). Relative information loss in the PCA. In 2012 IEEE Information Theory Workshop (pp. 562–566). https://doi.org/10.48550/arXiv.1204.0429 Ghaderi, E., Amini, P., Mohammadi Mlqrny, A., & Norvash, I. (2019). The Accuracy of Artificial Neural Network and Ant Colony Optimization algorithm in predicting profit management. Quarterly Financial Accounting, 10(39), 82-110.  http://qfaj.mobarakeh.iau.ir/article-1-1347-fa.html [In Persian]
Gholipour, M., Jafarpoor, H., & Saremi Nia, M. (2022). The Relationship between Audit Quality and Earnings Management in Companies AcceptedTehran Stock Exchange. Journal of Management Accounting and Auditing Knowledge, 10(40), 379-390. https://www.jmaak.ir/article_18285.html?lang=fa [In Persian]
Gord, A., Vaghfi, H., Habibzade, J., & Khajehzadeh, S. (2015). Comparing the Accuracy of Earnings Management Forecast Using Ant Colony Optimization Algorithm and Bacteria Foraging Algorithm. Empirical Research in Accounting, 5(1), 181-203. https://doi.org/10.22051/jera.2015.2073 [In Persian]
Gunny, K. A. (2010). The relation between earnings management using real activities manipulation and future performance: Evidence from meeting earnings benchmarks. Contemporary Accounting Research, 27(3), 855–888. https://doi.org/10.1111/j.1911-3846.2010.01029.x
Gupta, R., & Modise, M. P. (2012). South African stock return predictability in the context data mining: The role of financial variables and international stock returns. Economic Modelling, 29(3), 908–916. https://doi.org/10.1016/j.econmod.2011.12.013
Haga, J., Siekkinen, J., & Sundvik, D. (2015). A neural network approach to measure real activities manipulation. Expert Systems with Applications, 42(5), 2313–2322. https://doi.org/10.1016/j.eswa.2014.10.047
Healy, P. M., & Wahlen, J. M. (1999). A Review of the Earning Management Literature and Its Implications for Standard Setting.  Accounting Horizons, 13(4), 365-383. https://doi.org/10.2308/acch.1999.13.4.365
Hinton, G. E., Osindero, S. & Teh, Y.-W. (2006). A fast-learning algorithm for deep belief nets. Neural Comput, 18, 1527–1554. https://doi.org/10.1162/neco.2006.18.7.1527
Höglund, H. (2012). Detecting earnings management with neural networks. Expert Systems with Applications, 39(10), 9564–9570. https://doi.org/10.1016/j.eswa.2012.02.096  
Hosseini, S., & Rashidi, Z. (2013). Bankruptcy Prediction of Companies listed Corporations in Tehran Stock Exchange by Using Decision Tree and Logistic Regression. Financial Accounting Research, 5(3), 105-128. https://far.ui.ac.ir/article_16987.html [In Persian]
Huang, W., Nakamori, Y., & Wang, S. Y. (2005). Forecasting stock market movement direction with support vector machine. Computers & Operations Research, 32(10), 2513–2522. https://doi.org/10.1016/j.cor.2004.03.016
Jan, C. L. (2018). An effective financial statements fraud detection model for the sustainable development of financial  markets: Evidence from Taiwan.  Sustainability, 10(2), 1-14. https://doi.org/10.3390/su10020513
Janiesch, C., Zschech, P., & Heinrich, K. (2021). Machine learning and deep learning. Electron. Mark, 31, 685–695. https://doi.org/10.1007/s12525-021-00475-2
Jaspersen, J., Richter, A., & Zoller, S. (2021). Predicting Earnings Management from Qualitative Disclosures. Available at SSRN: https://ssrn.com/abstract=3732203  or 
Jiraporn, P., Miller, G. A., Yoon, S. S., & Kim, Y. S. (2008). Is earnings management opportunistic or beneficial? An agency theory perspective. International Review of Financial Analysis,17(3), 622–634. https://doi.org/10.1016/j.irfa.2006.10.005
Kardan, B., Salehi, M., Gharekhani, B., & Mansouri, M. (2017). The evaluation accuracy of BBO and ICDE as Linear- evolutionary Algorithms and SVR and CART as Non-linear Algorithms to earnings management prediction. Financial Accounting Research, 9(1), 77-96. https://doi.org/10.22108/far.2017.21776 [In Persian]
Karhunen, J., Raiko, T., & Cho, K. (2015). Unsupervised deep learning: A short review. In Advances in Independent Component Analysis and Learning Machines (pp. 125–142). Academic Press: Cambridge, MA, USA, https://doi.org/10.1016/B978-0-12-802806-3.00007-5
Kira, K., & Rendell, L. A. (1992). The feature selection problem: Traditional methods and a new algorithm. In Aaai (Vol. 2; pp. 129–134).
Kordestani, G., & Tatli, R. (2016). The Prediction of Earnings Manipulation: Development of a Model. Accounting and Auditing Review, 23(1), 73-96. https://doi.org/10.22059/acctgrev.2016.57021 [In Persian]
Kothari, S. P., Leone, A. J., & Wasley C. E. (2005). Performance matched discretionary accrual measures. Journal of Accounting and Economics, 39(1), 163–197. https://doi.org/10.1016/j.jacceco.2004.11.002
Koutanaei, F. N., Sajedi, H., & Khanbabaei, M. (2015). A hybrid data mining model of feature selection algorithms and ensemble learning classifiers for credit scoring. Journal of Retailing and Consumer Services, 27, 11–23. https://doi.org/10.1016/j.jretconser.2015.07.003
Lassoued, N., Attia, M. B. R., & Sassi, H. (2017). Earnings management and ownership structure in emerging market: Evidence from banking industry. Managerial Finance, 43(10), 1117–1136. https://doi.org/10.1108/MF-11-2015-0312
Li, H., Li, C.-J., Wu, X.-J., & Sun, J. (2014). Statistics-based wrapper for feature selection: An implementation on financial distress identification with support vector machine. Applied Soft Computing, 19, 57–67. https://doi.org/10.1016/j.asoc.2014.01.018
Liou, F.-M. (2008). Fraudulent financial reporting detection and business failure prediction models: A comparison. Managerial Auditing Journal, 23(7), 650–662. https://doi.org/10.1108/02686900810890625
Lopez, D. M., & Vega, J. J. (2019). Evaluating the effect of industry specialist duration on earnings management. Advances in Accounting, 45, 100412. https://doi.org/10.1016/j.adiac.2019.02.002
Matin, R., Hansen, C., Hansen, C., & Mølgaard, P. (2019). Predicting distresses using deep learning of text segments in annual reports, Expert Systems with Applications, 132, 199–208. https://doi.org/10.1016/j.eswa.2019.04.071
McVay, S. E. (2006). Earnings management using classification shifting: An examination of core earnings and special items. The Accounting Review, 81(3), 501–531. https://doi.org/10.2308/accr.2006.81.3.501
Milner, C., & Berg, B. (2017). Tax Analytics Artificial Intelligence and Machine Learning–Level 5. Available at: https://www.pwc.no/no/ publikasjoner/Digitalisering/artificial-intelligence-andmachine-learning-final1.pdf. Accessed 19 May 2020
Mirghafouri, S. H., & Amin, Z. (2015). Presenting a Model for Measuring Credit Risk of Bank Customers using Data Mining Approach. Journal of Business Administration Researches, 7(13), 247-266. https://bar.yazd.ac.ir/article_655.html [In Persian]
Mohammadian, H. K. A., Asgharzadeh Z. M., & Emam, D. M. (2016). Credit risk assessment of corporate customers using support vector machine and genetic algorithm hybrid model - A case study of Tejarat Bank. Financial Engineering & Portfolio Management, (7), 17-32. https://sanad.iau.ir/Journal/fej/Article/1079259 [In Persian]
Nair, B. B., Mohandas, V., & Sakthivel, N. (2010). A genetic algorithm optimized decision tree-SVM based stock market trend prediction system. International Journal on Computer Science and Engineering, 2(9), 2981–2988. http://www.enggjournals.com/ijcse/issue.html?issue=20100209
Najari, M., Bishak, A, H., Rezaie Pazhand, P., & Habibzadeh Baygi, S, J. (2014). Forecasting of Earning Management by Support Vector Machine: Case Study in Tehran Exchange Stock. Middle-East Journal of Scientific Research, 19(7), 1007-1017. https://idosi.org/mejsr/mejsr19(7)14.htm
Namazi, M., & Ebrahimi, S. (2021). Financial Distress Prediction of the Listed Companies on Tehran Stock Exchange (TSE) and Iran Fara Burse (IFB) Using Support Vector Machine. Financial Management Strategy, 9(1), 115-132. https://doi.org/10.22051/jfm.2020.25973.2077 [In Persian]
Namazi, M. , Bayazidi, A. & Jabarzadeh Kangarloie, S. (2011). Investigating the Relationship between Audit Quality and Earnings Management of Companies Listed in Tehran Stock Exchange. Accounting and Auditing Research, 3(9), 4-21. https://doi.org/10.22034/iaar.2011.104758 [In Persian]
Ngai, E. W., Hu, Y., Wong, Y. H., Chen, Y., & Sun, X. (2011). The application of data mining techniques in financial fraud detection: A classification framework and an academic review of literature. Decision Support Systems, 50(3), 559–569. https://doi.org/10.1016/j.dss.2010.08.006
Ninh, P. V. B., Do Thanh, T., & Hong, D. V. (2018). Financial distress and bankruptcy prediction: An appropriate model for listed firms in Vietnam. Economic Systems, 42(4), 616-624. https://doi.org/10.1016/j.ecosys.2018.05.002
Nobakht, M., & Baradaran Hassanzadeh, R. (2016). The effect of free cash flows on real and artificial profit management. Accounting and Auditing Reviews, 24(3), 421-440. https://doi.org/10.22059/acctgrev.2017.224708 [In Persian]
Oreski, S., & Oreski, G. (2014). Genetic algorithm-based heuristic for feature selection in credit risk assessment. Expert Systems with Applications, 41(4), 2052–2064. https://doi.org/10.1016/j.eswa.2013.09.004
Osta, S. (2011). Investigating the relationship between Ownership Structure and Earning Management. Financial Accounting Research, 3(2), 93-106. https://far.ui.ac.ir/article_16915.html [In Persian]
Poor Ali, M., & kochaki Tajani, M. (2020). Comparing the accuracy of predicting the manipulation of corporate earnings using the colonial competition algorithm and the genetic algorithm. 1st International Conference on Challenges and New Solutions in Industrial Engineering and Management and Accounting, Sari. https://civilica.com/doc/1045469  [In Persian]
Pyo, G., & Lee, H.-Y. (2013). The association between corporate social responsibility activities and earnings quality: Evidence from donations and voluntary issuance of CSR reports. Journal of Applied Business Research, 29(3), 945–962. https://doi.org/10.19030/jabr.v29i3.7793
Robu, I. B., & Istrate, C. (2015). The analysis of the principal components of the financial reporting in the case of Romanian listed companies. Procedia Economics and Finance, 20, 553–561. https://doi.org/10.1016/S22125671(15)00108-2
Rodriguez-Ariza, L., Martínez-Ferrero, J., & Bermejo-Sanchez, M. (2016). Consequences of earnings management for corporate reputation: Evidence from family firms. Accounting Research Journal, 29(4), 457–474. https://doi.org/10.1108/ARJ-02-2015-0017
Roweis, S. T. (1998). EM algorithms for PCA and SPCA. In Advances in neural information processing systems (pp. 626–632).
Roychowdhury, S. (2006). Earnings management through real activities manipulation. Journal of Accounting and Economics, 42(3), 335–370. https://doi.org/10.1016/j.jacceco.2006.01.002
Saeidmoghadam, M., Javid, D., & Hematfar, M. (2018). Detecting automotive and parts manufacturing industry earnings management by combining Bayesian networks and C5.0 decision tree. Quarterly Financial Accounting, 9(36), 102-126. http://qfaj.mobarakeh.iau.ir/article-1-1080-fa.html [In Persian]
Salehi, M., & Farrokhi Pilehroud, L. (2018). Predicting profit management using neural network and decision tree. Quarterly Journal of Financial Accounting and Auditing Research, 10(37), 1-24. https://sanad.iau.ir/Journal/faar/Article/1073544 [In Persian]
Schmidhuber, J. (2015). Deep Learning in Neural Networks: An Overview. Neural Networks, 61, 85–117. https://doi.org/10.1016/j.neunet.2014.09.003
Schipper, K., (1989). Commentary on earnings management. Accounting Horizons, 3(4), 91-102. https://publications.aaahq.org/accounting-horizons/issue/3/4
Setayesh, M. H., & Kazemnezhad, M. (2019). The Usefulness of Variables (Dimension) Reduction Methods in Stock Returns of the Companies Listed on Tehran Stock Exchange. Empirical Studies in Financial Accounting, 16(63), 83-107. https://doi.org/10.22054/qjma.2019.10647 [In Persian]
Shahmoradi, N., & Tabatabaienasab, Z. (2021). The effect of Audit Quality on the Relationship between Economic Uncertainty and Accrual Based Earnings Management in Listed Companies in Tehran Stock Exchange. Financial Accounting Research, 13(1), 67-86. https://doi.org/10.22108/far.2021.125552.1683 [In Persian]
Shen, C. H., & Chih, H. L. (2007). Earnings management and corporate governance in Asia's emerging markets. Corporate Governance: An International Review, 15(5), 999–1021. https://doi.org/10.1111/j.1467-8683.2007.00624.x
Sun, N., Salama, A., Hussainey, K., & Habbash, M. (2010). Corporate environmental disclosure, corporate  governance  and  earnings  management.  Managerial Auditing Journal, 25(7), 679-700. https://doi.org/10.1108/02686901011061351
Tay, F. E., & Cao, L. (2001). Application of support vector machines in financial time series forecasting. Omega, 29(4), 309–317. https://doi.org/10.1016/S0305-0483(01)00026-3
Tian, S., Yu, Y., & Guo, H. (2015). Variable selection and corporate bankruptcy forecasts. Journal of Banking & Finance, 52, 89–100. https://doi.org/10.1016/j.jbankfin.2014.12.003
Tsai, C. F. (2009). Feature Selection in Bankruptcy Prediction. Knowledge-Based Systems, 22(2), 120–127. https://doi.org/10.1016/j.knosys.2008.08.002
Tsai, C. F., & Chiou, Y. J. (2009). Earnings Management Prediction: A Pilot Study of Combining Neural Networks and Decision Trees. Expert Systems with Applications, 36(3), 7183–7191. https://doi.org/10.1016/j.eswa.2008.09.025
Tort, L. P. (2013). Earnings management under IFRS and PGC. Revista de Contabilidade Y Direccion, 16(1), 161–185. https://accid.org/es/revista-de-contabilidad-y-direccion-num-16/
Veganzones, D., & Séverin, E. (2018). An investigation of bankruptcy prediction in imbalanced datasets. Decision Support Systems, 112, 111–124. https://doi.org/10.1016/j.dss.2018.06.011
Viaene, S., Dedene, G., & Derrig, R. A. (2005). Auto claim fraud detection using Bayesian learning neural networks. Expert Systems with Applications, 29(3), 653-666. https://doi.org/ 10.1016/j.eswa.2005.04.030
Wei, Z., Wang, Y., He, S., & Bao, J. (2017). A novel intelligent method for bearing fault diagnosis based on affinity propagation clustering and adaptive feature selection. Knowledge-Based Systems, 116, 1–12. https://doi.org/10.1016/j.knosys.2016.10.022
Yu, Q., Miche, Y., Séverin, E., & Lendasse, A. (2014). Bankruptcy prediction using extreme learning machine and financial expertise. Neurocomputing, 128, 296–302. https://doi.org/10.1016/j.neucom.2013.01.063
Zang, A. Y. (2012). Evidence on the trade-off between real activities manipulation and accrual-based earnings management. The Accounting Review, 87(2), 675–703. https://doi.org/10.2308/accr-10196