Страхові випадки: аналіз з використанням машинного навчання
Анотація
Однією з головних проблем страхування є шахрайство, коли клієнт шляхом спотворення інформації про страховий випадок, хоче отримати завищені суми виплат. Проте традиційні методи боротьби з шахрайством у страхуванні вимагають великої кількості рутинної ручної праці та є не надто ефективними. У роботі запропоновано розробку прототипу системи моніторингу страхових випадків з метою виявлення шахрайства із застосуванням методів машинного навчання. Розробку проведено на прикладі бази даних страхових випадків, що налічує 38 змінних та містить 1000 записів зі страхових претензій клієнтів. У датасеті надана інформація щодо 1) клієнтів – 10 ознак; 2) договору страхування – 7 ознак; 3) інциденту – 21 ознака. Попередню обробку даних, побудову моделей та розробку системи моніторингу проведено з використанням мови програмування Python. На основі моделей логістичної регресії, градієнтного бустингу та випадкового лісу було побудовано низку класифікаторів з різними комбінаціями змінних. Для кожної моделі було проаналізовано матрицю спряженості, показники точності, специфічності, чутливість, побудовані ROC-криви. За результатами моделювання вдалось відібрати 5 основних змінних для моніторингу, 3 з яких характеризують клієнта, 2 – зіткнення транспортних засобів. За допомогою запропонованої системи моніторингу вдалося виявити наступні закономірності: 1) серед шахраїв найчастіше зустрічаються менеджери та працівники технічної підтримки; 2) клієнти, які у вільний час грають у шахи або займаються кросфітом, більш схильні до шахрайства; 3) більшість фактів шахрайства було зафіксовано при сильному пошкодженні транспортного засобу; 4) за відсутності контакту з екстреними службами, велика сума претензії свідчить про фрод.
Завантаження
Посилання
Plastun, V. (2014). Problems of insurance fraud and the practice of avoiding it. Economics: problems of theory and practice, 477-488. (in Ukrainian)
Bondarenko, E. (2020). Crimes in the field of insurance: features of their commission in Ukraine. Electronic repository of NAVS, 3. Retrieved from http://elar.naiau.kiev.ua/jspui/handle/123456789/8505. (in Ukrainian)
Nedzherya, V. (2020). Risks of insurance fraud and methods of combating them. Efficient economy, 3. doi: https://doi.org/10.32702/2307-2105-2020.3.150. (in Ukrainian)
Punith, A. (2021). Insurance claims – Fraud detection using machine learning. Retrieved from https://medium.com/geekculture/insurance-claims-fraud-detection-using-machine-learning-78f04913097.
Roshan, S. (2021). Fraud Detection in Insurance Claims. Retrieved from https://www.kaggle.com/roshansharma/fraud-detection-in-insurance-claims/notebook#Modelling-with-Ensemble-of-Samplers.
Ermoshenko, A. (2009). Insurance fraud as a source of threats in the interaction of insurers and banks. Ukrainian Academy of Banking of the NBU, 27. Retrieved from http://essuir.sumdu.edu.ua/handle/123456789/54055e. (in Ukrainian)
Zhabynetsʹ, O. (2009). Prevention of insurance abuse as one of the factors ensuring economic security of the insurer. Bulletin of Lviv State University of Internal Affairs, 1, 1-6 Retrieved from: https://www.lvduvs.edu.ua/documents_pdf/visnyky/nvse/01_2009/09zojebs.pdf. (in Ukrainian)
Shirinyan, L. (2010). Insurance fraud – economic and legal aspects, indicators and ways to fight. Economics and law, 3. Retrieved from http://dspace.nuft.edu.ua/jspui/handle/123456789/16581. (in Ukrainian)
FEDERAL BUREAU OF INVESTIGATION (FBI). 2020. Insurance Fraud. Retrieved from https://www.fbi.gov/stats-services/publications/insurance-fraud.