Introduction, contexte et objectifs
La modélisation du comportement des clients d’assurance a reçu une attention toute particulière ces dernières années. Milhaud et al. (2011) et Guelman et al. (2012) ont modélisé respectivement le rachat et la résiliation avec des forêts aléatoires, tandis que Yeo et al. (2001) ont proposé une approche avec des réseaux de neurones. De plus, l’utilisation des méthodes d’apprentissage statistique en actuariat s’est intensifiée. Typiquement, Guelman (2012) montre les bennées d’utiliser une technique de boosting pour modéliser la fréquence de sinistres sur des données d’un concours Kaggle.
Dans la suite, on s’attache à exhiber les avantages et les défauts des méthodes d’apprentissage à la mode par rapport à un modèle linéaire généralisé (GLM) pour réaliser une optimisation tarifaire. Nous reprenons l’article de Spedicato et al. (2018), qui traite d’une optimisation en affaire nouvelle sur un portefeuille d’assurance directe à l’aide de R, R Core Team (2019).
Méthodologie et modèles testés
L’optimisation tarifaire consiste à modéliser d’une part les sinistres pour un produit considéré et d’autre part à modéliser la demande en assurance. Plus précisément, on s’intéresse ici à une modélisation par contrat des sinistres et des primes sur des marchés d’assurance pour les particuliers. On exclut de ce fait les polices vendues collectivement ou les risques d’entreprise.