L’analyse des itinéraires domicile-travail ouvre de nouvelles perspectives pour l’assurance automobile. En exploitant les données ouvertes et des modèles bayésiens, cette approche vise à améliorer la maîtrise du risque pour les assureurs.
Ces dernières années, le secteur de l’assurance automobile a été marqué par une compétitivité accrue et un contexte de fortes revalorisations des primes d’assurance. Cette tension importante sur le marché pousse les assureurs à innover, notamment en faisant évoluer leurs méthodes tarifaires. Dans ce cadre, certaines tentatives d’introduction de systèmes pay how you drive, reposant sur des outils embarqués d’analyse de conduite, ont été réalisées, mais avec des succès parfois mitigés. Ces dispositifs, souvent complexes et peu lisibles pour les assurés, peinent à démontrer clairement leurs bénéfices.
Notre étude propose une méthodologie innovante d’affinage de la tarification de la garantie responsabilité civile corporelle (RCC). Cette dernière constitue la seule assurance obligatoire en France et couvre l’indemnisation des dommages causés à des tiers en cas de faute du conducteur ou de ses passagers. Dommages qui incluent les blessures ou le décès de piétons, de passagers ou d’occupants d’autres véhicules.
Les sinistres liés à la garantie RCC représentent une part significative de la charge de sinistralité pour les assureurs. Bien que leur fréquence soit faible, leur gravité potentielle engendre des coûts souvent très élevés. En effet, la couverture d’un sinistre grave, où des victimes sont hospitalisées ou décèdent, peut inclure l’indemnisation des frais médicaux, le pretium doloris ou encore le préjudice financier résultant d’un arrêt d’activité. Dans les cas les plus sévères, impliquant des séquelles ou une invalidité, les coûts liés à l’indemnisation peuvent être particulièrement importants.
Plutôt que de se limiter aux critères traditionnels comme l’âge ou le type de véhicule, notre approche repose sur une analyse fine du risque associé à l’itinéraire quotidien de l’assuré. Cette méthode s’appuie sur l’exploitation de données issues de la base de l’Observatoire national interministériel de la sécurité routière (ONISR), chargé de collecter, structurer et publier des statistiques relatives à la sécurité routière. Ce cadre méthodologique ouvre des perspectives intéressantes pour adapter les primes de manière plus précise et plus équitable.
L’approche adoptée dans notre étude repose sur l’idée qu’il est possible d’améliorer l’évaluation et la maîtrise du risque d’un assureur grâce à l’exploitation de bases de données ouvertes (open data). Cette pratique est déjà bien ancrée dans le domaine de l’assurance MRH, notamment dans l’analyse des risques climatiques. Les données, bien qu’externes au secteur assurantiel, offrent une perspective globale et nationale couvrant l’ensemble du marché. Leur valorisation, par une interprétation adaptée aux enjeux assurantiels, permet de pallier certaines lacunes dans l’information disponible sur les risques pris en charge par les assureurs.
Répondre à des enjeux actuariels avec l’open data
Dans le cadre de notre étude, nous nous sommes appuyés sur la base de données ONISR, une ressource essentielle sur l’accidentologie et la topologie routières qui recense tous les accidents survenus entre 2008 et 2020 en France métropolitaine. Chacun d’entre eux est décrit par un ensemble de variables détaillant les circonstances des accidents, les types de véhicules impliqués, les caractéristiques des victimes et les localisations précises des événements.
La définition du cadre d’étude a nécessité des retraitements approfondis de cette base. En effet, les données proviennent des procès-verbaux renseignés manuellement par les forces de l’ordre, ce qui a rendu indispensable une sélection rigoureuse des variables exploitables. Par ailleurs, notre analyse, centrée sur la garantie RCC et les accidents sur les itinéraires domicile-travail, a conduit à filtrer les observations en fonction de leur pertinence. Nous avons retenu en priorité les accidents pour lesquels le motif d’usage du véhicule était identifié comme étant un trajet domicile-travail. En l’absence de cette information, nous avons sélectionné les accidents survenus de 7 h à 10 h ou de 17 h à 19 h, les plages horaires correspondant aux deux pics d’incidence typiquement associés à ces trajets.
En cohérence avec le principe de responsabilité civile, nous avons veillé à inclure une large diversité d’usagers dans les données, parmi lesquels les conducteurs et passagers de véhicules légers, les piétons, et les utilisateurs de moyens de transport individuels (deux-roues motorisés ou non, trottinettes électriques, etc.). La base ainsi traitée comporte 448 496 observations et constitue un support analytique très riche.
L’approche par itinéraire pour évaluer le risque
Dans les modèles traditionnels de tarification automobile, le risque est estimé à partir de données déclaratives fournies par les assurés, comme l’âge du conducteur, la catégorie du véhicule ou le lieu de résidence. Ces informations, pertinentes, ne permettent pas de capturer la spécificité des trajets effectués au quotidien, en particulier l’itinéraire domicile-travail. Pourtant, ce dernier constitue une part significative de l’usage d’un véhicule. Notre démarche propose d’enrichir la compréhension du risque corporel en s’intéressant directement aux caractéristiques des itinéraires parcourus.
L’exploitation des data repose sur le développement d’un outil dédié au traitement des données géospatiales. Les lieux d’accidents, géocodés dans la base ONISR, permettent de croiser l’information d’accidentologie avec les simples adresses de départ et d’arrivée. Grâce à l’API Google Maps, nous détectons spatialement les accidents survenus le long d’un itinéraire donné et collectons les informations d’accidentologie associées. L’outil ainsi développé fournit des indicateurs tels que le nombre total d’accidents sur le trajet, le nombre de victimes graves ou l’âge moyen (hors conducteurs) des blessés graves.
Soulignons que la base ONISR n’est pas assurantielle. Elle ne contient donc aucune information sur les coûts réels d’indemnisation des sinistres détectés. Afin d’évaluer le risque d’assurance, une interprétation actuarielle des indicateurs d’accidentologie s’est révélée nécessaire. Nous avons dû élaborer une métrique permettant d’estimer un coût théorique de sinistre pour l’assureur. Dans la conception de notre score de risque, nous avons supposé que les réparations accordées aux blessés graves prenaient la forme de rentes viagères. Une fois l’historique d’accidentologie associé à un itinéraire, nous avons calculé l’espérance de vie résiduelle des blessés graves en nous appuyant sur leur âge moyen et sur la table réglementaire TGH 005. Pour l’ensemble des accidents détectés sur les treize années d’historique, l’âge moyen des victimes graves est calculé à partir de la variable d’âge des usagers impliqués, telle qu’elle figure dans la base ONISR. Cette approche nous a permis d’estimer le nombre moyen d’annuités à verser pour couvrir les accidents enregistrés sur un itinéraire. En normalisant ce nombre d’annuités par le kilométrage de l’itinéraire, nous obtenons un score qualifiant le risque de sinistre corporel d’un trajet. Ce score permet également de comparer les itinéraires du point de vue du risque d’assurance.
Cet outil alimente une WebApp interactive, conçue pour évaluer le risque d’accident corporel lié à un itinéraire donné. L’outil ainsi construit constitue le socle de la méthode d’affinage tarifaire développée dans la suite.
Bien que le score de risque empirique permette d’appréhender le sinistre corporel associé à un itinéraire donné, il reste perfectible pour capturer pleinement la complexité du risque à l’échelle d’un portefeuille d’assurance. Pour affiner cette approche et atténuer les biais inhérents à une mesure directe fondée sur des données ponctuelles, nous avons exploité l’outil développé pour élaborer une méthode probabiliste. Cette démarche permet de mieux intégrer la variabilité des sinistres observés et d’offrir une évaluation du risque plus robuste et représentative des spécificités d’un itinéraire dans un contexte élargi à un portefeuille d’assurés.
L’élaboration d’un tel indicateur repose sur une classification la plus exhaustive possible des routes du réseau routier français en fonction de divers facteurs de risque d’accident corporel qui leur sont propres. Ces facteurs de risque ont été identifiés à partir de la base ONISR par une analyse de corrélation entre ces variables et la gravité des accidents. Ils incluent, entre autres, le type de route (autoroute, nationale, départementale), la topologie de la voirie et la fréquentation des axes routiers. En s’appuyant sur un échantillon représentatif pour chaque classe de route, des mesures de score de risque sont effectuées à l’aide d’un outil de reconnaissance de la sinistralité. Ces données permettent de construire des lois de distribution du score de risque spécifiques à chaque classe de route, utilisées ensuite pour modéliser le score de risque d’un itinéraire quelconque, décomposé en segments correspondant aux différentes classes de routes empruntées.
Établies à partir des données de l’outil de reconnaissance de la sinistralité, exploitant la base ONISR, ces lois reflètent le comportement global des usagers du réseau routier français. Si elles fournissent une perspective objective et générale du risque, elles ne tiennent toutefois pas compte de l’exposition spécifique d’un assureur.
Une modélisation bayésienne pour affiner le score
Afin de modéliser le score de risque ou coût kilométrique au plus proche du risque réellement encouru sur un itinéraire, nous nous sommes inspirés de la théorie de la crédibilité. Ce principe repose sur l’idée que les expériences passées d’un assuré ou d’un groupe d’assurés peuvent être exploitées pour affiner la prédiction des événements futurs. Cette approche, déjà bien connue des actuaires, se distingue par la possibilité de personnaliser le modèle de prédiction du risque en y intégrant de nouvelles observations. Ainsi, en optant pour une approche bayésienne, la méthode construite permet l’ajustement dynamique des prédictions du score de risque en fonction de l’exposition propre à un assureur. Par conséquent, les lois de sinistralité établies à l’échelle du marché peuvent être affinées grâce à l’intégration de l’historique de sinistralité du portefeuille de l’assureur, offrant une évaluation plus représentative et adaptée du score de risque à l’itinéraire.
À cette fin, le score de risque sera modélisé par un modèle bayésien Gamma-Gamma propre à chaque classe de route. Ce choix découle de tests approfondis visant à identifier le modèle le plus pertinent pour capturer la variabilité et les spécificités des différentes classes de routes. Ce modèle permet de concilier une perspective globale, issue des observations agrégées du marché, avec une perspective locale, tirée des données propres à chaque assureur.
En définitive, cette méthodologie offre aux acteurs de l’assurance un modèle robuste mais également adaptable, permettant de mieux aligner les prédictions de risque avec les spécificités de leur portefeuille. L’objectif de cette démarche est d’ajuster la prime d’assurance automobile d’un assuré en fonction du risque RC associé à son trajet domicile-travail, afin que cette prime reflète au mieux le niveau de risque réel.
La méthode développée permet de calculer un score de risque individuel pour un trajet domicile-travail en intégrant à la fois l’historique de sinistralité du portefeuille de l’assureur et les caractéristiques spécifiques des routes empruntées. À partir de ce score, il devient possible de construire un coefficient d’ajustement directement applicable à la prime RC. Ce coefficient prévoit qu’un assuré empruntant un itinéraire plus risqué subisse une augmentation proportionnelle de sa prime, tandis qu’un itinéraire moins risqué entraîne une réduction cohérente. Plusieurs possibilités de score de risque sont envisageables, on peut alors décider d’ajuster dynamiquement la prime selon le coefficient de crédibilité du trajet par comparaison du score de risque de l’itinéraire avec le score de risque moyen dans le département de résidence de l’assuré. La prime peut également être ajustée par comparaison du score de risque d’un assuré à la moyenne des scores de risque au sein du portefeuille.
Études d’un cas particulier
Pour illustrer le fonctionnement de notre modèle, prenons un exemple concret d’application. Imaginons un assureur disposant d’un portefeuille de polices d’assurance automobile. Pour chaque assuré, un score de risque est calculé, puis utilisé pour ajuster sa prime en conséquence.
Considérons un assuré résidant au 45 chemin du Gué à Arpajon-sur-Cère et travaillant au 1 rue de Grachou à Neussargues-en-Pinatelle. À l’aide d’une API de routage, nous subdivisons son trajet en fonction des routes empruntées et identifions les différentes classes de routes composant son itinéraire. À chaque classe de route est associé un modèle bayésien permettant la modélisation du score de risque sur cette classe, puis in fine pour l’itinéraire dans son ensemble. Nous obtenons un score de risque global pour cet assuré. Dans cet exemple, il est de 2,77.
Ce calcul est effectué pour chaque assuré du portefeuille, permettant ainsi de déterminer un score de risque moyen pour l’ensemble des assurés. Ce score moyen est de 1,07. Le coefficient d’ajustement applicable pour l’assuré serait alors de 9 %. Selon des données de benchmark de l’Étude statistique-L’assurance automobile des particuliers en 2023 menée par France assureurs, la part moyenne de la prime pure automobile consacrée à la responsabilité civile représente 29 %. Pour l’assuré étudié, le malus se traduirait par une hausse globale de sa prime d’assurance automobile de 2,61 %.
Perspectives et enjeux pour le métier
L’approche proposée offre une perspective d’évolution pour la tarification automobile, en intégrant une évaluation plus fine et dynamique des risques. La personnalisation des tarifs repose sur l’analyse des risques associés aux itinéraires quotidiens des assurés. Cette méthode permet d’ajuster les primes en fonction des risques identifiés, en valorisant les trajets moins risqués et en modulant les tarifs pour les parcours plus accidentogènes. Elle pourrait également offrir aux assureurs une meilleure capacité de sélection des risques. À terme, cette granularité dans l’analyse contribuerait à une gestion plus maîtrisée des coûts liés aux sinistres. En l’absence d’un historique complet de sinistralité pour un portefeuille donné, l’outil peut exploiter les données ouvertes pour affiner les estimations de risque. Ce recours aux données externes constitue un levier supplémentaire pour limiter l’exposition au risque et anticiper plus efficacement les charges liées aux sinistres corporels.
La modélisation bayésienne dynamique renforce cette approche en permettant une mise à jour continue des primes. Elle intègre simultanément les données issues du portefeuille de l’assureur et les tendances nationales relatives au risque d’accidents corporels. Cette capacité d’adaptation continue garantit une meilleure adéquation des primes à l’évolution du risque, tant au sein du portefeuille qu’à l’échelle nationale, année après année. En somme, cette méthodologie contribuerait à revisiter certaines pratiques de gestion des risques et de tarification, en plaçant la personnalisation et l’adaptabilité au cœur des priorités.
Bien que notre approche offre des perspectives intéressantes pour affiner la tarification des primes d’assurance automobile en fonction des risques spécifiques liés aux itinéraires domicile-travail, elle n’est pas exempte de contraintes. Tout d’abord, la qualité et l’exhaustivité des données ouvertes utilisées conditionnent fortement la pertinence des résultats obtenus. Des données incomplètes ou mal actualisées limiteraient la précision des estimations et fausseraient les ajustements tarifaires. Par ailleurs, le coût opérationnel est un point critique. La mise à jour régulière des données, nécessaire pour maintenir la pertinence des scores de risque, s’avère chronophage et peut générer des frais non négligeables si elle est réalisée à grande échelle. Ces frais sont notamment liés à l’utilisation payante d’outils externes comme l’API Google. Ensuite, l’intégration de cette méthode au sein des processus existants d’un assureur n’est pas sans poser des défis. Cette approche repose sur la connaissance du lieu de travail des assurés ou sur des données déclaratives permettant d’en faire une approximation. Les parcours de souscription sont déjà complexes, et allonger leur durée avec une étape supplémentaire pourrait dissuader certains assureurs de l’adopter. Dans le cadre de nos travaux, un benchmark des tunnels de souscription des assureurs a été réalisé : à date, peu d’assureurs demandent à la fois l’adresse du domicile et celle du lieu de travail. De fait, la mise en place de cette mesure ne pourra se faire que sur les affaires nouvelles et une fois les tunnels de souscription modifiés.
Un équilibre délicat à respecter
De plus, la tarification différenciée, bien qu’efficace pour individualiser les primes, doit impérativement respecter l’équilibre délicat entre mutualisation et segmentation des risques tout en maintenant une compétitivité tarifaire sur le marché. Une segmentation trop fine des risques accentuerait les effets de sélection adverse avec pour conséquence de déstabiliser la structure de mutualisation au sein du portefeuille. Il est donc crucial de trouver un équilibre qui permette une différenciation juste sans compromettre la solidarité inhérente au modèle assurantiel.
Il serait pertinent d’appliquer la méthode à l’appui d’une base de données réelle contenant à la fois les primes d’assurance de chaque assuré et un historique de sinistres corporels. Une telle application permettrait d’analyser avec plus de précision l’impact des ajustements tarifaires sur la mutualisation et la segmentation des risques. Elle permettrait également de comparer le risque lié à l’itinéraire domicile-travail avec celui déjà pris en compte dans la tarification actuelle des primes.
En dépit de ces limites, l’outil développé ouvre des perspectives prometteuses. S’il est avant tout conçu pour les assureurs, il pourrait également avoir des applications en prévention routière. L’identification des trajets les plus accidentogènes pourrait, par exemple, aider les autorités locales à cibler des zones à risque et à mettre en œuvre des mesures visant à réduire les accidents corporels sur ces itinéraires.