首页

精算过程中的谨慎性原则探讨

精算过程中谨慎性是每个从业人员最重视的,在保险行业如果出错,轻则出现重大赔付进入死亡螺旋,重则面临停业整顿或破产的境地。

今天就以统计分析建模简单了解一下谨慎性原则如何体现。

对于多元线性回归模型未知参数向量β的估计,最主要的方法是普通最小二乘估计。在运用普通最小二乘法估计未知参数时,应首先看具体问题的样本数据是否满足模型的基本假定,只有满足基本假定的模型才能应用普通最小二乘法。通常我们遇到的都是假设满足基本假定要求的,但是当看到不满足基本假定的情况时,如何估计未知参数。

当回归模型的未知参数估计出来后,我们实际上是由n组样本观测数据得到一个经验回归方程,这个经验回归方程是否真正反映了变量y和变量X1,X2,…,Xp之间的线性关系,这就需要进一步对回归方程进行检验。一种检验方法是拟合优度检验,即用样本决定系数的大小来衡量模型的拟合优度。样本决定系数R^2越大,说明回归方程拟合原始数据y的观测值的效果越好。但由于R^2的大小与样本量n以及自变量个数p有关,当n与p的数目接近时,R容易接近1,这说明R中隐含着一些虚假成分。因此,仅由R^2的值去推断模型优劣一定要慎重。

对于回归方程的显著性检验,我们用F统计量去判断假设H。:B1=B2=…= Bp=0是否成立。当给定显著性水平α时,若F>F(p,n-p-1),则拒绝假设H。,否则接受H。接受假设H。和拒绝假设H。对于回归方程来说意味着什么,仍需慎重对待。

一般来说,当接受假设H。时,认为在给定的显著性水平α下,自变量X1,X2,…,Xp对因变量y无显著影响,于是通过X1,X2,…,Xp去推断y也就没有多大意义。在这种情况下,一方面可能这个问题本来应该用非线性模型去描述,而我们误用了线性模型,使得自变量对因变量无显著影响;另一方面可能是在考虑自变量时,由于我们认识上的局限性把一些影响因变量的自变量漏掉了,这就从两个方面提醒我们重新考虑建模问题。

当拒绝了假设H。时,我们也不能过于相信这个检验,认为这个回归模型已经很完美了。其实当拒绝H。时,我们只能认为这个回归模型在一定程度上说明了自变量X1,X2,…,Xp与因变量y的线性关系。因为这时仍不能排除我们漏掉了一些重要的自变量。小编认为,此检验只宜用于辅助性的、事后验证性质的目的。研究者在事前根据专业知识及经验,认为已把较重要的自变量选了,且在一定误差限度内认为模型为线性是合理的。经过样本数据计算后,可以来验证原先的考虑是否周全。这时,若拒绝,可认为至少并不与其原来的设想矛盾。如果接受H。,可以肯定模型不能反映因变量y与自变量X1,X2,…,Xp的线性关系,这个模型就不能用于实际预测和分析。

当样本量n较小,变量个数p较大时,F检验或t检验的自由度太小,这时尽管样本决定系数很大,但参数估计的效果很不稳定,我曾发现一个实际应用例子暴露出这方面的问题。某新闻报道在研究建筑业降低成本率y与流动资金X1固定资金X2、优良品率X3竣工面积X4、劳动生产率X5、施工产值X6的关系时得到的回归方程也暴露了这方面的问题。

平稳时间序列分析介绍

平稳时间序列是时间序列中一类重要的时间序列,对于该时间序列,有一套非常成熟的平稳序列建模方法。对于非平稳序列,可以通过差分、提取确定性成分等方法,将其转化成平稳序列,再运用平稳序列建模方法进行建模。

在实际操作中,由于样本数据的匮乏,要根据样本数据要找到生成样本的真实随机过程基本是不太可能的。理论研究表明,任意平稳时间序列都可以由ARMA过程(包括AR过程、MA过程和混合过程)近似表示,并且通过ARMA模型可以对序列作出比较精确的预测 Box-Jenkins 建模方法是关于如何分析平稳时间序列、建立ARMA模型以及进行预测的方法,它也是目前比较流行的一种建模方法。建模过程基本可以分为如下3步。

1)模型识别:考察时间序列特征,进行模型识别,辨识出有价值且参数简约的模型子类,如AR(3)、ARMA(2,2)等。

2)参数估计和诊断检验:对已辨识出的模型子类进行数据拟合和参数估计,在恰当的条件下,有效地运用样本数据对模型参数进行推断和估计,并对模型进行诊断检验,通过检验拟合模型与数据的关系来揭示模型的不当之处,从而对模型进行改进。模型识别、参数估计和诊断检验是不断循环和改进的过程,通过该过程来找到合适的模型表达式。 

3)预测:利用拟合好的时间序列模型来推断序列其他的统计性质或预测序列将来的发展通常要求,用来建模的观测值的个数至少有50个,最好是100个或更多。当无法获得50个或者更多的历史观测时,例如进行某种新产品的需求预测时,可以使用经验或者类似产品的历史需求信息得到一个初始模型;当获得更多的数据时,这个模型可以随时被更新。

在进行建模时,应使用包含尽可能少的参数的模型,以获得数学上的充分表达。这就是参数使用的简约性原则,该原则在实际应用中是非常重要的。如果模型不恰当,或参数使用冗余,将会使预测出现严重问题。因此,在选择模型时,谨慎和反复试探是非常必要的,这也是一个不断改进、修正错误和试验的过程。

广义的Box-Jenkins建模方法也可以建立带趋势和季节因素的时间序列,并且可以根据需要在模型中添加其他输入变量。

下次另选时间,我们将会从数据准备、平稳性和白噪声检验、模型识别、参数估计和诊断检验、预测等方面讲解

下图为SAS Forecast Server 的用户界面

图1:SAS Forecast Server 的用户界面

精算建模的过程简介

精算师是度量和管理风险的专门职业,精算师为未来不确定的损失进行评估,并提出相应的风险应对措施计划。

在实践中,各种模型是精算师的主要技术基础,建模成为精算师的核心工作之一。

离开为不确定损失建模,精算工作就失去了灵魂。

下面介绍下,精算建模的一般过程。

精算建模过程和现在说的产品打磨很相似,就是需要明确需要解决的痛点,创造出解决问题的产品,再不断解决问题的过程中去打磨工具。所以精算建模一旦开始,基本也就没有说一劳永逸,撒手不管的。

笔者搞过的工具设计和系统,都存在这个不断循环的过程,书上称为“模型控制循环”。举个例子,这几天笔者发现自建的股票选股模型在选股中,存在时间滞后,又开始清理基础数据,要提高选股的时间敏感性。等基础数据重新建立好后,又开始模型的运行,并通过模拟买卖,检测选股的质量。

回到精算建模的步骤:

第一步,定义模型。 明确建模的主要目的,对现有可选模型的确认和选择以及所需的修正,确认建模所需的数据,输入、假设和约束条件。

第二步,建立模型。excel ,python 都可以实现模型的建立。需要确定模型假设和估计参数,比如假设均匀分布,和通胀率的估计。检查数据是否充分,合适,这就需要精算师对数据分析的工作了如指掌。

第三步, 模型维护。模型的输出是否解决问题,模型输出对参数和输入的敏感程度是否在合理地范围。维护包括,运行模型,测试模型,确认模型的真实性、验证模型的一致性以及必要时重新定义和建立模型等。

这里对精算师的技能要求就很高,需要知道数据来源,数据存储工具,数据结构,然后再熟练运用编程语言和数学统计知识进行模型的设计。

笔者爱说设计,因为很多情况下,并不是可以照搬的。需要根据具体情况,具体设计。设计并不是定义,而是要包括施工建立模型。

是不是感觉精算师的工作和数据科学家的工作,或者算法工程师的工作很类似。有相同的部分,也有差异比较大的部分。

差异较大的是对业务知识,对风险管理这个领域,精算师可以等同于该领域的数据科学家,和算法工程师。

所以,精算师一般都是集数据分析技能、数据建模技能、数据库建设维护、甚至还能针对企业经营情况写经营分析报告的存在。

好了,今天对精算模型的设计简介就到这里。