Repensando o nível de significância nos testes estatísticos aplicados às tábuas biométricas: uma proposta para mitigação do erro tipo II na gestão do risco atuarial

Artigos

Pesquisar tag(s):

Selecionar tag(s):

Adicionar nova tag:

Rafael Porto de Almeida^[1]

Karen Tressino^[2]

Resumo

Os testes estatísticos aplicados às tábuas biométricas são instrumentos amplamente utilizados na avaliação da aderência das premissas atuariais adotadas na mensuração do passivo de longo prazo dos planos previdenciários. Contudo, a prática de adotar níveis de significância de até 5% – herdada das ciências sociais e da bioestatística – pode não ser adequada ao contexto atuarial. Isso porque, enquanto tais áreas buscam mitigar o Erro Tipo I (rejeitar uma hipótese verdadeira), na aplicação da técnica ao contexto da aderência de tábuas biométricas, o risco a ser mitigado é o do Erro Tipo II: não rejeitar uma hipótese falsa, o que se traduz, aqui, em manter uma tábua inadequada, acreditando em sua aderência. Este artigo propõe a revisão do nível de significância aplicado nesses testes, com vistas a reduzir a probabilidade do Erro Tipo II e, consequentemente, aprimorar a gestão dos riscos atuariais, em especial, aqueles associados à longevidade.

1. Introdução

A matemática atuarial adotada para o dimensionamento do passivo de planos previdenciários precisa se fundamentar em premissas que busquem representar – adequadamente – as expectativas futuras quanto às mais diferentes variáveis adotadas na modelagem técnica, dentre elas, as tábuas biométricas.

Nesse sentido, para que se tenha segurança quanto à fidedignidade dos resultados, é essencial a adequação dessas premissas à população segurada dos planos de benefícios, como se estabelecem, por exemplo, os normativos aplicados às Entidades Fechadas de Previdência Complementar (EFPC) – atualmente a Resolução nº 30/2018 do Conselho Nacional de Previdência Complementar (CNPC) – e aos Regimes Próprios de Previdência Social (RPPS) – atualmente a Portaria MTP Nº 1.467, de 02 de junho de 2022.

A gestão dos riscos atuariais pressupõe o controle das incertezas associadas a essas hipóteses e, para tanto, consolidou-se no mercado o uso de testes estatísticos para avaliação da aderência de tábuas biométricas, geralmente adotando-se 5% como nível de significância – parâmetro amplamente aceito por tradição científica, mas raramente questionado quanto à sua adequação no contexto atuarial-previdenciário.

2. Reflexões quanto ao tema

Os testes estatísticos são amplamente adotados em pesquisas das ciências sociais e da bioestatística. Para tanto, define-se uma hipótese nula (H₀) e uma hipótese alternativa (H₁).

Em síntese, e de forma genérica, adotadas as técnicas atinentes ao teste, rejeita-se H₀ quando são detectadas evidências estatísticas suficientes. Ao contrário, quando os resultados do teste não detectam evidências estatísticas suficientes, demonstrando-se fora da região de rejeição, logo, dentro de um intervalo de confiança definido, H₀não é rejeitada.

Ocorre que a região de rejeição está intimamente relacionada ao nível de significância previamente definido.

Então, eis que devemos nos perguntar: Qual o nível de significância adequado a ser utilizado em testes estatísticos aplicáveis às tábuas biométricas?

Para respondermos essa pergunta, precisamos retomar o conceito dos tipos de erros possíveis em testes de hipóteses, bem como definir, ainda que de forma ampla, a hipótese nula e a alternativa:

Tenhamos, portanto, as seguintes hipóteses a serem testadas:

Hipótese Nula (H₀): A tábua biométrica testada é aderente e, portanto, é uma boa representante da realidade dos segurados do plano de benefícios;
Hipótese Alternativa (H₁): A tábua biométrica testada não é aderente e, portanto, não é uma boa representante da realidade dos segurados do plano de benefícios;

A depender do teste, essa “aderência” pode ser avaliada quanto à distribuição dos eventos ao longo das idades ou quanto ao quantitativo de eventos ao longo das idades ou ao longo dos anos.

Definidas as hipóteses, são apresentados os possíveis tipos de erros:

O Erro Tipo I reflete a probabilidade de rejeitar a Hipótese Nula quando não deveríamos rejeitá-la, sendo ela verdadeira. Uma espécie de falso negativo, em nossa aplicação (estaríamos afirmando que a tábua não reflete a realidade, quando na verdade ela reflete).

Já o Erro Tipo II reflete a probabilidade de não rejeitarmos a Hipótese Nula quando ela deveria ser rejeitada. Uma espécie de falso positivo, em nossa aplicação (estaríamos afirmando que a tábua é adequada, quando na verdade ela não é).

Realidade	Rejeitar H₀	Não Rejeitar H₀
H₀ Verdadeira	Erro Tipo I	-
H₀Falsa	(Poder do Teste)	Erro Tipo II

A probabilidade de se cometer o Erro Tipo I está associada ao nível de significância adotado para o teste. Assim, se definimos, à priori, um nível de significância do teste em 5%, estamos assumindo a probabilidade de 5% de rejeitarmos a Hipótese Nula, a partir dos dados obtidos, enquanto ela não deveria ser rejeitada.

A probabilidade do Erro Tipo II, por sua vez, é complementar ao Poder do Teste, que é a probabilidade de rejeitar a hipótese nula quando ela, de fato, é falsa. Ocorre que o Poder do Teste não é algo simples de se apurar, pois depende da metodologia do teste estatístico, do tamanho da amostra (quanto maior a amostra, maior o Poder do Teste), da variância dos dados (quanto menor a variância, maior o Poder do Teste) e, também, do nível de significância (quanto maior a significância adotada, maior o Poder do Teste).

Então, até mesmo intuitivamente, é possível inferir que quanto maior o nível de significância, maiores são as chances de se cometer o Erro Tipo I. Da mesma forma, ao elevar o nível de significância, eleva-se também o Poder do Teste e, em consequência, é reduzida a chance de se cometer o Erro Tipo II.

Assim, uma coisa ou outra: Se aumentamos a chance de cometer um erro, diminuímos a chance de cometer o outro. E eis que se chega à reflexão central deste artigo: qual o erro eu mais gostaria de mitigar?

Talvez, por termos herdado tais testes de hipóteses das Ciências Sociais ou da Bioestatística, a prática de mercado tem demonstrado a utilização do nível de significância de 5% como sendo um padrão. Há quem defenda ainda a utilização de um nível de significância igual ou menor que 5%. A nítida intenção presente é a de mitigar o risco do Erro Tipo I.

Mas trazemos aqui uma reflexão, aplicada à realidade dos testes estatísticos em tábuas biométricas utilizadas em Planos Previdenciários: O que é pior, em nosso caso? Rejeitar uma tábua aderente (Erro Tipo I) ou não rejeitar uma tábua inadequada (Erro Tipo II)?

Almeida e Vieira (2024), nesse contexto, destacam que o pior erro a se cometer aqui seria o Erro Tipo II. Isso nos levaria a dimensionar o passivo atuarial de um plano acreditando estar utilizando uma hipótese adequada, quando na verdade ela não é. Apenas não se conseguiu detectar as evidências pelo teste aplicado, haja vista o nível de significância utilizado.

O Erro Tipo I, que nos levaria a rejeitar uma tábua quando, na verdade, ela é adequada, nos traria qual impacto, em conclusão? Substituí-la por outra cujos resultados demonstraram melhor ajuste estatístico. No fim, estaríamos até mesmo precificando o passivo com uma hipótese aderente e mais bem ajustada, estatisticamente.

Voltando ao Erro Tipo II, ele nos levaria à miopia de precificar o passivo acreditando em seus resultados, podendo, porém, nos frustrar com o futuro que está por vir.

Assim, na prática dos testes estatísticos aplicados às tábuas biométricas, aumentar o nível de significância, aumentando, assim, o Poder do Teste, pode nos levar a mitigar o risco de cometer o pior erro que não gostaríamos de cometer: O de mal precificar o passivo (Erro Tipo II).

Por isso, a defesa apresentada aqui, cujo objetivo é gerar reflexões em aplicações práticas no segmento previdenciário, é a de que elevar o nível de significância do teste estatístico aplicado às tábuas poderia colaborar na gestão do risco atuarial, reduzindo a probabilidade de adoção de uma premissa inadequada.

Apenas cabe uma importante ponderação: Como mencionado, o Poder do Teste está intimamente relacionado, também, ao tamanho da amostra. Dessa forma, em muitos casos práticos, o próprio número de expostos aos riscos de óbito ou de invalidez, bem como o histórico de eventos, já possibilita um rigor técnico do teste suficiente para mitigar o risco do Erro Tipo II, sem a necessidade de elevação do nível de significância, cabendo ao atuário responsável pela elaboração do estudo avaliar, a partir da sua amostra, tal necessidade.

6. Conclusão

A proposta aqui apresentada convida a comunidade atuarial a repensar paradigmas estatísticos herdados de outras ciências. Em vez de buscar a mitigação do risco do Erro Tipo I, deve-se considerar o impacto prático do Erro Tipo II sobre a solvência e o dimensionamento dos passivos atuariais dos planos previdenciários.

Observado o tamanho da amostra, elevar o nível de significância em testes de aderência de tábuas biométricas, quando necessário, não representa flexibilização técnica, mas, ao contrário, reflete um maior rigor metodológico na condução dos testes aplicados e uma maior prudência na gestão do risco atuarial. Trata-se, portanto, de uma mudança de perspectiva, mantendo-se, porém, as ferramentas já adotadas.

* Artigo publicado na Revista Brasileira de Atuária 2025 (9ª Edição)

Referências

ALMEIDA, R. P; VIEIRA, F. S. D. Fundamentos e práticas da gestão atuarial: conceitos e princípios aplicados à previdência. 1. ed. São Paulo: Dialética, 2024.

BRASIL. CONSELHO NACIONAL DE PREVIDÊNCIA COMPLEMENTAR. Resolução CNPC Nº 30, de 10 de outubro de 2018. Brasília, DF: CNPC, 2018a.

BRASIL. MINISTÉRIO DO TRABALHO E PREVIDÊNCIA. Portaria MTP Nº 1.467, de 02 de junho de 2022. Brasília, DF: MTP, 2022.

^[1] Sócio-Diretor da Lumens Atuarial. É Atuário com bacharelado pela UFMG, Mestre em Finanças pela UFSC, Pós-graduado em Gestão da Previdência Complementar pelo CESUSC e Pós-graduado em Mercado Financeiro e de Capitais pela FIPECAFI. Profissional com Certificado Técnico do Instituto Brasileiro de Atuária (IBA) e CPA 20 / ANBIMA. Atua desde 2006 nos segmentos de EFPC e RPPS.

^[2] Sócia-Diretora da Lumens Atuarial. É atuária, com bacharelado pela UFRGS e pós-graduada em Gestão de Seguros e Previdência Privada pela Universidade Presbiteriana Mackenzie. Profissional certificada pelo ICSS. Atua desde 2001 no ramo de Previdência Complementar Fechada.

Em janeiro de 2026