Disponibilizamos parte do Guia de Publicação de Pesquisas Eleitorais da Associação Brasileira de Empresas de Pesquisa – ABEP, para aqueles que tenham interesse em conhecer conceitos básicos da temática das pesquisas quantitativas.
“GUIA DE PUBLICAÇÃO DE PESQUISAS ELEITORAIS”
INFERÊNCIA ESTATÍSTICA
Inferência é o processo pelo qual se generalizam informações obtidas de uma amostra para a população de onde essa amostra foi selecionada. Um exemplo típico é aquele em que se tenta estimar o número (ou porcentagem) de votos que um candidato vai obter nas eleições (aqui a população de interesse é aquela constituída por todos os indivíduos que vão depositar votos nas urnas) a partir dos dados da amostra selecionada numa pesquisa eleitoral.
Nesse processo de generalização, dois tipos de erros podem ser cometidos:
1) Os chamados erros amostrais, oriundos das variações naturais existentes de amostra para amostra, e
2) Os erros não amostrais, gerados por inúmeros fatores, como a definição inadequada da população de interesse, as respostas incorretas fornecidas por indivíduos ou unidades selecionadas, dados demográficos ou eleitorais desatualizados, questionários mal elaborados (perguntas que induzem a determinadas respostas, falta de objetividade, ordem inadequada, vocabulário inacessível etc.), entrevistadores mal treinados, ocorrências inesperadas ligadas ao tema da pesquisa, e inclusive as abstenções eleitorais, conhecidas apenas após a contagem de votos.
A proporção de ocorrência de erros não amostrais pode ser reduzida através de uma especificação criteriosa da população de interesse, do treinamento apropriado dos entrevistadores, da elaboração cuidadosa de questionários etc.
A redução da proporção de ocorrência de erros amostrais pode ser obtida através de uma estratificação conveniente e do aumento do tamanho da amostra (designado por n), que possuem uma relação inversa entre si: quanto mais homogênea a população, menor o tamanho da amostra necessário para a obtenção de estimativas com a mesma precisão. Assim, uma das finalidades da estratificação é obter subpopulações mais homogêneas e consequentemente diminuir o tamanho requerido para a amostra. Nesse contexto, podemos dizer que amostras representativas são aquelas em que a proporção de ocorrência dos dois tipos de erros – amostrais e não amostrais – é minimizada, ou, pelo menos, quantificada. É devido à possibilidade de ocorrência desses erros que os resultados de pesquisas realizadas através de métodos probabilísticos devem sempre incluir a margem de erro das estimativas. Somente uma amostra selecionada através de métodos probabilísticos permite quantificar a magnitude e a proporção de ocorrências dos erros amostrais.
Em uma situação eleitoral, quando dizemos que a porcentagem esperada (dentre todos os votantes e não somente entre aqueles selecionados na amostra) de votos favoráveis a um determinado candidato “A” é de 41% com margem de erro de 2 pontos percentuais, queremos dizer que temos grande confiança que essa porcentagem populacional deve estar entre 39% e 43%.
Se a porcentagem esperada de votos favoráveis ao candidato “B” for de 40% com margem de erro de 2 pontos percentuais, o máximo que poderemos afirmar é que temos grande confiança que a diferença entre as porcentagens de votos favoráveis a esses dois candidatos esteja entre 5% (= 43% – 38%) em favor do candidato “A” e 3% (= 42% – 39%) em favor do candidato “B”. Nesse caso, dizemos que há um empate técnico entre os dois candidatos. A interpretação de “grande confiança”, aqui, tem uma natureza mais técnica, e essencialmente quer dizer que se repetirmos esse procedimento de estimação um grande número de vezes, em 95 de cada 100 (por exemplo), estaremos fazendo uma afirmação correta; neste caso, dizemos que o coeficiente de confiança do procedimento é de 95%.
O erro amostral é também chamado de margem de erro, e pode ser definido como um intervalo de possíveis resultados, consideradas as características da amostra (OLIVEIRA e GRÁCIO, 2005).
Erro amostral tolerável é a diferença tolerada, pelo pesquisador, entre o valor que a estatística acusa e o verdadeiro valor do parâmetro que se deseja estimar (Barbetta, 1999). Quanto menor o erro amostral tolerado pelo pesquisador, maior é o tamanho da amostra necessário para se atendê-lo. Considerando que o erro amostral tolerável representa o quanto o pesquisador admite errar na estimação dos parâmetros de interesse, quanto menor o erro amostral tolerado pelo pesquisador, maior será o tamanho da amostra para que se possa obter essa maior precisão da estatística.
Nível de confiança é a probabilidade de o valor do parâmetro em estudo pertencer ao intervalo centrado na estimativa estatística do parâmetro e limites determinados pelo erro amostral tolerado. Sem conhecer o tamanho N da população, o tamanho de uma amostra aleatória simples em função de uma variável dicotômica é obtido através da seguinte expressão: ou seja, uma amostra três vezes maior que a primeira. Se diminuirmos o nível de confiança para 90%, o valor de n diminui para 1089. Por outro lado, mantendo-se o nível de confiança em 95%, mas diminuindo-se o erro amostral para 2 pontos percentuais, o valor de n aumenta para 2401 indivíduos.
Com base nas constatações acima descritas, pode-se observar que o tamanho da amostra diminui em função do fato de a população ser mais homogênea (a estimativa de p se distancia de 0,5), diminui com o decréscimo do nível de confiança e aumenta com a maior precisão desejada (menor erro amostral tolerado). Portanto, quanto maior a precisão que se deseja associar à estimativa estatística, maior o tamanho amostral necessário para atendê-la.
O EMPATE TÉCNICO
Uma situação é considerada empate técnico quando a diferença entre os candidatos se encontra dentro das margens de erro das pesquisas, ou seja, quando há superposição dos respectivos intervalos de confiança dos candidatos.
Suponha que em determinada pesquisa a margem de erro seja de 3 pontos percentuais e o candidato A tenha 27% das intenções de voto e o candidato B tenha 30%.
Os intervalos de confiança construídos para cada um deles são os seguintes:
Candidato A: [27% – 3%; 27%+3%] = [24%;30%]
Candidato B: [30% – 3%; 30%+3%] = [27%;33%]
Obs.: os extremos são os Limites de Confiança
Quando existe uma superposição nos dois intervalos de confiança, pode-se dizer que existe um empate técnico entre os dois candidatos.
Fonte: Guia de Publicações de Pesquisas Eleitorais. Disponível no site da ABEP.