2 pontos por GN⁺ 2025-08-24 | Ainda não há comentários. | Compartilhar no WhatsApp
  • Nas ciências sociais e ciências da vida, existe algum nível de correlação entre quase todas as variáveis
  • Esse fenômeno não é mera coincidência nem erro estatístico, mas um fato real decorrente de fatores genéticos e ambientais complexamente entrelaçados
  • Quanto maior o tamanho da amostra, correlações significativas aparecem na maioria dos pares de variáveis, e os pesquisadores passam a prestar atenção mais ao próprio padrão de correlações do que a correlações individuais
  • O “crud factor” significa que quase todos os pares de variáveis têm pequenas correlações, e apenas com uma teoria arbitrária e a escolha de pares de variáveis já se obtêm resultados significativos com alta probabilidade
  • Nessa situação, o significado do nível de significância tradicional (0,05) enfraquece, exigindo cautela na interpretação estatística nas ciências sociais

Visão geral e contexto

  • Em psicologia e sociologia, a afirmação de que “tudo se correlaciona com tudo em algum grau” é amplamente aceita
  • Certas características são determinadas por vários fatores genéticos e ambientais, e esses fatores também têm correlações entre si
  • Portanto, na prática, quase toda variável mensurável apresenta algum grau de inter-relação

“Crud factor” e descobertas estatísticas

  • “Crud factor” refere-se ao fenômeno, em pesquisas de ciências sociais (e em parte das ciências da vida), de que sempre existe uma pequena correlação até mesmo entre pares arbitrários de variáveis
  • Em um grande conjunto de dados com 57.000 estudantes do ensino médio de Minnesota, em 1966, os resultados da análise de 105 tabelas cruzadas (crosstabulation) entre variáveis diversas como família, educação, atividades de lazer, carreira e religião foram todos estatisticamente significativos
    • Em 96% do total, a possibilidade de acaso foi descartada com probabilidades extremamente baixas, no nível de p<10⁻⁶
  • Ao ampliar o número de variáveis para 45, 92% das 990 combinações no total foram estatisticamente significativas
    • A mediana (median) das relações significativas entre uma variável e todas as demais foi de 41 entre 44

Exemplos entre variáveis reais

  • Nas relações entre pontuações do MCAT e número de irmãos, ordem de nascimento, sexo, plano de carreira, preferência religiosa etc., também foram encontradas altas significâncias estatísticas em todos os casos
    • Ex.: alunas tiveram pontuação maior que alunos, houve tendência de queda na pontuação quanto maior o número de irmãos, primogênitos/filhos únicos eram mais inteligentes que os caçulas, e havia várias diferenças claras entre grupos religiosos
  • Mesmo entre 5 denominações protestantes representativas, foi observada alta significância nas relações com várias variáveis
    • Ex.: a probabilidade de um filho único ser Presbyterian era quase o dobro da de ser Baptist, além de várias correlações como diferenças por denominação na afinidade com a escola e nas aspirações profissionais

Caso dos itens do MMPI

  • Entre os 550 itens do MMPI (teste de personalidade), 507 (92%) mostraram diferenças significativas por sexo
    • Alguns itens permitem explicar claramente diferenças marcantes de tendência, enquanto outros têm motivos complexos ou impossíveis de explicar
  • Como esses resultados aparecem em estudos de grande escala com amostras muito grandes, tratam-se de fenômenos reais, e não de erro estatístico (type I error)

Correlações nas ciências sociais e os limites da validação teórica

  • Mesmo combinando aleatoriamente uma teoria qualquer com pares de variáveis, se a correlação média (crud factor) estiver em torno de 0,30, é possível encontrar uma diferença significativa em praticamente uma a cada três tentativas
    • Isso ocorre com muito mais frequência do que o nível de significância (0,05) normalmente considerado relevante nas ciências sociais
  • Como correlações aparecem facilmente até em pares de variáveis que o pesquisador não previu teoricamente, é difícil sustentar uma relação causal substantiva apenas com significância estatística
  • Causas complexas (genes/ambiente) e a riqueza dos dados observacionais produzem essas correlações em muitas direções

Conclusão prática

  • Ao interpretar dados de ciências sociais e validar teorias, é preciso sempre ter em mente as “correlações comuns, mas realmente existentes” geradas pelo ‘crud factor’
  • Em vez de confiar cegamente em estatísticas de significância (ex.: p<0,05), é necessário adotar uma abordagem que foque mais na causalidade substantiva entre variáveis e na interpretação de padrões
  • Como no aforismo de Thorndike, “todas as coisas boas tendem a vir juntas”, no mundo real há coisas demais entrelaçadas entre si

Ainda não há comentários.

Ainda não há comentários.