Uma introdução à estatística descritiva: uma revisão e um guia prático PDF

Title Uma introdução à estatística descritiva: uma revisão e um guia prático
Course Estatística Descritiva
Institution Universidade do Anhembi Morumbi
Pages 7
File Size 261.8 KB
File Type PDF
Total Downloads 59
Total Views 119

Summary

Tradução do artigo "An introduction to descriptive statistics: A review
and practical guide"...


Description

Radiografia (2010) 16, e1ee7

disponível em www. sci c ed irect. com

Página inicial do j ou rnal: www. elsevier. c om / locate / radi

ARTIGO DE REVISÃO

Uma introdução à estatística descritiva: uma revisão e um guia prático Gill Marshall*Leon Jonker Faculdade de Saúde, Ciências Médicas e Assistência Social, Universidade de Cumbria, Bowerham Road, Lancaster LA1 3JD, Reino Unido

Recebido em 28 de maio de 2009; revisado em 27 de novembro de 2009; aceito em 3 de janeiro de 2010 Disponível online em 6 de fevereiro de 2010

PALAVRAS-CHAVE

Estatísticas descritivas; Níveis de medição; Medidas de central tendência;

Dispersão; Distribuição normal;

Desvio padrão

Resumo Este artigo, o primeiro de dois, demonstra por que é necessário que os radiologistas entendam conceitos básicos de estatística tanto para assimilar o trabalho de outros quanto em seu próprio trabalho de pesquisa. À medida que aumenta a ênfase na prática baseada em evidências, se tornará mais urgente para os radiologistas serem capazes de dissecar as pesquisas de outras pessoas e contribuir para as próprias pesquisas. Os diferentes tipos de dados que podem ser encontrados são abordados aqui, bem como as diferentes maneiras de descrever os dados. Além disso, são explicados a terminologia estatística e os métodos utilizados que compõem a estatística descritiva, incluindo níveis de medição, medidas de tendência central (média) e dispersão (spread) e o conceito de distribuição normal. Este documento revisa a literatura relevante, fornece uma lista de verificação de pontos a serem considerados antes de avançar com a aplicação de métodos estatísticos apropriados a um conjunto de dados e fornece um glossário de termos relevantes para referência.

ª 2010 The College of Radiographers. Publicado pela Elsevier Ltd. Todos os direitos reservados.

Introdução A dificuldade em compreender as estatísticas é uma das barreiras relatadas com mais frequência, impedindo os enfermeiros de aplicar os resultados da pesquisa à sua prática, limitando assim a oportunidade de empreender uma prática baseada em evidências de pesquisa.1e3 É provável que isso também se aplique a outras profissões da área de saúde, como a radiografia. Na verdade, os autores deste

* Autor correspondente. Tel .:º44 1524 384384x2246; fax:º44 1524 384385. Endereço de e-mail: [email protected] (G. Marshall).

a revisão começou sem um diploma formal de especialista em estatística. A intenção aqui é demonstrar que uma apreciação das estatísticas pode ser obtida por meio do autodidatismo e do acesso à literatura destinada a pesquisadores novatos ou corpo clínico e profissionais de saúde aliados que talvez nunca tenham sido expostos a aulas estatísticas aprofundadas durante seu período formal educação, para assim compreender melhor as estatísticas. Para ajudar ainda mais o leitor em seu caminho, os autores apresentarão a terminologia estatística relevante e os elementos básicos da aplicação da estatística. Os autores desejam enfatizar que, com tarefas estatísticas mais complexas, deve-se sempre considerar entrar em contato com um estatístico qualificado para suporte e feedback, de preferência antes

1078-8174 / $ - ver matéria inicial ª 2010 The College of Radiographers. Publicado pela Elsevier Ltd. Todos os direitos reservados. doi: 10.1016 / j.radi.2010.01.001

e2 iniciar a coleta de dados para garantir que os dados a serem coletados sejam apropriados.

Estatísticas em radiografia A mensuração de parâmetros na assistência médica é um dos primeiros pontos para facilitar a melhoria da qualidade.4 Embora certamente não seja necessário que os radiologistas sejam estatísticos totalmente qualificados, é desejável um conhecimento prático de estatística para poder avaliar e compreender as implicações da pesquisa para que os radiologistas evoluam sua prática. Além disso, se um radiologista está realizando um projeto de pesquisa, ele / ela deve ser estatisticamente alfabetizado para interagir com outros pesquisadores e estatísticos e, a fim de garantir que um projeto tenha o melhor desenho metodológico, que pode incluir a seleção de metodologia estatística apropriada que testará uma hipótese predeterminada ; além disso, este teste deve ser realizado de forma adequada.1

A qualidade da educação estatística fornecida aos alunos enquanto eles estão em um curso ou tirando um diploma é relatada na literatura como inadequada. Além disso, os alunos logo esquecem o que lhes foi ensinado, principalmente se não for aplicado.5,6 Esses dois cenários constituem uma barreira para a compreensão dos artigos de pesquisa. Informar alguém sobre como ler e dissecar estatísticas é considerado mais eficaz quando os conceitos estatísticos são ensinados primeiro, antes de começar o ensino de '' como realizar '' as estatísticas.7 À medida que a radiografia se esforça para se tornar uma profissão autônoma, ela deve "conquistar uma base de conhecimento que seja dinâmica e com visão de futuro"8 e isso claramente precisa do conhecimento das estatísticas lidas por radiologistas em artigos ou aplicadas a seus próprios estudos. Alega-se que “a medicina de hoje é tão boa quanto a pesquisa de quinze anos atrás”, mostrando o tempo considerável gasto entre as descobertas da pesquisa sendo relatadas e sua filtragem na prática clínica.6 Embora o objetivo da prática baseada em evidências seja estreitar a teoriaelacuna prática por meio de evidências da pesquisa informando a prática, parece que a pesquisa às vezes não é apresentada de uma forma que seja amigável e compreensível para os profissionais, que consequentemente não irão ou não podem aplicá-la em sua prática diária.9 Cabe, portanto, aos pesquisadores pensar sobre seu público, ao publicar, para que seus resultados sejam clinicamente relevantes e significativos. Em um estudo de Welch e Gabbe em 1996, 32% dos artigos eram desprovidos de estatísticas ou afirmavam significância nos resultados sem o uso de estatísticas.9 Um leitor com apenas um conhecimento de estatística descritiva normalmente compreenderá apenas 44,5% dos dados em artigos, enquanto aqueles com conhecimento de testes estatísticos comuns irão aumentar a taxa de acesso de compreensão de dados produzidos em artigos para 80,5%.9

G. Marshall, L. Jonker existem diferentes níveis de medição para variáveis de pontuação. Existem duas categorias principais: - Dados categóricos

- Dados contínuos Os dados categóricos podem ser divididos em quatro subcategorias: - Dados binários

Em tais casos, apenas dois resultados ou medições são possíveis. Por exemplo, se a sobrevivência dos pacientes for registrada, pode haver apenas dois resultadose sobrevivência ou morte. Outro exemplo é o preenchimento correto ou não do laudo radiológico. Esses dados geralmente são resumidos em proporções ou probabilidades. - Dados nominais

Embora este seja o tipo de dados menos robusto para categorizar dados em categorias mutuamente exclusivas, sem classificação hierárquica, este é, no entanto, um tipo de dados muito usado e valioso. Um exemplo poderia ser grupos sanguíneos, ou seja, O, A, B, AB, ou grupos distintos de profissões, por exemplo, radiologistas, radiologistas e enfermeiras. Ambos os dados binários e nominais podem ser representados ou armazenados pela atribuição de números às categorias (radiologistasZ 1, radiologistas Z 2 e enfermeiras Z 3, onde os números não têm significado numérico).11 Com esses dados, a medida de tendência central é a categoria com mais casos, conhecida como moda. - Dados ordinais

Aqui, os dados têm uma ordem ou hierarquia clara, mas não em uma escala calibrada, por exemplo, concordo totalmente, concordo etc., de uma escala chamada Likert com uma afirmação fornecida.12 Um exemplo é o nível de dor causado pela mamografia, por exemplo, nenhuma dor, leve desconforto, dor moderada, dor intensa. As categorias são mutuamente exclusivas e, como acima, os valores numéricos atribuídos às categorias não são medidas absolutas, mas ordenam os dados. Em dados ordinais, a medida de tendência central é chamada de mediana e a categoria que está no meio da descrição ordenada por classificação é, portanto, chamada de mediana. Escalas binárias, nominais e ordinais são consideradas variáveis discretas porque os dados são classificados em variáveis discretas não sobrepostas.13 - Dados de intervalo / proporção

Este é o tipo mais forte de dados, com os dados de proporção sendo

Tipos de dados

dados mais fortes do que os dados de intervalo, pois os dados de proporção

As estatísticas são usadas para demonstrar o significado dos dados e são

dados são obtidos pelo uso de uma escala calibrada para fornecer medições

baseadas em números, por exemplo, a frequência cardíaca do paciente

quantitativas, por exemplo, leituras de densidade de um densitômetro, peso

ou números atribuídos a atributos qualitativos, como a cor dos olhos. As

em quilogramas ou pressão arterial. Esses dados podem ser plotados em um

estatísticas podem ser usadas descritivamente para ilustrar as

histograma. Os dados de proporção ou intervalo podem ser resumidos pela

características de um grupo de observações, ou seja, os dados brutos;

média ou mediana (como uma medida de tendência central) dependendo da

isso é chamado de estatística descritiva.10 Em termos estatísticos,

distribuição. Para

têm um valor zero verdadeiro, enquanto os dados de intervalo não.14 Esses

e3

Uma introdução à estatística descritiva Para ilustrar o ponto, um exemplo de dados de intervalo seria uma pontuação de teste de QI. Razões dessas medidas não podem ser aplicadase um QI de 140 no sujeito 1 versus 70 no sujeito 2 não significa que o sujeito 1 é duas vezes mais inteligente do que o sujeito 2. Por outro lado, exemplos de dados de razão mostram que todos eles têm uma escala constante que inclui um zero, por exemplo, duzentos metros tem o dobro do comprimento de cem metros. Esses dados podem ser plotados em um histograma e o ponto médio da curva será novamente a medida da tendência central. Se uma variável é normalmente distribuída (ou seja, ela produz uma curva em forma de sino simétrica), a média, a mediana e o valor da moda serão aproximadamente iguais. Se o pesquisador vai realizar estatísticas inferenciais, isto é, testes que permitem ao pesquisador tirar inferências dos dados (cobertos em um artigo subsequente), deve-se decidir se os dados são normalmente distribuídos. Se for esse o caso, a média e o desvio padrão serão suficientes como estatísticas de resumo. Se os dados não forem distribuídos normalmente, as estatísticas de cinco ordens são usadas, ou seja, mínimo, primeiro quartil, mediana, terceiro quartil e máximo. O intervalo e o intervalo interquartil podem ser facilmente derivados desses, mas geralmente não são usados explicitamente como estatísticas de resumo. O resultado do teste determinará se o pesquisador pode usar estatísticas paramétricas ou estatísticas não paramétricas. Para dados de intervalo / razão de uma escala contínua, o intervalo, intervalo interquartil e desvio padrão são usados para relatar a propagação ou largura dos dados. Os

figura 1

Exemplo de dados com distribuição normal.

dados das escalas de intervalo ou razão são descritos como O intervalo e o intervalo interquartil podem ser facilmente derivados desses, mas geralmente não são usados explicitamente como estatísticas de resumo. O resultado do teste determinará se o pesquisador pode usar estatísticas paramétricas ou estatísticas não paramétricas. Para dados de intervalo / razão de uma escala contínua, o intervalo, intervalo interquartil e desvio padrão são usados para relatar a propagação ou largura dos dados. Os dados das escalas de intervalo ou razão são descritos como O intervalo e o intervalo interquartil podem ser facilmente derivados desses, mas geralmente não são usados explicitamente como estatísticas de resumo. O resultado do teste determinará se o pesquisador pode usar estatísticas paramétricas ou estatísticas não paramétricas. Para dados de intervalo / razão de uma escala contínua, o intervalo, intervalo interquartil e desvio padrão são usados para relatar a propagação ou largura dos dados. Os dados das escalas de intervalo ou razão são descritos como dados contínuos e assim fornece variáveis contínuas porque os dados representam um continuum subjacente onde há potencialmente um número infinito de valores.

Distribuição de dados Este artigo enfoca a metodologia estatística que pode ser aplicada para definir descritivamente os dados. Esses métodos são procedimentos numéricos ou técnicas gráficas, por exemplo, gráficos de barras, histogramas, polígonos de frequência e gráficos de pizza, usados para organizar, apresentar e descrever as características de uma amostra, por exemplo, fornecem um resumo das medidas das características. A estatística descritiva busca descrever o ponto médio de uma dispersão de pontuações, chamada de medida de tendência central, e a dispersão de pontuações que é chamada de dispersão, da qual a variância é um exemplo.14 Para entender isso, é necessário considerar os níveis de medição, porque certos testes (subsequentes) só funcionam com níveis de medição adequados. Se as medições forem feitas a partir de uma grande amostra aleatória, por exemplo, do peso de pacientes adultos com TC com contraste e um polígono de frequência é traçado dos resultados, é provável que uma curva em forma de sino seja produzida, o que mostra que as variáveis de uma amostra são normalmente distribuídas . Esta forma de sino é chamada de distribuição normal ou Gaussiana (Verfigura 1) A palavra 'normal' aqui significa que os dados estão em conformidade com um padrão de distribuição que permite matematicamente a aplicação de testes estatísticos paramétricos.

Medida hipotética de uma artéria de 100 pacientes, apresentada por meio de um histograma, com a curva em sino gaussiana destacando o padrão de distribuição normal.

Na radiografia, a distribuição normal das medidas pode ser vista ao traçar os tamanhos e volumes de certos

estruturas anatômicas, como o globo ocular, nervo óptico ou conforme mostrado em figura 1, estruturas vasculares. De modo geral, as medidas para tais estruturas não diferem muito entre as pessoas. No entanto, muitas vezes uma distribuição normal não é alcançada; valores discrepantes podem ser comuns, o que dará à curva do sino uma 'cauda' no lado esquerdo ou direito. Os exemplos aqui seriam um histograma do peso dos pacientes, onde a curva de distribuição seria inclinada em direção a um peso maior (a curva seria descrita como inclinada positivamente)e Veja também Figura 2 .

Os mesmos dados representados nos histogramas de figura 1 é resumido. Se os dados não apresentam uma distribuição normal, por exemplo, quando existem alguns outliers, a apresentação dos dados pode ser alterada para atingir uma distribuição normal. Um procedimento matemático comum para realizar é transformar dados logaritmicamente; não altera os dados reais, mas sim a maneira como são distribuídos em um gráfico e, portanto, facilita a análise dos dados como se fossem normalmente distribuídos. Se a normalização não for possível, testes não paramétricos apropriados devem ser aplicados aos dados. Os testes não paramétricos levam em consideração o fato de que os dados são distorcidos ou têm vários outliers e, portanto, são mais conservadores. Os estatísticos Altman e Bland ilustram esses pontos muito claramente em uma série de artigos curtos que publicaram ao longo dos anos no British Medical Journal.15e18 O desvio padrão é uma medida de quão espalhados os dados estão, a variância deles. Quanto mais estreito for o desvio padrão, mais próximo do ponto médio dos dados estarão todos os resultados.17 Sem citar a fórmula matemática por trás dele, o desvio padrão permite expressar a variância usando as mesmas unidades usadas para as observações ou medições. De um modo geral, aproximadamente 2/3 de todas as observações ou medições estão dentro de um desvio padrão da média (o topo do gráfico de distribuição emfigura 1), e 95% estão dentro de dois desvios padrão da média. O intervalo interquartil está se tornando mais comum em relatórios de estatísticas descritivas de dados contínuos. Essa estatística representa 50% intermediários da amostra mostrando sua dispersão e não é influenciada por outliers.18 tabela 1 contém exemplos do desvio padrão para os dois conjuntos de dados de exemplo, bem como

e4

G. Marshall, L. Jonker

B

UMA

Figura 2

Exemplos de dados com distribuição normal e enviesada. Estas são distribuições de dados hipotéticos para 60 pacientes em relação ao volume do globo ocular com distribuição normal (A) e peso corporal com distribuição enviesada negativamente (B), respectivamente.

o intervalo interquartil. Particularmente do desvio padrão, pode-se concluir que, para os dados de peso corporal, mais pontos de medição estão mais distantes da média.

UMA

Recolha e apresentação de dados É essencial esclarecer o tipo apropriado de dados necessários para responder à pergunta de pesquisa no estágio de concepção de um projeto de pesquisa, para que possam ser coletados. O nível de medição precisa ser identificado, permitindo a identificação do procedimento estatístico a ser utilizado e a tomada de decisão sobre o tamanho da amostra. As estatísticas descritivas são mais fáceis de realizar e interpretar e são uma forma útil de resumir dados e fornecer uma descrição da amostra.Figura 3 fornece outro exemplo de como resumir dados; neste caso, a relação hipotética entre duas medições do diâmetro das artérias brônquica e pulmonar para 100 pacientes. Os gráficos de caixa permitem uma visão geral clara das características de um conjunto de dados, conforme mostrado emFigura 3. A caixa representa o 25º e 75º valores percentuais, enquanto a barra dentro da caixa representa os 50º

percentil (mediana). Os 'bigodes' anexados à caixa representam os valores mais baixos e mais altos (o intervalo) dos dados, bar outliers extremos ou valores extremos.

B

Em última análise, a estatística descritiva não pode ser usada para demonstrar a análise causal que requer o uso de estatísticas inferenciais, que nos permitem generalizar de uma amostra para uma população maior. A análise de dados pode ser levada um passo adiante, inferindo a partir do grupo de amostra

tabela 1

Estatísticas descritivas de dois conjuntos de exemplos de

dados.

Volume (cm3)

Peso (kg)

Mediana

5,50 5,50

Desvio padrão

0,27 (5%)

76,75 73,00 13,34 (17%)

5,38e5,60

67,25e83,00

Quer dizer

(% da média)

Intervalo interquartil (25%e75%)

Figura 3

Apresentação da relação entre brônquica e

diâmetros da artéria pulmonar em formato de histograma (A) e gráfico de caixa (B).

e5

Uma introdução à estatística descritiva generalizações que podem ser aplicadas a uma população mais ampla, que

Referências

são chamadas de estatísticas inferenciais e estes são considerados em nosso segundo artigo.

A compreensão das estatísticas não é importante apenas para o pesquisador, mas os leitores da produção de pesquisa (manuscritos, relatórios, teses) precisam estar cientes do nível em que as variáveis são medidas, dos testes estatísticos usados e devem estar cientes de que o erro de procedimento estatístico por pesquisadores não é incomum.9 Normalmente, esse erro não está no cálculo do resultado do teste, que hoje em dia raramente é realizado manualmente, mas usando pacotes estatísticos como Excel, Minitab, Supastat e o abrangente e comumente usado SPSS (Statis...


Similar Free PDFs