Wednesday, 8 November 2017

Dichotomous Variables In Stata Forex


Tarefa 2c: Como usar o código Stata para executar a regressão logística Neste módulo, você usará regressão logística simples para analisar os dados da NHANES para avaliar a associação entre gênero (riagendr) com a exposição ou variável independente e a probabilidade de ter hipertensão (baseada No bpxsar. Bpxdar) mdash o resultado ou variável dependente, entre os participantes com 20 anos ou mais. Em seguida, você usará regressão logística múltipla para avaliar o relacionamento depois de controlar as covariáveis ​​selecionadas. As covariáveis ​​incluem idade (ridageyr), colesterol (lbxtc), índice de massa corporal (bmxbmi) e triglicerídeos em jejum (lbxtr). Há várias coisas que você deve estar ciente ao analisar os dados da NHANES com a Stata. Consulte a página Stata Tips para analisá-las antes de continuar. Etapa 1: Use svyset para definir variáveis ​​de projeto de pesquisa. Lembre-se de que você precisa definir o SVYSET antes de usar a série SVY de comandos. O formato geral deste comando está abaixo: svyset wweightvar, psu (psuvar) strata (stratavar) vce (linearizado) Para definir as variáveis ​​de projeto de pesquisa para sua análise de colesterol, use a variável de peso para quatro-seu de dados MEC (wtmec4yr) A variável PSU (sdmvpsu) e a variável strata (sdmvstra). A opção vce especifica o método para calcular a variância e o padrão é quotlinearizedquot qual é a linearização de Taylor. Aqui está o comando svyset para anos de pele de dados MEC: svyset w wtmec4yr, psu (sdmvpsu) strata (sdmvstra) vce (linearizado) Passo 2: Criar variável dicotômica dependente Para variáveis ​​contínuas, você pode usar a variável no original Forma (contínua) ou alterando-a para uma variável categórica (por exemplo, com base em pontos de corte padrão, quartis ou prática comum). As variáveis ​​categóricas devem refletir a distribuição subjacente da variável contínua e não criar categorias onde há apenas algumas observações. Para a variável dependente, você criará uma variável dicotômica, hiperativa. Que define as pessoas como tendo (ou não tendo) hipertensão. Especificamente, uma pessoa diz ter hipertensão se sua pressão arterial sistólica (medida no MEC) exceder 140 ou sua pressão arterial diastólica exceder 90 ou se estiverem tomando medicação para pressão arterial. Lembre-se de que a regressão logística funcione no Stata, esta variável precisa ser definida como 0 (o resultado não ocorreu, aqui a pessoa não tem hipertensão) ou 1 (o resultado ocorre, aqui a pessoa possui hipertensão). O código para criar esta variável está abaixo: gen hyper1 if (bpxsargt140 amp bpxsarlt. Bpxdargt90 amp bpxdarlt.) Bpq050a1 substituir hyper0 se hyper 1 amp (bpxsar. Amp bpxdar.) Etapa 3: criar variáveis ​​categóricas independentes Além de criar o dependente dicotômico Variável, este exemplo também criará variáveis ​​categóricas independentes adicionais (idade, hichol, bmigrp) das variáveis ​​categóricas idade, colesterol e IMC a serem usadas nesta análise. Código para gerar variáveis ​​categóricas independentes Etapa 10: Pós-estimativa Você pode querer saber se diferentes comparações (além das categorias de referência que você especificou) são significativas. Nesse caso, você pode usar um comando de pós-estimativa (ou seja, um comando que só pode ser executado depois de ter executado o comando do modelo logit). Isso assume a forma geral, se você não quer o Wald F: teste vargroup não ajustado. Este exemplo usará este comando para testar que a faixa etária mais jovem possui uma probabilidade diferente estatisticamente significativa de ter hipertensão do que a faixa etária mais velha: teste Iage1 Iage3, nosvyadjust Os resultados para este exemplo são: AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Estatal dando um presente Stata FAQ Como posso realizar uma análise fatorial com variáveis ​​categóricas (ou categóricas e contínuas) Métodos padrão de análise fatorial (ou seja, baseados em uma matriz de Correlações Pearsons) assumem que as variáveis ​​são contínuas e seguem uma distribuição normal multivariada. Se o modelo inclui variáveis ​​que são dicotômicas ou ordinais, uma análise fatorial pode ser realizada usando uma matriz de correlação policaróica. Em Stata podemos gerar uma matriz de correlações policaróicas usando o comando policarralizado escrito pelo usuário. Você pode encontrar e instalar o comando polychoric digitando findit polychoric na janela de comando Stata e seguindo as instruções na tela. Para obter mais informações sobre como localizar e instalar comandos escritos pelo usuário, consulte nossas Perguntas frequentes: Como eu uso findit para pesquisar programas e ajuda adicional. Observe que as variáveis ​​usadas com policarral podem ser binárias (01), ordinais ou contínuas, mas não podem ser nominais (categorias não ordenadas). Observe também que as correlações na matriz produzida pelo comando policarico não são todas correlações policortricas. Quando ambas as variáveis ​​possuem 10 ou menos valores observados, uma correlação policarólica é calculada, quando apenas uma das variáveis ​​assume 10 ou menos valores (ou seja, uma variável é contínua e outra categórica) é calculada uma correlação polyserial e se ambas as variáveis ​​tomam Em mais de 10 valores, uma correlação Pearsons é calculada. Uma vez que temos uma matriz de correlação policírica, podemos usar o comando factormat para realizar uma análise de fatores exploratórios usando a matriz como entrada, e não como variáveis ​​brutas. O conjunto de dados para este exemplo inclui dados em 1428 estudantes universitários e seus instrutores. O exemplo de análise inclui variáveis ​​dicotômicas, incluindo sexo do corpo docente (facsex) e nacionalidade do corpo docente (cidadão dos EUA ou cidadão estrangeiro, facnat) variáveis ​​categóricas ordenadas, incluindo classificação de faculdade (facrank), classificação do aluno (studrank) e grau (A, B, C, Etc.) e as variáveis ​​contínuas do salário da faculdade (salário), anos de ensino na Universidade do Texas (ano) e número de alunos na turma (nstud) nesta análise. Essas variáveis ​​foram selecionadas para representar uma gama de tipos de variáveis ​​(ou seja, dicotômicas, ordenadas categóricas e contínuas) e não formam necessariamente fatores substancialmente significativos. Abaixo, abrimos o conjunto de dados e geramos a matriz de correlação policorica para as oito variáveis ​​em nossa análise. Você pode notar que o comando policíclico corre um pouco mais lentamente do que Statas correlacionar e comandos de pwcorr, isso é normal. O comando polychoric não exibe o número de casos (com eliminação de lista) usado para gerar a matriz, mas armazena n in r (sumw) para que possamos usar o comando de exibição para visualizá-lo. Em seguida, usamos o comando matricial para armazenar a matriz de correlação policristalina (salva em r (R) pelo comando policarral) como r. Para que possamos usá-lo com o comando factormat. O comando factormat é seguido pelo nome da matriz que desejamos usar para a análise (ou seja, r). O quotoptionquot n (.) Dá o tamanho da amostra e é necessário. Utilizamos a opção de fatores (.) Para indicar que desejamos reter três fatores. O resultado da análise fatorial acima pode ser interpretado de forma semelhante a um modelo padrão de análise fatorial, incluindo o uso de métodos de rotação para aumentar a interpretabilidade.

No comments:

Post a Comment