Sunday 18 June 2017

Resumindo Data In Stata Forex


Bem-vindo ao Instituto de Pesquisa e Educação Digital Módulo de Aprendizado Stata Uma visão geral da sintaxe Stata Este módulo mostra a estrutura geral dos comandos Stata. Vamos demonstrar isso usando resumir como um exemplo, embora esta estrutura geral se aplique à maioria dos comandos do Stata. Nota: Este código foi testado em Stata 12. Permite primeiro usar o arquivo de dados automático. Como você viu, podemos digitar resumir e nos dará estatísticas de resumo para todas as variáveis ​​no arquivo de dados. Também é possível obter meios para variáveis ​​específicas. Por exemplo, abaixo, obtemos estatísticas de resumo apenas por mpg e preço. Poderíamos ainda dizer à Stata que limite as estatísticas resumidas aos carros estrangeiros, adicionando um se qualificador. O qualificador se pode conter mais de uma condição. Aqui, pedimos estatísticas resumidas para os carros estrangeiros que recebem menos de 30 milhas por galão. Podemos usar a opção de detalhes para pedir a Stata para nos dar mais detalhes nas estatísticas de resumo. Observe que a opção de detalhes vai após a vírgula. Se a vírgula fosse omitida, Stata daria um erro. Note-se que mesmo que construíssemos essas partes um de cada vez, elas não precisam ir juntas. Vamos ver outras formas do comando de resumo. Você pode dizer a Stata quais números de observação você deseja usar no qualificador. Aqui, solicitamos resúmenes das observações 1 a 10. Isto é útil se você possui um grande arquivo de dados e deseja testar um comando em um subconjunto de observações. Além disso, lembre-se de que você pode pedir à Stata que realize resumos para carros estrangeiros e domésticos usando separadamente. como mostrado abaixo. Revise todas essas peças. Um comando pode ser precedido com um prefixo, conforme mostrado abaixo. Há muitas partes que podem vir após um comando. Cada um deles é apresentado separadamente abaixo. Por exemplo, resumir seguido pelo nome das variáveis. Resumir com a especificação de uma série de registros a serem resumidos. Resumir com simples, se especificando registros para resumir. Resuma com complexo se especificando registros para resumir. Resumir seguido de opção (s). Assim, colocando tudo em conjunto, a sintaxe geral do comando de resumo pode ser descrita como: Compreender a sintaxe geral dos comandos do Stata ajuda a lembrá-los e usá-los de forma mais eficaz, e também ajuda você a entender os arquivos de ajuda no Stata. Toda a coisa extra. Se e dentro poderia ser confuso. Vamos dar uma olhada no arquivo de ajuda para resumir. Faz mais sentido saber o que o by. Se e em partes significam. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia. Bem-vindo ao Instituto de Pesquisa e Educação Digital Stata Annotated Output Estatística descritiva usando o comando de resumo Esta página Mostra um exemplo de obter estatísticas descritivas usando o comando de resumo com notas de rodapé explicando a saída. No primeiro exemplo, obtemos as estatísticas descritivas para uma variável de 1 (dummy) chamada fêmea. Essa variável é codificada 1 se o aluno for feminino e 0 de outra forma. No segundo exemplo, obtemos as estatísticas descritivas para uma variável contínua chamada escrever. Qual foi a pontuação que os alunos receberam em um teste de escrita. Usamos a opção de detalhes para obter informações adicionais, incluindo percentis, skewness e kurtosis. Você não precisa usar a opção de detalhes com todas as variáveis ​​contínuas. uma. Variável - Esta coluna indica qual variável está sendo descrita. Você pode listar mais de uma variável após o comando de resumo quando você faz, você verá cada variável em sua própria linha da saída. B. Obs - Esta coluna informa o número de observações (ou casos) que foram válidas (ou seja, não faltam) para essa variável. Se você tivesse 200 observações em seu conjunto de dados, mas você tinha 10 valores faltantes para a variável feminina, então o número dessa coluna seria 190. c. Média - Esta é a média da variável. Nesse caso, nossa variável feminina varia de 0 a 1 (os valores mínimo e máximo), de modo que a média é na verdade a proporção de observações codificadas como 1. d. Std. Dev. - Este é o desvio padrão da variável. Isso fornece informações sobre a disseminação da distribuição da variável. E. 1 - Este é o primeiro percentil. Os percentis são calculados ordenando os valores de uma variável do mais baixo para o mais alto e, em seguida, encontrando o valor que corresponde a qualquer porcentagem em que você esteja interessado, neste caso. 1. Portanto, 1 dos valores da variável escrever são iguais ou Menos de 31. f. 25 - Este é o percentil 25, também conhecido como o primeiro quartil. G. 50 - Este é o percentil 50, também conhecido como a mediana. Se você classificar os valores da variável de menor para o mais alto, a mediana seria o valor exatamente no meio. Em outras palavras, metade dos valores estaria abaixo da mediana, e metade ficaria acima. Esta é uma boa medida de tendência central se a variável tiver outliers. H. 75 - Este é o 75º percentil, também conhecido como o terceiro quartil. Eu. Menor - Esta é uma lista dos quatro valores mais pequenos da variável. Neste exemplo, os quatro valores mais pequenos são todos 31. j. Maior - Esta é uma lista dos quatro maiores valores da variável. Neste exemplo, os quatro maiores valores são todos 67. b. Obs - Esta coluna informa o número de observações (ou casos) que foram válidas (ou seja, não faltam) para essa variável. Se você tivesse 200 observações em seu conjunto de dados, mas você tinha 10 valores faltantes para a variável feminina, então o número dessa coluna seria 190. k. Soma de Wgt. - Esta é a soma dos pesos. Em Stata, você pode usar diferentes tipos de pesos em seus dados. Por padrão, cada caso (ou seja, assunto) recebe um peso de 1. Quando esse padrão é usado, a soma dos pesos será igual ao número de observações. C. Média - Esta é a média aritmética nas observações. É a medida mais utilizada da tendência central. É comumente chamado de média. A média é sensível a valores extremamente grandes ou pequenos. D. Std. Dev. - Este é o desvio padrão da variável. Isso fornece informações sobre a disseminação da distribuição da variável. eu. Variância - Este é o desvio padrão quadrado (ou seja, elevado para a segunda potência). É também uma medida de disseminação da distribuição. M. Skewness - Skewness mede o grau e a direção da assimetria. Uma distribuição simétrica, como uma distribuição normal, possui uma afinidade de 0, e uma distribuição que está inclinada para a esquerda, e. Quando a média é menor do que a mediana, tem uma negatividade negativa. N. Kurtosis - Kurtosis é uma medida do peso das caudas de uma distribuição. Uma distribuição normal tem uma curtose de 3. As distribuições de cauda pesada terão uma curste maior que 3 e as distribuições ligeiras terão uma curta cursite inferior a 3. (Por favor, note que há mais de uma maneira de calcular a curtosis, por favor veja nossas FAQ Obter valores diferentes de Kurtosis em SAS, Stata e SPSS O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment