Análise de dados com SQL: médias

pexels-photo-616353.jpeg
Foto por Lukas (Pexels)

Estatística: a ciência que diz que se você comeu um frango e eu não comi nenhum então teremos comido meio frango cada um, em média. (Dino Segre)

Este é o segundo artigo sobre como utilizar a linguagem SQL para realizar análise de dados, tratando agora de médias. Em sua primeira versão foi publicado junto com distribuição de frequências mas acréscimos no artigo original fizeram com que fosse necessário dividi-lo em dois, cada um tratando de um assunto. Clique aqui para entrar na média

Análise de dados com SQL: distribuição de frequências

pngwing

Alguns artigos que relacionam as habilidades desejadas para um cientista de dados destacam SQL como uma das 3 linguagens que deve conhecer, sendo R e Python as duas outras.

Este é o primeiro artigo sobre como utilizar a linguagem SQL para realizar análise de dados, tratando de distribuição de frequências.
Clique aqui para ler o artigo

Índice de cobertura (covering index)

Em vários artigos na web e na documentação do SQL Server são fornecidas dicas de como criar índices para atender às junções definidas na cláusula “FROM/ON” ou ainda aos predicados da cláusula WHERE. Mas o que nem sempre esses textos explicam é sobre os critérios que o otimizador de consultas (query optimizer, vide artigo O Plano Perfeito) utiliza para que um índice seja escolhido ao criar o plano de execução da consulta. clique aqui para ir até a cobertura

Qual é mais rápido: NOT IN ou NOT EXISTS?

p037_a_minus_bQual a melhor forma de obter relação dos produtos que não foram vendidos nos últimos 7 dias, de modo a avaliar estratégias de promoção desses produtos?

Ou seja, como saber quais elementos estão no conjunto A mas não estão no conjunto B. clique aqui para me ajudar a descobrir qual é a melhor forma

Como datas & horas são armazenadas no SQL Server?

Com frequência tenho visto dúvidas sobre como o SQL Server armazena colunas com tipo de dados que contenha data e/ou hora. Recentemente li em tópico de fórum alguém mencionando que a data é armazenada de acordo com o idioma do sistema operacional. 😮

Se (não) é assim, então como são armazenados data & horário no banco de dados? Continue Lendo “Como datas & horas são armazenadas no SQL Server?”

Programação e otimização de consultas distribuídas (linked server)

Consultas distribuídas são aquelas em que são acessadas múltiplas fontes de dados, heterogêneas ou não, sendo que essas fontes de dados podem estar no mesmo computador ou mesmo em computadores diferentes; sistemas operacionais similares ou diferentes; mesmo gerenciador de banco de dados ou gerenciadores de bancos de dados diferentes.

clique aqui para ler o artigo

Obter o enésimo elemento de uma lista

Sabe aquelas colunas cujo conteúdo é uma lista composta de diversos valores, separados por algum caractere? Algo assim:

'Rua|Santos e Almeida|180||Centro|98900-300|Caripibuna|XX'

E então, como obter o enésimo elemento sem ter que fazer “string split” de todo o conteúdo da coluna?
clique aqui para ler o artigo

Crie seu site com o WordPress.com
Comece agora