Análise de dados com SQL: médias

pexels-photo-616353.jpeg
Foto por Lukas (Pexels)

Estatística: a ciência que diz que se você comeu um frango e eu não comi nenhum então teremos comido meio frango cada um, em média. (Dino Segre)

Este é o segundo artigo sobre como utilizar a linguagem SQL para realizar análise de dados, tratando agora de médias. Em sua primeira versão foi publicado junto com distribuição de frequências mas acréscimos no artigo original fizeram com que fosse necessário dividi-lo em dois, cada um tratando de um assunto. Clique aqui para entrar na média

Análise de dados com SQL: distribuição de frequências

pngwing

Alguns artigos que relacionam as habilidades desejadas para um cientista de dados destacam SQL como uma das 3 linguagens que deve conhecer, sendo R e Python as duas outras.

Este é o primeiro artigo sobre como utilizar a linguagem SQL para realizar análise de dados, tratando de distribuição de frequências.
Clique aqui para ler o artigo

Fragmentação de índices no SQL Server – além do básico

Esta é a segunda parte do artigo sobre fragmentação de índices no SQL Server e nela é demonstrada o impacto das instruções INSERT e DELETE no conteúdo e disposição das páginas que compõem a tabela. Bem ilustrado, com um passo a passo demonstrando a ocorrência da fragmentação do índice clustered enquanto a tabela é modificada.

Na publicação anterior (primeira parte) estão os dois capítulos iniciais deste artigo. Se você ainda não leu a parte inicial, acesse Fragmentação de índices – o básico pois é fundamental para a compreensão desta segunda parte do artigo. clique aqui para ler a segunda parte

Aprenda T-SQL com os melhores: Erland Sommarskog

Este artigo faz parte da série “Aprenda T-SQL com os melhores” em que relaciono publicações (artigos, livros, palestras, vídeos etc.) daqueles que considero os principais autores de publicações sobre T-SQL.
Este segundo artigo é sobre Erland Sommarskog; já leu ou ouviu comentários a respeito dele?

clique aqui para conhecer o segundo autor desta série

Fragmentação de índices no SQL Server – o básico

A fragmentação de índices no SQL Server é assunto antigo e recorrente em notas de blogs, em fóruns e também em grupos de sql server no telegram e no whatsapp.
Eu tinha lá minhas dúvidas e resolvi estudar o assunto, procurando conhecer as entranhas da fragmentação. O resultado é este artigo sobre fragmentação de índices no SQL Server, cuja publicação será dividida em partes.

Continue Lendo “Fragmentação de índices no SQL Server – o básico”

Ative o modo turbo nas funções de janela

No processo de melhora no desempenho de motores de automóveis uma das opções é acrescentar turbina que force a entrada de mais ar para as câmaras de combustão; é o turbocompressor. A partir do SQL Server 2016 é possível “instalar uma turbina”, melhorando o desempenho das funções de janela. clique aqui para acionar o modo turbo!

Aprenda T-SQL com os melhores: Itzik Ben-Gan

Quando em 2018 criei o Porto SQL foi definida uma seção para conter informações sobre aqueles que considero os principais autores de publicações sobre T-SQL. Entretanto, desde então ela está praticamente vazia, somente com referência curta a alguns autores. A seção está no menu Armazém, item Autores. Aliás, alguma vez você passou por lá?

Mas agora resolvi criar uma nova série de artigos em que relacionarei publicações (artigos, livros, palestras, vídeos etc.) desses autores. E inicio essa série por clique para conhecer o primeiro autor desta nova série

Otimização de funções de janela

A partir do SQL Server 2012 novas funções de janela foram implementadas, várias delas permitindo construir códigos SQL mais eficientes. Mas mesmo assim é necessário ficar atento a como otimizar o processamento das funções de janela e este artigo detalha algumas técnicas.
clique aqui para abrir as janelas

Índice de cobertura (covering index)

Em vários artigos na web e na documentação do SQL Server são fornecidas dicas de como criar índices para atender às junções definidas na cláusula “FROM/ON” ou ainda aos predicados da cláusula WHERE. Mas o que nem sempre esses textos explicam é sobre os critérios que o otimizador de consultas (query optimizer, vide artigo O Plano Perfeito) utiliza para que um índice seja escolhido ao criar o plano de execução da consulta. clique aqui para ir até a cobertura

Qual é mais rápido: NOT IN ou NOT EXISTS?

p037_a_minus_bQual a melhor forma de obter relação dos produtos que não foram vendidos nos últimos 7 dias, de modo a avaliar estratégias de promoção desses produtos?

Ou seja, como saber quais elementos estão no conjunto A mas não estão no conjunto B. clique aqui para me ajudar a descobrir qual é a melhor forma

Crie seu site com o WordPress.com
Comece agora