Exploração e Visualização de Dados

Google Planilhas

Gilberto Sassi

IME/UFBA - OBEC

Google Planilhas

Planilha

Planilha de papel.

Planilha em tablet de argila.

Planilha

  • Estrutura tabular: informações distribuídas em células distribuídas pelas linhas e colunas.
  • Linhas identificadas por números.
  • Colunas identificadas por letras (maiúsculas).
  • Cada linha é uma observação.
  • Cada coluna é uma variável.

Planilha eletrônica

Surgiram na década de 1970.

LANPAR.

VisiCalc.

Lotus-1-2-3.

Google Planilhas

  • Desenvolvida em 2010 pela Quickoffice.
  • Em 2012, Google adquiriu Quickoffice.
  • Novo nome: Google Planilhas, Google Docs, e Google Apresentação.
  • Vinculadas a uma conta Google, com uso exclusivamente on-line.
  • Planilhas são salvas no Google Drive.

Google Planilhas
Exercício

  • Crie uma planilha uma pasta vazia no Google Drive para este curso e crie uma planilha com nome modulo_1: drive.google.com;
  • Crie duas abas;
  • Renomeie as duas abas;
  • Anote na primeira aba as informações sobre o seu núcleo familiar: nome, data de nascimento e idade;
  • Anote na segunda aba as informações sobre seus melhores amigos: nome, profissão e idade.

Arquivos .csv

  • Comma Separated Values: planilha em formato de texto com colunas separadas por um caracter.
  • Amplamente usado por órgãos gorvenarmentais como: IPEA, Banco Central do Brasil, IBGE, INEP, entre outros.

Sistema métrico

USADO NO BRASIL.

csv usado em países que adotam o sistema métrico.
Caracter Função
, separador decimal
; separador de colunas
. agrupador de milhar

Exemplo: dois mil reais e vinte e cinco centavos - 2.000,25.

Sistema imperial

USADO NOS EUA.

csv usado em países como Reino Unido, EUA e Canadá.
Caracter Função
. separador decimal
, separador de colunas
, agrupador de milhar

Exemplo: dois mil reais e vinte e cinco centavos - 2,000.25.

Importação de dados

  • xlsx: permite substituir planilha e novas páginas.
  • csv: permite incluir novas linhas, substituir planilha e novas páginas.
  • Arquivo > Importar.

Importação de dados.

Importação de dados
Exercício

  • Em sua planilha, importe as bases de dados editais-proprios-estados.csv em uma nova página, e em seguida importe editais-proprios-capitais-separador-virgula.csv.
  • Em sua planilha, importe a base de dados respostas.xlsx em novas páginas.

Congelamento de linhas/colunas e linhas de grade

  • Congelamento de linhas e/ou colunas: Ver > Congelar.
  • Linha de grade e fórmulas: Ver > Mostrar.

Congelamento de linhas/colunas.

Linhas de grade.

Formatação de células

  • Cor, Negrito, Itálico, Sublinhado e Bordas.
  • Alinhamento na horizontal e Mesclagem.
  • Formatação de números: moeda, porcentagem e casas decimais.
  • Alinhamento vertical, ajuste de texto e rotação de texto.
  • Fonte.

Formatação de texto.

Formatação
Exercício

Em sua planilha com as informação sobre os editais PNAB dos estados:

  • Coloque a primeira linha em negrito.
  • Formate o montante do edital como formatação monetária para o montante total do edital (v_1_5).
  • Coloque o número de páginas com duas casas decimais (n_page).
  • Mude a fonte para toda página.
  • Mude a cor de preenchimento e o ajuste de texto para o objeto do edital (v_1_4).

Tabela

  • Formatar > Converter para tabela.
  • Possível editar as configurações da tabela.
  • Possível editais as configurações das colunas.
  • Referência a células usando nome_tabela[nome_coluna].

Criando tabelas.

Tabela
Exercício

  • Adicione uma tabela chamada pnab_capitais na página pnab-capitais de sua planilha.
  • Modifique os formatos das colunas v_1_5 para moeda e v_1_7 para número.
  • Crie uma nova coluna montante_por_proposta usando a fórmula:
=pnab_capitais[v_1_5] / pnab_capitais[v_1_7]

(Dica: crie uma nova coluna clicando em \(\lor\) no nome da coluna na tabela.)

Fórmulas

Fórmulas

equações que executam cálculos ou transformações sobre valores anotados.

Podem conter:

  • operadores matemáticos: +, -, *, /, ^ (exponenciação).
  • operadores de comparação de valores: =, <> (diferente), <, >, >=, <=.
    • comparação de dois valores retorna VERDADEIRO ou FALSO.
  • : (dois pontos): todos os valores entre duas células.
  • Referências a células.
  • Funções.

Referência a células

  • Letra seguido de número. Exemplo: A2.
  • Dentro de uma tabela: nome_tabela[nome_coluna].
  • Intervalo de valores em uma linha: A2:Z2.
  • Intervalo de valores em uma coluna: A2:A100.

Para arrastar uma célula, clique e segure no pequeno círculo e mova o mouse.
  • Ao arrastar uma célula para esquerda ou direita, mudam as referências das colunas.
    • Para fixar a coluna, use $ antes da letra. Exemplo: $A2.
  • Ao arrastar uma célular para cima ou para baixo, mudam as referências das linhas.
    • Para fixar a linha, use $ antes do número. Exemplo: A$2.
  • Podemos ficar a célula (fixando a linha e a coluna). Exemplo: $A$2.
  • Para referenciar toda a coluna: a2:a ou a:a.

Funções

  • Realizam algumas ações pré-definidas.

Sintaxe:

=função(argumento1; argumento2;[argumento3];[argumento4])
  • argumentos: informações necessários para executar a ação.
  • argumentos são fornecidas em uma ordem pré-estabelecida e obrigatória.
  • argumentos com [] não são obrigatórios.
    • se não for fornecido, o Google Planilhas usa alguma valor padrão.

Exemplo:

=soma(c:c)

Funções de texto

Transformações em células com texto.

Textos em fórmulas precisam de aspas.


Algumas funções básicas:

  • maiúscula: coloca todas as letras em maiúscula.
  • minúscula: coloca todas as letras em minúscula.
  • pri.maiúscula: coloca apenas a primeira letra em maiúscula.
  • concatenar ou &: juntar dois textos.
  • núm.caract: retorna o número de caracteres no texto.
  • localizar(texto_para_procurar; texto_para_localizar):
    • primeira ocorrência de texto_para_procurar em texto_para_localizar.
  • esquerda(texto, n):
    • retorna os primeiros n caracteres.
  • direita(texto, n):
    • retorna os últimos n caracteres.

Funções de texto
Exercício

  • Para a página pnab-estados, crie uma nova coluna com todas as letras em minúsculas na coluna arquivo.
  • Para a página pnab-estados, crie uma nova coluna com a primeira letra em maiúscula na coluna v_6_1.
  • Para a página pnab-estados, crie uma nova coluna com os textos das colunas ente e região concatenados. Separe os textos por -.
  • Para a página pnab-estados, crie uma nova coluna com os valores da coluna arquivo sem o sufixo .pdf.

Outras funções de texto

  • PROCH: realiza pesquisa horizontal usando a primeira linha
  • PROCV: realiza pesquisa vertical usando a primeira coluna
  • CORRESP: retorna a posição de um item dentro de uma lista de células
  • ÍNDICE: retorna valor na i-ésimo linha e na j-ésima coluna
  • FILTER: retorna linhas de uma tabela segundo um ou mais critérios

PROCH

=PROCH(chave_pesquisa; intervalo; índice; [classificado])
  • chave_pesquisa: a valor a ser pesquisado na primeira coluna
  • intervalo: intervalo de dados
  • índice: linha com o valor retornado
  • classificado: 0 - correspondência exata e 1 - correspondência com valores aproximados. Padrão é 0.

chave_pesquisa será buscada na coluna verde e o valor retornado será buscada na coluna laranja.

Exemplo

Dados armazenados no intervalo A1:C3.
arquivo ente montante
00_pnab_999.pdf Acre R$1.000.000,00
00_pnab_998.pdf Acre R$1.500.000,00
=PROCH("montante"; A1:C3; 3; 0)

Resultado: R$1.500.000,00.

PROCH
Exercício

  1. Use a função PROCH para encontrar o montante (v_1_5) do edital para a terceira linha de pnab-capitais.
  2. Use a função PROCH para encontrar o número de propostas previstas (v_1_7) do edital para a quinta linha de pnab-capitais.

PROCV

=PROCH(chave_pesquisa; intervalo; índice; [classificado])
  • chave_pesquisa: a valor a ser pesquisado na primeira coluna
  • intervalo: intervalo de dados
  • índice: linha com o valor retornado
  • classificado: 0 - correspondência exata e 1 - correspondência com valores aproximados. Padrão é 0.

Exemplo

chave_pesquisa será buscada na coluna verde e o valor retornado será buscada na coluna laranja.
Dados armazenados no intervalo A1:C3.
arquivo ente montante
00_pnab_999.pdf Acre R$1.000.000,00
00_pnab_998.pdf Acre R$1.500.000,00
=PROCV("00_pnab_999.pdf"; A1:C3; 3; 0)

Resultado: R$1.500.000,00.

PROCV
Exercício

  1. Use a função PROCV para encontrar a terceira coluna para o edital 1600303_pnab_2.pdf de pnab-capitais.
  2. Use a função PROCV para encontrar a segunda coluna para o edital 1600303_pnab_2.pdf de pnab-capitais.
  3. Use a função PROCV para encontrar a quinta coluna para o edital 2927408_pnab_9.pdf de pnab-capitais.
  4. Use a função PROCV para encontrar a segunda coluna para o edital 2927408_pnab_9.pdf de pnab-capitais.

CORRESP

=CORRESP(chave_pesquisa; intervalo; [tipo_pesquisa])
  • chave_pesquisa: a valor a ser pesquisado no intervalo de dados
  • intervalo: intervalo de dados
  • classificado: 0 - correspondência exata e 1 - correspondência com valores aproximados. Padrão é 0.

Exemplo

chave_pesquisa será buscada na coluna verde.
Dados armazenados no intervalo A1:C3.
arquivo ente montante
00_pnab_999.pdf Acre R$1.000.000,00
00_pnab_998.pdf Acre R$1.500.000,00



=CORRESP("00_pnab_998.pdf"; A1:C3; 0)

Resultado: 3.

chave_pesquisa será buscada na linha verde.
Dados armazenados no intervalo A1:A3.
arquivo ente montante
00_pnab_999.pdf Acre R$1.000.000,00
00_pnab_998.pdf Acre R$1.500.000,00



=CORESP("ente"; A1:A3; 0)

Resultado: 2.

CORRESP
Exercício

  1. Em qual linha está o edital 3550308_pnab_2.pdf de pnab-capitais?
  2. Em qual linha está o edital 4205407_pnab_2.pdf de pnab-capitais?
  3. Em qual coluna está a variável v_1_7 de pnab-capitais?
  4. Em qual coluna está a variável v_1_5 de pnab-capitais?

ÍNDICE

=ÍNDICE(intervalo; linha; [coluna])
  • intervalo: intervalo de dados
  • linha: i-ésima linha
  • coluna: j-ésima coluna

Exemplo

Valor na segunda linha e na segunda coluna.
Dados armazenados no intervalo A1:C3.
arquivo ente montante
00_pnab_999.pdf Acre R$1.000.000,00
00_pnab_998.pdf Acre R$1.500.000,00



=ÍNDICE(A1:C2;2;2)

Resultado: Acre.

ÍNDICE
Exercício

  1. Use as funções CORRESP e ÍNDICE, para determinar o número de propostas (v_1_7) previstas no edital no 3550308_pnab_2.pdf.
  2. Use as funções CORRESP e ÍNDICE, para determinar o número de propostas (v_1_5) previstas no edital no 3550308_pnab_2.pdf.
  3. Use as funções CORRESP e ÍNDICE, para determinar o número de página (v_1_7) do edital 4205407_pnab_3.pdf.
  4. Use as funções CORRESP e ÍNDICE, para determinar a população (populacao) da capital que publicou o 4205407_pnab_3.pdf.

FILTER

=FILTER(intervalo; condição1; [condição2; ...])
  • intervalo: intervalo de dados (sem o cabeçalho)
  • condição1: critério envolvendo uma coluna para selecionar linhas.
    Exemplo: D1:D3 > 100000.

Essa função podem ter vários critérios.

Exemplo

Linhas que satisfazem montante > R$ 725.000,00.
Dados armazenados no intervalo A1:C6.
arquivo ente montante
00_pnab_999.pdf Acre R$ 1.000.000,00
00_pnab_998.pdf Acre R$ 1.500.000,00
00_pnab_997.pdf SP R$ 500.000,00
00_pnab_996.pdf RJ R$ 750.000,00
00_pnab_995.pdf AM R$ 700.000,00
=FILTER(A2:C6;C2:C6 > 725000)
Resultado de FILTER(A2:C6;C2:C6 > 725000).
arquivo ente montante
00_pnab_999.pdf Acre R$ 1.000.000,00
00_pnab_998.pdf Acre R$ 1.500.000,00
00_pnab_996.pdf RJ R$ 750.000,00

FILTER
Exercício

  1. Use a função FILTER para selecionar os editais do pnab-capitais com montante (v_1_5) maior que um milhão de reais.
  2. Use a função FILTER para selecionar os editais do pnab-capitais que preveem contemplar duas ou mais propostas (v_1_7).

Funções lógicas e de erro

  • SE: retorna valor conforme condição
  • SEERRO: retorna uma valor padrão se tiver erro na fórmula
  • ÉRROS: checa se uma célula contém algum erro #DIV/0!, #N/A, #NAME? , #NULL!, #NUM!, #VALOR! e #REF!.

Código Descrição do erro
#DIV/0! Erro de Divisão por Zero.
#N/A A fórmula não consegue encontrar o que você pediu para ela procurar.
#NAME? Não existe a função.
#ERROR! Erro na análise da fórmula. Exemplo: =SOMA(A1:A5 B1:B5).
#NUM! O cálculo resulta em um número inválido. Exemplo: =RAIZ(-1).
#REF! A fórmula faz referência a uma célula que não existe mais.

SE

=SE(condição; resultado1, resultado2)
  • condição: critério envolvendo uma coluna para selecionar linhas.
    Exemplo: C1 > 100000.
  • resultado1: valor retornado se condição for VERDADEIRO.
  • resultado2: valor retornado se condição for FALSO.

Exemplo


=SE(C1 >= 800000; "Muito alto", "Dentro do padrão")

Resultado: Muito alto.


=SE(C6 >= 800000; "Muito alto", "Dentro do padrão")

Resultado: Dentro do padrão.

ÉERROS E SEERRO

Exemplo de uso da função =ÉEROS.



=ÉERROS(D1) 

Resultado: VERDADEIRO.

=ÉERROS(D2) 

Resultado: FALSO.

Exemplo de uso da função =ÉEROS.



=SEERRO(C1;"Sem informação")

Resultado: Sem informação.

=SEERRO(C2;"Sem informação")

Resultado: R$ 100.000,00.

Validação de dados

Inputação de dados com controle de qualidade.

Dados > Validação de dados

Opções de validação:

  • Data
  • Menu suspenso (categorias)
  • Texto: email e URL
  • Número

Validação de dados no Google Planilhas.

Validação de dados
Tabelas

Validação de dados para colunas com categorias.

Cliquem em \(\lor\) no nome da coluna.

Editar tipo de coluna > Menu suspenso

Conceitos iniciais de Estatística

Conceitos iniciais

  • População: todos os elementos ou indivíduos alvo do estudo.
  • Amostra: parte da população.
  • Parâmetro: característica numérica da população. Usamos letras gregas para denotar parâmetros populacionais.
  • Estatística: função ou cálculo da amostra
  • Estimativa: característica numérica da amostra, obtida da estatística computada na amostra. Em geral, usamos uma estimativa para estimar o parâmetro populacional.
  • Variável: característica mensurável comum a todos os elementos da população.
  • Observação: um elemento ou indivíduo alvo do estudo.

Conceitos iniciais

Exemplo

Pesquisa de Fomento às Artes no Brasil.

  • População: todos os estados, todos municípios e o Distrito Federal.
  • Amostra: 96 entes - 69 cidades, 26 estados e o Distrito Federal.
  • Variável: ente publicou edital com recursos próprios (“sim” ou “não”).
  • Parâmetro: porcentagem de entes que publicaram editais com recursos próprios no Brasil.
  • Estatística: porcentagem de entes que publicaram editais com recursos próprios.
  • Estimativa: porcentagem de entes que publicaram editais com recursos próprios entre os 96 entes.
  • Observação: ente federativo que participou da pesquisa.

Classificação de variáveis

flowchart TD
  A[VARIÁVEL] == texto ==> B["`QUALITATIVA`"]
  A == número ==> C["`QUANTITATIVA`"]
  B == com ordem ==> D["`ORDINAL`"]
  D --> H["`Exemplo:
  <br/>
  Escala Likert`"]
  B == sem ordem ==> E["`NOMINAL`"]
  E --> I["`Exemplo:
  <br/>
  UF`"]
  C == parte decimal ==> F["`CONTÍNUA`"]
  F --> J["`Exemplo:
  <br/>
  Montante do edital
  `"]
  C == número inteiro ==> G["`DISCRETA`"]
  G --> K["`Exemplo:
  <br/>
  Número de propostas previstas
  `"]

Medidas de Resumo

Medidas de resumo

  • Estatísticas usadas em EDA (Exploratory Data Analysis).
  • Em alguns programas, também é chamado de métrica.

Medidas de posição

Um valor para sintetiza ou representa todos valores.

Média, Mediana, Moda, e Quantil.

Medidas de dispersão

Distribuição dos valores.

Variância, desvio padrão, amplitude e intervalo interquartílico.

Outras medidas de resumo

Mínimo, máximo, tamanho amostral, número de valores faltantes (células vazias), soma, frequência.

Como calcular

  • Usando fórmulas
  • Usando dinâmica

Tabela dinâmica

Medidas de resumo sem usar fórmulas com quatro inputações.

Inserir > Tabela dinâmica
  1. linhas: variável qualitativa. Estatística calculada por categoria.
  2. colunas: variável qualitativa. Estatística calculada por categoria.
  3. valores: estatística.
  4. filtros: exclusão de observações da análise.

Estatísticas disponíveis na Tabela dinâmica.
Estatística Descrição
SUM soma
COUNTA quantidade de células não vazias
COUNT quantidade de células com números
COUNTUNIQUE número de valores únicos
AVERAGE média
MAX máximo
MIN mínimo
Estatísticas disponíveis na Tabela dinâmica.
Estatística Descrição
MEDIAN mediana
PRODUCT multiplicação de todos os valores
STDEV desvio padrão - denominador n-1
STDEVP desvio padrão - denominador n
VAR variânca - denominador n-1
VARP variância - denominado n

Tabela de distribuição de frequências
exceto variável quantitativa contínua

  • Estatística: frequência.
  • Variável qualitativa e variável quantitativa.
Tabela de distribuição de frequência para uma variável qualitativa.
\(X\) frequência frequência relativa porcentagem
\(B_1\) \(n_1\) \(f_1=\frac{n_1}{n}\) \(100 \cdot f_1\%\)
\(B_2\) \(n_2\) \(f_2=\frac{n_2}{n}\) \(100 \cdot f_2\%\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\(B_k\) \(n_k\) \(f_k=\frac{n_k}{n}\) \(100 \cdot f_k\%\)
Total \(n=n_1+\cdots+n_k\) \(1\) \(100\%\)

Usando fórmula

Sintaxe

Contagem sem filtro:

=CONT.VALORES(coluna_identificacao)

Contagem com um filtro:

=CONT.SE(intervalo_de_criterio; criterio)

Contagem com um ou mais filtros:

=CONT.SES(intervalo_de_criterio1; criterio1;[intervalo_de_criterio1; criterio1; ...])

Exemplo

Contagem sem filtro:

=CONT.VALORES(pnab[arquivo])

Contagem com um filtro:

=CONT.SE(pnab[ente]; "São Paulo")

Contagem com um ou mais filtros:

=CONT.SES(pnab[ente];"São Paulo"; pnab[v_1_5]; ">=1000000")

Usando tabela dinâmica

  • valores: COUNTA
  • linhas: variável qualitativa.

Podemos filtrar usando filtros.

Tabela de distribuição de frequências
Exercício

  1. Construa uma tabela de distribuição de frequência a origem regional (regiao) dos editais PNAB publicados pelos estados usando a função CONT.SES.
  2. Conte o número de editais com recursos próprios publicados por cada capital usando a tabela dinâmica.
  3. Encontre de número total de páginas nos editais PNAB publicados pelos estados por cada região usando a tabela dinâmica.

Tabela de distribuição de frequências
Variável quantitativa contínua

X: variável quantitativa contínua

Tabela de frequências para a variável quantitativa contínua.
X Frequência Frequência relativa Porcentagem
\([l_0, l_1)\) \(n_1\) \(f_1 = \frac{n_1}{n}\) \(p_1 = f_1 \cdot 100\)
\([l_1, l_2)\) \(n_2\) \(f_2 = \frac{n_2}{n}\) \(p_2 = f_2 \cdot 100\)
\(\vdots\) \(\vdots\) \(\vdots\) \(\vdots\)
\([l_{k-1}, l_k]\) \(n_k\) \(f_k = \frac{n_k}{n}\) \(p_k = f_k \cdot 100\)
total \(n=n_1+\cdots+n_k\) \(1\) \(100\)
  • \(\text{menor valor de }X = l_0 \leq l_1 \leq \cdots \leq l_{k-1} \leq l_k = \text{maior valor de }X\)
  • \(n_i\) é número de valores de X entre \(l_{i-1}\) e \(l_i\)
  • \(l_0, l_1, \dots, l_k\) quebram o suporte da variável X (breakpoints).
  • \(l_0, l_1, \cdots, l_k\) são escolhidos de acordo com a teoria por trás da análise de dados

Recomendações:

  • crie \(k\) intervalos:
    • \(l_0, l_1, \cdots, l_k\) igualmente espaçados
    • \([l_0, l_1)\), \([l_1, l_2)\), \(\cdots\), \([l_{k-1}, l_k]\): intervalos com mesma quantidade de observações - use quantil
  • use a regra de Sturges para determinar o valor de \(k\):
    • \(k = 1 + \log2(n)\) onde \(n\) é tamanho da amostra
    • Se \(1 + \log2(n)\) não é um número inteiro, usamos \(k = \lceil 1 + \log2(n) \rceil\).
=1 + LOG(CONT.VALORES(pnab[arquivo]); 2)

Tabela de distribuição de frequências
Variável quantitativa contínua

Tabela de distribuição de frequências para variável quantitativa contínua.
número de páginas
notação matemática
número de páginas
notação simplificada
fórmula
[0, 20) de 0 a 20,01 =CONT.SES(pnab[n_page]; ">=0";pnab[n_page]; "<20")
[20, 30) de 20 a 30,01 =CONT.SES(pnab[n_page]; ">=20";pnab[n_page]; "<30")
[30, 40) de 30 a 40,01 =CONT.SES(pnab[n_page]; ">=30";pnab[n_page]; "<40")
[40, 50) de 40 a 50,01 =CONT.SES(pnab[n_page]; ">=40";pnab[n_page]; "<50")
[50, 60) de 50 a 60,01 =CONT.SES(pnab[n_page]; ">=50";pnab[n_page]; "<60";)
[60, \(\infty\)) mais de 60 =CONT.SES(pnab[n_page]; ">60")

Tabela de distribuição de frequências
variável quantitativa contínua

Exercício

  1. Qual o número de faixas/intervalos para o conjunto de dados dos editais PNAB dos estados? Use a Regra de Sturges.
  2. Construa uma tabela de distribuição de frequências o montante (v_1_5) dos editais PNAB dos estados usando os intervalos: [0, 250000), [250000, 500000), [500000, 750000), [750000, 1000000), [1000000, 1250000), [1250000, 1500000), [1500000, \(\infty\)).
  3. Construa uma tabela de distribuição de frequência para o número de páginas (n_page) dos editais com recursos próprios das capitais. Use a Regra de Sturges.

Tabela de distribuição de frequência
pergunta checkbox

  • campo de formulário que permite assinalar mais de uma opção
  • cada opção precisa ser sua própria categoria
  • vamos contar o número de sucesso em cada coluna

Usando Fórmula

Neste caso, use a fórmula CONT.SES.

Vamos fazer um exemplo com a pergunta linguagens_orgao. As alternativas dessa pergunta estão nas colunas: linguagens_orgao___1, \(\cdots\), linguagens_orgao___8.

Tabela de distribuição de frequência
pergunta checkbox

Exercício

  • Construa a tabela de distribuição de frequência para a natureza jurídica (v_1_10) permitida para as/os proponentes nos editais PNAB para estados.
  • Construa a tabela de distribuição de frequência para a modalidade de fomento (v_2_1) prevista nos editais com recursos próprios das capitais.

Quantil, percentil e quartil

Quantil de ordem de 10% para os editais PNAB dos estados.

Quantil de ordem de 90% para os editais PNAB dos estados.


Seu salário na realidade brasileira.

Nomenclatura

  • Primeiro quartil: quantil de ordem \(\frac{1}{4}\).
  • Segundo quartil: quantil de ordem \(\frac{2}{4}\) - mediana.
  • Terceiro quartil: quantil de ordem \(\frac{3}{4}\).

  • Primeiro decil: quantil de ordem 10%.
  • Segundo decil: quantil de ordem 20%.
  • Sétimo decil: quantil de ordem 70%.

  • Primeiro percentil: quantil de ordem 1%.
  • Segundo percentil: quantil de ordem 2%.
  • Vigésimo terceiro percentil: quantil de ordem 23%.

Quantil, percentil e quartil

Quartis

Primeiro quartil.

=QUARTIL(pnab_capitais[n_page]; 1)

Resultado: 24,75 páginas.

Segundo quartil.

=QUARTIL(pnab_cpaitais[n_page]; 2)

Resultado: 39 páginas.

Terceiro quartil.

=QUARTIL(pnab_capitais[n_page]; 3)

Resutlado: 55,75 páginas.

Percentis

Quantil de ordem 1%.

=PERCENTIL(pnab_capitais[n_page]; 1/100)

Resultado: 7 páginas.

Quantil de ordem 13%.

=PERCENTIL(pnab_capitais[n_page]; 13/100)

Resultado: 14,91 páginas.

Quantil de ordem 77%.

=PERCENTIL(pnab_capitais[n_page]; 77/100)

Resultado: 58,39 páginas.

Quantil, percentil e quartil
Exercício

  1. Calcule o primeiro quartil, o segundo quartil e o terceiro quartil para o montante (v_1_5) dos editais PNAB das capitais.
  2. Calcule o primeiro decil, o segundo decil, o oitavo decil e o nono decil para o número de propostas (v_1_7) dos editais com recursos próprios dos estados.
  3. Calcule o quantil de ordem 1% e o quantil de ordem 99% para o montante (v_1_5) dos editais PNAB dos estados.

Média

  • Centro de massa dos valores.
  • Como calcular: somar todos os valores e, em seguida, dividir esta soma pela quantidade de valores somados.

Interpretação de média.

Usando fórmula

Sintaxe

Média sem filtro:

=MÉDIA(intervalo)

Média com um filtro:

=MÉDIASE(intervalos;intervalo_de_criterio; criterio)

Média com um ou mais filtros:

=MÉDIASES(intervalo; intervalo_de_criterio1; criterio1;[intervalo_de_criterio1; criterio1; ...])

Exemplo

Média sem filtro:

=MÉDIA(pnab_capitais[n_page])

Média com um filtro:

=MÉDIASE(pnab_capitais[n_page];pnab_capitais[ente]; "São Paulo")

Média com um ou mais filtros:

=MÉDIASES(pnab_capitais[n_page]; pnab_capitais[ente];"São Paulo"; pnab_capitais[v_1_5]; ">=1000000")

Usando tabela dinâmica

  • valores: AVERAGE

Podemos filtrar usando filtros.

Média
Exercício

  1. Calcule o montante (v_1_5) médio dos editais com recursos próprios dos estados usando a função MÉDIA.
  2. Calcule o número médio de páginas (n_page) para os editais com recursos próprios com montante maior que um milhão de reais usando a função MÉDIASES.
  3. Calcule o numéro médio de propostas (v_1_7) médio dos editais com PNAB dos estados usando tabela dinâmica.
  4. Calcule o número médio do valor máximo (v_1_8) previsto nos editais PNAB dos estados para os editais com montante maior que um milhão de reais usando tabela dinâmica.

Mediana

  • Meio da fila ordenada.
  • Como calcular: ordenar os valores do menor ao maior valor, em seguida pela o valor que está no meio da fila.

Mediana.

Usando fórmula

Sintaxe

Mediana.

=MED(intervalo)

Exemplo

Mediana.

=MED(pnab_capitais[n_page])

Usando tabela dinâmica

  • valores: MEDIAN

Podemos filtrar usando filtros.

Mediana
Exercício

  1. Calcule o número mediano de páginas (n_page) nos chamamentos públicos com recursos próprios das capitais usando a função MED.
  2. Calcule o número mediano do montante total (v_1_5) nos chamamentos públicos com recursos próprios dos estados usando tabela dinâmica.

Variância e desvio padrão

Montante em 100 mil reais para cinco entes em 2022, 2023, 2024 e 2025.

Usando fórmula

Sintaxe

  • VAR(intervalo): média dos desvios aos quadrados.
  • DESVPAD(intervalo): raiz quadrada do resultado de VAR(intervalo).
    Usamos esse na prática.

Exemplo

Variância:

=VAR(pnab_capitais[n_page])

Resultado: 654,20 páginas ao quadrado.

Desvio padrão:

=DESVPAD(pnab_capitais[n_page])

Resultado: 25,58 páginas ao quadrado.


Usando tabela dinâmica

  • Variância: VAR.
  • Desvio padrão: STDEV

Variância e desvio padrão

  1. Calcule o desvio padrão do montante (v_1_5) para os editais PNAB dos estados.
  2. Calcule o desvio padrão do montante (v_1_5) para os editais PNAB das capitais.

Outras medidas de resumo

Sintaxe

  • MÍNIMO(intervalo): Mínimo
  • MÁXIMO(intervalo): máximo
  • CONT.VALORES(intervalo): tamanho amostral
  • CONT.NÚM(intervalo): quantidade de células com valores numéricos
  • SOMA(intervalo): soma

Exemplo

=MÍNIMO(pnab_capitais[n_page])

Resultado: 4.

=MÁXIMO(pnab_capitais[n_page])

Resultado: 145.

CONT.VALORES(pnab_capitais[arquivo])

Resultado: 108.

=CONT.NÚM(pnab_capitais[v_1_7])

Resultado: 103.

=SOMA(pnab_capitais[v_1_5])

Resultado: R$ 193.386.571,25.

Outras medidas de resumo
Exercício

  • Encontre o edital com o menor número de propostas previstas (v_1_7) para os editais com recursos próprios dos estados.
  • Encontre o edital com o maior montante (v_1_5) para os editais com recursos próprios dos estados.
  • Encontro valor total investido (v_1_5) nos editais com recursos próprios dos estados em 2023.

Gráficos

Gráfico de barras

Selecione a tabela de distribuição de frequências (colunas e porcentagem).

Inserir > Gráfico

Depois vá em Configuração > Gráfico de barras epilhadas

Gráfico de barras.
  • Série: selecione porcentagem.
    • No campo Cor de preenchimento escolha Branco.
    • Selecione a opção Legenda de dados. Em Cor de texto, Cor de texto é preto.
  • Série: selecione frequência.
    • No campo Cor de preenchimento, escolha uma cor adequada.
  • Legenda:
    • No campo Posição, escolha Nenhuma.
  • Linhas de grade: Escolha eixo horizontal.
    • Remova a seção da opção Linhas de grade principais.

Personalização do gráfico de barras.

Gráfico de barras
Exercício

  • Crie um gráfico de barras para a variável linguagem artística abarcada (v_3_2) para os editais PNAB dos estados.
  • Crie um gráfico de barras para a elos da rede produtiva (v_3_6) para os editais PNAB das capitais.

Gráficos de barras
Poucas categorias

  • Uma barra com 100%.
  • Pedaço de categoria corresponde a sua porcentagem.
  • Adequado para variável qualitativa com duas ou três categorias.

Selecione a tabela de distribuição de frequências (colunas e porcentagem).

Inserir > Gráfico

Selecione a opção Alternar linhas/colunas em Configuração.

Barra com 100%: cada cor representa uma categoria.

Gráfico de barras
Poucas categorias
Exercício

  • Crie um gráfico de barras empilhadas com uma única barra para a abrangência dos editais (v_3_1) com recursos próprios dos estados.
  • Crie um gráfico de barras empilhadas com uma única barra para o recorte dos editais (v_4_2) dos editais com recursos próprios das capitais.