RIME/UFBA - OBEC
RR com versão pelo menos 4.1: cran.r-project.org.tidyverse e o pacote statBasics:
install.packages("tidyverse")install.packages("statBasics")R: REditorSupport.RO nome de um objeto precisa ter um significado. O nome deve indicar e deixar claro o que este objeto é ou faz.
R:
R. Por exemplo: c.(). Exceção: Coloque um espaço antes e depois de () quando usar if, for ou while.+, -, *, == e outros. Exceção: ^.Para mais detalhes, consulte: guia de estilo do tidyverse.
Mantenha uma estrutura (organização) consistente de diretórios em seus projetos.
dados: diretório para armazenar seus conjuntos de dados.
brutos: dados brutos.processados: dados processados.codigo_fonte: código fonte do seu projeto.figuras: figuras criadas no seu projeto.output: outros arquivos que não são figuras.legado: arquivos da versão anterior do projeto.notas: notas de reuniões e afins.relatorio (ou artigos): documento final de seu projeto.documentos: livros, artigos e qualquer coisa que são referências em seu projeto.Para mais detalhes, consulte esse guia do curso-r: diretórios e .Rproj.
RRR: S.R é uma linguagem derivada do S.S foi desenvolvido em fortran por John Chambers em 1976 no Bell Labs.S foi desenvolvido para ser um ambiente de análise estatística.S: permitir que usuários possam analisar dados usando estatística com pouco conhecimento de programação.RR na Nova Zelândia.R sob a licença “GNU General License”, o que tornou o R um software livre.R.RR.R for Data Science.R.Depois desse curso, comece por aqui: R for Data Science.
R:Error in log("G"): non-numeric argument to mathematical functionQual o resultado das seguintes operações?
RPacotes precisam estar instalados
pacmanpacman carrega os pacotespacman instala e depois carrega os pacotesRFunção: é uma ação e tem os seguinte componentes na ordem:
\[ \texttt{resultado <- } \overbrace{\texttt{nome_funcao}}^{\textit{nome da função}} \overbrace{(}^{\textit{parênteses}} \overbrace{\texttt{valor1},\quad \texttt{valor2}}^{\textit{argumentos posicionais}},\quad \overbrace{\texttt{nome1 = valor3},\quad \texttt{nome2 = valor4}}^{\textit{argumentos nomeados}} \overbrace{)}^{\textit{parênteses}} \]
Rmean usando a função help.log.pnab-capitais.xlsx (está na pasta dados/brutos/) usando a função read_xlsx.A função read_xlsx faz parte do readxl.
Rcharacter), número real (double), número inteiro (integer), número complexo (complex) e lógico (logical).vector (a estrutura de dados mais básica no R), matrix, array, list e data.frame (tibble no tidyverse).vector, matrix e array.list e data.frame (tibble no tidyverse).Neste curso, vamos usar vetores e dataframes.
c(...)primeiro_numero_inteiro:ultimo_numero_inteiroseq(from = a, to = b, by = c).double, integer e complex): Operações básicas (operação, substração, multiplicação e divisão ) realizada em cada elemento do vetor.Selecionando todos os elementos entre o primeiro e o quinto.
Adição (vetores númericos)
Substração (vetores numéricos)
Realize as seguintes operações envolvendo vetores:
tibble)RRtidy:
tibble: tibble(...) e tribble(....).As funçõestibble e tribble fazem parte do pacote tidyverse.
tibbleCódigo em R |
Descrição |
|---|---|
head() |
Mostra as primeiras linhas de um tibble |
tail() |
Mostra as últimas linhas de um tibble |
glimpse() |
Impressão de informações básicas dos dados |
operador $ |
Recupera uma coluna de dataframe |
Realize as seguintes operações no dataset iris:
irisirisirisSepal.Length de irisiris é toy dataset da linguagem: você pode usá-lo diretamente.
R| Valor | Descrição | O que é | Função para identificar |
|---|---|---|---|
NA |
Not Available | Valor faltante. | is.na() |
NaN |
Not a Number | Resultado do cálculo indefinido. | is.nan() |
Inf |
Infinito | Valor que excede o valor máximo que sua máquina aguenta. | is.inf() |
NULL |
Nulo | Valor indefinido de expressões e funções (diferente de NaN e NA) |
is.null() |
xlsx ou xlsreadxlread_xls: importação de arquivos .xlsread_xlsx: importação de arquivos .xlsxpath: caminho até o arquivo.sheet: especifica a planilha do arquivo que será lida.Para mais detalhes, consulte a documentação: documentação de read_xl.
xlsx ou xlsRows: 87
Columns: 14
$ nome <chr> "Luke Skywalker", "C-3PO", "R2-D2", "Darth Vader", "Le…
$ altura <dbl> 172, 167, 96, 202, 150, 178, 165, 97, 183, 182, 188, 1…
$ massa <dbl> 77.0, 75.0, 32.0, 136.0, 49.0, 120.0, 75.0, 32.0, 84.0…
$ cor_do_cabelo <chr> "Loiro", NA, NA, "Nenhum", "Castanho", "Castanho, Cinz…
$ cor_da_pele <chr> "Branca clara", "Ouro", "Branca, Azul", "Branca", "Cla…
$ cor_dos_olhos <chr> "Azul", "Amarelo", "Vermelho", "Amarelo", "Castanho", …
$ ano_nascimento <dbl> 19.0, 112.0, 33.0, 41.9, 19.0, 52.0, 47.0, NA, 24.0, 5…
$ sexo_biologico <chr> "Macho", "Nenhum", "Nenhum", "Macho", "Fêmea", "Macho"…
$ genero <chr> "Masculino", "Masculino", "Masculino", "Masculino", "F…
$ planeta_natal <chr> "Tatooine", "Tatooine", "Naboo", "Tatooine", "Alderaan…
$ especie <chr> "Humano", "Droide", "Droide", "Humano", "Humano", "Hum…
$ filmes <chr> "A New Hope; The Empire Strikes Back; Return of the Je…
$ veiculos <chr> "Snowspeeder; Imperial Speeder Bike", NA, NA, NA, "Imp…
$ naves_espaciais <chr> "X-wing; Imperial shuttle", NA, NA, "TIE Advanced x1",…
xlsx ou xlspnab-capitais.xlsx na linguagem R sob o nome pnab_capitais.pnab-estados.xlsx na linguagem R sob o nome pnab_estados.csv.csvAs unidades de medidas usadas no Brasil e EUA são diferentes.
| BR | EUA | |
|---|---|---|
| separador decimal | . |
, |
| agrupador de milhar | . |
, |
separador de colunas em arquivos .csv |
; |
, |
csvtidyverseread_csv: importação de arquivos .csv - sistema imperial (EUA)read_csv2: importação de arquivos .csv - sistema métrico (BR)path: caminho até o arquivo.Para mais detalhes, consulte a documentação: documentação.
csvRows: 87
Columns: 14
$ nome <chr> "Luke Skywalker", "C-3PO", "R2-D2", "Darth Vader", "Le…
$ altura <dbl> 172, 167, 96, 202, 150, 178, 165, 97, 183, 182, 188, 1…
$ massa <dbl> 77.0, 75.0, 32.0, 136.0, 49.0, 120.0, 75.0, 32.0, 84.0…
$ cor_do_cabelo <chr> "Loiro", NA, NA, "Nenhum", "Castanho", "Castanho, Cinz…
$ cor_da_pele <chr> "Branca clara", "Ouro", "Branca, Azul", "Branca", "Cla…
$ cor_dos_olhos <chr> "Azul", "Amarelo", "Vermelho", "Amarelo", "Castanho", …
$ ano_nascimento <dbl> 19.0, 112.0, 33.0, 41.9, 19.0, 52.0, 47.0, NA, 24.0, 5…
$ sexo_biologico <chr> "Macho", "Nenhum", "Nenhum", "Macho", "Fêmea", "Macho"…
$ genero <chr> "Masculino", "Masculino", "Masculino", "Masculino", "F…
$ planeta_natal <chr> "Tatooine", "Tatooine", "Naboo", "Tatooine", "Alderaan…
$ especie <chr> "Humano", "Droide", "Droide", "Humano", "Humano", "Hum…
$ filmes <chr> "A New Hope; The Empire Strikes Back; Return of the Je…
$ veiculos <chr> "Snowspeeder; Imperial Speeder Bike", NA, NA, NA, "Imp…
$ naves_espaciais <chr> "X-wing; Imperial shuttle", NA, NA, "TIE Advanced x1",…
Rows: 87
Columns: 14
$ nome <chr> "Luke Skywalker", "C-3PO", "R2-D2", "Darth Vader", "Le…
$ altura <dbl> 172, 167, 96, 202, 150, 178, 165, 97, 183, 182, 188, 1…
$ massa <dbl> 77.0, 75.0, 32.0, 136.0, 49.0, 120.0, 75.0, 32.0, 84.0…
$ cor_do_cabelo <chr> "Loiro", NA, NA, "Nenhum", "Castanho", "Castanho, Cinz…
$ cor_da_pele <chr> "Branca clara", "Ouro", "Branca, Azul", "Branca", "Cla…
$ cor_dos_olhos <chr> "Azul", "Amarelo", "Vermelho", "Amarelo", "Castanho", …
$ ano_nascimento <dbl> 19.0, 112.0, 33.0, 41.9, 19.0, 52.0, 47.0, NA, 24.0, 5…
$ sexo_biologico <chr> "Macho", "Nenhum", "Nenhum", "Macho", "Fêmea", "Macho"…
$ genero <chr> "Masculino", "Masculino", "Masculino", "Masculino", "F…
$ planeta_natal <chr> "Tatooine", "Tatooine", "Naboo", "Tatooine", "Alderaan…
$ especie <chr> "Humano", "Droide", "Droide", "Humano", "Humano", "Hum…
$ filmes <chr> "A New Hope; The Empire Strikes Back; Return of the Je…
$ veiculos <chr> "Snowspeeder; Imperial Speeder Bike", NA, NA, NA, "Imp…
$ naves_espaciais <chr> "X-wing; Imperial shuttle", NA, NA, "TIE Advanced x1",…
csveditais-proprios-capitais-separador-virgula.csv na linguagem R sob o nome editais_proprios_capitais.editais-proprios-estados.csv na linguagem R sob o nome editais_proprios_estados..csv (sistema métrico)write_csv2 é parte do pacote tidyverse.
.xlsxwrite_xlsx é parte do pacote writexl.
iris como uma planilha eletrônica em formato .csv sob o nome iris_novo.cars como uma planilha eletrônica em formato .xlsx sob o nome carros.cars é toy dataset da linguagem: você pode usá-lo diretamente.
|>|>Extensamente usado!
Executar
é exatamente a mesma coisa que executar
é exatamente a mesma coisa que executar
Argumentação e lógica para desenhar conclusões e predições.
A partir de alguns casos, desenham-se conclusões e predições.
Estudo de 96 entes federativos para análise do fomento às artes para todos os mais de 5 mil entes federativos do Brasil.
Controlamos o erro da generalização usando probabilidade.
Ideia: associar números (ou intervalo de números) a probabilidade.
Variável aleatória.
Exemplo: número de propostas previstas no edital.
Exemplo: montante do edital.
Existem diversas variáveis aleatórias (livros inteiros).
80% dos problemas na Estatística e Ciência de Dados são resolvidos com:
proba: Q(proba)
proba.Probabilidade sucesso: \(p\).
RProbabilidade de 11 cidades do Recôncavo Baiano ter cinema:
Probabilidade de até 11 cidades terem cinema:
Quantil de ordem 90%:
Resultado: até 17 cidades têm cinema.
Distribuição binomial quando \(n=1\) (apenas um caso).
Probabilidade da cidade tem plano de cultura:
Probabilidade de fracasso:
proba: Q(proba)
proba.RRIdeia: Encontrar \(LI\) e \(LS\) tal que
\[ LI \leq p \leq LS \]
\((LI, LS)\) é chamado de Intervalo de Confiança (IC).
Impossível sempre produzir um resultado correto!
| x1 | x2 | x3 | x4 | x5 | li | ls | média populacional |
|---|---|---|---|---|---|---|---|
| 1.087.275,5 | 1.096.954,5 | 1.038.384,7 | 814.844,4 | 994.600,3 | 864.030,4 | 1.106.399,8 | 1.000.000 |
| 1.106.477,3 | 1.081.319,5 | 980.918,3 | 730.007,0 | 1.006.096,7 | 795.298,8 | 1.111.347,7 | 1.000.000 |
| 1.057.375,2 | 1.004.580,4 | 1.015.741,2 | 1.043.156,5 | 960.345,0 | 969.462,3 | 1.049.089,2 | 1.000.000 |
| 992.654,2 | 861.297,3 | 869.332,4 | 923.160,5 | 947.289,2 | 850.628,5 | 966.583,0 | 1.000.000 |
| 915.118,4 | 891.148,0 | 951.570,9 | 966.368,9 | 984.664,2 | 894.436,0 | 975.017,4 | 1.000.000 |
| 929.756,1 | 968.857,0 | 833.684,3 | 924.946,7 | 922.264,8 | 854.197,8 | 959.233,6 | 1.000.000 |
RRrespostas <- read_xlsx("dados/brutos/resposta.xlsx")
p_load(statBasics)
respostas_cidades <- respostas |>
filter(tipo_ente == "Cidade") |>
filter(resposta_completa == "Resposta completa")
ic = ci_1pop_norm(respostas_cidades$valor_complementar_lab_numero, conf_level = 0.95, na.rm = T)
write_xlsx(ic, "output/ic_media_exemplo.xlsx")
icci_1pop_mean é uma função do pacote statBasics.
filter filtra observações de forma semelhante a função FILTER do Google Planilha, apenas substituímos = por ==.
na.rm = TRUE retira os valores faltantes antes de realizar os cálcullos.
write_xlsx (do pacote write_xl) salvará o dataframe ic como uma planilha eletrônica .xlsx.
# A tibble: 1 × 3
lower_ci upper_ci conf_level
<dbl> <dbl> <dbl>
1 -1192140. 8017389. 0.95
O valor total complementado nos editais LAB pelas cidades esteve entre -R$ 1.192.140,42 e R$ 8.017.388,84 com coeficiente de confiança 95%.
Em todos intervalos de confiança abaixo, use \(\gamma=99\%\).
v_1_5) médio nos editais com recursos próprios das capitais.v_1_7) nos editais com recursos próprios das capitais.n_page) nos editais com recursos próprios das capitais.valor_complementar_lpg_numero) nos municípios brasileiros.Rsucesso: categoria que indica o sucessovetor: vetor de textoIC para a proporção de cidades com plano de cultura com coeficiente de confiança 99%.
# A tibble: 1 × 3
lower_ci upper_ci conf_level
<dbl> <dbl> <dbl>
1 0 0.155 0.99
A proporção de cidades com plano de cultura no Brasil está entre 0% e 15,5%, com coeficiente de confiança 99%.
v_2_3__1) para os chamamentos públicos com recursos próprios das capitais. Use \(\gamma=95\)%.v_2_3__1) para os chamamentos públicos com recursos próprios dos estados. Use \(\gamma=90\)%.Objetivo:
Decidir entre \(H_0\) (hipótese nula) e \(H_1\) (hipótese alternativa) usando as evidências da amostra.
Decisão usando evidência na amostra:
Como temos uma tendência de continuar em \(H_0\) na ausência de evidências,escrevemos:
Podemos cometer dois erros ao decidir:
Não existe uma regra (estratégia) de decisão que minimiza \(\alpha\) e \(\beta\) simultaneamente.
\(\alpha\) e \(\beta\) são erros concorrentes.
Tradeoff entre \(\alpha\) e \(\beta\).
Encontrar regra de decisão satisfazendo:
\(\alpha\) é chamado de nível de significância.
Amostras com 10 editais.
Calculamos uma distância entre a média amostral e \(\mu_0\):
Esta distância é chamada de estatística de teste.
\(p\): proporção de amostras com estatística de teste mais extrema que a estatística de teste observada.
Equação matemática
\[ t_0 = \frac{(\bar{x}-\mu_0) \cdot \sqrt{n}}{s} \]
Equação matemática
| \(H_1: \mu - \mu_0<0\) | \(H_1: \mu - \mu_0>0\) | \(H_1: \mu - \mu_0\neq 0\) | |
|---|---|---|---|
| Equação | \(P(t_{n-1}<t_0 )\) | \(P(t_{n-1}>t_0 )\) | \(2 \cdot (1 - P(t_{n-1} < \lvert t_0 \rvert))\) |
alternative |
"less" |
"greater" |
"two.sided" |
Rvetor: coluna do dataframemu: número que compõe as hipóteses.alternative: um dos valores: “less”, “greater”, e “two_sided”.sig_level: nível de significânciana.rm: retirar os valores faltantes para fazer os cálculos? Por padrão, TRUE.Existe evidência que o valor complementado pelos municípios nos editais LAB ultrapassou 500 mil reais, em média, ao nível de significância 5%?
# A tibble: 1 × 7
statistic p_value critical_value critical_region alternative mu sig_level
<dbl> <dbl> <dbl> <chr> <chr> <dbl> <dbl>
1 1.39 0.0957 1.80 (1.796, Inf) greater 500000 0.05
Não podemos afirmar que o valor complementado nos municípios nos editais LAB ultrapassou 500 mil reais em média, ao nível de significância 5%.
Equação matemática
\[ z_0 = \frac{(\hat{p}-p_0) \cdot \sqrt{n}}{p_0 - p_0^2} \]
Equação matemática
| \(H_1: p - p_0<0\) | \(H_1: p - p_0>0\) | \(H_1: p - p_0\neq 0\) | |
|---|---|---|---|
| Equação | \(P(Z<z_0 )\) | \(P(Z>z_0 )\) | \(2 \cdot (1 - P(Z < \lvert z_0 \rvert))\) |
alternative |
"less" |
"greater" |
"two.sided" |
Rvetor: coluna do dataframe.proportion: número que compõe as hipótesessucesso: categoria que indica o sucessoalternative: um dos valores: “less”, “greater”, e “two.sided”sig_level: nível de significânciaExiste evidência que mais de 50% dos municípios brasileiros têm Plano de Cultura ao nível de significância 5%?
# A tibble: 1 × 7
statistic p_value critical_value critical_region alternative proportion
<dbl> <dbl> <dbl> <chr> <chr> <dbl>
1 0.602 0.274 1.64 (1.645, Inf) greater 0.5
# ℹ 1 more variable: sig_level <dbl>
Não temos evidência para afirmar que mais de 50% dos munícipios brasileiros têm Plano de Cultura, ao nível de singificância 5%.
planos_setoriais) para as artes? Use \(\alpha=5\%\).v_2_3__2)? Use \(\alpha=1\%\).Intervalo de Confiança para a diferença de médias.
vetor1: coluna do dataframe com os dados da população 1vetor2: coluna do dataframe com os dados da população 2conf_level: coeficiente de confiança.# A tibble: 1 × 3
lower_ci upper_ci conf_level
<dbl> <dbl> <dbl>
1 -3353130. 6131894. 0.95
A diferença entre a complementação realizada pelas cidades nos editais LAB e LPG está entre -R$ 3.365.059,51 e R$ 6.143.824,10, com coeficiente de confiança 95%.
v_1_5) médio dos editais PNAB das capitais das regiões Norte, Norte e Centro-Oeste e montante médio dos PNAB das capitais das regiões Sul e Suldeste. Use \(\gamma=99\%\).v_1_7) dos editais PNAB das capitais das regiões Norte, Norte e Centro-Oeste e número médio de propostas previstas dos PNAB das capitais das regiões Sul e Suldeste. Use \(\gamma=95\%\).Intervalo de Confiança para a diferença de proporções populacionais de sucesso.
Rvetor1: coluna do dataframe com os dados da população 1vetor2: coluna do dataframe com os dados da população 1sucesso: categoria que indica sucessoconf: coeficiente de confiançaIC para a diferença entre a proporção de entes que apoiam Circo (linguagens_orgao__3) entre cidades de pequeno porte (menos de 100 mil habitantes) e cidades de grande porte (mais de 100 mil habitantes).
respostas_cidades_pequeno_porte <- respostas_cidades |>
filter(populacao < 1e+5)
respostas_cidades_grande_porte <- respostas_cidades |>
filter(populacao >= 1e+5)
ic <- ci_2pop_bern(
respostas_cidades_pequeno_porte$linguagens_orgao___3 == "checked",
respostas_cidades_grande_porte$linguagens_orgao___3 == "checked",
conf_level = 0.99
)
ic# A tibble: 1 × 3
lower_ci upper_ci conf_level
<dbl> <dbl> <dbl>
1 -0.367 0.367 0.99
A diferença na porcentagem de entes que apoiam circo entre cidades de grande porte e cidades de pequento está entre -36,7% e 36,7% com coeficiente de confiança 99%.
v_3_2__3) entre as capitais das regiões Norte, Nordeste e Centro-Oeste e as capitais das regiões Sul e Sudeste. Use \(\gamma=95\%\).linguagens_orgao__4) entre cidades de pequeno porte (menos de 100 mil habitantes) e grande porte (mais de 100 mil habitantes). Use \(\gamma=99\%\).Equação matemática
\[ t_0 = \frac{\bar{x}_1 - \bar{x_2}}{\sqrt{\frac{s_1^2}{n_1} + \frac{s_2^2}{n_2}}} \]
Equação matemática
| \(H_1: \mu_1 - \mu_2<\Delta_0\) | \(H_1: \mu_1 - \mu_2>\Delta_0\) | \(H_1: \mu_1 - \mu_2\neq \Delta_0\) | |
|---|---|---|---|
| Equação | \(P(t_\nu<t_0 )\) | \(P(t_\nu>t_0 )\) | \(2 \cdot (1 - P(t_\nu < \lvert t_0 \rvert))\) |
alternative |
"less" |
"greater" |
"two.sided" |
\(\mu_1\) é a média populacional da população 1, \(\mu_2\) é a média populacional da população 2, e \(\nu\) é grau de liberdade pela correção de Welch.
Rvetor1: coluna do dataframe com os dados da população 1vetor2: coluna do dataframe com os dados da população 2alternative: um dos valores: “less”, “greater”, e “two.sided”delta: número que compõe as hipótesessig_level: nível de significânciaExiste diferença entre o valor complementado nos editais LAB e LPG para as cidades brasileiras? Use \(\alpha=5\%\).
\[ \begin{split} H_0 &: \mu_1 - \mu_2 = 0\\ H_1 &: \mu_1 - \mu_2 \neq 0 \end{split} \]
# A tibble: 1 × 7
statistic p_value critical_value critical_region delta alternative sig_level
<dbl> <dbl> <dbl> <chr> <dbl> <chr> <dbl>
1 0.631 0.539 2.15 (-Inf,-2.155)U(2… 0 two.sided 0.05
Em média, as complementações nos editais LAB e LPG realizadas pelas cidades brasileiras são iguais, ao nível de significância 5%.
Equação matemática
\[ z_0 = \frac{\hat{p}_1 - \hat{p}_2}{\sqrt{ \frac{\hat{p}(1-\hat{p})}{n_1} + \frac{\hat{p}(1-\hat{p})}{n_2} }} \]
Equação matemática
| \(H_1: p_1 - p_2<0\) | \(H_1: p_1 - p_2>0\) | \(H_1: p_1 - p_2\neq 0\) | |
|---|---|---|---|
| Equação | \(P(Z<t_0 )\) | \(1-P(Z<t_0 )\) | \(2 \cdot (1 - P(Z < \lvert t_0 \rvert))\) |
alternative |
"less" |
"greater" |
"two.sided" |
Rvetor1: coluna com dados da população 1vetor2: coluna com dados da população 1sucesso: categoria que indica sucessoalternative: um dos valores: “less”, “greater”, e “two.sided”delta: número que compõe as hipótesessig_level: nível de significânciaAo nível de significância 5%, existe evidência que as cidades de grande porte (mais de 100 mil habitantes) apoiam, proporcionalmente, mais o circo (linguagens_orgao__3) do que cidade de pequeno porte (100 mil habitantes ou menos)?
\[ \begin{split} H_0 &: p_1 - p_2 \leq 0\\ H_1 &: p_1 - p_2 > 0 \end{split} \]
respostas <- read_xlsx("dados/brutos/resposta.xlsx")
respostas_cidades <- respostas |>
filter(tipo_ente == "Cidade") |>
filter(resposta_completa == "Resposta completa") |>
mutate(populacao = as.numeric(populacao))
cidades_grandes <- respostas_cidades |>
filter(populacao >= 1e+5)
cidades_pequenas <- respostas_cidades |>
filter(populacao < 1e+5)
ht <- ht_2pop_prop(
cidades_grandes$linguagens_orgao___3 == "Checked",
cidades_pequenas$linguagens_orgao___3 == "Checked",
delta = 0, alternative = "greater", sig_level = 0.05
)
htmutate cria uma nova coluna ou modifica uma coluna existente. Neste caso, estamos transformando uma coluna de texto em uma coluna numérica usando as.numeric. A função mutate faz parte do tidyverse.
# A tibble: 1 × 7
statistic p_value critical_value critical_region delta alternative sig_level
<dbl> <dbl> <dbl> <chr> <dbl> <chr> <dbl>
1 4.68 1.41e-6 1.64 (1.645, Inf) 0 greater 0.05
Ao nível de significância 5%, não podemos afirmar que cidades de grande apoiam proporcionalmente mais o circo do que cidades de pequeno porte.
v_3_2__3) com recursos próprios do que as capitais das regiões Norte, Nordeste e Centro-Oeste? Use \(\alpha=5\%\) e utilize o conjunto de dados pnab-capitais.xlsx.linguagens_orgao__4) do que as cidades de pequeno porte. Use \(\alpha=1\%\) e utilize o conjunto de dados respostas.xlsx.IME/UFBA
OBEC