# Setar diretório de trabalho
setwd("E:/tcc")
# Instalação de pacotes necessários
install.packages("RCurl")
install.packages('data.table')
# Carga das bibliotecas
library(RCurl)
library(data.table)
# Download arquivos
download.file("http://download.inep.gov.br/microdados/Enade_Microdados/microdados_enade_2005.zip",
destfile="E:/tcc/dados_zipados/microdados_enade_2014.zip",method="libcurl")
download.file("http://download.inep.gov.br/microdados/Enade_Microdados/microdados_enade_2008.zip",
destfile="E:/tcc/dados_zipados/microdados_enade_2014.zip",method="libcurl")
download.file("http://download.inep.gov.br/microdados/Enade_Microdados/microdados_enade_2011.zip",
destfile="E:/tcc/dados_zipados/microdados_enade_2014.zip",method="libcurl")
download.file("http://download.inep.gov.br/microdados/Enade_Microdados/microdados_enade_2014.zip",
destfile="E:/tcc/dados_zipados/microdados_enade_2014.zip",method="libcurl")
# Carregamento em memória dos dados
microdados_enade_2005 <- fread("dados/microdados_enade_2005.csv", data.table = FALSE)
microdados_enade_2008 <- fread("dados/microdados_enade_2008.csv", data.table = FALSE)
microdados_enade_2011 <- fread("dados/microdados_enade_2011.csv", data.table = FALSE)
microdados_enade_2014 <- fread("dados/microdados_enade_2014.csv", data.table = FALSE)
summary(microdados_enade_2005)
install.packages('dplyr')
library(dplyr)
# Selecionar as variaveis
dados2005 <- subset(microdados_enade_2005, co_grupo == 40,
select = c(nu_ano, cd_catad, cd_orgac, co_grupo, co_regiao_habil, co_uf_habil,
co_munic_habil, co_curso, nu_idade, tp_sexo, no_munic, sg_uf, tp_semest,
in_matut, in_vesper, in_noturno, in_grad, tp_def_fis, tp_def_vis,
tp_def_aud, tp_pres, tp_pr_ger, tp_pr_ob_fg, tp_pr_di_fg, tp_pr_ob_ce,
tp_pr_di_ce, nt_obj_fg,
nt_dis_fg, nt_fg, nt_obj_ce, nt_dis_ce, nt_ce, nt_ger, qp_i1, qp_i2,
qp_i7, qp_i9))
dados2008 <- subset(microdados_enade_2008, co_grupo == 40,
select = c(nu_ano, cd_catad, cd_orgac, co_grupo, co_regiao_habil, co_uf_habil,
co_munic_habil, co_curso, nu_idade, tp_sexo, sg_uf, tp_semest,
in_matut, in_vesper, in_noturno, in_grad, tp_def_fis, tp_def_vis,
tp_def_aud, tp_pres, tp_pr_ger, tp_pr_ob_fg, tp_pr_di_fg, tp_pr_ob_ce,
tp_pr_di_ce, nt_obj_fg,
nt_dis_fg, nt_fg, nt_obj_ce, nt_dis_ce, nt_ce, nt_ger, qp_i1, qp_i2,
qp_i7, qp_i9))
dados2011 <- subset(microdados_enade_2011, co_grupo == 4004 | co_grupo == 4005 | co_grupo == 4006 | co_grupo == 4007,
select = c(nu_ano, cd_catad, cd_orgac, co_grupo, co_regiao_curso, co_uf_curso,
CO_MUNIC_CURSO, co_curso, nu_idade, tp_sexo, no_munic, sg_uf, tp_semest,
in_matut, in_vesper, in_noturno, in_grad, tp_def_fis, tp_def_vis,
tp_def_aud, tp_pres, tp_pr_ger, tp_pr_ob_fg, tp_pr_di_fg, tp_pr_ob_ce,
tp_pr_di_ce, nt_obj_fg,
nt_dis_fg, nt_fg, nt_obj_ce, nt_dis_ce, nt_ce, nt_ger, CO_QPP_I1, CO_QPP_I2,
CO_QPP_I7, CO_QPP_I9))
dados2014 <- subset(microdados_enade_2014, co_grupo == 4004 | co_grupo == 4005 | co_grupo == 4006 | co_grupo == 4007,
select = c(nu_ano, co_catad, co_orgac, co_grupo, co_regiao_curso, co_uf_curso,
co_munic_curso, co_curso, nu_idade, tp_sexo, tp_semestre,
in_matutino, in_vespertino, in_noturno, tp_inscricao, tp_def_fis, tp_def_vis,
tp_def_aud, tp_pres, tp_pr_ger, tp_pr_ob_fg, tp_pr_di_fg, tp_pr_ob_ce,
tp_pr_di_ce, nt_obj_fg,
nt_dis_fg, nt_fg, nt_obj_ce, nt_dis_ce, nt_ce, nt_ger, qp_i1, qp_i2,
qp_i7, qp_i9))
# Adicionar colunas que estao faltando em 2008 e 2014 como nulos
dados2008 <- data.frame(append(dados2008, list(no_munic = NA), after = 10))
dados2014 <- data.frame(append(dados2014, list(no_munic = NA), after = 10))
dados2014 <- data.frame(append(dados2014, list(sg_uf = NA), after = 11))
# Renomear todas variaveis para padronizacao
colnames(dados2005) <- c('nu_ano', 'co_catad', 'co_orgac', 'co_grupo', 'co_regiao_curso', 'co_uf_curso',
'co_munic_curso', 'co_curso', 'nu_idade', 'tp_sexo', 'no_munic', 'sg_uf', 'tp_semestre',
'in_matutino', 'in_vespertino', 'in_noturno', 'tp_inscricao', 'tp_def_fis', 'tp_def_vis',
'tp_def_aud', 'tp_pres', 'tp_pr_ger', 'tp_pr_ob_fg', 'tp_pr_di_fg', 'tp_pr_ob_ce',
'tp_pr_di_ce', 'nt_obj_fg',
'nt_dis_fg', 'nt_fg', 'nt_obj_ce', 'nt_dis_ce', 'nt_ce', 'nt_ger', 'qp_i1', 'qp_i2',
'qp_i7', 'qp_i9')
colnames(dados2008)<- c('nu_ano', 'co_catad', 'co_orgac', 'co_grupo', 'co_regiao_curso', 'co_uf_curso',
'co_munic_curso', 'co_curso', 'nu_idade', 'tp_sexo', 'no_munic', 'sg_uf', 'tp_semestre',
'in_matutino', 'in_vespertino', 'in_noturno', 'tp_inscricao', 'tp_def_fis', 'tp_def_vis',
'tp_def_aud', 'tp_pres', 'tp_pr_ger', 'tp_pr_ob_fg', 'tp_pr_di_fg', 'tp_pr_ob_ce',
'tp_pr_di_ce', 'nt_obj_fg',
'nt_dis_fg', 'nt_fg', 'nt_obj_ce', 'nt_dis_ce', 'nt_ce', 'nt_ger', 'qp_i1', 'qp_i2',
'qp_i7', 'qp_i9')
colnames(dados2011) <- c('nu_ano', 'co_catad', 'co_orgac', 'co_grupo', 'co_regiao_curso', 'co_uf_curso',
'co_munic_curso', 'co_curso', 'nu_idade', 'tp_sexo', 'no_munic', 'sg_uf', 'tp_semestre',
'in_matutino', 'in_vespertino', 'in_noturno', 'tp_inscricao', 'tp_def_fis', 'tp_def_vis',
'tp_def_aud', 'tp_pres', 'tp_pr_ger', 'tp_pr_ob_fg', 'tp_pr_di_fg', 'tp_pr_ob_ce',
'tp_pr_di_ce', 'nt_obj_fg',
'nt_dis_fg', 'nt_fg', 'nt_obj_ce', 'nt_dis_ce', 'nt_ce', 'nt_ger', 'qp_i1', 'qp_i2',
'qp_i7', 'qp_i9')
colnames(dados2014) <- c('nu_ano', 'co_catad', 'co_orgac', 'co_grupo', 'co_regiao_curso', 'co_uf_curso',
'co_munic_curso', 'co_curso', 'nu_idade', 'tp_sexo', 'no_munic', 'sg_uf', 'tp_semestre',
'in_matutino', 'in_vespertino', 'in_noturno', 'tp_inscricao', 'tp_def_fis', 'tp_def_vis',
'tp_def_aud', 'tp_pres', 'tp_pr_ger', 'tp_pr_ob_fg', 'tp_pr_di_fg', 'tp_pr_ob_ce',
'tp_pr_di_ce', 'nt_obj_fg',
'nt_dis_fg', 'nt_fg', 'nt_obj_ce', 'nt_dis_ce', 'nt_ce', 'nt_ger', 'qp_i1', 'qp_i2',
'qp_i7', 'qp_i9')
# Criar dimensão dim_co_catad
dim_co_catad <- data.frame('cod' = 1:2, 'valor' = c('PUBLICA','PRIVADA'))
# Normalizacao da variavel co_catad
table(dados2005$co_catad)
table(dados2008$co_catad)
table(dados2011$co_catad)
table(dados2014$co_catad)
dados2005$co_catad <- ifelse(dados2005$co_catad == 1 | dados2005$co_catad == 2 | dados2005$co_catad == 3,
1, 2)
dados2008$co_catad <- ifelse(dados2008$co_catad == 1 | dados2008$co_catad == 2 | dados2008$co_catad == 3,
1, 2)
dados2011$co_catad <- ifelse(dados2011$co_catad == 1 ,
1, 2)
dados2014$co_catad <- ifelse(dados2014$co_catad == 93 | dados2014$co_catad == 116 | dados2014$co_catad == 10001 |
dados2014$co_catad == 10002 | dados2014$co_catad == 10003,
1, 2)
# Criar dim_co_orgac
dim_co_orgac <- data.frame('cod' = 1:9, 'valor' = c('CENTRO FEDERAL DE EDUCACAO TECNOLOGICA',
'CENTRO UNIVERSITARIO',
'FACULDADE',
'FACULDADE DE TECNOLOGIA',
'FACULDADE INTEGRADA',
'FACULDADE, ESCOLA, INSTITUTO SUPERIOR',
'INSTITUTO SUPERIOR, ESCOLA SUPERIOR',
'INSTITUTO FEDERAL DE EDUCACAO, CIENCIA E TECNOLOGIA',
'UNIVERSIDADE'
))
# Normalizacao da variavel co_orgac
table(dados2005$co_orgac)
table(dados2008$co_orgac)
table(dados2011$co_orgac)
table(dados2014$co_orgac)
dados2005$co_orgac[dados2005$co_orgac == '1'] <- 9 # UNIVERSIDADE
dados2005$co_orgac[dados2005$co_orgac == '2'] <- 2 # CENTRO UNIVERSITARIO
dados2005$co_orgac[dados2005$co_orgac == '3'] <- 5 # FACULDADE INTEGRADA
dados2005$co_orgac[dados2005$co_orgac == '4'] <- 6 # FACULDADE, ESCOLA, INSTITUTO SUPERIOR
dados2008$co_orgac[dados2008$co_orgac == '1'] <- 9 # UNIVERSIDADE
dados2008$co_orgac[dados2008$co_orgac == '3'] <- 2 # CENTRO UNIVERSITARIO
dados2008$co_orgac[dados2008$co_orgac == '5'] <- 5 # FACULDADE INTEGRADA
dados2008$co_orgac[dados2008$co_orgac == '6'] <- 3 # FACULDADE
dados2008$co_orgac[dados2008$co_orgac == '8'] <- 1 # CENTRO FEDERAL DE EDUCACAO TECNOLOGICA
dados2008$co_orgac[dados2008$co_orgac == '7'] <- 7 # INSTITUTO SUPERIOR, ESCOLA SUPERIOR
dados2008$co_orgac[dados2008$co_orgac == '9'] <- 4 # FACULDADE DE TECNOLOGIA
dados2011$co_orgac[dados2011$co_orgac == '1'] <- 9 # UNIVERSIDADE
dados2011$co_orgac[dados2011$co_orgac == '2'] <- 2 # CENTRO UNIVERSITARIO
dados2011$co_orgac[dados2011$co_orgac == '3'] <- 3 # FACULDADE
dados2014$co_orgac[dados2014$co_orgac == '10020'] <- 2 # CENTRO UNIVERSITARIO
dados2014$co_orgac[dados2014$co_orgac == '10022'] <- 3 # FACULDADE
dados2014$co_orgac[dados2014$co_orgac == '10026'] <- 8 # INSTITUTO FEDERAL DE EDUCACAO, CIENCIA E TECNOLOGIA
dados2014$co_orgac[dados2014$co_orgac == '10028'] <- 9 # UNIVERSIDADE
# Criar dim_co_grupo
dim_co_grupo <- data.frame('cod' = c(40, 4004, 4005, 4006, 4007), 'valor' = c('COMPUTACAO','CIENCIA DA COMPUTACAO - BACHARELADO',
'CIENCIA DA COMPUTACAO - LICENCIATURA', 'SISTEMAS DE INFORMACAO', 'ENGENHARIA DE COMPUTACAO'))
# Normalizacao da variavel co_grupo
table(dados2005$co_grupo)
table(dados2008$co_grupo)
table(dados2011$co_grupo)
table(dados2014$co_grupo)
# Criar dim_co_regiao_curso
dim_co_regiao_curso <- data.frame('cod' = 1:5, 'valor' = c('NORTE','NORDESTE', 'SUDESTE', 'SUL', 'CENTRO-OESTE'))
# Normalizacao da variavel co_regiao_curso
table(dados2005$co_regiao_curso)
table(dados2008$co_regiao_curso)
table(dados2011$co_regiao_curso)
table(dados2014$co_regiao_curso)
# Criar dim_co_uf_curso
dim_co_uf_curso <- data.frame('cod' = c(11, 12, 13, 14, 15, 16, 17, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32,
33, 35, 41, 42, 43, 50, 51, 52, 53), 'valor' = c('RONDONIA','ACRE', 'AMAZONAS', 'RORAIMA', 'PARA',
'AMAPA', 'TOCANTINS', 'MARANHAO', 'PIAUI', 'CEARA', 'RIO GRANDE DO NORTE', 'PARAIBA', 'PERNAMBUCO',
'ALAGOAS', 'SERGIPE', 'BAHIA', 'MINAS GERAIS', 'ESPIRITO SANTO', 'RIO DE JANEIRO', 'SAO PAULO',
'PARANA', 'SANTA CATARINA', 'RIO GRANDE DO SUL', 'MATO GROSSO DO SUL', 'MATO GROSSO',
'GOIAS', 'DISTRITO FEDERAL'))
# Normalizacao da variavel co_uf_curso
table(dados2005$co_uf_curso)
table(dados2008$co_uf_curso)
table(dados2011$co_uf_curso)
table(dados2014$co_uf_curso)
# Normalizacao da variavel co_munic_curso - TODO
# Normalizacao da variavel co_curso - TODO
# nu_idade = IDADE
# Criar dim_tp_sexo
dim_tp_sexo <- data.frame('cod' = 1:2, 'valor' = c('MASCULINO','FEMININO'))
# Normalizacao da variavel tp_sex
table(dados2005$tp_sexo)
table(dados2008$tp_sexo)
table(dados2011$tp_sexo)
table(dados2014$tp_sexo)
dados2011$tp_sexo <- ifelse(dados2011$tp_sexo == 'M' , 1, 2)
dados2014$tp_sexo <- ifelse(dados2014$tp_sexo == 'M' , 1, 2)
# Criar dim_tp_semestre
dim_tp_semestre <- data.frame('cod' = 1:2, 'valor' = c('1 SEMESTRE','2 SEMESTRE'))
# Normalizacao da variavel tp_semestre
table(dados2005$tp_semestre)
table(dados2008$tp_semestre)
table(dados2011$tp_semestre)
table(dados2014$tp_semestre)
dados2008$tp_semestre[dados2008$tp_semestre == '0'] <- NA
# Criar dim_turno
dim_turno <- data.frame('cod' = 0:1, 'valor' = c('NAO','SIM'))
# Normalizacao da variavel in_matutino, in_vespertino, in_noturno
table(dados2005$in_matutino)
table(dados2008$in_matutino)
table(dados2011$in_matutino)
table(dados2014$in_matutino)
table(dados2005$in_vespertino)
table(dados2008$in_vespertino)
table(dados2011$in_vespertino)
table(dados2014$in_vespertino)
table(dados2005$in_noturno)
table(dados2008$in_noturno)
table(dados2011$in_noturno)
table(dados2014$in_noturno)
# Criar dim_tp_inscricao
dim_tp_inscricao <- data.frame('cod' = 0:1, 'valor' = c('CONCLUINTE','INGRESSANTE'))
# Normalizacao da variavel tp_inscricao
table(dados2005$tp_inscricao)
table(dados2008$tp_inscricao)
table(dados2011$tp_inscricao)
table(dados2014$tp_inscricao)
# Criar dim_tp_presenca
dim_tp_presenca <- data.frame('cod' = c(111,222,333,335,336,444,555,556,666,777,888,999), 'valor' =
c('ALUNO NAO SELECIONADO',
'ALUNO AUSENTE',
'PROVA EM BRANCO',
'QUESTAO NULA',
'QUESTAO DESCONSIDERADA',
'PROTESTO',
'PARTICIPACAO EFETIVA',
'RESULTADO DESCONSIDERADO PROB ADM',
'QUESTAO ANULADA',
'QUESTAO NAO ESCOLHIDA',
'NAO REALIZADA POR PROB ADM',
'ALUNO FORA DO CADASTRO'
))
# Normalizacao da variavel tp_presenca
table(dados2005$tp_pres)
table(dados2008$tp_pres)
table(dados2011$tp_pres)
table(dados2014$tp_pres)
table(dados2005$tp_pr_ger)
table(dados2008$tp_pr_ger)
table(dados2011$tp_pr_ger)
table(dados2014$tp_pr_ger)
table(dados2005$tp_pr_ob_fg)
table(dados2008$tp_pr_ob_fg)
table(dados2011$tp_pr_ob_fg)
table(dados2014$tp_pr_ob_fg)
table(dados2005$tp_pr_di_fg)
table(dados2008$tp_pr_di_fg)
table(dados2011$tp_pr_di_fg)
table(dados2014$tp_pr_di_fg)
table(dados2005$tp_pr_ob_ce)
table(dados2008$tp_pr_ob_ce)
table(dados2011$tp_pr_ob_ce)
table(dados2014$tp_pr_ob_ce)
table(dados2005$tp_pr_di_ce)
table(dados2008$tp_pr_di_ce)
table(dados2011$tp_pr_di_ce)
table(dados2014$tp_pr_di_ce)
# Criar dim_qp_i1_i2
dim_qp_i1_i2 <- data.frame('cod' = c('A','B','C','D','E'), 'valor' = c('MUITO FACIL','FACIL', 'MEDIO', 'DIFICIL', 'MUITO DIFICIL'))
# Normalizacao da variavel qp_i1_i2
table(dados2005$qp_i1)
table(dados2008$qp_i1)
table(dados2011$qp_i1)
table(dados2014$qp_i1)
table(dados2005$qp_i2)
table(dados2008$qp_i2)
table(dados2011$qp_i2)
table(dados2014$qp_i2)
dados2005$qp_i1 <- ifelse(dados2005$qp_i1 == 'A' , 'A',
ifelse(dados2005$qp_i1 == 'B' , 'B',
ifelse(dados2005$qp_i1 == 'C' , 'C',
ifelse(dados2005$qp_i1 == 'D' , 'D',
ifelse(dados2005$qp_i1 == 'E' , 'E',
NA )))))
dados2008$qp_i1 <- ifelse(dados2008$qp_i1 == 'A' , 'A',
ifelse(dados2008$qp_i1 == 'B' , 'B',
ifelse(dados2008$qp_i1 == 'C' , 'C',
ifelse(dados2008$qp_i1 == 'D' , 'D',
ifelse(dados2008$qp_i1 == 'E' , 'E',
NA )))))
dados2011$qp_i1 <- ifelse(dados2011$qp_i1 == 'A' , 'A',
ifelse(dados2011$qp_i1 == 'B' , 'B',
ifelse(dados2011$qp_i1 == 'C' , 'C',
ifelse(dados2011$qp_i1 == 'D' , 'D',
ifelse(dados2011$qp_i1 == 'E' , 'E',
NA )))))
dados2014$qp_i1 <- ifelse(dados2014$qp_i1 == 'A' , 'A',
ifelse(dados2014$qp_i1 == 'B' , 'B',
ifelse(dados2014$qp_i1 == 'C' , 'C',
ifelse(dados2014$qp_i1 == 'D' , 'D',
ifelse(dados2014$qp_i1 == 'E' , 'E',
NA )))))
dados2005$qp_i2 <- ifelse(dados2005$qp_i2 == 'A' , 'A',
ifelse(dados2005$qp_i2 == 'B' , 'B',
ifelse(dados2005$qp_i2 == 'C' , 'C',
ifelse(dados2005$qp_i2 == 'D' , 'D',
ifelse(dados2005$qp_i2 == 'E' , 'E',
NA )))))
dados2008$qp_i2 <- ifelse(dados2008$qp_i2 == 'A' , 'A',
ifelse(dados2008$qp_i2 == 'B' , 'B',
ifelse(dados2008$qp_i2 == 'C' , 'C',
ifelse(dados2008$qp_i2 == 'D' , 'D',
ifelse(dados2008$qp_i2 == 'E' , 'E',
NA )))))
dados2011$qp_i2 <- ifelse(dados2011$qp_i2 == 'A' , 'A',
ifelse(dados2011$qp_i2 == 'B' , 'B',
ifelse(dados2011$qp_i2 == 'C' , 'C',
ifelse(dados2011$qp_i2 == 'D' , 'D',
ifelse(dados2011$qp_i2 == 'E' , 'E',
NA )))))
dados2014$qp_i2 <- ifelse(dados2014$qp_i2 == 'A' , 'A',
ifelse(dados2014$qp_i2 == 'B' , 'B',
ifelse(dados2014$qp_i2 == 'C' , 'C',
ifelse(dados2014$qp_i2 == 'D' , 'D',
ifelse(dados2014$qp_i2 == 'E' , 'E',
NA )))))
# Criar dim_qp_i7
dim_qp_i7 <- data.frame('cod' = c('A','B','C','D','E'), 'valor' = c('DESCONHECIMENTO DO CONTEUDO',
'FORMA DIFERENTE DE ABORDAGEM',
'ESPACO INSUFICIENTE DE RESPOSTA',
'FALTA DE MOTIVACAO',
'SEM DIFICULDADES'))
# Normalizacao da variavel qp_i7
table(dados2005$qp_i7)
table(dados2008$qp_i7)
table(dados2011$qp_i7)
table(dados2014$qp_i7)
dados2005$qp_i7 <- ifelse(dados2005$qp_i7 == 'A' , 'A',
ifelse(dados2005$qp_i7 == 'B' , 'B',
ifelse(dados2005$qp_i7 == 'C' , 'C',
ifelse(dados2005$qp_i7 == 'D' , 'D',
ifelse(dados2005$qp_i7 == 'E' , 'E',
NA )))))
dados2008$qp_i7 <- ifelse(dados2008$qp_i7 == 'A' , 'A',
ifelse(dados2008$qp_i7 == 'B' , 'B',
ifelse(dados2008$qp_i7 == 'C' , 'C',
ifelse(dados2008$qp_i7 == 'D' , 'D',
ifelse(dados2008$qp_i7 == 'E' , 'E',
NA )))))
dados2011$qp_i7 <- ifelse(dados2011$qp_i7 == 'A' , 'A',
ifelse(dados2011$qp_i7 == 'B' , 'B',
ifelse(dados2011$qp_i7 == 'C' , 'C',
ifelse(dados2011$qp_i7 == 'D' , 'D',
ifelse(dados2011$qp_i7 == 'E' , 'E',
NA )))))
dados2014$qp_i7 <- ifelse(dados2014$qp_i7 == 'A' , 'A',
ifelse(dados2014$qp_i7 == 'B' , 'B',
ifelse(dados2014$qp_i7 == 'C' , 'C',
ifelse(dados2014$qp_i7 == 'D' , 'D',
ifelse(dados2014$qp_i7 == 'E' , 'E',
NA )))))
# Criar dim_qp_i9
dim_qp_i9 <- data.frame('cod' = c('A','B','C','D','E'), 'valor' = c('MENOS DE UMA HORA',
'ENTRE UMA E DUAS HORAS',
'ENTRE DUAS E TRES HORAS',
'ENTRE TRES E QUATRO HORAS',
'NAO TERMINOU'))
# Normalizacao da variavel qp_i9
table(dados2005$qp_i9)
table(dados2008$qp_i9)
table(dados2011$qp_i9)
table(dados2014$qp_i9)
dados2005$qp_i9 <- ifelse(dados2005$qp_i9 == 'A' , 'A',
ifelse(dados2005$qp_i9 == 'B' , 'B',
ifelse(dados2005$qp_i9 == 'C' , 'C',
ifelse(dados2005$qp_i9 == 'D' , 'D',
ifelse(dados2005$qp_i9 == 'E' , 'E',
NA )))))
dados2008$qp_i9 <- ifelse(dados2008$qp_i9 == 'A' , 'A',
ifelse(dados2008$qp_i9 == 'B' , 'B',
ifelse(dados2008$qp_i9 == 'C' , 'C',
ifelse(dados2008$qp_i9 == 'D' , 'D',
ifelse(dados2008$qp_i9 == 'E' , 'E',
NA )))))
dados2011$qp_i9 <- ifelse(dados2011$qp_i9 == 'A' , 'A',
ifelse(dados2011$qp_i9 == 'B' , 'B',
ifelse(dados2011$qp_i9 == 'C' , 'C',
ifelse(dados2011$qp_i9 == 'D' , 'D',
ifelse(dados2011$qp_i9 == 'E' , 'E',
NA )))))
dados2014$qp_i9 <- ifelse(dados2014$qp_i9 == 'A' , 'A',
ifelse(dados2014$qp_i9 == 'B' , 'B',
ifelse(dados2014$qp_i9 == 'C' , 'C',
ifelse(dados2014$qp_i9 == 'D' , 'D',
ifelse(dados2014$qp_i9 == 'E' , 'E',
NA )))))
# Salvar arquivos
dados_enade <- do.call("rbind", list(dados2005, dados2008, dados2011, dados2014))
write.csv2(dim_co_catad, "dim_co_catad.csv", na = "", row.names = FALSE)
write.csv2(dim_co_grupo, "dim_co_grupo.csv", na = "", row.names = FALSE)
write.csv2(dim_co_orgac, "dim_co_orgac.csv", na = "", row.names = FALSE)
write.csv2(dim_co_regiao_curso, "dim_co_regiao_curso.csv", na = "", row.names = FALSE)
write.csv2(dim_co_uf_curso, "dim_co_uf_curso.csv", na = "", row.names = FALSE)
write.csv2(dim_qp_i1_i2, "dim_qp_i1_i2.csv", na = "", row.names = FALSE)
write.csv2(dim_qp_i7, "dim_qp_i7.csv", na = "", row.names = FALSE)
write.csv2(dim_qp_i9, "dim_qp_i9.csv", na = "", row.names = FALSE)
write.csv2(dim_tp_inscricao, "dim_tp_inscricao.csv", na = "", row.names = FALSE)
write.csv2(dim_tp_presenca, "dim_tp_presenca.csv", na = "", row.names = FALSE)
write.csv2(dim_tp_semestre, "dim_tp_semestre.csv", na = "", row.names = FALSE)
write.csv2(dim_tp_sexo, "dim_tp_sexo.csv", na = "", row.names = FALSE)
write.csv2(dim_turno, "dim_turno.csv", na = "", row.names = FALSE)
write.csv2(dados_enade, "fato_enade_computacao.csv", na = "", row.names = FALSE)
Be the first to comment
You can use [html][/html], [css][/css], [php][/php] and more to embed the code. Urls are automatically hyperlinked. Line breaks and paragraphs are automatically generated.