Script ENADE

# Setar diretório de trabalho setwd("E:/tcc") # Instalação de pacotes necessários install.packages("RCurl") install.packages('data.table') # Carga das bibliotecas library(RCurl) library(data.table) # Download arquivos download.file("http://download.inep.gov.br/microdados/Enade_Microdados/microdados_enade_2005.zip", destfile="E:/tcc/dados_zipados/microdados_enade_2014.zip",method="libcurl") download.file("http://download.inep.gov.br/microdados/Enade_Microdados/microdados_enade_2008.zip", destfile="E:/tcc/dados_zipados/microdados_enade_2014.zip",method="libcurl") download.file("http://download.inep.gov.br/microdados/Enade_Microdados/microdados_enade_2011.zip", destfile="E:/tcc/dados_zipados/microdados_enade_2014.zip",method="libcurl") download.file("http://download.inep.gov.br/microdados/Enade_Microdados/microdados_enade_2014.zip", destfile="E:/tcc/dados_zipados/microdados_enade_2014.zip",method="libcurl") # Carregamento em memória dos dados microdados_enade_2005 <- fread("dados/microdados_enade_2005.csv", data.table = FALSE) microdados_enade_2008 <- fread("dados/microdados_enade_2008.csv", data.table = FALSE) microdados_enade_2011 <- fread("dados/microdados_enade_2011.csv", data.table = FALSE) microdados_enade_2014 <- fread("dados/microdados_enade_2014.csv", data.table = FALSE) summary(microdados_enade_2005) install.packages('dplyr') library(dplyr) # Selecionar as variaveis dados2005 <- subset(microdados_enade_2005, co_grupo == 40, select = c(nu_ano, cd_catad, cd_orgac, co_grupo, co_regiao_habil, co_uf_habil, co_munic_habil, co_curso, nu_idade, tp_sexo, no_munic, sg_uf, tp_semest, in_matut, in_vesper, in_noturno, in_grad, tp_def_fis, tp_def_vis, tp_def_aud, tp_pres, tp_pr_ger, tp_pr_ob_fg, tp_pr_di_fg, tp_pr_ob_ce, tp_pr_di_ce, nt_obj_fg, nt_dis_fg, nt_fg, nt_obj_ce, nt_dis_ce, nt_ce, nt_ger, qp_i1, qp_i2, qp_i7, qp_i9)) dados2008 <- subset(microdados_enade_2008, co_grupo == 40, select = c(nu_ano, cd_catad, cd_orgac, co_grupo, co_regiao_habil, co_uf_habil, co_munic_habil, co_curso, nu_idade, tp_sexo, sg_uf, tp_semest, in_matut, in_vesper, in_noturno, in_grad, tp_def_fis, tp_def_vis, tp_def_aud, tp_pres, tp_pr_ger, tp_pr_ob_fg, tp_pr_di_fg, tp_pr_ob_ce, tp_pr_di_ce, nt_obj_fg, nt_dis_fg, nt_fg, nt_obj_ce, nt_dis_ce, nt_ce, nt_ger, qp_i1, qp_i2, qp_i7, qp_i9)) dados2011 <- subset(microdados_enade_2011, co_grupo == 4004 | co_grupo == 4005 | co_grupo == 4006 | co_grupo == 4007, select = c(nu_ano, cd_catad, cd_orgac, co_grupo, co_regiao_curso, co_uf_curso, CO_MUNIC_CURSO, co_curso, nu_idade, tp_sexo, no_munic, sg_uf, tp_semest, in_matut, in_vesper, in_noturno, in_grad, tp_def_fis, tp_def_vis, tp_def_aud, tp_pres, tp_pr_ger, tp_pr_ob_fg, tp_pr_di_fg, tp_pr_ob_ce, tp_pr_di_ce, nt_obj_fg, nt_dis_fg, nt_fg, nt_obj_ce, nt_dis_ce, nt_ce, nt_ger, CO_QPP_I1, CO_QPP_I2, CO_QPP_I7, CO_QPP_I9)) dados2014 <- subset(microdados_enade_2014, co_grupo == 4004 | co_grupo == 4005 | co_grupo == 4006 | co_grupo == 4007, select = c(nu_ano, co_catad, co_orgac, co_grupo, co_regiao_curso, co_uf_curso, co_munic_curso, co_curso, nu_idade, tp_sexo, tp_semestre, in_matutino, in_vespertino, in_noturno, tp_inscricao, tp_def_fis, tp_def_vis, tp_def_aud, tp_pres, tp_pr_ger, tp_pr_ob_fg, tp_pr_di_fg, tp_pr_ob_ce, tp_pr_di_ce, nt_obj_fg, nt_dis_fg, nt_fg, nt_obj_ce, nt_dis_ce, nt_ce, nt_ger, qp_i1, qp_i2, qp_i7, qp_i9)) # Adicionar colunas que estao faltando em 2008 e 2014 como nulos dados2008 <- data.frame(append(dados2008, list(no_munic = NA), after = 10)) dados2014 <- data.frame(append(dados2014, list(no_munic = NA), after = 10)) dados2014 <- data.frame(append(dados2014, list(sg_uf = NA), after = 11)) # Renomear todas variaveis para padronizacao colnames(dados2005) <- c('nu_ano', 'co_catad', 'co_orgac', 'co_grupo', 'co_regiao_curso', 'co_uf_curso', 'co_munic_curso', 'co_curso', 'nu_idade', 'tp_sexo', 'no_munic', 'sg_uf', 'tp_semestre', 'in_matutino', 'in_vespertino', 'in_noturno', 'tp_inscricao', 'tp_def_fis', 'tp_def_vis', 'tp_def_aud', 'tp_pres', 'tp_pr_ger', 'tp_pr_ob_fg', 'tp_pr_di_fg', 'tp_pr_ob_ce', 'tp_pr_di_ce', 'nt_obj_fg', 'nt_dis_fg', 'nt_fg', 'nt_obj_ce', 'nt_dis_ce', 'nt_ce', 'nt_ger', 'qp_i1', 'qp_i2', 'qp_i7', 'qp_i9') colnames(dados2008)<- c('nu_ano', 'co_catad', 'co_orgac', 'co_grupo', 'co_regiao_curso', 'co_uf_curso', 'co_munic_curso', 'co_curso', 'nu_idade', 'tp_sexo', 'no_munic', 'sg_uf', 'tp_semestre', 'in_matutino', 'in_vespertino', 'in_noturno', 'tp_inscricao', 'tp_def_fis', 'tp_def_vis', 'tp_def_aud', 'tp_pres', 'tp_pr_ger', 'tp_pr_ob_fg', 'tp_pr_di_fg', 'tp_pr_ob_ce', 'tp_pr_di_ce', 'nt_obj_fg', 'nt_dis_fg', 'nt_fg', 'nt_obj_ce', 'nt_dis_ce', 'nt_ce', 'nt_ger', 'qp_i1', 'qp_i2', 'qp_i7', 'qp_i9') colnames(dados2011) <- c('nu_ano', 'co_catad', 'co_orgac', 'co_grupo', 'co_regiao_curso', 'co_uf_curso', 'co_munic_curso', 'co_curso', 'nu_idade', 'tp_sexo', 'no_munic', 'sg_uf', 'tp_semestre', 'in_matutino', 'in_vespertino', 'in_noturno', 'tp_inscricao', 'tp_def_fis', 'tp_def_vis', 'tp_def_aud', 'tp_pres', 'tp_pr_ger', 'tp_pr_ob_fg', 'tp_pr_di_fg', 'tp_pr_ob_ce', 'tp_pr_di_ce', 'nt_obj_fg', 'nt_dis_fg', 'nt_fg', 'nt_obj_ce', 'nt_dis_ce', 'nt_ce', 'nt_ger', 'qp_i1', 'qp_i2', 'qp_i7', 'qp_i9') colnames(dados2014) <- c('nu_ano', 'co_catad', 'co_orgac', 'co_grupo', 'co_regiao_curso', 'co_uf_curso', 'co_munic_curso', 'co_curso', 'nu_idade', 'tp_sexo', 'no_munic', 'sg_uf', 'tp_semestre', 'in_matutino', 'in_vespertino', 'in_noturno', 'tp_inscricao', 'tp_def_fis', 'tp_def_vis', 'tp_def_aud', 'tp_pres', 'tp_pr_ger', 'tp_pr_ob_fg', 'tp_pr_di_fg', 'tp_pr_ob_ce', 'tp_pr_di_ce', 'nt_obj_fg', 'nt_dis_fg', 'nt_fg', 'nt_obj_ce', 'nt_dis_ce', 'nt_ce', 'nt_ger', 'qp_i1', 'qp_i2', 'qp_i7', 'qp_i9') # Criar dimensão dim_co_catad dim_co_catad <- data.frame('cod' = 1:2, 'valor' = c('PUBLICA','PRIVADA')) # Normalizacao da variavel co_catad table(dados2005$co_catad) table(dados2008$co_catad) table(dados2011$co_catad) table(dados2014$co_catad) dados2005$co_catad <- ifelse(dados2005$co_catad == 1 | dados2005$co_catad == 2 | dados2005$co_catad == 3, 1, 2) dados2008$co_catad <- ifelse(dados2008$co_catad == 1 | dados2008$co_catad == 2 | dados2008$co_catad == 3, 1, 2) dados2011$co_catad <- ifelse(dados2011$co_catad == 1 , 1, 2) dados2014$co_catad <- ifelse(dados2014$co_catad == 93 | dados2014$co_catad == 116 | dados2014$co_catad == 10001 | dados2014$co_catad == 10002 | dados2014$co_catad == 10003, 1, 2) # Criar dim_co_orgac dim_co_orgac <- data.frame('cod' = 1:9, 'valor' = c('CENTRO FEDERAL DE EDUCACAO TECNOLOGICA', 'CENTRO UNIVERSITARIO', 'FACULDADE', 'FACULDADE DE TECNOLOGIA', 'FACULDADE INTEGRADA', 'FACULDADE, ESCOLA, INSTITUTO SUPERIOR', 'INSTITUTO SUPERIOR, ESCOLA SUPERIOR', 'INSTITUTO FEDERAL DE EDUCACAO, CIENCIA E TECNOLOGIA', 'UNIVERSIDADE' )) # Normalizacao da variavel co_orgac table(dados2005$co_orgac) table(dados2008$co_orgac) table(dados2011$co_orgac) table(dados2014$co_orgac) dados2005$co_orgac[dados2005$co_orgac == '1'] <- 9 # UNIVERSIDADE dados2005$co_orgac[dados2005$co_orgac == '2'] <- 2 # CENTRO UNIVERSITARIO dados2005$co_orgac[dados2005$co_orgac == '3'] <- 5 # FACULDADE INTEGRADA dados2005$co_orgac[dados2005$co_orgac == '4'] <- 6 # FACULDADE, ESCOLA, INSTITUTO SUPERIOR dados2008$co_orgac[dados2008$co_orgac == '1'] <- 9 # UNIVERSIDADE dados2008$co_orgac[dados2008$co_orgac == '3'] <- 2 # CENTRO UNIVERSITARIO dados2008$co_orgac[dados2008$co_orgac == '5'] <- 5 # FACULDADE INTEGRADA dados2008$co_orgac[dados2008$co_orgac == '6'] <- 3 # FACULDADE dados2008$co_orgac[dados2008$co_orgac == '8'] <- 1 # CENTRO FEDERAL DE EDUCACAO TECNOLOGICA dados2008$co_orgac[dados2008$co_orgac == '7'] <- 7 # INSTITUTO SUPERIOR, ESCOLA SUPERIOR dados2008$co_orgac[dados2008$co_orgac == '9'] <- 4 # FACULDADE DE TECNOLOGIA dados2011$co_orgac[dados2011$co_orgac == '1'] <- 9 # UNIVERSIDADE dados2011$co_orgac[dados2011$co_orgac == '2'] <- 2 # CENTRO UNIVERSITARIO dados2011$co_orgac[dados2011$co_orgac == '3'] <- 3 # FACULDADE dados2014$co_orgac[dados2014$co_orgac == '10020'] <- 2 # CENTRO UNIVERSITARIO dados2014$co_orgac[dados2014$co_orgac == '10022'] <- 3 # FACULDADE dados2014$co_orgac[dados2014$co_orgac == '10026'] <- 8 # INSTITUTO FEDERAL DE EDUCACAO, CIENCIA E TECNOLOGIA dados2014$co_orgac[dados2014$co_orgac == '10028'] <- 9 # UNIVERSIDADE # Criar dim_co_grupo dim_co_grupo <- data.frame('cod' = c(40, 4004, 4005, 4006, 4007), 'valor' = c('COMPUTACAO','CIENCIA DA COMPUTACAO - BACHARELADO', 'CIENCIA DA COMPUTACAO - LICENCIATURA', 'SISTEMAS DE INFORMACAO', 'ENGENHARIA DE COMPUTACAO')) # Normalizacao da variavel co_grupo table(dados2005$co_grupo) table(dados2008$co_grupo) table(dados2011$co_grupo) table(dados2014$co_grupo) # Criar dim_co_regiao_curso dim_co_regiao_curso <- data.frame('cod' = 1:5, 'valor' = c('NORTE','NORDESTE', 'SUDESTE', 'SUL', 'CENTRO-OESTE')) # Normalizacao da variavel co_regiao_curso table(dados2005$co_regiao_curso) table(dados2008$co_regiao_curso) table(dados2011$co_regiao_curso) table(dados2014$co_regiao_curso) # Criar dim_co_uf_curso dim_co_uf_curso <- data.frame('cod' = c(11, 12, 13, 14, 15, 16, 17, 21, 22, 23, 24, 25, 26, 27, 28, 29, 31, 32, 33, 35, 41, 42, 43, 50, 51, 52, 53), 'valor' = c('RONDONIA','ACRE', 'AMAZONAS', 'RORAIMA', 'PARA', 'AMAPA', 'TOCANTINS', 'MARANHAO', 'PIAUI', 'CEARA', 'RIO GRANDE DO NORTE', 'PARAIBA', 'PERNAMBUCO', 'ALAGOAS', 'SERGIPE', 'BAHIA', 'MINAS GERAIS', 'ESPIRITO SANTO', 'RIO DE JANEIRO', 'SAO PAULO', 'PARANA', 'SANTA CATARINA', 'RIO GRANDE DO SUL', 'MATO GROSSO DO SUL', 'MATO GROSSO', 'GOIAS', 'DISTRITO FEDERAL')) # Normalizacao da variavel co_uf_curso table(dados2005$co_uf_curso) table(dados2008$co_uf_curso) table(dados2011$co_uf_curso) table(dados2014$co_uf_curso) # Normalizacao da variavel co_munic_curso - TODO # Normalizacao da variavel co_curso - TODO # nu_idade = IDADE # Criar dim_tp_sexo dim_tp_sexo <- data.frame('cod' = 1:2, 'valor' = c('MASCULINO','FEMININO')) # Normalizacao da variavel tp_sex table(dados2005$tp_sexo) table(dados2008$tp_sexo) table(dados2011$tp_sexo) table(dados2014$tp_sexo) dados2011$tp_sexo <- ifelse(dados2011$tp_sexo == 'M' , 1, 2) dados2014$tp_sexo <- ifelse(dados2014$tp_sexo == 'M' , 1, 2) # Criar dim_tp_semestre dim_tp_semestre <- data.frame('cod' = 1:2, 'valor' = c('1 SEMESTRE','2 SEMESTRE')) # Normalizacao da variavel tp_semestre table(dados2005$tp_semestre) table(dados2008$tp_semestre) table(dados2011$tp_semestre) table(dados2014$tp_semestre) dados2008$tp_semestre[dados2008$tp_semestre == '0'] <- NA # Criar dim_turno dim_turno <- data.frame('cod' = 0:1, 'valor' = c('NAO','SIM')) # Normalizacao da variavel in_matutino, in_vespertino, in_noturno table(dados2005$in_matutino) table(dados2008$in_matutino) table(dados2011$in_matutino) table(dados2014$in_matutino) table(dados2005$in_vespertino) table(dados2008$in_vespertino) table(dados2011$in_vespertino) table(dados2014$in_vespertino) table(dados2005$in_noturno) table(dados2008$in_noturno) table(dados2011$in_noturno) table(dados2014$in_noturno) # Criar dim_tp_inscricao dim_tp_inscricao <- data.frame('cod' = 0:1, 'valor' = c('CONCLUINTE','INGRESSANTE')) # Normalizacao da variavel tp_inscricao table(dados2005$tp_inscricao) table(dados2008$tp_inscricao) table(dados2011$tp_inscricao) table(dados2014$tp_inscricao) # Criar dim_tp_presenca dim_tp_presenca <- data.frame('cod' = c(111,222,333,335,336,444,555,556,666,777,888,999), 'valor' = c('ALUNO NAO SELECIONADO', 'ALUNO AUSENTE', 'PROVA EM BRANCO', 'QUESTAO NULA', 'QUESTAO DESCONSIDERADA', 'PROTESTO', 'PARTICIPACAO EFETIVA', 'RESULTADO DESCONSIDERADO PROB ADM', 'QUESTAO ANULADA', 'QUESTAO NAO ESCOLHIDA', 'NAO REALIZADA POR PROB ADM', 'ALUNO FORA DO CADASTRO' )) # Normalizacao da variavel tp_presenca table(dados2005$tp_pres) table(dados2008$tp_pres) table(dados2011$tp_pres) table(dados2014$tp_pres) table(dados2005$tp_pr_ger) table(dados2008$tp_pr_ger) table(dados2011$tp_pr_ger) table(dados2014$tp_pr_ger) table(dados2005$tp_pr_ob_fg) table(dados2008$tp_pr_ob_fg) table(dados2011$tp_pr_ob_fg) table(dados2014$tp_pr_ob_fg) table(dados2005$tp_pr_di_fg) table(dados2008$tp_pr_di_fg) table(dados2011$tp_pr_di_fg) table(dados2014$tp_pr_di_fg) table(dados2005$tp_pr_ob_ce) table(dados2008$tp_pr_ob_ce) table(dados2011$tp_pr_ob_ce) table(dados2014$tp_pr_ob_ce) table(dados2005$tp_pr_di_ce) table(dados2008$tp_pr_di_ce) table(dados2011$tp_pr_di_ce) table(dados2014$tp_pr_di_ce) # Criar dim_qp_i1_i2 dim_qp_i1_i2 <- data.frame('cod' = c('A','B','C','D','E'), 'valor' = c('MUITO FACIL','FACIL', 'MEDIO', 'DIFICIL', 'MUITO DIFICIL')) # Normalizacao da variavel qp_i1_i2 table(dados2005$qp_i1) table(dados2008$qp_i1) table(dados2011$qp_i1) table(dados2014$qp_i1) table(dados2005$qp_i2) table(dados2008$qp_i2) table(dados2011$qp_i2) table(dados2014$qp_i2) dados2005$qp_i1 <- ifelse(dados2005$qp_i1 == 'A' , 'A', ifelse(dados2005$qp_i1 == 'B' , 'B', ifelse(dados2005$qp_i1 == 'C' , 'C', ifelse(dados2005$qp_i1 == 'D' , 'D', ifelse(dados2005$qp_i1 == 'E' , 'E', NA ))))) dados2008$qp_i1 <- ifelse(dados2008$qp_i1 == 'A' , 'A', ifelse(dados2008$qp_i1 == 'B' , 'B', ifelse(dados2008$qp_i1 == 'C' , 'C', ifelse(dados2008$qp_i1 == 'D' , 'D', ifelse(dados2008$qp_i1 == 'E' , 'E', NA ))))) dados2011$qp_i1 <- ifelse(dados2011$qp_i1 == 'A' , 'A', ifelse(dados2011$qp_i1 == 'B' , 'B', ifelse(dados2011$qp_i1 == 'C' , 'C', ifelse(dados2011$qp_i1 == 'D' , 'D', ifelse(dados2011$qp_i1 == 'E' , 'E', NA ))))) dados2014$qp_i1 <- ifelse(dados2014$qp_i1 == 'A' , 'A', ifelse(dados2014$qp_i1 == 'B' , 'B', ifelse(dados2014$qp_i1 == 'C' , 'C', ifelse(dados2014$qp_i1 == 'D' , 'D', ifelse(dados2014$qp_i1 == 'E' , 'E', NA ))))) dados2005$qp_i2 <- ifelse(dados2005$qp_i2 == 'A' , 'A', ifelse(dados2005$qp_i2 == 'B' , 'B', ifelse(dados2005$qp_i2 == 'C' , 'C', ifelse(dados2005$qp_i2 == 'D' , 'D', ifelse(dados2005$qp_i2 == 'E' , 'E', NA ))))) dados2008$qp_i2 <- ifelse(dados2008$qp_i2 == 'A' , 'A', ifelse(dados2008$qp_i2 == 'B' , 'B', ifelse(dados2008$qp_i2 == 'C' , 'C', ifelse(dados2008$qp_i2 == 'D' , 'D', ifelse(dados2008$qp_i2 == 'E' , 'E', NA ))))) dados2011$qp_i2 <- ifelse(dados2011$qp_i2 == 'A' , 'A', ifelse(dados2011$qp_i2 == 'B' , 'B', ifelse(dados2011$qp_i2 == 'C' , 'C', ifelse(dados2011$qp_i2 == 'D' , 'D', ifelse(dados2011$qp_i2 == 'E' , 'E', NA ))))) dados2014$qp_i2 <- ifelse(dados2014$qp_i2 == 'A' , 'A', ifelse(dados2014$qp_i2 == 'B' , 'B', ifelse(dados2014$qp_i2 == 'C' , 'C', ifelse(dados2014$qp_i2 == 'D' , 'D', ifelse(dados2014$qp_i2 == 'E' , 'E', NA ))))) # Criar dim_qp_i7 dim_qp_i7 <- data.frame('cod' = c('A','B','C','D','E'), 'valor' = c('DESCONHECIMENTO DO CONTEUDO', 'FORMA DIFERENTE DE ABORDAGEM', 'ESPACO INSUFICIENTE DE RESPOSTA', 'FALTA DE MOTIVACAO', 'SEM DIFICULDADES')) # Normalizacao da variavel qp_i7 table(dados2005$qp_i7) table(dados2008$qp_i7) table(dados2011$qp_i7) table(dados2014$qp_i7) dados2005$qp_i7 <- ifelse(dados2005$qp_i7 == 'A' , 'A', ifelse(dados2005$qp_i7 == 'B' , 'B', ifelse(dados2005$qp_i7 == 'C' , 'C', ifelse(dados2005$qp_i7 == 'D' , 'D', ifelse(dados2005$qp_i7 == 'E' , 'E', NA ))))) dados2008$qp_i7 <- ifelse(dados2008$qp_i7 == 'A' , 'A', ifelse(dados2008$qp_i7 == 'B' , 'B', ifelse(dados2008$qp_i7 == 'C' , 'C', ifelse(dados2008$qp_i7 == 'D' , 'D', ifelse(dados2008$qp_i7 == 'E' , 'E', NA ))))) dados2011$qp_i7 <- ifelse(dados2011$qp_i7 == 'A' , 'A', ifelse(dados2011$qp_i7 == 'B' , 'B', ifelse(dados2011$qp_i7 == 'C' , 'C', ifelse(dados2011$qp_i7 == 'D' , 'D', ifelse(dados2011$qp_i7 == 'E' , 'E', NA ))))) dados2014$qp_i7 <- ifelse(dados2014$qp_i7 == 'A' , 'A', ifelse(dados2014$qp_i7 == 'B' , 'B', ifelse(dados2014$qp_i7 == 'C' , 'C', ifelse(dados2014$qp_i7 == 'D' , 'D', ifelse(dados2014$qp_i7 == 'E' , 'E', NA ))))) # Criar dim_qp_i9 dim_qp_i9 <- data.frame('cod' = c('A','B','C','D','E'), 'valor' = c('MENOS DE UMA HORA', 'ENTRE UMA E DUAS HORAS', 'ENTRE DUAS E TRES HORAS', 'ENTRE TRES E QUATRO HORAS', 'NAO TERMINOU')) # Normalizacao da variavel qp_i9 table(dados2005$qp_i9) table(dados2008$qp_i9) table(dados2011$qp_i9) table(dados2014$qp_i9) dados2005$qp_i9 <- ifelse(dados2005$qp_i9 == 'A' , 'A', ifelse(dados2005$qp_i9 == 'B' , 'B', ifelse(dados2005$qp_i9 == 'C' , 'C', ifelse(dados2005$qp_i9 == 'D' , 'D', ifelse(dados2005$qp_i9 == 'E' , 'E', NA ))))) dados2008$qp_i9 <- ifelse(dados2008$qp_i9 == 'A' , 'A', ifelse(dados2008$qp_i9 == 'B' , 'B', ifelse(dados2008$qp_i9 == 'C' , 'C', ifelse(dados2008$qp_i9 == 'D' , 'D', ifelse(dados2008$qp_i9 == 'E' , 'E', NA ))))) dados2011$qp_i9 <- ifelse(dados2011$qp_i9 == 'A' , 'A', ifelse(dados2011$qp_i9 == 'B' , 'B', ifelse(dados2011$qp_i9 == 'C' , 'C', ifelse(dados2011$qp_i9 == 'D' , 'D', ifelse(dados2011$qp_i9 == 'E' , 'E', NA ))))) dados2014$qp_i9 <- ifelse(dados2014$qp_i9 == 'A' , 'A', ifelse(dados2014$qp_i9 == 'B' , 'B', ifelse(dados2014$qp_i9 == 'C' , 'C', ifelse(dados2014$qp_i9 == 'D' , 'D', ifelse(dados2014$qp_i9 == 'E' , 'E', NA ))))) # Salvar arquivos dados_enade <- do.call("rbind", list(dados2005, dados2008, dados2011, dados2014)) write.csv2(dim_co_catad, "dim_co_catad.csv", na = "", row.names = FALSE) write.csv2(dim_co_grupo, "dim_co_grupo.csv", na = "", row.names = FALSE) write.csv2(dim_co_orgac, "dim_co_orgac.csv", na = "", row.names = FALSE) write.csv2(dim_co_regiao_curso, "dim_co_regiao_curso.csv", na = "", row.names = FALSE) write.csv2(dim_co_uf_curso, "dim_co_uf_curso.csv", na = "", row.names = FALSE) write.csv2(dim_qp_i1_i2, "dim_qp_i1_i2.csv", na = "", row.names = FALSE) write.csv2(dim_qp_i7, "dim_qp_i7.csv", na = "", row.names = FALSE) write.csv2(dim_qp_i9, "dim_qp_i9.csv", na = "", row.names = FALSE) write.csv2(dim_tp_inscricao, "dim_tp_inscricao.csv", na = "", row.names = FALSE) write.csv2(dim_tp_presenca, "dim_tp_presenca.csv", na = "", row.names = FALSE) write.csv2(dim_tp_semestre, "dim_tp_semestre.csv", na = "", row.names = FALSE) write.csv2(dim_tp_sexo, "dim_tp_sexo.csv", na = "", row.names = FALSE) write.csv2(dim_turno, "dim_turno.csv", na = "", row.names = FALSE) write.csv2(dados_enade, "fato_enade_computacao.csv", na = "", row.names = FALSE)

Be the first to comment

You can use [html][/html], [css][/css], [php][/php] and more to embed the code. Urls are automatically hyperlinked. Line breaks and paragraphs are automatically generated.