DATA | CONTEÚDO | CÓDIGOS | REFERÊNCIAS |
---|---|---|---|
terça-feira, 10 de junho | conhecendo r e rstudio; operações básicas; criando variáveis; criando vetores. |
2025_06_10.R | 📘cdr - instalação r 📘cdr - rstudio 📘cdr - fluxo básico 📗r4ds - fluxo básico |
segunda-feira, 16 de junho | vetores; operações com vetores e indexação; sequências; amostragem e simulação com for. |
2025_06_16.R | 📘cdr - vetores 📘cdr - testes lógicos 📗r4ds - fluxo básico |
terça-feira, 17 de junho | data frames; manipulando data frames. |
2025_06_17.R importando-arquivos.R |
📘cdr - data frames 📘cdr - mais sobre data frames |
segunda-feira, 23 de junho | importando data frames; manipulando data frames; introduzindo o dplyr e o pipe. |
2025_06_23.R | 📗r4ds - transformando dados 📘cdr - importando dados |
informações gerais
as aulas do curso de introdução à ciência de dados (famat31308) acontecem no laboratório do curso de Estatística, sala 1J110 do bloco 1J, nos seguintes dias e horários:
- segunda-feira, 18h10 - 19h50.
- terça-feira, 20h50 - 22h30.
o atendimento aos estudantes acontece na sala 1J 107 nos seguintes dias e horários:
- segunda-feira, 17h00 - 18h00.
- quarta-feira, 17h50 - 18h50.
as comunicações extraclasse devem ser feitas através do email pedrofranklin@ufu.br
ementa
introdução à linguagem R; introdução à ciência de dados; visualização, manipulação e análise de dados; introdução ao aprendizado de máquina; comunicando resultados.
avaliações
- primeira prova, 15 pontos, 07 de julho.
- segunda prova, 15 pontos, 11 de agosto.
- terceira prova, 32 pontos, 16 de setembro.
- laboratórios e listas, 18 pontos, com datas de entrega a serem definidas em sala de aula.
- projeto final, 15 pontos.
- curso datacamp, 5 pontos.
- prova de recuperação, 100 pontos, 22 de setembro.
bibliografia básica
r para ciência de dados.
hadley wickham, mine çetinkaya-rundel, garrett grolemund. 2ed.an introduction to statistical learning with applications in r.
gareth james, daniela witten, trevor hastie, robert tibshirani; 2ed, springer, 2023.
materiais de apoio
A ggplot2 Tutorial for Beautiful Plotting in R: tutorial em inglês sobre o pacote ggplot2 escrito por cédric scherer. material excelente e acessível.
ciência de dados em r.
livro escrito pela equipe do curso-r.
aulas
a seguir, uma tabela com informações de cada aula do curso, incluindo a data, os tópicos abordados, os códigos produzidos durante a aula e as referências recomendadas para estudo. a tabela será atualizada ao final de cada aula.
na coluna de referências, cdr refere-se ao livro ciência de dados em r e r4ds, ao livro r para ciência de dados, ambos utilizados como base para o curso.
laboratórios e listas
- primeiro laboratório: lab1.pdf e violencia_domestica_2023.csv.