introdução à ciência de dados

laboratório de estatística | segunda 18h10-19h50 | terça 20h50-22h30
início do curso

20 de outubro de 2025

informações gerais

o atendimento aos estudantes acontece na sala 1J 107 nos seguintes dias e horários:

  • segunda-feira, 17h00 - 18h00.
  • sexta-feira, 19h30 - 20h30.

as comunicações extraclasse devem ser feitas através do email pedrofranklin@ufu.br.

instruções para o envio de e-mails: por favor, adicione "[dados]" no assunto da mensagem. o e-mail deve ser tratado como uma forma de comunicação profissional.

objetivos do curso

  • explorar, visualizar e analisar dados a partir de problemas do mundo real;
  • realizar limpeza, transformação e integração de dados;
  • construir visualizações informativas e corretas para exploração e comunicação de resultados;
  • introduzir conceitos de aprendizado de máquina, com foco em modelos de máquinas de vetor de suporte e métodos baseados em árvores;
  • adotar princípios éticos em ciência de dados, incluindo uso responsável de ferramentas de ia;
  • documentar e compartilhar análises de modo reprodutível;

atividades e avaliações do curso

você será avaliado com base em quatro componentes: participação nas aulas, tarefas de casa, duas provas e um projeto.

participação

nesta disciplina, a sua participação é parte fundamental do aprendizado. você será convidado a resolver exercícios em aula, individualmente ou em grupo, com o objetivo de identificar rapidamente dúvidas e testar a compreensão dos conceitos trabalhados no dia. estar presente, contribuir nas discussões e acompanhar as atividades propostas serão os critérios para sua avaliação nesta componente.

tarefas de casa

ao longo do semestre, você receberá tarefas de casa com o objetivo de praticar, com calma e autonomia, os conceitos apresentados em aula. essas tarefas devem ser feitas individualmente, mas você é encorajado a discutir ideias e dificuldades comigo e com seus colegas, desde que o raciocínio final seja seu. entregar as tarefas no prazo é parte da avaliação, e a menor nota poderá ser desconsiderada ao final do curso.

provas

você realizará duas provas ao longo do semestre, cada uma cobrindo o conteúdo ministrado até aquele momento.

  • prova 1: 09 de dezembro;
  • prova 2: 09 de março.

prova de recuperação

caso você seja um estudante frequente e sua nota final seja inferior a 60%, você terá a oportunidade de realizar a prova de recuperação no dia 16 de março. esta prova abrangerá todo o conteúdo do curso. a nota final será a média entre a nota obtida na prova de recuperação e a nota final original.

projeto

o projeto tem como objetivo aplicar o que você aprendeu ao longo do semestre para analisar uma questão de pesquisa interessante baseada em dados. os resultados do projeto serão apresentados no final do semestre (10 e 16 de março). o relatório escrito deverá ser entregue no mesmo dia.

mais informações sobre o projeto serão fornecidas ao longo do semestre.

composição da nota final

a nota final do curso será calculada da seguinte forma:

categoria porcentagem
participação. 10%
tarefas de casa 10%
prova 1 30%
prova 2 35%
projeto 15%

integridade acadêmica

nesta disciplina, espero que você participe das aulas com atenção e respeito ao ambiente coletivo de aprendizagem. fazer perguntas, compartilhar dúvidas e contribuir nas discussões faz parte do processo e será sempre bem-vindo. da mesma forma, ouvir os colegas com interesse é parte essencial da convivência acadêmica.

o uso de computadores, tablets ou outras ferramentas digitais é permitido quando estiver diretamente ligado às atividades da aula. fora desse contexto, distrações com mensagens, redes sociais ou qualquer outro conteúdo prejudicam não apenas o seu aprendizado, mas o dos demais. mantenha os dispositivos em silêncio e evite qualquer uso que interrompa o andamento da aula.

quanto ao trabalho acadêmico, você é encorajado a discutir ideias e estratégias com colegas, mas todo trabalho entregue deve refletir o seu próprio entendimento. copiar respostas ou reproduzir código sem compreensão ou sem citação é uma violação da integridade acadêmica e poderá resultar em penalidades. é permitido consultar materiais e recursos online, inclusive ferramentas de inteligência artificial, desde que você reconheça sua origem e não substitua o esforço de pensamento próprio. utilizar esses recursos para aprender é diferente de usá-los para responder no seu lugar.

acima de tudo, lembre-se de que este curso valoriza o raciocínio e a honestidade intelectual.

livros do curso

as leituras do curso serão baseadas nos seguintes livros, todos disponíveis gratuitamente online. - Estatística e Ciência de Dados. Pedro A. Morettin e Julio M. Singer. 2nd edition. LTC, 2025. - R for Data Science. Hadley Wickham, Mine Çetinkaya-Rundel, and Garrett Grolemund. 2nd edition. O’Reilly, 2022.

leitura complementar