Skip to content

Latest commit

 

History

History
40 lines (23 loc) · 4.09 KB

README.md

File metadata and controls

40 lines (23 loc) · 4.09 KB

Introdução à programação e ciência de dados para a gestão pública

Bem vindas e bem vindos ao curso de 'Introdução à programação e ciência de dados para a gestão pública' do SEADE.

Informações básicas

Instrutor

Leonardo S. Barone

Local, data e hora

Virtual, às terças-feiras, das 9h às 13h.

Apresentação

O curso oferece uma iniciação à lógica de programação e ao uso da linguagem R para organização, análise e apresentação de dados. O foco do curso é o desenvolvimento da habilidade de programação para solução de problemas diversos relacionados ao manejo de dados, com ênfase na preparação de dados para análise, na visualização de dados e na produção de estatísticas descritivas. R é uma linguagem de código aberto e desenvolvimento comunitário e se tornou uma das linguagens de programação e análise de dados mais populares em diversos campos científicos e profissionais.

Programa

20-10-2020 Manipulação de dados no R e introdução - Na primeira aula do curso nos habituaremos à linguagem R trabalhando com uma das gramáticas mais populares de manipulação de dados em R, a do pacote dplyr. O curso começa, assim, não pelos elementos básicos da linguagem R, mas pelo seu uso mais comum. Dessa forma, nos habituaremos à linguagem observando seu uso a problemas concretos.

03-11-2020 Do básico ao intermediário - Após termos aprendido sobre data frames, vamos fazer um percurso das funcionalidades básicas da linguagem até alguns de seus usos intermediários. O objetivo do percurso é criar um repertório de funções e utilidades da linguagem que serão utilizados adiante.

10-11-2020 Tidyverse para manipuação de dados - Faremos o camninho de volta ao nosso ponto de partida do curso: a manipulação de dados com a gramática do dplyr. Exploraremos agora aspectos diversos da manipulação de dados com mais rigor e profundidade.

17-11-2020 Bases de dados relacionais - No encontro de hoje seguiremos com a produção de tabelas em R, agora com o pacote janitor. Aprenderemos um pouco sobre factors, que é a estrutura de dados em R para variáveis categóricas. Em finalmente, veremo como trabalhar com dados relacionais em R.

24-11-2020 ggplot2: Gramática de gráficos - Agora que temos muitos recursos para manupilar dados em R, veremos como produzir gráficos com a gramática de gráficos do pacote ggplot2. Além disso, veremos a integração entre R e Power BI.

01-12-2020 R + SQL e PNAD Contínua no R - Neste último encontro trataremos de dois tópicos importantes: a integração de R com Sistemas de Gerenciamento de Bancos de Dados (SGBD) em SQL e o uso da linguagem para análise de dados de survey, em particular da PNAD Contínua.

Referências bibliográficas

  • Grolemund, Garrett (2014). Hands-On Programming with R. Ed: O'Reilly Media. Disponível gratuitamente aqui
  • Wichkam, Hadley e Grolemund, Garrett (2016). R for Data Science. Ed: O'Reilly Media. Disponível gratuitamente aqui
  • Wichkam, Hadley(2016). [ggplot2: Elegant Graphics for Data Analysis]. Ed: O'Reilly Media. Disponível gratuitamente aqui
  • Wichkam, Hadley (2014). Advanced R. Ed: Chapman and Hall/CRC. Disponível gratuitamente Disponível gratuitamente aqui
  • Chang, Winston. R Graphics Cookbook. Ed: O'Reilly Media. Disponível gratuitamente aqui
  • Gillespie, Colin e Lovelace, Robin (2016). Efficient R programming. Ed: O'Reilly Media. Disponível gratuitamente aqui