No atual contexto de Big Data, onde os dados se tornaram produtos preciosos nas jazidas de mineração algorítmica da Internet, é altamente estratégico possuir conhecimento para trabalhar com ferramentas computacionais.
O curso de atualização de Ciência de Dados Sociais é voltado especialmente para a área de Humanidades, a partir de um conhecimento integrado e multidisciplinar, e para o público leigo e iniciante, ou seja, para não programadores.
Serão utilizadas linguagens de programação de alto nível, orientadas por objetos, de script e estatística - Python e R - que possibilitam uma infinidade de possibilidades de mineração, tratamento e visualização de dados sociais.
O curso será dividido em dois módulos:
(1) Ciência de Dados com R
20 horas
Minicurso de análise de dados com R
Duração de 16h (8 aulas de 2h)
1 – Introdução ao R:
- Ambientação ao R e ao RStudio
- Objetos do R: vetores, matrizes, fatores, data frames e listas
- Estruturas úteis: operadores, loops, funções e apply
2 – Manipulação de bases de dados (R base e pacote dplyr):
- Importação e exportação de informações
- Tipos de variáveis e respectivos objetos
- Filtrando informações e ordenando linhas
- Selecionando, criando e modificando colunas
- Juntando bases de dados
3 – Visualização de dados (R base e pacote ggplot2):
- Análise exploratória visual
- Tipos de gráficos
- Customização
4 – Técnicas estatísticas aplicadas:
- Teste qui-quadrado
- Análise de regressão
- Valores atípicos
(2) Ciência de Dados com Python
20 horas
1 - Introdução ao Python
- Ambientação ao Python e ao Colab
- Estruturas úteis e conceitos: tipos de variáveis, controle de fluxo e escopos
- Tratamento de erros
2 - Bases de dados e visualização
- Criação e manipulação de dados com o Pandas
- Selecionar dados nas bases
- Visualizar os dados com matplotlib
3 - Obtendo dados na Internet com Python
- Introdução aos conceitos de dados na web e alguns de seus tipos
- Protocolos e estruturas para obtenção de dados web
- APIs e exemplo prático – Twitter (tweepy)
4 - Visualização interativa com IPython e Colab
- Propriedades e funções interativas do IPython e Colab
- Widgets e outros objetos interativos para visualização de dados
- Curiosidades e itens para aprofundamento (html, interoperabilidade, etc)
Voltar para as PROJETOS DE EXTENSÃO