Programando em R

R é atualmente uma das linguagens mais usada no mundo para Data Science. Sendo, utilizada desde coleta à análise de dados, por exemplo: coleta em páginas da web (institucionais, redes sociais), análise de dados (estatística frequentista, bayesiana, mineração de dados). O R é dessa forma o software que mais ganha espaço na comunidade acadêmica nas diversas áreas da ciência.

O objetivo desta seção apresentar a linguagem R com foco principal em coleta de dados na web (web scraping) , manipulação de banco de dados e análise estatística. Tentarei focar exemplos da área de Ciências Sociais, e mais especificamente em Ciência Política área que estou em formação.  

Usando o pacote electionsBR para fazer download dos votos dos candidatos a presidente no segundo turno e compatabilizando os codigos IBGE e TSE usando o pacote ribge, para poder gerar um mapa coroplético com a porcentagem de votos do PT por município em 2010.

Slide para taller R en la Univesidad de Salamanca


dados

Dados para ciência é um elemento muito importante na construção, no teste, na reformulação de teoria, em especial para Ciências Sociais. Pois é importante para conhecermos parte da realidade. Neste post apresento uma lista de pacotes que ajudam aos interessados por dados a obter de forma mais fácil. A comunidade de programadores em R no Brasil cresce a cada dia, esse post de hoje é motivado por mais uma boa notícia para os amantes dos dados, a publicação do pacote congressbr.

Pagina 1 de 2