Curso I

Ministrante: Fabricio Todeschini

Resumo: Diversas aplicações comerciais atuais necessitam gerenciar conjuntos de dados não compatíveis com os sistemas banco de dados relacionais disponíveis no mercado. Comumente, isso se deve à complexidade dos dados, e.g., grandes grafos, impressões digitais, imagens e áudio, ao intuito limitado de uso analítico, ou até mesmo à necessidade de processamento massivo dos dados em grandes “clusters” de computadores formados por computadores pessoais comuns. Este curso visa introduzir os principais conceitos, técnicas e ferramentas de gerência de dados em larga escala, voltado principalmente a aplicações comerciais com necessidades não atendidas por sistemas de banco de dados relacionais disponíveis no mercado.

Conteúdo: NoSQL e Consistência de Dados; Dados em Larga Escala e Computação em Nuvem; O Modelo de Programação MapReduce.

Referências:

Joe Celko. Complete Guide to NoSQL: What Every SQL Professional Needs to Know about Non-relational Databases, Elsevier, 2014.

Eric Redmond and Jim R. Wilson. Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement, Pragmatic Bookshelf, 2012.

Pramod J. Sadalage and Martin Fowler. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence, Addison-Wesley Professional, 2012.

Shashank Tiwari. Professional NoSQL, Wrox, 2011.

Gaurav Vaish. Getting Started with NoSQL, Packt Publishing, 2013.

John Sharp, Douglas McMurtry, Andrew Oakley, Mani Subramanian, Hanzhong Zhang. Data Access for Highly-Scalable Solutions: Using SQL, NoSQL, and Polyglot Persistence, Microsoft patterns & practices, 2013.

Mini CV:

Engenheiro de Dados com mais de 10 anos de experiência em análise, arquitetura e implementação de projetos com tecnologias ditas “Big Data”, utilizando principalmente ferramentas como Hadoop, Spark, Kafka e seus ecossistemas.

Formado em Ciência da Computação pela PUCRS, com experiência em ensino e formação de pessoas nas tecnologias para gestão de dados em larga escala. Atualmente estudando e se aprimorando em Machine Learning, e processamento de dados em fluxo contínuo (streaming).

Hoje atuando como Líder da Engenharia de Dados na empresa Bling, sendo responsável pela definição e construção da nova arquitetura de dados.