Curso X
Gerência de Dados Complexos em Larga Escala
Curso X
Gerência de Dados Complexos em Larga Escala
Ministrantes: Robson Leonardo Ferreira Cordeiro e Cristina Dutra de Aguiar Ciferri
Resumo: Diversas aplicações comerciais atuais necessitam gerenciar conjuntos de dados não compatíveis com os sistemas banco de dados relacionais disponíveis no mercado. Comumente, isso se deve: (i) ao grande volume de dados manipulado, o qual está diretamente relacionado ao contexto de big data; (ii) à necessidade de manipulação de dados complexos como dados de impressões digitais, imagens e áudio; (iii) ao intuito limitado de uso analítico; e (iv) à necessidade de processamento massivo dos dados em grandes “clusters” de computadores formados por computadores pessoais comuns. Este curso visa introduzir os principais conceitos, técnicas e ferramentas de gerência de dados em larga escala, voltado principalmente a aplicações comerciais com necessidades não atendidas por sistemas de banco de dados relacionais disponíveis no mercado. Do ponto de vista analítico, serão explorados conceitos e técnicas relacionadas ao uso de ambientes de data warehousing para melhorar o desempenho da tomada de decisão.
Conteúdo: NoSQL e Consistência de Dados; Dados em Larga Escala e Computação em Nuvem; O Modelo de Programação MapReduce. Objetivo e fundamentos de data warehousing; Características e Projeto do Data Warehouse; Componentes de integração e de consulta análitica.
Referências:
Joe Celko. Complete Guide to NoSQL: What Every SQL Professional Needs to Know about Non-relational Databases, Elsevier, 2014.
Eric Redmond and Jim R. Wilson. Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement, Pragmatic Bookshelf, 2012.
Pramod J. Sadalage and Martin Fowler. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence, Addison-Wesley Professional, 2012.
Shashank Tiwari. Professional NoSQL, Wrox, 2011.
Gaurav Vaish. Getting Started with NoSQL, Packt Publishing, 2013.
John Sharp, Douglas McMurtry, Andrew Oakley, Mani Subramanian, Hanzhong Zhang. Data Access for Highly-Scalable Solutions: Using SQL, NoSQL, and Polyglot Persistence, Microsoft patterns & practices, 2013.
Kimball and M. Ross. The Data Warehouse Toolkit: The Complete Guide to Dimensional Modeling, 2nd edition. John Wiley and Sons, Inc., 2002.
D. A. Ciferri and R. R. Ciferri and L. Gómez and M. Schneider and A. Vaisman and E. Zimányi. Cube algebra: A generic user-centric model and query language for OLAP cubes. Journal of Data Warehousing and Mining, v. 9, n. 2, p. 39-65, 2013.
Vaismann and E. Zimányi. Data Warehouse Systems: Design and Implementation, 1st edition. Springer, 2014.
Mini CV:
Robson L. F. Cordeiro possui graduação em Bacharelado em Ciência da Computação pela Universidade do Oeste Paulista (2002), mestrado em Ciências da Computação pela Universidade Federal do Rio Grande do Sul (2005), doutorado (2011) e pós-doutorado (2013) em Ciências da Computação e Matemática Computacional pelo Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo – ICMC-USP em São Carlos. Seu doutoramento incluiu um período sanduíche de um ano na Universidade Carnegie Mellon – EUA, entre 2009 e 2010. Atualmente, é Professor Doutor no ICMC-USP. Robson foi eleito o melhor aluno de sua turma de graduação. Sua Tese de Doutorado foi classificada em Primeiro Lugar no XXV Concurso de Teses e Dissertações – CTD 2012, promovido pela SBC, e também gerou um livro publicado pela Springer e premiado como um dos Computing Reviews Notable Computing Books and Articles of 2013 pela ACM. Robson tem experiência na área de Ciência da Computação, com ênfase em Banco de Dados, Inteligência Artificial e em Mineração de Dados, atuando principalmente nos seguintes temas: mineração de dados em alta dimensionalidade, e em escala de Terabytes de dados, agrupamento de dados e detecção de casos de exceção, rotulação e sumarização de dados, mineração de dados em geral, similaridade em bases de dados e Teoria de Fractais aplicada a bases de dados. Robson também é membro da IEEE, ACM e SBC.
Cristina Dutra de Aguiar Ciferri possui graduação em Bacharelado em Ciência da Computação pela Universidade Federal de São Carlos (1992), mestrado em Ciência da Computação pela Universidade Estadual de Campinas (1995) e doutorado em Ciência da Computação pela Universidade Federal de Pernambuco (2002). Atualmente, é Professora Associada do Instituto de Ciências Matemáticas e de Computação, Departamento de Ciências de Computação, Universidade de São Paulo, São Carlos, SP. Tem trabalhado com fundamentos de data warehousing desde 1998, possuindo experiência prática e teórica, bem como adaptando aspectos de data warehousing para a gerência de dados em larga escala. Suas áreas de interesse incluem data warehouse, bancos de dados espaciais, sistemas de informações geográficas, bancos de dados de imagens, big data, aplicações de banco de dados com processamento paralelo e distribuído, bancos de dados heterogêneos e distribuídos, integração e procedência de dados.