Portuguese Chinese (Simplified) English French German Italian Japanese Russian Spanish

Gerência de Dados Complexos em Larga Escala

GERÊNCIA DE DADOS COMPLEXOS EM LARGA ESCALA

 

Ministrantes: Prof. Dr. Robson Leonardo Ferreira Cordeiro e Prof. Dr. Renato Fileto
Resp.: Prof. Dr. Robson Leonardo Ferreira Cordeiro

 

Resumo

Diversas aplicações comerciais atuais necessitam gerenciar e analisar conjuntos de dados não compatíveis com os sistemas de banco de dados relacionais disponíveis no mercado. Comumente, isso se deve à complexidade dos dados (e.g., grandes grafos, coleções de dados textuais, imagens e áudio), ao intuito limitado de uso analítico, ou até mesmo à necessidade de processamento massivo dos dados, por exemplo em grandes “clusters” de computadores formados por computadores pessoais comuns. Este curso visa introduzir os principais conceitos, técnicas e ferramentas de gerência de dados em larga escala, voltados principalmente a aplicações comerciais com necessidades não atendidas por sistemas de banco de dados relacionais disponíveis no mercado. O curso também apresenta alternativas para enriquecimento semântico de dados complexos, análises e aplicações que podem ser suportadas pelos dados enriquecidos e perspectivas de desenvolvimento nesta área..

 

Conteúdo

NoSQL e Consistência de Dados; Dados em Larga Escala e Computação em Nuvem; O Modelo de Programação MapReduce; Enriquecimento e Análise Semântica de Dados Complexos.

 
Bibliografia
  • Joe Celko. Complete Guide to NoSQL: What Every SQL Professional Needs to Know about Non-relational Databases, Elsevier, 2014.
  • Eric Redmond and Jim R. Wilson. Seven Databases in Seven Weeks: A Guide to Modern Databases and the NoSQL Movement, Pragmatic Bookshelf, 2012.
  • Pramod J. Sadalage and Martin Fowler. NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence, Addison-Wesley Professional, 2012.
  • Shashank Tiwari. Professional NoSQL, Wrox, 2011.
  • Gaurav Vaish. Getting Started with NoSQL, Packt Publishing, 2013.
  • John Sharp, Douglas McMurtry, Andrew Oakley, Mani Subramanian, Hanzhong Zhang. Data Access for Highly-Scalable Solutions: Using SQL, NoSQL, and Polyglot Persistence, Microsoft patterns & practices, 2013.
  • Grigoris Antoniou, Paul Groth, Frank van Harmelen and Rinke Hoekstra. A Semantic Web Primer, 3rd edition. The MIT Press, Cambridge, MA, USA, 2012.
  • Dan Jurafsky and James H. Martin. Speech and Language Processing, 3rd edition, draft chapters in progress, 2019.

 

Mini CV - Robson L. F. Cordeiro

Robson L. F. Cordeiro possui graduação em Bacharelado em Ciência da Computação pela Universidade do Oeste Paulista (2002), mestrado em Ciências da Computação pela Universidade Federal do Rio Grande do Sul (2005), doutorado (2011) e pós-doutorado (2013) em Ciências da Computação e Matemática Computacional pelo Instituto de Ciências Matemáticas e de Computação da Universidade de São Paulo - ICMC-USP em São Carlos. Seu doutoramento incluiu um período sanduíche de um ano na Universidade Carnegie Mellon - EUA, entre 2009 e 2010. Atualmente, é Professor Doutor no ICMC-USP. Robson foi eleito o melhor aluno de sua turma de graduação. Sua Tese de Doutorado foi classificada em Primeiro Lugar no XXV Concurso de Teses e Dissertações - CTD 2012, promovido pela SBC, e também gerou um livro publicado pela Springer e premiado como um dos Computing Reviews Notable Computing Books and Articles of 2013 pela ACM. Robson tem experiência na área de Ciência da Computação, com ênfase em Banco de Dados, Inteligência Artificial e em Mineração de Dados, atuando principalmente nos seguintes temas: mineração de dados em alta dimensionalidade, e em escala de Terabytes de dados, agrupamento de dados e detecção de casos de exceção, rotulação e sumarização de dados, mineração de dados em geral, similaridade em bases de dados e Teoria de Fractais aplicada a bases de dados. Robson também é membro da IEEE, ACM e SBC.

 

Mini CV - Renato Fileto

Renato Fileto tem doutorado em Ciência da Computação pelo IC/Unicamp (2003), com estágio sanduíche no Georgia Tech (EUA), e pós-doutorado pelo ICMC/USP (2011). Trabalhou mais de uma década como pesquisador na Embrapa Informática Agropecuária e é professor do INE/UFSC desde 2006. Também foi pesquisador visitante no CNR/Pisa (Itália), Universidade de Piraeus (Grécia), Universidade Ca'Foscari de Veneza (Itália) e Universidade de Leipzig (Alemanha) ao longo do últimos anos. Sua área de pesquisa é bancos de dados e ciência de dados, com foco de interesse em semântica, visando enriquecimento, recuperação, integração e análise de dados. Seus temas de pesquisa atualmente incluem anotação semântica, contextos, Web semântica e análise de dados suportada por semântica.

Última modificação em Terça, 13 Agosto 2019 16:24