Curso I

Análise de Dados com Aprendizado de Máquina

Curso I

Análise de Dados com Aprendizado de Máquina

Ministrantes: Roseli Ap. Francelin Romero e Rodrigo Mello

Resumo: Analisar dados tem sido cada vez mais necessário em empresas, centros de pesquisa e universidades visando resolver problemas de diversas áreas e atender melhor as demandas de mercado. Este minicurso vai introduzir os principais conceitos, técnicas e ferramentas referentes a análise de dados utilizando algoritmos de aprendizado de máquina.

Conteúdo: O curso apresentará brevemente o impacto econômico da ciência de dados. Apresentar o ciclo de passos da Ciência de Dados e destacar a importância da integração de técnicas de CD e AM visando a análise de dados.Posteriormente, serão discutidos resultados recentes sobre a complexidade do viés de algoritmos de aprendizado de máquina supervisionados, com foco especial no coeficiente de shattering, o qual nos permite responder questões como: o tamanho mínimo de amostra necessário para conduzir aprendizado e avaliar o potencial de overfitting de um classificador.

Referências:

David J. Hand, Heikki Mannila, Padhraic Smyth. (2001). Principles of Data Mining. Capítulos 1, 2, 3, 4, 5.

Tan, P.-N.; Steinbach, M.; Kumar, T. (2005). Introduction to Data Mining.

Paolo Giudici, Silvia Figini. (2009). Applied Data Mining for Business and Industry. Capítulos 1, 2, 3, 6.

Faceli, Katti; Lorena, Ana Carolina; Gama, João ; de Carvalho, A. C. P. L. F. (2011). Inteligência Artificial – Uma Abordagem de Aprendizado de Máquina, 1. ed.

Mello, R.F.; Ponti, M.A. (2018). Machine Learning: A Practical Approach on the Statistical Learning Theory, 1. ed.

Mello. R.F. (2020). On the Shattering Coefficient of Supervised Learning Algorithms. https://arxiv.org/abs/1911.05461

Mini-CV:

Roseli Ap. Francelin Romero possui Doutorado em Engenharia Elétrica pela Universidade de Campinas, UNICAMP e realizou posdoc na Carnegie Mellon University. Atualmente, ela é professora Titular junto ao Departamento de Ciências de Computação, do ICMC, da Universidade de São Paulo, atuando tanto na graduação como na pós-graduação. Ela é membro do grupo de Computação Bioinspirada do ICMC-USP e coordenadora do LAR – Laboratório de Aprendizado de Robôs do ICMC-USP. De 2016 a 2018, atuou como Chefe do depto. SCC/ICMC-USP e coordenadora do Centro de Robótica da USP de São Carlos-SP (CRob-SC/USP). Atuou também como vice-coordenadora do Centro de Robótica da USP de São Carlos-SP (CRob-SC/USP), de 2011 a 2015 e vice-chefe do depto. SCC/ICMC/USP de 2014 a 2016. Ela é membro ´Senior´ da INNS – International Neural Networks Society e sócia da SBC – Sociedade Brasileira de Computação e da SBA – Sociedade Brasileira de Automática. Tem atuado como Revisora de vários periódicos incluindo IEEE Trans. on Neural Networks and Learning Systems e Neurocomputing. Ela é tutora do grupo de Robótica Warthog, bicampeão da CBR – Competição Brasileira de Robótica e também coordenadora local da Regional da Olimpiada Brasileira de Robótica, em São Carlos-SP. Recebeu o Premio Jabuti´2015, para segunda colocação na Categoria: Engenharias, Tecnologias e Informática. Atualmente é Vice-Chair do IEEE South RAS Chapter. Suas área de interesse são: redes neurais artificiais, sistemas nebulosos, visão computacional, aprendizado de máquina e robótica

Rodrigo Fernandes de Mello é professor Associado do Instituto de Ciências Matemáticas e de Computação, Departamento de Ciências de Computação, Universidade de São Paulo, São Carlos, SP. Autor do livro Machine Learning: A Practical Approach to the Statistical Learning Theory, tem se dedicado ao desenvolvimento teórico e suas conexões práticas da área de Aprendizado de Máquina, investigando limites de aprendizado para algoritmos supervisionados e não-supervisionados. Conta com experiência no mercado antes de assumir sua atual posição no meio acadêmico, o que lhe traz a atenção tão necessária à prática, implementação de algoritmos e soluções. Obteve seu título de doutor em novembro de 2003 pela Escola de Engenharia da Universidade de São Paulo, São Carlos, SP, Brasil e é mestre em Ciências da Computação pela Universidade Federal de São Carlos, Brasil. Seus interesses em pesquisa incluem aspectos teóricos e de generalização para o Aprendizado de Máquina Supervisionado e Não-Supervisionado, Análise de Séries Temporais com ferramental Estatístico e de Sistemas Dinâmicos, além da modelagem de sistemas de Aprendizado Online e Data streams.