Curso VIII

Ministrantes: Prof. Dr. Alneu de Andrade Lopes e Alan Valejo

Resumo: Diversos fenômenos do mundo real são naturalmente representados por redes, isto é, estruturas compostas por vértices conectados entre si por arestas. Exemplos de tais redes são encontrados em todo local: redes de transmissão e distribuição de energia elétrica, redes viárias, redes sociais, redes de computadores, redes neuronais, para citar apenas algumas. Algumas dessas redes modelam textos e corpus textuais, permitindo que novos algoritmos enderecem a tarefa de mineração de texto utilizando-se de formalismos e técnicas da área de Redes Complexas. Em computação, as redes complexas são utilizadas em várias linhas de pesquisas, como mineração de dados, mineração de textos, processamento de imagens, recuperação de informação, reconhecimento de padrões, bioinformática, entre outros.

Conteúdo: Neste curso será feita uma introdução ao uso de técnicas baseadas em redes na mineração de texto. Também serão apresentados alguns casos de mineração baseada em redes relacionados com classificação semissupervisionada, extração de tópicos, Learning from positive and unlabeled data ou PU learning, e visualização de redes construídas a partir de coleções textuais.

Referências:

1 Faleiros, T.; Valejo, Alan; de Andrade Lopes, Alneu. Unsupervised learning of textual pattern based on Propagation in Bipartite Graph. Intelligent Data Analysis , v. 24, p. 543-565, 2020.

2 Valejo, Alan; Goes, F. ; Romanetto, L.; Oliveira, M.C.; Lopes, Alneu de Andrade . A benchmarking tool for the generation of bipartite network models with overlapping communities. KNOWLEDGE AND INFORMATION SYSTEMS , p. 1-29, 2019.

3 Corrêa, Edilson.; LOPES, ALNEU A.; Amâncio, D. Word sense disambiguation: a complex network approach. INFORMATION SCIENCES , v. 442443, p. 103-113, 2018.

4 Berton, L.; Faleiros, T. P.; Valejo, Alan; Valverde, Jorge; Lopes, Alneu de Andrade . RGCLI: Robust Graph that Considers Labeled Instances for Semi-Supervised Learning. Neurocomputing (Amsterdam) , v. 226, p. 238-248, 2017.

5 Rossi, R.; Lopes, Alneu de Andrade; Rezende, S. O.  Using bipartite heterogeneous networks to speed up inductive semi-supervised learning and improve automatic text categorization. KNOWLEDGE-BASED SYSTEMS , v. 132, p. 94-118, 2017.

6 Faleiros, T. P.; Rossi, R.; LOPES, A. A.  Optimizing the class information divergence for transductive classification of texts using propagation in bipartite graphs. PATTERN RECOGNITION LETTERS , v. 87, p. 127-138, 2017.

7 Rossi, R.; Lopes, Alneu de Andrade; Rezende, R. Optimization and label propagation in bipartite heterogeneous networks to improve transductive classification of texts. INFORMATION PROCESSING & MANAGEMENT , v. 52, p. 217-257, 2016.

8 Rossi, R.; Rezende, S.; de Andrade Lopes, Alneu. Term Network Approach for Transductive Classification. In: Alexander Gelbukh. (Org.). Lecture Notes in Computer Science. 1ed.Switzerland: Springer International Publishing, 2015, v. 9042, p. 497-515.

9 Rossi, R.; de Andrade Lopes, Alneu ;Faleiros, R.; Rezende, R. Inductive Model Generation for Text Classification Using a Bipartite Heterogeneous Network. Journal of Computer Science and Technology , v. 29, p. 361-375, 2014.

10 Bertini, João Roberto; Zhao, Liang; Motta, Robson; Lopes, Alneu de Andrade. A nonparametric classification method based on K-associated graphs. Information Sciences , v. 181, p. 5435-5456, 2011.

Mini CV:

Alneu de Andrade Lopes é Professor Dr. na Universidade de São Paulo, bolsista de Produtividade em Pesquisa do CNPq – Nível 2, e atua na área de Inteligência Artificial e Aprendizado de Máquina proposicional e relacional, principalmente, em Mineração de Dados e Mineração de Redes Complexas. Nesse último tópico, apenas nos últimos 5 anos, esteve envolvido na produção de cerca de 40 artigos em periódicos ou conferências do estrato superior do qualis Capes.

Alan Valejo obteve os títulos de Doutor e de Mestre em Ciência da Computação e Matemática Computacional pela Universidade de São Paulo, em 2019 e 2014, respectivamente. Seu trabalho de pesquisa, conduzido no grupo de Inteligência Computacional (LABIC) do ICMC-USP, concentra-se na área de Inteligência Artificial e Aprendizagem de Máquina e tem interesse em problemas relacionados à análise e mineração de redes complexas de grande escala com foco em métodos multiníveis. Atualmente faz pós-doutorado na Universidade de São Paulo.