Projetos

Implantação do Sistema Integrado de Centros de Documentação Histórica da UFRRJ

Aprovado para financiamento no âmbito do edital FINEP CT-INFRA 04/2018

Coordenador: Prof. Alexandre Fortes

Este projeto visa à criação de condições para a Implantação do Sistema Integrado de Centros de Documentação Histórica da UFRRJ. O seu trabalho interdisciplinar com foco na mineração de dados e no campo da Humanidades Digitais estabelece uma experiência piloto que pode vir a apontar um caminho para o desenvolvimento econômico futuro, explorando o potencial da presença da universidade pública para impulsionar a formação de um polo de geração de tecnologia informacional.

Dois fatores devem ser levados em consideração na avaliação do impacto potencial dessa iniciativa: a riqueza dos acervos históricos da UFRRJ e a carência de instituições arquivísticas no entorno geográfico dos nossos maiores câmpus (Baixada Fluminense, Costa Verde e Zona Oeste do município do Rio de Janeiro). A preservação e difusão de acervos relevantes permite o reconhecimento da relevância histórica das regiões, o fortalecimento de uma identidade positiva e o combate à estigmatização associada à sua condição periférica. Esses processos no âmbito da memória coletiva são condição fundamental para a construção de qualquer projeto de desenvolvimento regional

Como instituição centenária, originada na Escola Superior de Agronomia e Medicina Veterinária, estabelecida em 1910, a UFRRJ possui uma grande diversidade de acervos (documentos oficiais de caráter institucional e acadêmico, livros e periódicos raros, mapas, ilustrações científicas, amostras vegetais e animais etc.) de grande relevância para o estudo do processo de desenvolvimento científico nacional e internacional. Parte dessa documentação está adequadamente organizada e preservada, mas mesmo nesses casos, inexiste um sistema integrado de catalogação e difusão das informações de referência, ou, nos casos pertinentes, de produção e difusão de versões digitais dos acervos, que se encontram dispersos nos diversos Institutos e Departamentos, no Arquivo Permanente, na Biblioteca Central e no Centro de Memória. Já no que diz respeito ao potencial externo da proposta, a UFRRJ, particularmente após a criação dos cursos de graduação em História nos câmpus de Seropédica e de Nova Iguaçu e do Programa de Pós-Graduação em História, tem cumprido um importante papel na preservação, catalogação e difusão de acervos históricos relevantes.

As experiências mais avançadas nesse sentido vem sendo conduzidas pelo Centro de Documentação e Imagem (CEDIM), localizado no câmpus de Nova Iguaçu, que se especializou na digitalização e catalogação de coleções de documentos sobre a história da Baixada Fluminense localizados ou gerados por docentes e discentes da UFRRJ em suas pesquisas (documentação textual, fotografias, entrevistas em vídeo e áudio etc.), muitas vezes resultando em parcerias institucionais como aquelas celebradas com o Arquivo da Diocese de Nova Iguaçu, com o jornal Correio da Lavoura e com a Prefeitura Municipal de Nova Iguaçu. No âmbito de Itaguaí e Seropédica, o CEDOC, vinculado ao Programa de Pós-Graduação em História da UFRRJ tem cumprido papel semelhante.

Coleções selecionadas dessas fontes históricas, assim como trabalhos de conclusão de curso resultantes da sua análise passaram, desde 2016, a ser disponibilizadas no RIMA (Repositório Institucional do Instituto Multidisciplinar), implantado com apoio da FAPERJ. Já as dissertações e teses são disponibilizadas por meio de outro repositório, o TEDE. Ambos são baseados na plataforma D-Space, e um dos objetivos da presente proposta será integrá-los por meio de uma página de acesso comum, que permita ao usuário a navegação do conjunto dos acervos digitalizados da UFRRJ.

O processo de implantação do RIMA gerou também uma colaboração interdisciplinar entre as áreas de História e Ciência da Computação, com foco em tecnologias de mineração de dados aplicada à pesquisa histórica, e se desdobrou na elaboração de uma proposta de mestrado em Humanidades Digitais, que se encontra atualmente em análise na CAPES. O reconhecimento da expertise adquirida pela UFRRJ por meio do CEDIM, no que diz respeito à digitalização e disponibilização de acervos vem sendo reconhecido externamente, o que gera demandas que extrapolam o alcance originalmente previsto. Um exemplo significativo foi a parceria firmada com um grupo de docentes especializados em História da América Latina da UFRJ e UERJ para a digitalização da coleção completa da revista Cadernos do Terceiro Mundo, realizada com apoio do Instituto de Educação, Ciência e Tecnologia do Maranhão.null

Implantação de Sistema Analítico Integrado de Centros de Documentação Histórica da UFRRJ

Aprovado para financiamento no âmbito do edital FAPERJ Nº 11/2018

Coordenador: Prof. Álvaro Pereira do Nascimento

A adoção de novos instrumentos ou metodologias oriundos da modelagem matemática e computacional tornou-se um elemento essencial para o avanço das ciências sociais. Seguindo essa tendência, o arranjo do Instituto Multidisciplinar da UFRRJ tem proporcionado a interação entre cientistas que são especialistas em estudar comportamentos sociais com pesquisadores que têm treinamento em Ciência da Computação. No centro dessa interação está a construção de abordagens multidisciplinares de investigação de dinâmicas sociais. Fruto dessa interação, neste projeto estão reunidas equipes de pesquisadores em História e Ciência da Computação visando consolidar a UFRRJ como centro de referência na digitalização, disponibilização e análise computacional de acervos de relevância histórica, institucional e científica.

A integração entre História e Ciência da Computação se faz em dois eixos principais nesta proposta. O primeiro deles é a integração de centros de documentação da UFRRJ decorrente necessidade desenvolver uma política de aquisição de fontes primárias para utilização nas pesquisas de Mestrado e Doutorado em História e outras áreas de ciências humanas. Recentemente, uma proposta para aquisição dos equipamentos e serviços computacionais indispensáveis ao desenvolvimento do Centro de Documentação e Imagem (CEDIM) e do futuro Centro de Documentação Histórica do Câmpus de Seropédica, assim como de sua integração, foi aprovada no âmbito do edital FINEP CT-INFRA 04/2018. Esta proposta complementa aquela aprovada pela FINEP no apoio às atividades acadêmicas e de pesquisa no futuro Sistema Integrado de Centros de Documentação Histórica. O segundo eixo desta proposta é a instalação de um grupo de pesquisa multidisciplinar em análise qualitativa e quantitativa de dinâmicas sociais a partir de dados históricos. Vale destacar que esse eixo está presente na Linha de Pesquisa de Mineração de Dados Digitais do Mestrado em Humanidades Digitais da UFRRJ.

Problemas de Classificação e Programação Inteira

Financiado no âmbito do edital CNPq Universal 2016

Coordenador: Prof. Ricardo C. Corrêa

Uma questão de notória relevância prática na sociedade da informação em que vivemos é a extração automática de informações de um conjunto de dados a partir da descoberta de padrões e relações entre estes com o objetivo de gerar modelos capazes de prever comportamentos futuros. Tratando-se de uma área do conhecimento em progressiva efervescência, há atualmente uma multitude de estratégias adotadas com sucesso, cada qual mais adptada a um contexto particular. Uma dessas estratégias é conhecida pelo termo de classificação supervisionada. Esta é uma estratégia em duas fases: na fase inicial, ou de treinamento, um conjunto de amostras é analisado. Cada amostra é constituída de um conjunto de informações caracterizando um objeto e um rótulo. Nesta primeira fase procura-se um padrão subjacente às amostras de mesmo rótulo. Na segunda fase, utiliza-se o padrão detectado na primeira fase para se realizar a atribuição de um rótulo a um conjunto objetos.

Refere-se ao problema em sua fase inicial de treinamento sob o termo de problema de classificação. A entrada desse problema é um conjunto de amostras, cada qual consistindo de um vetor de números, e de um rótulo identificando a classe a que pertence o objeto identificado pelo vetor de números. A resolução do problema de classificação consiste no estabelecimento de um padrão para cada classe de objetos. Conforme detalhado posteriormente neste documento, o problema de classificação pode ser formulado matematicamente como um problema de otimização.

A grande dedicação da comunidade científica no desenvolvimento de métodos de otimização contínua, incluindo sobretudo programação linear e programação quadrática, causou um grande impulso no conhecimento sobre a resolução do problema da classificação nos últimos 40 anos. Embora formulações de programação linear inteira para o problema de classificação também tenham surgido nesses anos, o esforço empreendido no desenvolvimento de métodos de resolução baseados nessas formulações foi significativamente menor devido à crença que tais métodos não seriam eficientes na prática. Tal crença era justificada pelo estágio ainda preliminar do conhecimento na área de programação linear inteira. De fato, o desempenho de pacotes de programação inteira disponíveis na comunidade em aplicações com características semelhantes não prenunciavam um bom desempenho no problema de classificação em curto prazo.

Desde então, a programação inteira tem conhecido um significativo avanço, o que tem feito surgir métodos bastante eficientes de resolução de instâncias de tamanho de médio para grande de maneira ótima. Destacam-se nessa área os avanços nos métodos de geração de desigualdades válidas, em particular a técnica conhecida como lift-and-project. Acrescente-se a isso os vertiginosos incrementos na potência de cálculo dos computadores e dos pacotes de resolução disponíveis no mercado ou na comunidade científica, e a aplicação de programação linear inteira para o problema de classificação passa a se tornar exequível. Este fato vem motivando alguns autores a investir em tal abordagem na última década.

O objeto de estudo neste projeto é o uso de formulações de programação linear inteira para a resolução de duas versões do problema de classificação. O problema de classificação por convexidade geométrica pode ser formulado como um problema de programação matemática de encontrar hiperplanos no espaço das amostras de forma a classificá-las segundo o seu padrão subjacente. Esta abordagem em que as amostras são separadas linearmente é bastante explorada nos trabalhos na literatura. São de particular interesse para a abordagem por programação linear inteira os casos em que a separação linear não apresenta bons resultados devido à natureza da distribuição das amostras no espaço. Em casos assim, uma possível abordagem é o uso de vários hiperplanos, possivelmente criando a necessidade de associação entre amostras e hiperplanos.

A abordagem na versão do problema de classificação por convexidade geodésica tem natureza combinatória. Neste caso, trabalha-se com um conjunto discreto de soluções, e o que deseja-se encontrar são subconjuntos convexos de vértices com determinada características. A informação relevante é o contraste com a versão com convexidade geométrica: enquanto naquele caso busca-se a determinação de hiperplanos em um espaço multidimensional, no caso de convexidade geodésica a busca é pela determinação de subconjuntos discretos. Vale ressaltar que os métodos de resolução estudados neste projeto pressupõem o estabelecimento de formulações de programação inteira 0-1.