- Open-Lab
- Implantação do Sistema Integrado de Centros de Documentação Histórica da UFRRJ
- Implantação de Sistema Analítico Integrado de Centros de Documentação Histórica da UFRRJ
Implantação do Sistema Integrado de Centros de Documentação Histórica da UFRRJ
Aprovado para financiamento no âmbito do edital FINEP CT-INFRA 04/2018
Coordenador: Prof. Alexandre Fortes
Este projeto visa à criação de condições para a Implantação do Sistema Integrado de Centros de Documentação Histórica da UFRRJ. O seu trabalho interdisciplinar com foco na mineração de dados e no campo da Humanidades Digitais estabelece uma experiência piloto que pode vir a apontar um caminho para o desenvolvimento econômico futuro, explorando o potencial da presença da universidade pública para impulsionar a formação de um polo de geração de tecnologia informacional.
Dois fatores devem ser levados em consideração na avaliação do impacto potencial dessa iniciativa: a riqueza dos acervos históricos da UFRRJ e a carência de instituições arquivísticas no entorno geográfico dos nossos maiores câmpus (Baixada Fluminense, Costa Verde e Zona Oeste do município do Rio de Janeiro). A preservação e difusão de acervos relevantes permite o reconhecimento da relevância histórica das regiões, o fortalecimento de uma identidade positiva e o combate à estigmatização associada à sua condição periférica. Esses processos no âmbito da memória coletiva são condição fundamental para a construção de qualquer projeto de desenvolvimento regional
Como instituição centenária, originada na Escola Superior de Agronomia e Medicina Veterinária, estabelecida em 1910, a UFRRJ possui uma grande diversidade de acervos (documentos oficiais de caráter institucional e acadêmico, livros e periódicos raros, mapas, ilustrações científicas, amostras vegetais e animais etc.) de grande relevância para o estudo do processo de desenvolvimento científico nacional e internacional. Parte dessa documentação está adequadamente organizada e preservada, mas mesmo nesses casos, inexiste um sistema integrado de catalogação e difusão das informações de referência, ou, nos casos pertinentes, de produção e difusão de versões digitais dos acervos, que se encontram dispersos nos diversos Institutos e Departamentos, no Arquivo Permanente, na Biblioteca Central e no Centro de Memória. Já no que diz respeito ao potencial externo da proposta, a UFRRJ, particularmente após a criação dos cursos de graduação em História nos câmpus de Seropédica e de Nova Iguaçu e do Programa de Pós-Graduação em História, tem cumprido um importante papel na preservação, catalogação e difusão de acervos históricos relevantes.
As experiências mais avançadas nesse sentido vem sendo conduzidas pelo Centro de Documentação e Imagem (CEDIM), localizado no câmpus de Nova Iguaçu, que se especializou na digitalização e catalogação de coleções de documentos sobre a história da Baixada Fluminense localizados ou gerados por docentes e discentes da UFRRJ em suas pesquisas (documentação textual, fotografias, entrevistas em vídeo e áudio etc.), muitas vezes resultando em parcerias institucionais como aquelas celebradas com o Arquivo da Diocese de Nova Iguaçu, com o jornal Correio da Lavoura e com a Prefeitura Municipal de Nova Iguaçu. No âmbito de Itaguaí e Seropédica, o CEDOC, vinculado ao Programa de Pós-Graduação em História da UFRRJ tem cumprido papel semelhante.
Coleções selecionadas dessas fontes históricas, assim como trabalhos de conclusão de curso resultantes da sua análise passaram, desde 2016, a ser disponibilizadas no RIMA (Repositório Institucional do Instituto Multidisciplinar), implantado com apoio da FAPERJ. Já as dissertações e teses são disponibilizadas por meio de outro repositório, o TEDE. Ambos são baseados na plataforma D-Space, e um dos objetivos da presente proposta será integrá-los por meio de uma página de acesso comum, que permita ao usuário a navegação do conjunto dos acervos digitalizados da UFRRJ.
O processo de implantação do RIMA gerou também uma colaboração interdisciplinar entre as áreas de História e Ciência da Computação, com foco em tecnologias de mineração de dados aplicada à pesquisa histórica, e se desdobrou na elaboração de uma proposta de mestrado em Humanidades Digitais, que se encontra atualmente em análise na CAPES. O reconhecimento da expertise adquirida pela UFRRJ por meio do CEDIM, no que diz respeito à digitalização e disponibilização de acervos vem sendo reconhecido externamente, o que gera demandas que extrapolam o alcance originalmente previsto. Um exemplo significativo foi a parceria firmada com um grupo de docentes especializados em História da América Latina da UFRJ e UERJ para a digitalização da coleção completa da revista Cadernos do Terceiro Mundo, realizada com apoio do Instituto de Educação, Ciência e Tecnologia do Maranhão.null
Implantação de Sistema Analítico Integrado de Centros de Documentação Histórica da UFRRJ
Aprovado para financiamento no âmbito do edital FAPERJ Nº 11/2018
Coordenador: Prof. Álvaro Pereira do Nascimento
A adoção de novos instrumentos ou metodologias oriundos da modelagem matemática e computacional tornou-se um elemento essencial para o avanço das ciências sociais. Seguindo essa tendência, o arranjo do Instituto Multidisciplinar da UFRRJ tem proporcionado a interação entre cientistas que são especialistas em estudar comportamentos sociais com pesquisadores que têm treinamento em Ciência da Computação. No centro dessa interação está a construção de abordagens multidisciplinares de investigação de dinâmicas sociais. Fruto dessa interação, neste projeto estão reunidas equipes de pesquisadores em História e Ciência da Computação visando consolidar a UFRRJ como centro de referência na digitalização, disponibilização e análise computacional de acervos de relevância histórica, institucional e científica.
A integração entre História e Ciência da Computação se faz em dois eixos principais nesta proposta. O primeiro deles é a integração de centros de documentação da UFRRJ decorrente necessidade desenvolver uma política de aquisição de fontes primárias para utilização nas pesquisas de Mestrado e Doutorado em História e outras áreas de ciências humanas. Recentemente, uma proposta para aquisição dos equipamentos e serviços computacionais indispensáveis ao desenvolvimento do Centro de Documentação e Imagem (CEDIM) e do futuro Centro de Documentação Histórica do Câmpus de Seropédica, assim como de sua integração, foi aprovada no âmbito do edital FINEP CT-INFRA 04/2018. Esta proposta complementa aquela aprovada pela FINEP no apoio às atividades acadêmicas e de pesquisa no futuro Sistema Integrado de Centros de Documentação Histórica. O segundo eixo desta proposta é a instalação de um grupo de pesquisa multidisciplinar em análise qualitativa e quantitativa de dinâmicas sociais a partir de dados históricos. Vale destacar que esse eixo está presente na Linha de Pesquisa de Mineração de Dados Digitais do Mestrado em Humanidades Digitais da UFRRJ.
Problemas de Classificação e Programação Inteira
Financiado no âmbito do edital CNPq Universal 2016
Coordenador: Prof. Ricardo C. Corrêa
Uma questão de notória relevância prática na sociedade da informação em que vivemos é a extração automática de informações de um conjunto de dados a partir da descoberta de padrões e relações entre estes com o objetivo de gerar modelos capazes de prever comportamentos futuros. Tratando-se de uma área do conhecimento em progressiva efervescência, há atualmente uma multitude de estratégias adotadas com sucesso, cada qual mais adptada a um contexto particular. Uma dessas estratégias é conhecida pelo termo de classificação supervisionada. Esta é uma estratégia em duas fases: na fase inicial, ou de treinamento, um conjunto de amostras é analisado. Cada amostra é constituída de um conjunto de informações caracterizando um objeto e um rótulo. Nesta primeira fase procura-se um padrão subjacente às amostras de mesmo rótulo. Na segunda fase, utiliza-se o padrão detectado na primeira fase para se realizar a atribuição de um rótulo a um conjunto objetos.
Refere-se ao problema em sua fase inicial de treinamento sob o termo de problema de classificação. A entrada desse problema é um conjunto de amostras, cada qual consistindo de um vetor de números, e de um rótulo identificando a classe a que pertence o objeto identificado pelo vetor de números. A resolução do problema de classificação consiste no estabelecimento de um padrão para cada classe de objetos. Conforme detalhado posteriormente neste documento, o problema de classificação pode ser formulado matematicamente como um problema de otimização.
A grande dedicação da comunidade científica no desenvolvimento de métodos de otimização contínua, incluindo sobretudo programação linear e programação quadrática, causou um grande impulso no conhecimento sobre a resolução do problema da classificação nos últimos 40 anos. Embora formulações de programação linear inteira para o problema de classificação também tenham surgido nesses anos, o esforço empreendido no desenvolvimento de métodos de resolução baseados nessas formulações foi significativamente menor devido à crença que tais métodos não seriam eficientes na prática. Tal crença era justificada pelo estágio ainda preliminar do conhecimento na área de programação linear inteira. De fato, o desempenho de pacotes de programação inteira disponíveis na comunidade em aplicações com características semelhantes não prenunciavam um bom desempenho no problema de classificação em curto prazo.
Desde então, a programação inteira tem conhecido um significativo avanço, o que tem feito surgir métodos bastante eficientes de resolução de instâncias de tamanho de médio para grande de maneira ótima. Destacam-se nessa área os avanços nos métodos de geração de desigualdades válidas, em particular a técnica conhecida como lift-and-project. Acrescente-se a isso os vertiginosos incrementos na potência de cálculo dos computadores e dos pacotes de resolução disponíveis no mercado ou na comunidade científica, e a aplicação de programação linear inteira para o problema de classificação passa a se tornar exequível. Este fato vem motivando alguns autores a investir em tal abordagem na última década.
O objeto de estudo neste projeto é o uso de formulações de programação linear inteira para a resolução de duas versões do problema de classificação. O problema de classificação por convexidade geométrica pode ser formulado como um problema de programação matemática de encontrar hiperplanos no espaço das amostras de forma a classificá-las segundo o seu padrão subjacente. Esta abordagem em que as amostras são separadas linearmente é bastante explorada nos trabalhos na literatura. São de particular interesse para a abordagem por programação linear inteira os casos em que a separação linear não apresenta bons resultados devido à natureza da distribuição das amostras no espaço. Em casos assim, uma possível abordagem é o uso de vários hiperplanos, possivelmente criando a necessidade de associação entre amostras e hiperplanos.
A abordagem na versão do problema de classificação por convexidade geodésica tem natureza combinatória. Neste caso, trabalha-se com um conjunto discreto de soluções, e o que deseja-se encontrar são subconjuntos convexos de vértices com determinada características. A informação relevante é o contraste com a versão com convexidade geométrica: enquanto naquele caso busca-se a determinação de hiperplanos em um espaço multidimensional, no caso de convexidade geodésica a busca é pela determinação de subconjuntos discretos. Vale ressaltar que os métodos de resolução estudados neste projeto pressupõem o estabelecimento de formulações de programação inteira 0-1.