

A mudança apresenta ganhos em profundidade das descrições, qualidade dos materiais disponibilizados e integração em rede. Já estão online mais de 30 mil itens no repositório, que pode ser acessado aqui . A previsão é que, em breve, os 54 acervos próprios do Museu e os oriundos de parcerias públicas e privadas de digitalização também estejam acessíveis para consulta.
O coordenador do Laboratório Multiusuário de Humanidades Digitais e Inovação (Lahmudi), Edson Armando Silva, explica que a reformulação é resultado de um projeto iniciado em 2024, quando a equipe começou a desenvolver a infraestrutura tecnológica do novo repositório. “Criamos a estrutura, desenvolvemos a tecnologia e atualmente estamos alimentando esse espaço. Está renovado, com nova tecnologia e novo design”, afirma. Segundo ele, o acervo continuará sendo ampliado continuamente, com a incorporação gradual de novas coleções digitalizadas.
A principal novidade do novo repositório é a adoção de dados de descrição profunda, o que amplia significativamente as informações associadas a cada documento. Enquanto a versão anterior do Memórias Digitais apresentava apenas dados básicos, como título, data e uma descrição geral do material, a nova plataforma identifica e descreve individualmente os diferentes elementos presentes em cada item do acervo.
No caso dos jornais históricos, por exemplo, cada edição passa a ser detalhada em diferentes níveis de informação. Pessoas, eventos, localidades, anúncios e obituários são identificados e catalogados separadamente, permitindo que pesquisadores e o público realizem buscas muito mais específicas. Como conta Julia Graciela Machado, bolsista do Lahmudi, um único exemplar de jornal pode gerar cerca de 300 descrições profundas, ampliando as possibilidades de pesquisa e recuperação de informações.

A migração para o novo repositório também inclui a atualização técnica dos materiais já digitalizados. Segundo Julia, parte dos arquivos disponíveis na versão anterior do Memórias Digitais foi produzida em um momento em que os padrões de armazenamento e compressão de imagens eram diferentes dos atuais. Por isso, esses documentos estão sendo recuperados e processados novamente para que estejam disponíveis ao público com melhor qualidade de visualização no novo ambiente digital.
Segundo o diretor do Museu Campos Gerais, Niltonci Batista Chaves, o modelo desenvolvido pelo MCG já serve de referência para as universidades públicas paranaenses e poderá ser adotado por outras instituições de memória. A expectativa é que, futuramente, órgãos públicos e até entidades privadas que realizam digitalização de acervos possam utilizar a mesma metodologia, ampliando a rede de preservação e acesso ao patrimônio documental.
O diretório a que está vinculado o acervo digital do MCG faz parte das atividades do Novo Arranjo de Pesquisa e Inovação (Napi) Conectando Memória e Inovação. O objetivo é que todas as universidades, museus e instituições ligadas ao Napi tenham seus espaços na plataforma, que utiliza o software Omeka S, que permite a organização de acervos com metadados estruturados e a integração entre diferentes instituições de memória. Como conta o professor Niltonci, o projeto prevê uma busca integrada entre as bases de dados das instituições – outro ganho da plataforma.

Para fazer a descrição profunda, foi desenvolvido no Lahmudi o software Vidya, ferramenta que utiliza inteligência artificial para estruturar metadados detalhados dos documentos digitalizados, permitindo que cada item seja descrito em diferentes níveis de informação antes de passar pela revisão humana. Segundo o coordenador de tecnologia do Lahmudi e desenvolvedor do software, Cloter Migliorini Filho, o Vidya funciona como um “orquestrador”, integrando diferentes ferramentas para cumprir uma finalidade específica: gerar descrições automatizadas de documentos digitalizados. “Ele usa ferramentas de outros pacotes para o objetivo dele, que é a descrição por IA de documentos digitalizados do Museu”, explica.
A solução surgiu porque não havia, até então, uma solução de código aberto capaz de realizar esse tipo de processamento na velocidade e no nível de detalhamento exigidos pelo projeto. Embora existam ferramentas voltadas à gestão de documentos em repositórios digitais, elas não produzem descrições profundas com o auxílio da inteligência artificial. A equipe do Lahmudi iniciou testes com diferentes modelos de IA ao longo do último ano e, a partir dos resultados, desenvolveu a tecnologia que hoje integra o novo repositório.
Além de atender às demandas do Museu Campos Gerais, o Vidya vem sendo compartilhado com outras instituições participantes da iniciativa. De acordo com Cloter, o projeto também se consolidou como um espaço de formação técnica voltado à digitalização e gestão de acervos. A expectativa é que o software continue evoluindo e seja disponibilizado futuramente como uma solução de código aberto. “Eventualmente, ele vai ser um produto totalmente software livre, que a pessoa pode baixar, instalar e usar”, afirma o pesquisador.
Texto e fotos: Aline Jasper
Mín. 24° Máx. 27°