Uma colaboração entre 23 historiadores profissionais e o modelo de IA Aeneas, do Google DeepMind, mostrou ganhos concretos na restauração de inscrições romanas. Trabalhando sem apoio digital, os especialistas registraram 39% de erro na recomposição de caracteres; com a IA, o índice caiu para 21%. A ferramenta foi considerada útil em 90% dos casos e elevou a confiança dos pesquisadores em 44% ao propor hipóteses de leitura e datação.

Por que isso importa

As inscrições latinas — decretos, dedicatórias, epitáfios, marcos militares e até graffiti — são fontes escritas pelos próprios habitantes do Império Romano, de diferentes classes sociais. Diferentemente de crônicas oficiais, elas registram o cotidiano e a vida cívica. Ao acelerar a leitura de peças fragmentadas e sugerir paralelos com documentos semelhantes, a IA encurta um caminho que, tradicionalmente, exigia anos de pesquisa em bibliotecas e museus.

O que a Aeneas é capaz de fazer

  • Restaurar trechos faltantes mesmo quando o tamanho da lacuna é desconhecido.
  • Estimar a origem geográfica entre 62 províncias romanas, com acurácia de referência reportada em estudos recentes.
  • Estimar o período de composição com erro médio em torno de uma dúzia de anos, auxiliando debates cronológicos finos.
  • Encontrar “paralelos” — inscrições com fórmulas, vocabulário e contextos semelhantes — para sustentar hipóteses de leitura.

Casos práticos

  • Res Gestae Divi Augusti: a IA indicou janelas de datação no fim do século I a.C. e início do século I d.C., em linha com o debate acadêmico.
  • Altar votivo de Mogúncia (Mainz, Alemanha): a Aeneas sugeriu data em torno de 211 d.C., origem em Germania Superior e conexões linguísticas antes não observadas com inscrições locais.

Como o modelo funciona (em termos simples)

A Aeneas combina informação textual (caracteres e padrões linguísticos) com informação visual (traços, danos, disposição das letras na pedra). Em seguida, consulta um grande acervo de epígrafes para rankear hipóteses: quais sequências de letras fazem sentido linguístico, quais fórmulas epigráficas eram comuns em certa região e época, e quais paralelos sustentam a reconstrução sugerida.

  • Entrada multimodal: imagem da inscrição + transcrição parcial/fragmentária.
  • Geração de hipóteses: o sistema propõe preenchimentos possíveis para lacunas.
  • Contextualização: atribui probabilidade a províncias e períodos históricos.
  • Justificativas: aponta epígrafes “irmãs” que embasam as sugestões.

O conjunto de dados por trás do avanço

O treinamento usa um grande corpus epigráfico latino, com centenas de milhares de inscrições somando dezenas de milhões de caracteres, que abrangem aproximadamente do séc. VII a.C. ao séc. VIII d.C.. Parte do acervo inclui imagens, o que permite ensinar ao modelo como a materialidade (pedra, desgaste, fraturas, cortes) influencia a leitura.

Desafios que a IA ajuda a enfrentar

A arqueologia lida com um fluxo constante de achados: estima-se que cerca de 1.500 novas inscrições latinas surjam por ano. Muitas chegam incompletas, com trechos ilegíveis ou faltantes. Ao oferecer um “ponto de partida” qualificado, a IA:

  • Ajuda a priorizar o que merece análise aprofundada.
  • Propõe leituras provisórias que guiam a verificação humana.
  • Aponta paralelos plausíveis para fortalecer (ou descartar) hipóteses.

O papel do pesquisador continua central

“A IA não substitui o olhar crítico. Ela reduz o ruído, sugere caminhos e poupa tempo em buscas massivas. A decisão final — aceitar, ajustar ou rejeitar uma hipótese — segue nas mãos do historiador.”

Em outras palavras, a Aeneas atua como copiloto: acelera a triagem e amplia o horizonte de comparação, enquanto a curadoria intelectual permanece com os especialistas.

Limitações e cuidados

  • Sinais ambíguos: danos extensos ou perda de contexto arqueológico podem levar a múltiplas leituras igualmente prováveis.
  • Viés do acervo: regiões e períodos com menos inscrições digitalizadas tendem a ficar sub-representados na inferência.
  • Risco de overfitting cultural: fórmulas muito comuns podem “atrair” leituras excessivamente padronizadas; cabe ao pesquisador testar alternativas.
  • Transparência: é crucial registrar por que uma leitura foi aceita — que paralelos sustentam a hipótese e quais foram descartados.

Impacto na prática acadêmica

Em avaliações com especialistas, a Aeneas foi apontada como “ponto de partida” útil em 90% dos casos. Além da redução de erro (de 39% para 21%), os pesquisadores relataram maior segurança para propor datações e localizações, e melhor rastreabilidade das decisões por meio dos paralelos recuperados.

Cenários de uso

  • Curadoria de acervos: triagem rápida de fragmentos recém-escavados.
  • Revisão de leituras antigas: checagem de epígrafes publicadas com fotos de baixa qualidade.
  • Ensino: exercícios de reconstrução assistida em cursos de epigrafia e humanidades digitais.

Acesso aberto e próximos passos

A ferramenta está disponível para pesquisadores na plataforma Predicting the Past, com código e materiais educativos para integração em sala de aula. A equipe trabalha em adaptações a outros idiomas e suportes antigos — de papiros a numismática — e em formas de tornar as justificativas do modelo ainda mais explicáveis.