Olá,
Quando algumas de nossas revistas foram coletadas através de OAI aparece a seguinte mensagem:
2019-02-28 02:06:57
ERROR: UERJ-13 :: Cosecha finalizada con errores
2019-02-28 02:06:54
ERROR: Fatal:Parsing XML (SAXException - set org.oclc.oai.harvester2 Logger level=DEBUG and see file log for xml body details): http://www.e-publicacoes.uerj.br/index.php/soletras/oai?verb=ListRecords&metadataPrefix=oai_dc :: White spaces are required between publicId and systemId.
2019-02-28 02:06:53
INFO: NO hay sets definidos, se cosechará toda la colección
Há alguma sugestão para corrigir o problema?
@nathaliaavila pelo erro parece que bastaria editar o XML manualmente e inserir o espaço faltante entre os conteúdos das tags publicid e systemid.
Consegue testar esta solução enquanto pesquisamos a ocorrência do erro em outras publicações?
UPDATE: Esta resposta descreve a razão do erro: IBM Support
Parece que mais frequentemente é causado por um espaço a mais existente na primeira tag do documento xml mas pode ter outras razões. Seria necessário analisar o documento XML inteiro para saber com certeza. Mas tente a primeira opção. Veja se nos seus arquivos XML, a primeira tag tem um espaço a mais após o conteúdo ou ainda qualquer indicação como " " - aspas vazias - ou pontuações.
Espero ter ajudado.