scieloorg / opac-airflow

Componente de coleta e identificação das alterações realizadas nos metadados do SciELO

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Artigos que estão no Kernel e não estão no Site.

jamilatta opened this issue · comments

Descrição do problema

Verificando a seguinte lista de PIDs que o processamento de similaridade identificou que não esta no site novo: https://drive.google.com/file/d/14cILCF8llM6eZLF2dLC-yeexE1Jff6Mq/view?usp=sharing

Observamos que estão no kernel e corretos, e não estão no site.

Passos para reproduzir o problema

  1. Acessando o Kernel é possível ver o artigo: https://kernel.scielo.br/documents/xjwZ69xyd7vV3whJPp4PTmz
  2. Veja que não está no site: https://new.scielo.br/article/S1983-41952008000400001

Comportamento esperado

É esperado que o artigo esteja no site novo.

Conversando com a equipe decidimos criar uma DAG em que seja possível sincronizar os artigos a partir de uma lista de pid_v3.

Verifica a disponibilidade dos artigos no site novo desses endereços de PIDs.

Detectei que todos estão disponíveis, vejam no arquivo em anexo.

Realizei um ajuste no ds_migracao para o output do subcomando de qualidade, commit: scieloorg/document-store-migracao@b99e913