CNRS-LACITO / Pangloss_website

Tools for the Pangloss Collection, an online archive of under-documented languages

Home Page:https://pangloss.cnrs.fr/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Problème d'affichage des titres dans la liste des ressources d'un corpus

sguillaume opened this issue · comments

Dans la page qui liste les ressources d'un corpus, seul un titre en anglais ou en français peut s'afficher.
Si jamais il n'y a ni titre en français ni titre en anglais mais qu'il existe un titre dans une autre langue, il faudrait l'afficher.

ex. https://pangloss.cnrs.fr/corpus/Southern_Qiang_(Luobozhai_Dialect)?lang=fr&mode=pro
Pour 9 ressources il y a un titre en chinois mais qui ne s'affiche pas.

Est-ce qu'on aurait pas meilleur temps à traduire les titres histoire d'avoir quelque chose en anglais et français ... ?
C'est qd même souhaitable, pour l'interface (fr+en), d'avoir quelque chose dans ces langues pour accueillir les internautes de passage... ? Surtout en mode grand public.

Peut-être un travail pour l'équipe d'éditorialisation...? Poser l'existence de titres en au moins fr ou en comme préalable à la publication d'un corpus ?

(Je pense que c'est dans ce sens que le choix s'était fait en 2020 de n'afficher que du fr ou de l'en... mais je me trompe peut-être)

Tiens, voici des titres fr + en pour les neuf ressources.

C'est du tout simple (et Nate Sims pourra bien sûr modifier s'il le souhaite ; le connaissant je pense qu'il sera content de la traduction !)

cocoon-fafaff1d-2bf9-488a-baff-1d2bf9288af5
马孝珍采访音频
Entretien avec Ma Xiaozhen 马孝珍 [audio]
Audio interview with Ma Xiaozhen 马孝珍

cocoon-6e32eafa-fb26-45c5-b2ea-fafb2695c577
王光零采访音频1
Entretien avec Wang Guangling 王光零 [audio] - 1
Audio interview with Wang Guangling 王光零 - 1

cocoon-6e32eafa-fb26-45c5-b2ea-fafb2695c577
王光零婚礼唱词2
Wang Guangling (王光零) wedding lyrics - 2
Chants de mariage par Wang Guangling (王光零) - 2

cocoon-561b6fce-2011-47dd-9b6f-ce2011d7dd97
杨登枝采访音频2
Entretien avec Yang Dengzhi 杨登枝 [audio] - 2
Audio interview with Yang Dengzhi 杨登枝 - 2

cocoon-a8b478da-2efd-4613-b478-da2efdc6130f
杨登枝采访音频1
Entretien avec Yang Dengzhi 杨登枝 [audio] - 1
Audio interview with Yang Dengzhi 杨登枝 - 1

cocoon-832450e2-9995-41da-a450-e29995e1da18
赵颁航采访音频1
Entretien avec Zhao Yanhang 赵颁航 [audio] - 1
Audio interview with Zhao Yanhang 赵颁航 - 1

cocoon-00ee490c-7881-4c06-ae49-0c7881ac0684
赵颁航采访音频2
Entretien avec Zhao Yanhang 赵颁航 [audio] - 2
Audio interview with Zhao Yanhang 赵颁航 - 2

cocoon-41a43888-a8db-4abe-a438-88a8db5abeba
赵颁航采访音频3
Entretien avec Zhao Yanhang 赵颁航 [audio] - 3
Audio interview with Zhao Yanhang 赵颁航 - 3

cocoon-67a6307b-f79d-4f60-a630-7bf79d3f60b5
赵颁航采访音频4
Entretien avec Zhao Yanhang 赵颁航 [audio] - 4
Audio interview with Zhao Yanhang 赵颁航 - 4

(si c'est utile je t'envoie un format tableur avec les DOI ? ou j'insère les titres fr et en dans un tableur que tu aurais déjà tout prêt ? bref : please instruct!)

Pour ce qui est de l'opportunité de réaliser un (petit) développement informatique... je pense que ça serait un cautère sur une jambe de bois... Afficher un titre en chinois, ça n'aidera guère...?

L'idée serait plutôt de bien remplir les champs dont l'affichage est prévu (dont les résumés)... ? Ajouter un p'tit résumé pour chaque ressource, par exemple. En anglais, ça ne devrait pas trop trop coûter au déposant...?

Salut, donc rien de plus à faire ici, non ?

@sguillaume qu'en dis-tu : la solution ci-dessus te va ? (demander un titre anglais et/ou français, a minima)

A terme je suis tout à fait d'accord que c'est mieux si les personnes fournissent un titre au moins en anglais ou en français.

Par contre ça me complique les dépôts parce que si on impose ça pour un dépôt ça veut dire que quand il n'y en a pas :

  • soit je dois décliner moi même un titre en anglais et attendre la validation du déposant pour finaliser le dépôt (et souvent il proposera autre chose ou des corrections ce qui n'est guère mieux qu'attendre qu'il donne un titre lui même)
  • soit je dois demander un titre et attendre une réponse qui tarde toujours (ou ne vient pas) avec des dépôts prêts qui passent en attente (comme c'est le cas depuis plus d'une semaine pour 3 corpus).

J'aime bien quand les choses sont faites rapidement :p et ça n'est pas dans mes habitudes de mettre en attente des corpus que je pourrai mettre immédiatement en ligne surtout s'ils ont les informations minimales.

Mais ok on peut faire comme ça.

Que fait on alors pour ce type de ressource ? https://doi.org/10.24397/pangloss-0006419
C'est indiqué anglais mais ça n'en est pas.
On voulait nettoyer les métadonnées pour que tout devienne bien cohérent mais si on faisait ça proprement ça fera disparaitre des dizaines et des dizaines de titres.

Oui... ces réflexions sont convaincantes.

Retirer la balise "en" de titres qui ne sont pas en anglais, et ainsi les faire disparaître de l'affichage, serait une mauvaise solution. On ne veut pas pousser à une "contrebande" dans laquelle un titre qui n'est pas en anglais devrait être déclaré comme anglais juste pour qu'il s'affiche.

Quand il n'y a pas de titre anglais ni français, mais qu'un titre est disponible dans une autre langue, il faudrait l'afficher (plutôt que de bloquer systématiquement le processus de dépôt jusqu'à ce que la personne qui dépose fournisse un titre dans au moins une de ces 2 langues).

@EdouardSombie ça se justifie donc de faire le développement informatique nécessaire afin d'afficher le titre dans la langue disponible, s'il n'y a pas la langue demandée (fr / en).

Commentaire bavard au passage : ça revient à reconnaître l'état de fait selon lequel Pangloss accueille des ressources en voie de constitution, qui ont vocation à s'améliorer avec le temps, mais qu'on accueille à peu près "en l'état", sans poser trop de préliminaires au dépôt.

Le japhug est un bon exemple. Une ressource pour laquelle aucun "vrai" titre n'est fourni, ça fait croire à un bug, c'est pas optimal comme affichage.
image
Y'en a des tartines comme ça, des textes japhug : quelques-uns pour lesquels le titre est du chinois translittéré en romanisation du mandarin (bianselong, xiyouji...), d'autres qui ressemblent à du japhug romanisé... Ce ne sont pas des titres lisibles pour lectorat français ou anglais.
image

En comparaison, un titre en chinois (surtout un qui est simple = facile à traduire par des outils disponibles en ligne), ça apporte une information nettement plus exploitable.

Ces documents en japhug, c'est néanmoins, à l'évidence, une bonne chose de les avoir accueillis dans Pangloss. Ce sont des ressources pour lesquelles l'essentiel a été fait (la transcription) et des outils existent maintenant pour que des contributrices/contributeurs puissent un jour enrichir et compléter les métadonnées et les annotations. Ca n'est pas grave qu'en l'état, sans traduction (ni résumé ni titre fr/en), ça ne soit accessible que pour un public de happy few qui lisent la langue japhug ou du moins arrivent à faire des recherches dans les textes. Doter ces ressources japhug d'un titre français et/ou anglais, ça n'est pas forcément plus prioritaire que de les doter d'une traduction, de gloses mot à mot, d'un résumé dans diverses langues...

Quand @EdouardSombie aura réalisé le développement nécessaire pour l'affichage des titres dans les langues les plus diverses (dans la liste des ressources d'un corpus), on pourra ouvrir un ticket "Métadonnées" pour que les titres de ressources japhug qui sont en japhug (j'imagine que c'est ça la langue de kAGWcAno, qaCpa, mAGAwunW et compagnie) soient codés comme tels dans les métadonnées : en soi ça constitue une information. Évidemment ce qui serait plus propre encore serait de les re-taper en caractères phonétiques, afin qu'ils puissent être interprétés au moyen du dictionnaire japhug. Tâche non urgente & non prioritaire mais ça aurait du sens de faire une liste de tâches de ce type à réaliser un jour ?

Bon alors, je fais quoi ? :)
J'affiche les titres de ressources dans les langues autres que fr/en ?
Avec à chaque fois le code de la langue ?

Attention, il peut aussi ne pas y avoir de code langue (ça arrive) :p

Mais pour répondre à ta question (si j'ai bien compris) oui on affiche un titre dans une autre langue si jamais il n'y a pas de titre en anglais ou français.

J'affiche les titres de ressources dans les langues autres que fr/en ? Avec à chaque fois le code de la langue ?

C'est pour la liste de ressources (page d'un corpus). Le code de la langue n'est pas affiché pour l'instant, juste un titre. @sguillaume tu serais d'avis de rajouter (entre parenthèses) le code langue après le titre, quand ce n'est pas la langue de l'interface de consultation ?