CNRS-LACITO / Pangloss_website

Tools for the Pangloss Collection, an online archive of under-documented languages

Home Page:https://pangloss.cnrs.fr/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Moteur de recherche

sguillaume opened this issue · comments

Retour utilisateur :
"Dans le moteur de recherche, on ne sait pas vraiment quels sont les champs consultés, on
navigue un peu à l’aveugle. Par exemple si je recherche « village » on obtient des résultats
qui tantôt ont la chaîne village dans le titre en français, tantôt dans le titre en anglais, tantôt
dans le nom du locuteur (ex. Elderly Persons' Association of Sanba village, Xianggelila
prefecture) tantôt nulle part qui soit visible.
Parfois on aimerait raffiner la recherche, ou la restreindre à certains champs. Par ex, si je
recherche « sing », j’obtiens des locuteurs dont le nom est « Thao Sing » ou « Padham
Singh » mais aussi des textes dont le titre anglais inclut singing / singer mais aussi choosing
ou missing ou rising tone, ou le titre français inclut le mot singe… On risque d’avoir beaucoup
de « bruit » dans les résultats de certaines requêtes."

Un moteur de recherche, c'est un gros boulot. Il y aurait lieu de planifier quelque chose d'ambitieux dans un cadre plus général, celui du réseau OLAC, et/ou DELAMAN.

Christian Chanard a quelque chose de vraiment bien (je trouve) dans Corporan. Voir avec lui, de façon à reprendre / émuler / recréer cet outil dans l'environnement Pangloss / Cocoon ?

La suggestion de Christian consisterait à ré-implémenter un moteur qui reprenne les fonctionnalités du moteur Corporan (qui a de nombreuses qualités pour les utilisateurs : détails sur demande), sans réutiliser le code (=refaire une programmation tournée vers l'environnement auquel sera appliqué le moteur de recherche, c'est-à-dire Cocoon).

Le ticket #92 fait aussi partie de l'ensemble des questions qui tournent autour du moteur de recherche.

Si vous voulez un moteur de recherche champ par champ, dites-moi lesquels sont concernés.
Il faudrait aussi que vous me disiez quels types de recherche sont disponibles sur ces champs (liste déroulante, champ de texte, nombre, plage de valeur...)
@alexis : je suis allé sur le site que tu cites. Mais je ne suis pas sûr d'avoir vu le moteur en question. C'est celui sur la page 'webservice' ?
En tout cas, je vous laisse préciser les fonctionnalités de recherche... :)

"préciser les fonctionnalités de recherche" : absolument, il faut partir sur un cahier des charges précis.

Il faudrait se caler un rendez-vous. Notamment : une démo de l'outil de Christian Chanard sera bien utile, je pense
(12 ou 14 avril par exemple ? choix de date à faire par mail)

On s'appelle pour en parler ?

Recherche à facettes : un nouveau retour utilisatrice (d'une enseignante de langues & cultures) qui va dans le sens de demander des moyens de s'orienter dans la collection :

il s'agirait d'associer aux documents (de type TEXT) des étiquettes comme "conte mythologique", "conte héroïque", "légende", "conte d’animaux", "conte familier"…

"Un outil plus accessible pour la reconnaissance des contes par thématique serait d’une grande utilité. Un outil qui permettrait l’accès à tous les contes d’animaux, contes légendaires, jeux de doigts (et leur traduction), etc. au niveau mondial serait strictement révolutionnaire pour tous les curieux et passionnés que nous sommes."

Exactement, des tags dans les métadonnées.

Si on trouve une super-classification existante, on s'y adosse, et tout est pour le mieux. Par exemple celle-ci ? On va se renseigner : le LACITO est pas le plus mauvais endroit pour ces savoirs-là :-)

À défaut, on bricole notre système... mais il faut alors le décrire et le documenter, pour avoir une base durable/solide et que ça parte pas dans tous les sens.