Savez-vous comment vos observations sont validées ? Et par qui ?

Publié le 27/03/2019 Vu 1199 fois

La mise en place d'un processus de validation de données est un gage de la crédibilité d'un tel portail. Voici un aperçu de cette fonction sur le web'obs de la SLE.


Dès le début de la création d'une base de données naturaliste, la question de la validation des données est évidente : qui valide ? A quel moment et comment ? quels sont les niveaux de validité ? quelle traçabilité de la validation dans la base ?

L'enjeu consiste ensuite à ce que les différents observateurs et utilisateurs de ces données, soient en mesure de connaître le niveau de confiance attribué à chaque donnée.

Les niveaux de validité utilisés sur le portail sont strictement hérités du standard SINP "Validation des données d’occurrences du SINP" mais le processus mis en place est original.

Chaque taxon (espèce, sous-espèce) du référentiel utilisé sur le portail se voit attribuer un code :

  • 0 : le taxon n'est pas soumis à validation et la donnée est validée dès la saisie, au niveau de confiance le plus élevé ("certain - très probable"). Ça peut concerner des taxons très faciles à déterminer et communs.
  • 1 : le taxon est mis en validation automatique : ce mode de validation est réalisé par le biais d’un algorithme prenant en considération les données déjà connues et validées dans la base pour le taxon observé (maille déjà existante, période de vol, amplitude altitudinale de présence) et l'expérience de l'observateur (déjà observé par l’observateur...). La finesse de ce type de validation est proportionnelle à la masse d’observations collectées.
  • 2 : le taxon est mis en validation manuelle : dès qu'une observation de ce taxon est saisie, elle est soumise automatiquement à l'avis d'un expert validateur. Elle subit également le processus précédent en passant par les différents filtres de l’algorithme, ce qui permet au validateur d'avoir une idée de "l'originalité" de la donnée, parmi celles déjà intégrées et validées dans la base.

Sur ce dernier cas de taxon (à validation manuelle), il est possible de lui associer un certain nombre d'exigences : photo si c'est un adulte ou une larve, dissection des pièces génitales effectuée, observation à la loupe en main de certains caractères...

L'attribution d'un de ces 3 codes à chaque taxon est essentielle pour la suite du processus. C'est le rôle des administrateurs de chaque observatoire.

Mais en quoi consiste le rôle des validateurs ensuite ?

Lorsque la donnée est soumise aux validateurs  (cas d'un taxon "1" selon les résultats de l'algorithme ou d'un taxon "2"), , leur rôle est d'attribuer un niveau de validité à la donnée. Il s'agit en fait d'évaluer la probabilité que les informations associées à cette donnée sont exactes. Il existe 6 niveaux de validité, du niveau initial "Non évalué" au niveau le plus fort "Certain-très probable".

Si les éléments apportés à la saisie de l'observation ne sont pas suffisants, le validateur peut communiquer avec l'observateur pour demander des précisions sur cette donnée (échanges privés). Lorsque le validateur considère les informations suffisantes (après demande de complément ou non), il affecte un code de validité à la donnée. Ce code, visible par tous sur le portail (dans la page observations par ex.); peut être modifié à tout moment en fonction de nouveaux éléments. Un des points originaux du processus mis en place est la traçabilité de la validation puisque l'historique  de validation est également visible par tous !

Si une donnée est passée entre les mailles du processus, pas de problème : chaque membre du portail peut alerter l'observateur (et de fait les validateurs) en commentant l'observation.

Qui valide les données sur le web'obs de la SLE ?

Un premier collège de validateurs a été mis en place dès la publication du portail. Il s'étoffe peu à peu, en fonction de la motivation des personnes et de la connaissance de leur territoire et des taxons. Pas besoin de connaître toutes les espèces de Lorraine sur le bout des doigts pour être validateur, puisque vous pouvez être validateur sur un observatoire (papillons de jour, libellules, coléoptères, syrphes...) et même sur un seul département ! Partant du principe que la validation la plus pertinente est celle qui se réalise au plus proche du lieu d'observation, si vous avez une bonne connaissance des papillons près de chez vous, vous pouvez devenir validateur sur le web'obs de la SLE !

Les liens utiles :

- La liste des validateurs, ainsi que les niveaux de validation et le processus associé, sont disponibles également sur le portail : https://lorraine-entomologie.org/webobs/index.php?module=validation&action=validation

Auteur : David DEMERGÈS