AdmiralenOla / niph_tb_pipeline

WGS pipeline for Mycobacterium tuberculosis at the Norwegian Institute of Public Health (NIPH)

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

IPL beskjed fra Vegard

AdmiralenOla opened this issue · comments

Eg veit det er veldig mykje som går for seg på din front for tida Ola, og dette er ikkje noko som hastar veldig, men vi sat nett og diskuterte litt tolkning av output frå IPL i dag (eg, AT og I). Så vidt eg forstår, og ref 702-BMY-AR-001, er reglane som styrer kva tekst som blir printa i IPL rapport følgande:

Dette er alle kriteriene som må være oppfylt for å få stemplet «OK» (Testes sekvensielt):

  1. Gjennomsnittlig read-dybde må være høyere enn 30,0.
    a. Ved feiling av dette punktet vil feltet inneholde «Lav dybde».
  2. Top hit fra MASH sin kmer-analyse må inneholde ordet «Mycobacterium».
    a. Ved feiling av dette punktet vil feltet inneholde «Ikke MTB».
  3. Top hit fra MASH sin kmer-analyse må være «Mycobacterium tuberculosis».
    a. Ved feiling av dette punktet vil feltet inneholde «Annen mykobakterie».
  4. Minst 90% av H37Rv-genomet må være dekket med reads.
    a. Ved feiling av dette punktet vil feltet inneholde «Lav ref. coverage».
  5. Gjennomsnittlig PHRED-kvalitet på reads, må være over 27 (tilsvarer 0,2% feilrate per base).
    a. Ved feiling av dette punktet vil feltet inneholde «Lav kvalitet».
  6. Dersom ingen av [1-5] trigges vil feltet inneholde «OK».

Det er eit par ting som er litt uklart og eit par ting som kanskje bør endrast tekst-messig. Tek det punktvis her, kom gjerne med innspel om noko er uklart eller om eg tolkar noko feil etc.

  • Punkt 2. Her bør printa tekst vere «IKKE Mycobacterium»?
  • Punkt 3. Her bør teksten vere «IKKE MTB»?
  • Generelt: Viss eit av punkta slår ut negativt, blir det då «overstyrt» av evt seinare sekvensielt moment som også blir flagga? Eller stopper algoritmen så fort eit punkt (sekvensielt) har slått ut «negativt»? Konkret, viss prøven blir gjenkjent som 2) Ikke MTB og 3) Annen mykobakterie og 4) Lav ref. coverage, kva blir printa ut til slutt?
  • Kanskje det kunne vere ein ide å printe alle desse meldingane om dei blir flagga, heller enn berre ein? Då vil det for eksempel vere meir intuitivt å tolke output på for eksempel (reint hypotetisk) ein M. abscessus der det eigentleg ikkje er noko problem med sekvenseringa. Denne vil då bli flagga med følgande: «Lav dybde, Annen mykobakterie, Lav ref coverage» (om ein endrar printinga ref punkt 2 og 3 over. Alternativt, viss alt anna er likt slik det blir flagga i dag, vil printa output vere «Lav dybde, Ikke MTB, Lav ref coverage»

Viss vi tenker gjennom dette grundig, treng vi ikkje endre fleire gongar, og så kan endringane evt bli utført når du har tid og overskot. Etter mitt syn er det heller ikkje naudsynt å gjere ein validering i etterkant av ein slik rein tekst-messig endring av IPL. Det burde halde å teste eit par isolat og sjekke at den printa teksten kjem ut som forventa.

Helsing Vegard :)

I versjon 0.9e skal dette være fikset

Alle disse endringene implementert i 0.10