failed: 139 at ./run-trust4 line 55.

Question

failed: 139 at ./run-trust4 line 55.

BobW4ng opened this issue 3 months ago · comments

Hi,
When i was using TRUST4 for my 10X Fastq files,it reported failed: 139 at ./run-trust4 line 55.

[Mon Apr 8 14:41:02 2024] TRUST4 begins.
[Mon Apr 8 14:41:02 2024] SYSTEM CALL: /home/work1/Documents/TRUSt4git/TRUST4/fastq-extractor -t 32 -f /home/work1/Documents/TRUSt4git/TRUST4/hg38_bcrtcr.fa -o /home/work1/Documents/TRUST4/HThuman/HRR568828_toassemble -u /home/work1/Documents/HT_human/HRR568828_R2.fastq.gz
[Mon Apr 8 14:41:02 2024] Start to extract candidate reads from read files.
system /home/work1/Documents/TRUSt4git/TRUST4/fastq-extractor -t 32 -f /home/work1/Documents/TRUSt4git/TRUST4/hg38_bcrtcr.fa -o /home/work1/Documents/TRUST4/HThuman/HRR568828_toassemble -u /home/work1/Documents/HT_human/HRR568828_R2.fastq.gz failed: 139 at ./run-trust4 line 55.

can you hele me ? thanks a lot!

Li Song · Answer 1 · Mon Apr 08 2024 22:22:52 GMT+0800 (China Standard Time)

Which version of TRUST4 are you using? Do you have access permission to "/home/work1/Documents/TRUST4/HThuman/" folder?

An unrelated issue, for 10x-style single-cell data, you may need to use the --readFormat to specify the barcode and UMI domain in a read.

BobW4ng · Answer 2 · Tue Apr 09 2024 10:10:30 GMT+0800 (China Standard Time)

thank you for the reply ,i think is the latest version ,i was using gitclone and make to install TRUST4, and check the permission is ok,but still have the issue.

BobW4ng · Answer 3 · Tue Apr 09 2024 10:18:50 GMT+0800 (China Standard Time)

[Tue Apr 9 09:55:27 2024] TRUST4 finishes.
[Tue Apr 9 09:55:27 2024] TRUST4 begins.
[Tue Apr 9 09:55:27 2024] SYSTEM CALL: /home/work1/Documents/TRUSt4git/TRUST4/fastq-extractor -t 32 -f /home/work1/Documents/TRUST4/HTmodel/bcrtcr.fa -o /home/work1/Documents/TRUST4/HTmodel/A-3_S1_L004_toassemble --readFormat bc:0:15 -u /home/work1/Documents/HLY_ABC/A/A-3_S1_L004_R2_001.fastq.gz --barcode /home/work1/Documents/HLY_ABC/A/A-3_S1_L004_R1_001.fastq.gz
[Tue Apr 9 09:55:27 2024] Start to extract candidate reads from read files.
Read file and barcode file have different number of reads.
system /home/work1/Documents/TRUSt4git/TRUST4/fastq-extractor -t 32 -f /home/work1/Documents/TRUST4/HTmodel/bcrtcr.fa -o /home/work1/Documents/TRUST4/HTmodel/A-3_S1_L004_toassemble --readFormat bc:0:15 -u /home/work1/Documents/HLY_ABC/A/A-3_S1_L004_R2_001.fastq.gz --barcode /home/work1/Documents/HLY_ABC/A/A-3_S1_L004_R1_001.fastq.gz failed: 256 at ./run-trust4 line 55.
And another bug i dont konw how to fix, is Read file and barcode file have different number of reads. So i just use the R2.fastq.gz.

Li Song · Answer 4 · Tue Apr 09 2024 10:21:15 GMT+0800 (China Standard Time)

Have you preprocessed the raw fastq files? Like read trimming and filters, which may causing read number change?

BobW4ng · Answer 5 · Tue Apr 09 2024 10:24:10 GMT+0800 (China Standard Time)

i dont konw, these data download from Sequencing company

Li Song · Answer 6 · Tue Apr 09 2024 10:25:15 GMT+0800 (China Standard Time)

Could you please show me the first a few lines of these two files?

BobW4ng · Answer 7 · Tue Apr 09 2024 10:36:03 GMT+0800 (China Standard Time)

the HRR568828file:
@a00224:86:H5F3KDSXX:1:1101:18466:1000 2:N:0:GTTGAGAA
NCTAAGGGCTGTGGCACTGTCCTGCTCTCCGGTCCTCGCAAGGGCCGAGAGGTGTACCGGCATTTCGGTAAGGCCCCAGGAACCCCGCACAGCCACACCAAACCCTACGTCCGCTCCAAGGGCCGGAAGTTCGAGCGTGCCAGAGGCCGAC
+
#FFFFFFFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFFFFF:FFFFF,FFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFFFFFFFFFFFFFF
@a00224:86:H5F3KDSXX:1:1101:18846:1000 2:N:0:GTTGAGAA
NGCCTTAAATGCTCCAGGGACCTTTGAGTTTCTAGAGTTATCATGTGCTACAGGAATGAGCAGTTTAAAGTTTCCAAAAAGGCTGGGCGTGGTGGCTCACACCTGTAATCCTAGCAATTTGGGAGGATGAGGTGGGCAGATCACTTTAGGT
+
#,,FFFFFFFF,F:,FFFFF,,FFF:F:FFF,FFFF,FFFF::F:F:,F,,F::FFFFF,FFFFFFF:,:FFF:FFFF,FF,:F:,F,,F,FFF,FF:F,:F,FFFFFF:,:FFFF,FFFFF,FFF,FF,FFFF,FFF,FF:F:FF,FFFF
@a00224:86:H5F3KDSXX:1:1101:19479:1000 2:N:0:GTTGAGAA
NTAGTTATCACCTTAGGTACATTATTATTTTGAATGATGAGGAATTTTTATTTTCATCTGCCTCAGTGGAGTGATTATATAGTATGCTAAGTAATCTTTCATTTCTTACAGAAGACGATCACCTTCTCCTTATTATAGTCGATATAGATCA

Li Song · Answer 8 · Tue Apr 09 2024 10:37:35 GMT+0800 (China Standard Time)

How about the barcode file?

BobW4ng · Answer 9 · Tue Apr 09 2024 10:42:54 GMT+0800 (China Standard Time)

sorry for the wrong files ,the files are here :
R2 file:
@A01426:197:HMYWKDSX2:4:1101:1325:1000 2:N:0:CGTCAAGGGC+GAGTGACCTA
GTGTGGGCTAGTGCGTCTCTTTCATAGTCGCCAGTCATCATCTCTACATCATCCCAGGACATTATCGCTTGCCATGGTGGTACATATGATGTTTACTTTTGTATATGTTTGAAATTTTACATCAATCACTGTGTTACTCTGTTGTTCTCT
+
:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF,:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFF:FFFFFFF:FFFFF:FFFFFFFFFFFFFFFFF
@A01426:197:HMYWKDSX2:4:1101:1344:1000 2:N:0:CGTCAAGGGC+GAGTGACCTA
TGGTTGCTGAGAAGCGGCTCATTCCTGATGGCTGTGGTGTCAAATATATCCCCAATCGTGGTCCTCTGGACAAGTGGAGAGCCCTGCATTCCTGAAGGCTTCAATAGTTCTCCTATACCCTACCAAATCGTTCAATAATAAAATCTCGCA
+
FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF,FFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF
@A01426:197:HMYWKDSX2:4:1101:1434:1000 2:N:0:CGTCAAGGGC+GAGTGACCTA
CTCGCTTGCATCTACTCCGCCCTCATCCTGCACGACGACGAGGTGACGGTCACGGAGGATAAGATCAATGCCCTCATTAAAGCAGCTGGTGTCAGCGTCGAACCTTTCTGGCCTGGCTTGTTTGCCAAGGCTCTGGCCAATGTCAACATT

barcode file:
@A01426:197:HMYWKDSX2:4:1101:1325:1000 1:N:0:CGTCAAGGGC+GAGTGACCTA
GGTAACTCATGTGGTTTAGGTCGTATACTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTATTGTTTTTTAAAATTTAAATTTTAAAATTTAAATTTAATTTATGAAAATTGGTTAATATTAAAAAAAAAATTATAAATATTAAATAATTTT
+
FFFFF:F:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:,,FFFFF,,,FFF:F:FF,FF,,,:FF,,FFFF,FF,F,,F,,,F,:F,,:,,F,F,,FF,,,FF::,FF,:F,FFF,,,F:F:F,,:FF,
@A01426:197:HMYWKDSX2:4:1101:1344:1000 1:N:0:CGTCAAGGGC+GAGTGACCTA
GAAACCTGTTGAATCCGACGGCGTTTAGTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTATTGGAAATTTTTTTTTTTAAAAATTTTGTTTTGTTAAAGTTAAATATTTTAAACATAAAGAAATAATAGAAATAAAAATTTAAAGATTA
+
FFFFF:F:FFFFFFFFFFFFFFFF,,,FF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFF:,,:,,,,,:FFF,FF,:F,,::,,:,F,,,F,,:,F,,,F,,:F,,F,:,,::,,,,,,,F,:,,,:,,,,,,,:,F,F,:F,,F,,,,,
@A01426:197:HMYWKDSX2:4:1101:1434:1000 1:N:0:CGTCAAGGGC+GAGTGACCTA
GGGCGTGTCTAAGCGTTACAATATGTATTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTAGTTAAAAAATTTATTGGGTAAATTAAAAAAATAAGTTTAATAAAAAATAAAAAAGCACAAATTATATTAAAAATCATAAGAATGTTAATT

Li Song · Answer 10 · Tue Apr 09 2024 10:49:59 GMT+0800 (China Standard Time)

Could you please also count the number of lines in the two files?

It seems sequences in R1 file are pretty long. Does it also include actual sequence data?

BobW4ng · Answer 11 · Tue Apr 09 2024 11:39:58 GMT+0800 (China Standard Time)

the R1 files have 367680198lines，the R2 files have 206562599lines，R1 is so long，whats wrong with my data？thanks for reply，Sorry for causing trouble for you

Li Song · Answer 12 · Tue Apr 09 2024 11:50:35 GMT+0800 (China Standard Time)

I'm not sure about that. You may check some of the read ids that only show up in R1 but not R2. Can you also use gzip -t to check the integrity of these gzipped files?

BobW4ng · Answer 13 · Tue Apr 09 2024 11:57:09 GMT+0800 (China Standard Time)

Both file invalid crc error and length error,i think these files are broken,i will replace these files and try again,thank you so much!!!

xanthexu · Answer 14 · Thu May 23 2024 19:10:20 GMT+0800 (China Standard Time)

I have the same issue . But I am using the mapped bam file.

./run-trust4 -b $data/G4-2135_sorted.bam -f $ref/GRCm38_bcrtcr.fa --ref $ref/mouse_IMGT+C.fa -t 10

The error looks like this :

Two reads from the unaligned fragment are not showing up together. Please use -u(--abnormalUnmapFlag from wrapper) option.
system /data/zxu/software/TRUST4/bam-extractor -b /archive/zxu/data/my_datasets/inhouse/Project_s1885r10t006_18Samples_20240520/Alignment/BAM/G4-2135_sorted.bam -t 10 -f /data/zxu/software/TRUST4/mouse/GRCm38_bcrtcr.fa -o output/G4-2135_sorted_toassemble  failed: 139 at ./run-trust4 line 55.

Does anyone have any clue ?

Li Song · Answer 15 · Fri May 24 2024 00:03:48 GMT+0800 (China Standard Time)

@xanthexu . Your file is all right. You can just add the "-u" option when running TRUST4. This happens when some tools generated the sorted BAM file, the unmapped read pairs may not be next to each other. "-u" makes the program slower, but it has less assumptions on the sort order in the BAM file.

xanthexu · Answer 16 · Fri May 24 2024 09:41:04 GMT+0800 (China Standard Time)

Thanks @mourisl . Yesterday I tried it by myself, and later found that removing unmapped reads from the BAM file can also solve this problem. This follows the same idea as the "-u" option you mentioned.

Li Song · Answer 17 · Fri May 24 2024 09:51:48 GMT+0800 (China Standard Time)

Many of the reads from the VDJ region are unmapped due to the recombination. I would recommend keeping them in the analysis.