dieterich-lab / DCC

DCC uses output from the STAR read mapper to systematically detect back-splice junctions in next-generation sequencing data. DCC applies a series of filters and integrates data across replicate sets to arrive at a precise list of circRNA candidates.

Home Page:https://dieterichlab.org/software/

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Do you have SJ.out.tab files in your sample folder

prince26121991 opened this issue · comments

When I am running Circtools with detect module everything goes smoothly but suddenly it stops everytime with same error
Do you have SJ.out.tab files in your sample folder? DCC cannot find it.
This the folder structure from where I am running it:
.
├── bam_files
├── CircCoordinates
├── CircRNACount
├── CircSkipJunctions
├── DCC-2019-01-02_2251.log
├── Homo_sapiens.GRCh38.94.gtf
├── Homo_sapiens.GRCh38.dna.fa
├── Homo_sapiens.GRCh38.dna.fa.fai
├── LinearCount
├── mate1
├── mate2
├── repeats_track.gtf
├── samplesheet
└── _tmp_DCC
├── ci1Chimeric.out.junction.ZKZ00K
├── ci1Chimeric.out.junction.ZKZ00K.circRNA
├── ci1Chimeric.out.junction.ZKZ00K.circRNAmapped
├── ci3Chimeric.out.junction.ABH7GN
├── ci3Chimeric.out.junction.ABH7GN.circRNA
├── ci3Chimeric.out.junction.ABH7GN.circRNAmapped
├── ci4Chimeric.out.junction.HA3TF3
├── ci4Chimeric.out.junction.HA3TF3.circRNA
├── ci4Chimeric.out.junction.HA3TF3.circRNAmapped
├── co1Chimeric.out.junction.UPUYBH
├── co1Chimeric.out.junction.UPUYBH.circRNA
├── co1Chimeric.out.junction.UPUYBH.circRNAmapped
├── co3Chimeric.out.junction.F3T4F6
├── co3Chimeric.out.junction.F3T4F6.circRNA
├── co3Chimeric.out.junction.F3T4F6.circRNAmapped
├── co4Chimeric.out.junction.QIBMPA
├── co4Chimeric.out.junction.QIBMPA.circRNA
└── co4Chimeric.out.junction.QIBMPA.circRNAmapped

bam_files contains following lines
/home/scbb/cdri_data/aaaaaa/star/ci1/ci1Aligned.noS.bam
/home/scbb/cdri_data/aaaaaa/star/ci3/ci3Aligned.noS.bam
/home/scbb/cdri_data/aaaaaa/star/ci4/ci4Aligned.noS.bam
/home/scbb/cdri_data/aaaaaa/star/co1/co1Aligned.noS.bam
/home/scbb/cdri_data/aaaaaa/star/co3/co3Aligned.noS.bam
/home/scbb/cdri_data/aaaaaa/star/co4/co4Aligned.noS.bam

this is the structure of star directory

.
├── ci1
│   ├── Chimeric.noS.bam
│   ├── Chimeric.noS.bam.bai
│   ├── ci1Aligned.noS.bam
│   ├── ci1Aligned.noS.bam.bai
│   ├── ci1Chimeric.out.junction
│   ├── header.txt
│   ├── Log.final.out
│   ├── Log.out
│   ├── Log.progress.out
│   ├── mate1
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── ci1_1_Chimeric.out.junction
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── mate2
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── ci1_2_Chimeric.out.junction
│   │   ├── ci1_2_Chimeric.out.junction.fixed
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── ReadsPerGene.out.tab
│   ├── SJ.out.tab
│   ├── Unmapped.out.mate1.gz
│   └── Unmapped.out.mate2.gz
├── ci3
│   ├── Chimeric.noS.bam
│   ├── Chimeric.noS.bam.bai
│   ├── ci3Aligned.noS.bam
│   ├── ci3Aligned.noS.bam.bai
│   ├── ci3Chimeric.out.junction
│   ├── header.txt
│   ├── Log.final.out
│   ├── Log.out
│   ├── Log.progress.out
│   ├── mate1
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── ci3_1_Chimeric.out.junction
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── mate2
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── ci3_2_Chimeric.out.junction
│   │   ├── ci3_2_Chimeric.out.junction.fixed
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── ReadsPerGene.out.tab
│   ├── SJ.out.tab
│   ├── Unmapped.out.mate1.gz
│   └── Unmapped.out.mate2.gz
├── ci4
│   ├── Chimeric.noS.bam
│   ├── Chimeric.noS.bam.bai
│   ├── ci4Aligned.noS.bam
│   ├── ci4Aligned.noS.bam.bai
│   ├── ci4Chimeric.out.junction
│   ├── header.txt
│   ├── Log.final.out
│   ├── Log.out
│   ├── Log.progress.out
│   ├── mate1
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── ci4_1_Chimeric.out.junction
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── mate2
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── ci4_2_Chimeric.out.junction
│   │   ├── ci4_2_Chimeric.out.junction.fixed
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── ReadsPerGene.out.tab
│   ├── SJ.out.tab
│   ├── Unmapped.out.mate1.gz
│   └── Unmapped.out.mate2.gz
├── co1
│   ├── Chimeric.noS.bam
│   ├── Chimeric.noS.bam.bai
│   ├── co1Aligned.noS.bam
│   ├── co1Aligned.noS.bam.bai
│   ├── co1Chimeric.out.junction
│   ├── header.txt
│   ├── Log.final.out
│   ├── Log.out
│   ├── Log.progress.out
│   ├── mate1
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── co1_1_Chimeric.out.junction
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── mate2
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── co1_2_Chimeric.out.junction
│   │   ├── co1_2_Chimeric.out.junction.fixed
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── ReadsPerGene.out.tab
│   ├── SJ.out.tab
│   ├── Unmapped.out.mate1.gz
│   └── Unmapped.out.mate2.gz
├── co3
│   ├── Chimeric.noS.bam
│   ├── Chimeric.noS.bam.bai
│   ├── co3Aligned.noS.bam
│   ├── co3Aligned.noS.bam.bai
│   ├── co3Chimeric.out.junction
│   ├── header.txt
│   ├── Log.final.out
│   ├── Log.out
│   ├── Log.progress.out
│   ├── mate1
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── co3_1_Chimeric.out.junction
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── mate2
│   │   ├── Aligned.noS.bam
│   │   ├── Aligned.noS.bam.bai
│   │   ├── Chimeric.noS.bam
│   │   ├── Chimeric.noS.bam.bai
│   │   ├── co3_2_Chimeric.out.junction
│   │   ├── co3_2_Chimeric.out.junction.fixed
│   │   ├── header.txt
│   │   ├── Log.final.out
│   │   ├── Log.out
│   │   ├── Log.progress.out
│   │   ├── ReadsPerGene.out.tab
│   │   ├── SJ.out.tab
│   │   └── Unmapped.out.mate1
│   ├── ReadsPerGene.out.tab
│   ├── SJ.out.tab
│   ├── Unmapped.out.mate1.gz
│   └── Unmapped.out.mate2.gz
└── co4
├── Chimeric.noS.bam
├── Chimeric.noS.bam.bai
├── co4Aligned.noS.bam
├── co4Aligned.noS.bam.bai
├── co4Chimeric.out.junction
├── header.txt
├── Log.final.out
├── Log.out
├── Log.progress.out
├── mate1
│   ├── Aligned.noS.bam
│   ├── Aligned.noS.bam.bai
│   ├── Chimeric.noS.bam
│   ├── Chimeric.noS.bam.bai
│   ├── co4_1_Chimeric.out.junction
│   ├── header.txt
│   ├── Log.final.out
│   ├── Log.out
│   ├── Log.progress.out
│   ├── ReadsPerGene.out.tab
│   ├── SJ.out.tab
│   └── Unmapped.out.mate1
├── mate2
│   ├── Aligned.noS.bam
│   ├── Aligned.noS.bam.bai
│   ├── Chimeric.noS.bam
│   ├── Chimeric.noS.bam.bai
│   ├── co4_2_Chimeric.out.junction
│   ├── co4_2_Chimeric.out.junction.fixed
│   ├── header.txt
│   ├── Log.final.out
│   ├── Log.out
│   ├── Log.progress.out
│   ├── ReadsPerGene.out.tab
│   ├── SJ.out.tab
│   └── Unmapped.out.mate1
├── ReadsPerGene.out.tab
├── SJ.out.tab
├── Unmapped.out.mate1.gz
└── Unmapped.out.mate2.gz

Each directory has SJ.out.tab in it but still it is not able to detect it, please help

This the command I am running
circtools detect @samplesheet -mt1 @mate1 -mt2 @mate2 -B @bam_files -D -R repeats_track.gtf -an Homo_sapiens.GRCh38.94.gtf -Pi -F -M -Nr 5 3 -fg -G -A Homo_sapiens.GRCh38.dna.fa

Problem is solved,
Solution: Tutorial manual suggest that, one must not change SJ.out.tab filename, but I look into DCC script, it replaces Chimeric.out.junction with SJ.out.tab. I was using
"/home/scbb/cdri_data/aaaaaa/star/ci1/ci1Chimeric.out.junction" in samplesheet, therefore if it replaces Chimeric.out.junction with SJ.out.tab I get "/home/scbb/cdri_data/aaaaaa/star/ci1/ci1SJ.out.tab" . Which is actually not present in my /home/scbb/cdri_data/aaaaaa/star/ci1 directory, because I haven't renamed it as per suggested in manual. But if one is renaming Chimeric.out.junction than one must change SJ.out.tab accordingly with same prefix.