- Install CycleCloud CLI
These applications is installed automatically.
- BWA
- SAMTOOLS
- htslib
- GATK
- Cromwell
- Slurm
- Docker, Singularity
- tar zxvf cyclecloud-genomicswfe.tar.gz
- cd cyclecloud-genomicswfe
- Rewrite "Files" attribute for your binariy in "project.ini" file.
- run "cyclecloud project upload azure-storage" for uploading template to CycleCloud
- "cyclecloud import_template -f templates/genomicswfe.txt" for register this template to your CycleCloud
- Download your sample
- Create batch script
- Submit the job. "sbatch -c 44 -n 1 run.sh" (for example, HC44rs 1 node)
Sample Submit Script (run.sh) for bwa mem. (without WDL)
CORE=44
time ~/apps/bwa-0.7.17/bwa mem -t $CORE -R ~/apps/ucsc.hg19 ~/apps/GENOMICS_randomreads_R1.fastq ~/apps/GENOMICS_randomreads_R2.fastq > ~/apps/GENOMICS_randomreads.sam
Azure CycleCloud はMicrosoft Azure上で簡単にCAE/HPC/Deep Learning用のクラスタ環境を構築できるソリューションです。
Azure CyceCloudのインストールに関しては、こちら のドキュメントを参照してください。
ゲノミクス向けパイプラインアプリケーションのテンプレートになっています。 以下の構成、特徴を持っています。
- OSS PBS ProジョブスケジューラをMasterノードにインストール
- H16r, H16r_Promo, HC44rs, HB60rsを想定したテンプレート、イメージ - OpenLogic CentOS 7.6 HPC を利用
- Masterノードに512GB * 2 のNFSストレージサーバを搭載 - Executeノード(計算ノード)からNFSをマウント
- MasterノードのIPアドレスを固定設定 - 一旦停止後、再度起動した場合にアクセスする先のIPアドレスが変更されない
テンプレートインストール方法
前提条件: テンプレートを利用するためには、Azure CycleCloud CLIのインストールと設定が必要です。詳しくは、 こちら の文書からインストールと展開されたAzure CycleCloudサーバのFQDNの設定が必要です。
- テンプレート本体をダウンロード
- 展開、ディレクトリ移動
- cyclecloudコマンドラインからテンプレートインストール
- tar zxvf cyclecloud-genomicswfe.tar.gz
- cd cyclecloud-genomicswfe
- cyclecloud project upload azure-storage
- cyclecloud import_template -f templates/genomicswfe.txt
- 削除したい場合、 cyclecloud delete_template genomicswfe コマンドで削除可能
Copyright Hiroshi Tanaka, hirtanak@gmail.com, @hirtanak All rights reserved. Use of this source code is governed by MIT license that can be found in the LICENSE file.