hirtanak / cyclecloud-genomicswfe

Azure CyclecCloud template for Genomics Workflow Engine and applications

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

Azure CycleCloud template for Genomics Pipeline Applications

Prerequisites

  1. Install CycleCloud CLI

Install Software

These applications is installed automatically.

  1. BWA
  2. SAMTOOLS
  3. htslib
  4. GATK
  5. Cromwell
  6. Slurm
  7. Docker, Singularity

How to install

  1. tar zxvf cyclecloud-genomicswfe.tar.gz
  2. cd cyclecloud-genomicswfe
  3. Rewrite "Files" attribute for your binariy in "project.ini" file.
  4. run "cyclecloud project upload azure-storage" for uploading template to CycleCloud
  5. "cyclecloud import_template -f templates/genomicswfe.txt" for register this template to your CycleCloud

How to use

  1. Download your sample
  2. Create batch script
  3. Submit the job. "sbatch -c 44 -n 1 run.sh" (for example, HC44rs 1 node)

Sample Submit Script (run.sh) for bwa mem. (without WDL)


CORE=44
time ~/apps/bwa-0.7.17/bwa mem -t $CORE -R  ~/apps/ucsc.hg19 ~/apps/GENOMICS_randomreads_R1.fastq ~/apps/GENOMICS_randomreads_R2.fastq > ~/apps/GENOMICS_randomreads.sam

Azure CycleCloud用テンプレート:Genomics向けアプリケーション、ワークフローエンジン

Azure CycleCloud はMicrosoft Azure上で簡単にCAE/HPC/Deep Learning用のクラスタ環境を構築できるソリューションです。

テンプレートがサポートするアプリケーション構成

Azure CyceCloudのインストールに関しては、こちら のドキュメントを参照してください。

ゲノミクス向けパイプラインアプリケーションのテンプレートになっています。 以下の構成、特徴を持っています。

  1. OSS PBS ProジョブスケジューラをMasterノードにインストール
  2. H16r, H16r_Promo, HC44rs, HB60rsを想定したテンプレート、イメージ - OpenLogic CentOS 7.6 HPC を利用
  3. Masterノードに512GB * 2 のNFSストレージサーバを搭載 - Executeノード(計算ノード)からNFSをマウント
  4. MasterノードのIPアドレスを固定設定 - 一旦停止後、再度起動した場合にアクセスする先のIPアドレスが変更されない

OSS PBS Default テンプレート構成

テンプレートインストール方法

前提条件: テンプレートを利用するためには、Azure CycleCloud CLIのインストールと設定が必要です。詳しくは、 こちら の文書からインストールと展開されたAzure CycleCloudサーバのFQDNの設定が必要です。

  1. テンプレート本体をダウンロード
  2. 展開、ディレクトリ移動
  3. cyclecloudコマンドラインからテンプレートインストール
    • tar zxvf cyclecloud-genomicswfe.tar.gz
    • cd cyclecloud-genomicswfe
    • cyclecloud project upload azure-storage
    • cyclecloud import_template -f templates/genomicswfe.txt
  4. 削除したい場合、 cyclecloud delete_template genomicswfe コマンドで削除可能

Copyright Hiroshi Tanaka, hirtanak@gmail.com, @hirtanak All rights reserved. Use of this source code is governed by MIT license that can be found in the LICENSE file.

About

Azure CyclecCloud template for Genomics Workflow Engine and applications

License:MIT License


Languages

Language:Python 58.4%Language:Shell 22.1%Language:C 8.8%Language:Ruby 8.3%Language:HTML 1.6%Language:Makefile 0.8%