새소식

Bioinformatics

BigBWA Alignment 분석 도구 설치 및 실행 방법

  • -

Github 사이트에서 BigBWA 를 다운 받아 설치한다. (https://github.com/citiususc/BigBWA)

 

1). 애플리케이션 디렉토리로 이동하여 Makefile.common 수정한다. (중요: 컴파일시 -lz 옵션이 추가되지 않으면,  gzlib 관련 에러 발생)

 

-변경전

LIBBWA_LIBS = -lrt

 

-변경후

LIBBWA_LIBS = -lrt  -lz

 

2). 애플리케이션 디렉토리로 이동하여 build.sh 코드를 시스템 환경에 맞게 변경 후 실행한다.

#!/bin/bash

cd BigBWA-master
make clean
make
cd ..
bash scp.sh \
'BigBWA-master/build/BigBWA.jar BigBWA-master/build/bwa.zip' \
/opt/cloudera/parcels/CDH/lib/BigBWA/

※ build 가 안될 경우 git 을 이용해서 빌드 명령어 실행

 

명령어 예제).

git clone https://github.com/citiususc/BigBWA.git
cd BigBWA
mvn package

 

3). 입력 데이터를 BigBWA 형태에 맞도록 변경한다.

 

명령어 예제).

/usr/bin/python2.7 \
~/BigBWA-master/src/utils/Fq2FqBigDataPaired.py \
~/R1_001.fastq ~/R2_001.fastq big_bwa_input.fqBD

 

4). build.sh 완료 후 run.sh 실행한다.

 

#!/bin/bash

hdfs dfs -rm -r -skipTrash ~/BigBWA-master/output
hadoop jar ~/BigBWA-master/BigBWA.jar \
-archives ~/BigBWA-master/bwa.zip \
-D hadoop.tmp.dir=/tmp \
-D mapreduce.input.fileinputformat.split.minsize=134217728 \
-D mapreduce.input.fileinputformat.split.maxsize=134217728 \
-algorithm mem \
-r -reads paired \
-index ~/index/hg19 \
~/BigBWA-master/big_bwa_input.fqBD \
~/BigBWA-master/output

 

5). https://github.com/citiususc/BigBWA/blob/master/src/BigBWA.java  255라인에서 임시디렉토리 경로가 /tmp/hadoop-yarn/ 으로 설정되어 있지만, 실제 디렉토리는 존재하지 않았음. /tmp/hadoop-yarn/ 디렉토리를 만들어 준다.

 

 

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.