BigBWA Alignment 분석 도구 설치 및 실행 방법

BigBWA Alignment 분석 도구 설치 및 실행 방법Bioinformatics2017. 1. 6. 14:37@kogun82

Table of Contents

Github 사이트에서 BigBWA 를 다운 받아 설치한다. (https://github.com/citiususc/BigBWA)

1). 애플리케이션 디렉토리로 이동하여 Makefile.common 수정한다. (중요: 컴파일시 -lz 옵션이 추가되지 않으면, gzlib 관련 에러 발생)

-변경전

LIBBWA_LIBS = -lrt

-변경후

LIBBWA_LIBS = -lrt  -lz

2). 애플리케이션 디렉토리로 이동하여 build.sh 코드를 시스템 환경에 맞게 변경 후 실행한다.

#!/bin/bash

cd BigBWA-master
make clean
make
cd ..
bash scp.sh \
'BigBWA-master/build/BigBWA.jar BigBWA-master/build/bwa.zip' \
/opt/cloudera/parcels/CDH/lib/BigBWA/

※ build 가 안될 경우 git 을 이용해서 빌드 명령어 실행

명령어 예제).

git clone https://github.com/citiususc/BigBWA.git
cd BigBWA
mvn package

3). 입력 데이터를 BigBWA 형태에 맞도록 변경한다.

명령어 예제).

/usr/bin/python2.7 \
~/BigBWA-master/src/utils/Fq2FqBigDataPaired.py \
~/R1_001.fastq ~/R2_001.fastq big_bwa_input.fqBD

4). build.sh 완료 후 run.sh 실행한다.

#!/bin/bash

hdfs dfs -rm -r -skipTrash ~/BigBWA-master/output
hadoop jar ~/BigBWA-master/BigBWA.jar \
-archives ~/BigBWA-master/bwa.zip \
-D hadoop.tmp.dir=/tmp \
-D mapreduce.input.fileinputformat.split.minsize=134217728 \
-D mapreduce.input.fileinputformat.split.maxsize=134217728 \
-algorithm mem \
-r -reads paired \
-index ~/index/hg19 \
~/BigBWA-master/big_bwa_input.fqBD \
~/BigBWA-master/output

5). https://github.com/citiususc/BigBWA/blob/master/src/BigBWA.java 255라인에서 임시디렉토리 경로가 /tmp/hadoop-yarn/ 으로 설정되어 있지만, 실제 디렉토리는 존재하지 않았음. /tmp/hadoop-yarn/ 디렉토리를 만들어 준다.

저작자표시 비영리 변경금지

'Bioinformatics' 카테고리의 다른 글

PASTASpark 설치 및 실행하기 (0)	2017.09.18
SparkBWA Alignment 분석 도구 설치 및 실행 방법 (0)	2017.01.18
MapSplice2 Alignment 분석 도구 설치 및 실행 방법 (0)	2017.01.06
BLAST Nr/Nt 데이터베이스에서 시퀀싱 서열로 변환 명령어 (0)	2016.02.17
Burrow-wheeler Transform (BWT) (0)	2012.08.01

@kogun82 :: Ctrl+C&V 로 하는 프로그래밍

Korean BioInformation Center(KOBIC) Korea Research Institute of Bioscience & Biotechnology Address: #52 Eoeun-dong, Yuseong-gu, Deajeon, 305-806, KOREA +82-10-9936-2261 e-mail: kogun82@kribb.re.kr Blog: kogun82.tistory.com Homepage: www.kobic.re.kr

포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!

'Bioinformatics' 카테고리의 다른 글

티스토리툴바