Github 사이트에서 BigBWA 를 다운 받아 설치한다. (https://github.com/citiususc/BigBWA)
1). 애플리케이션 디렉토리로 이동하여 Makefile.common 수정한다. (중요: 컴파일시 -lz 옵션이 추가되지 않으면, gzlib 관련 에러 발생)
-변경전
LIBBWA_LIBS = -lrt
-변경후
LIBBWA_LIBS = -lrt -lz
2). 애플리케이션 디렉토리로 이동하여 build.sh 코드를 시스템 환경에 맞게 변경 후 실행한다.
#!/bin/bash
cd BigBWA-master
make clean
make
cd ..
bash scp.sh \
'BigBWA-master/build/BigBWA.jar BigBWA-master/build/bwa.zip' \
/opt/cloudera/parcels/CDH/lib/BigBWA/
※ build 가 안될 경우 git 을 이용해서 빌드 명령어 실행
명령어 예제).
git clone https://github.com/citiususc/BigBWA.git
cd BigBWA
mvn package
3). 입력 데이터를 BigBWA 형태에 맞도록 변경한다.
명령어 예제).
/usr/bin/python2.7 \
~/BigBWA-master/src/utils/Fq2FqBigDataPaired.py \
~/R1_001.fastq ~/R2_001.fastq big_bwa_input.fqBD
4). build.sh 완료 후 run.sh 실행한다.
#!/bin/bash
hdfs dfs -rm -r -skipTrash ~/BigBWA-master/output
hadoop jar ~/BigBWA-master/BigBWA.jar \
-archives ~/BigBWA-master/bwa.zip \
-D hadoop.tmp.dir=/tmp \
-D mapreduce.input.fileinputformat.split.minsize=134217728 \
-D mapreduce.input.fileinputformat.split.maxsize=134217728 \
-algorithm mem \
-r -reads paired \
-index ~/index/hg19 \
~/BigBWA-master/big_bwa_input.fqBD \
~/BigBWA-master/output
5). https://github.com/citiususc/BigBWA/blob/master/src/BigBWA.java 255라인에서 임시디렉토리 경로가 /tmp/hadoop-yarn/ 으로 설정되어 있지만, 실제 디렉토리는 존재하지 않았음. /tmp/hadoop-yarn/ 디렉토리를 만들어 준다.
'Bioinformatics' 카테고리의 다른 글
PASTASpark 설치 및 실행하기 (0) | 2017.09.18 |
---|---|
SparkBWA Alignment 분석 도구 설치 및 실행 방법 (0) | 2017.01.18 |
MapSplice2 Alignment 분석 도구 설치 및 실행 방법 (0) | 2017.01.06 |
BLAST Nr/Nt 데이터베이스에서 시퀀싱 서열로 변환 명령어 (0) | 2016.02.17 |
Burrow-wheeler Transform (BWT) (0) | 2012.08.01 |
Korean BioInformation Center(KOBIC) Korea Research Institute of Bioscience & Biotechnology Address: #52 Eoeun-dong, Yuseong-gu, Deajeon, 305-806, KOREA +82-10-9936-2261 e-mail: kogun82@kribb.re.kr Blog: kogun82.tistory.com Homepage: www.kobic.re.kr
포스팅이 좋았다면 "좋아요❤️" 또는 "구독👍🏻" 해주세요!