BLAST Nr/Nt 데이터베이스에서 시퀀싱 서열로 변환 명령어
Bioinformatics2016. 2. 17. 10:56BLAST Nr/Nt 데이터베이스에서 시퀀싱 서열로 변환 명령어

BLAST NR 데이터베이스에서 FASTA 형태의 Sequences 데이터를 추출할때 다음과 같은 명령어를 이용한다. 명령어 예제). blastdbcmd \ -db est \ -dbtype nr \ -entry_batch myContigList.txt \ -outfmt %f \ -out myHitContigs.fasta

Burrow-wheeler Transform (BWT)
Bioinformatics2012. 8. 1. 17:15Burrow-wheeler Transform (BWT)

Burrow-wheeler Transform 알고리즘은 Block-Sorting compression으로 불린다. BWT 알고리즘은 압축을 시킬 파일의 구성 원소를 빈도 수 별로 분석 한 후 분석된 값을 효율 적으로 표현 시키는 data compression에 사용되는 알고리즘이다. 문자열이 BWT에 의해 변환되면 character 의 값은 변하지 않고 순서들만 변하게 된다. 원본 문자열에서 몇몇 substring이 자주 발생하게 되면, 변환된 문자열에서는 single character가 여러 번 반복되는 위치가 생기게 된다. 이것은 move-to-front transform과 run-length encoding에 의해 압축하기에 편리하다. output이 input에 비해서 압축 하기가 쉬운 이유는 많은..

Burrows-Wheeler Aligner(BWA) Alignment 분석 도구 설치 및 실행 방법
Bioinformatics2012. 7. 28. 19:19Burrows-Wheeler Aligner(BWA) Alignment 분석 도구 설치 및 실행 방법

http://bio-bwa.sourceforge.net/ 소스 및 메뉴얼 압축 해제 후 설치를 진행한다. 명령어 예제). make & make install 기본 동작 순서는 다음과 같다. 레퍼런스 시퀀싱을 데이터를 인덱싱한다. 명령어 예제). bwa index -a bwtsw database.fasta 리드 파일들을 레퍼런스 매핑한다. 명령어 예제). bwa aln database.fasta short_read.fastq > aln_sa.sai 매핑된 결과를 SAM 표준 파일로 변환한다. 명령어 예제). bwa sampe database.fasta aln_sa1.sai aln_sa2.sai read1.fq read2.fq > aln.sam 레퍼런스 시퀀싱을 인덱싱 한다. 데이터 Chromosome 별로..

SRA Toolkit 을 이용한 SRA 파일 FASTQ 로 전환하기
Bioinformatics2012. 6. 7. 08:56SRA Toolkit 을 이용한 SRA 파일 FASTQ 로 전환하기

NCBI SRA 파일을 다운로드 후 분석을 위한 FASTQ 파일 포멧으로 변경시 SRA-Toolkit 을 이용하여 변경한다. SRA 파일이 Single 일 경우 fastq-dump 명령어로 변환하면 되지만 Paired-end 경우 다음과 같은 옵션을 지정하여 변경한다. 명령어 예제). fastq-dump --split-files

Bowtie Alignment 분석 도구 설치 및 실행 방법
Bioinformatics2011. 3. 14. 16:47Bowtie Alignment 분석 도구 설치 및 실행 방법

Bowtie Aliner 레퍼런스 인덱스를 생성한다. 명령어 예제). ~/bowtie-0.12.8/bowtie-build -f ~/hg19/hg19.fa /$output_path/$output_name 생성된 레퍼런스 인덱스 파일과 리드들을 이용한 Paired-end Alignment 분석을 실행한다. 명령어 예제). ~/bowtie-0.12.8/bowtie \ -v 2 -a -m 100 -q -p 1 \ -S /hg19/hg19 -X 1000 \ -1 ~/R1_001.fastq \ -2 ~/R2_001.fastq > /$output_path/$output.sam

image