<aside> 💡 MEGACC를 이용해 Phylogeny 분석을 진행함으로써, 기존 GUI MEGA 대비 더 간편하고 빠르게 phylogeny 분석을 진행할 수 있게 합니다.
</aside>
작성일: 2020년 7월 19일
수정일: 2022년 2월 9일
작성자: @HJ Lee
모든 내용에 토글을 이용해 예시를 첨부해두었습니다.
MSA (by MUSCLE)
MEGACC는 MSA가 진행된 fasta file을 input으로 받습니다. 이를 위해 MSA를 진행합니다.
본 방법은 RNA server의 muscle을 이용합니다. output은 fasta 파일로 받습니다.
input: .faa or .fasta
output: .fasta
muscle3.8.31_i86linux64 (server: rna)
/program/muscle3.8.31_i86linux64 -in example.faa -out example.fasta
MEGA (by MEGACC)
본 방법은 MEGACC를 이용해 MSA가 완료된 fasta file을 통해 phylogeny file(newick format)을 만들어줍니다.
<aside> 💡 MEGACC는 RNA server에도 설치되어 있지만, SSD가 있는 windows 와 mac 로컬에서 실행할 경우 더 빠르게 진행할 수 있습니다. CPU 성능보다, HDD 속도에 더 많은 영향을 받는 것으로 확인됩니다. 하지만 서버에서 돌릴 경우 로컬보다 안정적으로 돌릴 수 있습니다. 필요에 따라 맞춰 돌려주세요.
</aside>
1300개 TssC 기준 RNA server에서 24시간 내외
2300개 TssC 기준 13inch MacBook Pro 8시간 - 10시간 내외
2300개 TssC 기준 15inch MacBook Pro 6시간 내외
2.1 설치
2.2 실행
MEGACC는 1개의 input (fasta file), 1개의 option file(MAO file), 1개의 output(newick file)로 실행됩니다.
megacc -a #MAO file
-d #fasta file
-o #output_newick file
-f fasta
e.g.)
megacc
-a /Users/whe/OneDrive/Documents/Hanyang/Project/R/Prot_infer_ML_nucleotide_T14_Bootstrap0.mao
-d /Users/whe/OneDrive/Documents/Hanyang/Project/2006_Proteobacteria_T6SS_re/08_testDB_to_HMP/0713_over7_NR_TssC_no_Abnormal_with_NR_Bacteroidetes/0713_over7_NR_TssC_no_Abnormal_with_NR_Bacteroidetes.fasta
-o /Users/whe/OneDrive/Documents/Hanyang/Project/2006_Proteobacteria_T6SS_re/08_testDB_to_HMP/0713_over7_NR_TssC_no_Abnormal_with_NR_Bacteroidetes/0713_over7_NR_TssC_no_Abnormal_with_NR_Bacteroidetes.nwk
-f fasta
MAO file은 MEGACC의 옵션이 지정된 파일이며, 제가 주로 사용하는 MAO 파일의 위치는 다음과 같습니다.
@mine:/data/hjlee/automatic_made/ (share 접근 가능)
필요한 옵션; DNA or Protein, Threads 개수, Bootstrap 개수에 따라 적절한 MAO 파일을 골라 입력해주세요.
Fasta file은 1.에서 진행한 MSA file을 그대로 넣어주시면 됩니다.
Output file은 newick format이 나오게 됩니다.
MEGACC:
https://www.megasoftware.net/web_help_10/index.htm#t=Running_in_Command-Line_Mode.htm&rhsearch=megacc&rhhlterm=megacc&rhsyns=
ggtree:
https://guangchuangyu.github.io/ggtree-book/chapter-ggtree.html#results-1
https://yulab-smu.github.io/treedata-book/chapter9.html#ggtree-for-phylogenetic-tree-objects