reciprocal_smallest_distance

Phần mềm chụp màn hình:
reciprocal_smallest_distance
Các chi tiết về phần mềm:
Phiên bản: 1.1.5
Ngày tải lên: 20 Feb 15
Giấy phép: Miễn phí
Phổ biến: 42

Rating: 3.5/5 (Total Votes: 2)

reciprocal_smallest_distance là một thuật toán orthology cặp có sử dụng liên kết chuỗi toàn cầu và khả năng tối đa khoảng cách giữa các chuỗi tiến hóa để phát hiện chính xác orthologs giữa bộ gen.
Cài đặt Từ một Tarball
Tải về và giải nén phiên bản mới nhất từ ​​github:
cd ~
-L curl https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz | Tar xvz
Cài đặt reciprocal_smallest_distance, đảm bảo sử dụng Python 2.7:
cd reciprocal_smallest_distance-VERSION
python setup.py cài đặt
Sử dụng RSD để Tìm Othologs
Các lệnh ví dụ sau đây chứng minh những cách chính để chạy rsd_search. Mỗi lời gọi của rsd_search yêu cầu xác định vị trí của một tập tin có định dạng chuỗi FASTA cho hai bộ gen, gọi là các truy vấn và bộ gen chịu. Thứ tự của họ là độc đoán, nhưng nếu bạn sử dụng tùy chọn --ids, id phải đến từ các bộ gen truy vấn. Bạn cũng phải xác định một tập tin để ghi các kết quả của các orthologs tìm thấy bởi các thuật toán RSD. Các định dạng của tập tin đầu ra có chứa một ortholog trên mỗi dòng. Mỗi dòng chứa các truy vấn tự id, chủ chuỗi id, và khoảng cách (tính bằng codeml) giữa các chuỗi. Bạn có thể tùy chọn chỉ định một tập tin có chứa id bằng cách sử dụng tùy chọn --ids. Sau đó RSD sẽ chỉ tìm kiếm cho orthologs cho những id. Sử dụng --divergence và --evalue, bạn có tùy chọn sử dụng các ngưỡng khác nhau từ giá trị mặc định.
Nhận trợ giúp về cách chạy rsd_search, rsd_blast, hoặc rsd_format:
rsd_search -h
rsd_blast -h
rsd_format -h
Tìm orthologs giữa tất cả các chuỗi trong bộ gen truy vấn và đối tượng, sử dụng phân kỳ mặc định và evalue ngưỡng
ví dụ rsd_search q / hệ gen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-gen = ví dụ / bộ gen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
Tìm orthologs sử dụng nhiều phân kỳ và evalue ngưỡng không mặc định
ví dụ rsd_search q / hệ gen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-gen = ví dụ / bộ gen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
--de 0,2 1e-20 --de 0,5 0,00001 --de 0,8 0,1
Nó không phải là cần thiết để định dạng một tập tin FASTA cho BLAST hoặc tính toán BLAST chạm vì rsd_search nào đó cho bạn.
Tuy nhiên nếu bạn có kế hoạch chạy nhiều lần rsd_search cho các bộ gen giống nhau, đặc biệt là đối với bộ gen lớn, bạn có thể tiết kiệm thời gian bằng cách sử dụng rsd_format để preformatting các tập tin và FASTA rsd_blast để precomputing các BLAST lượt truy cập. Khi chạy rsd_blast, hãy chắc chắn để sử dụng một --evalue lớn như ngưỡng evalue lớn nhất bạn có ý định để cho rsd_search.
Dưới đây là làm thế nào để định dạng một cặp file FASTA tại chỗ:
rsd_format -g ví dụ / bộ gen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g ví dụ / bộ gen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
Và đây là cách để định dạng các tập tin FASTA, đưa kết quả trong thư mục khác (thư mục hiện tại trong trường hợp này)
rsd_format -g ví dụ / bộ gen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa -d.
rsd_format -g ví dụ / bộ gen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa -d.
Dưới đây là làm thế nào để tính toán phía trước và ngược hits nổ (sử dụng evalue mặc định):
rsd_blast -v -q ví dụ / bộ gen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-gen = ví dụ / bộ gen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forward-hits q_s.hits --reverse-hits s_q.hits
Dưới đây là làm thế nào để tính toán về phía trước và ngược lại nổ hit với rsd_search, sử dụng bộ gen đã được định dạng cho vụ nổ và một evalue không mặc định
rsd_blast -v -q Mycoplasma_genitalium.aa
--subject-gen = Mycobacterium_leprae.aa
--forward-hits q_s.hits --reverse-hits s_q.hits
--no-format --evalue 0.1
Tìm orthologs giữa tất cả các chuỗi trong các truy vấn và bộ gen đối tượng sử dụng bộ gen đã được định dạng cho nổ
rsd_search -q Mycoplasma_genitalium.aa
--subject-gen = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-format
Tìm orthologs giữa tất cả các chuỗi trong các truy vấn và bộ gen đối tượng sử dụng hits mà đã được tính toán. Chú ý rằng --no-định dạng được bao gồm, vì kể từ hit nổ đã được tính toán các bộ gen không cần phải được định dạng cho vụ nổ.
rsd_search -v --query-gen Mycoplasma_genitalium.aa
--subject-gen = Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forward-hits q_s.hits --reverse-hits s_q.hits --no-format
Tìm orthologs cho các trình tự cụ thể trong hệ gen của truy vấn. Đối với việc tìm kiếm orthologs cho chỉ một vài trình tự, sử dụng --no-nổ-cache có thể tăng tốc độ tính toán. YMMV.
ví dụ rsd_search q / hệ gen / Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subject-gen = ví dụ / bộ gen / Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
ví dụ -o / Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids ví dụ / Mycoplasma_genitalium.aa.ids.txt --no-nổ-cache
Định dạng Output
Orthologs có thể được lưu trong các định dạng khác nhau bằng cách sử dụng tùy chọn --outfmt của rsd_search. Các định dạng mặc định, --outfmt -1, đề cập đến --outfmt 3. Lấy cảm hứng từ Uniprot dat file, một tập hợp các orthologs bắt đầu với một dòng thông số, sau đó có 0 hoặc nhiều dòng ortholog, sau đó có một dòng cuối cùng. Các parametes là tên truy vấn bộ gen, gen tên chủ đề, ngưỡng phân kỳ, và ngưỡng evalue. Mỗi ortholog là trên một dòng đơn liệt kê các truy vấn tự id, trình tự đề id, và ước tính khoảng cách tối đa khả năng. Định dạng này có thể đại diện cho orthologs cho nhiều bộ thông số trong một tập tin duy nhất cũng như bộ thông số không có orthologs. Vì vậy nó là thích hợp để sử dụng với rsd_search khi chỉ định nhiều phân kỳ và evalue ngưỡng.
Dưới đây là một ví dụ có chứa 2 kết hợp tham số, một trong số đó không có orthologs:
PA tLACJO tYEAS7 t0.2 t1e-15
OR tQ74IU0 tA6ZM40 t1.7016
OR tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 t1e-15
//
Các định dạng ban đầu của RSD, --outfmt 1, được cung cấp để tương thích ngược. Mỗi dòng chứa một ortholog, đại diện là dãy tượng id, truy vấn chuỗi id, và ước tính khoảng cách tối đa khả năng. Nó chỉ có thể đại diện cho một tập hợp các orthologs trong một tập tin.
Ví dụ:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
Cũng được cung cấp để tương thích ngược là một định dạng được sử dụng trong nội bộ của Roundup (http://roundup.hms.harvard.edu/) mà là giống như các định dạng RSD gốc, trừ các chuỗi truy vấn id cột trước khi tự chủ id.
Ví dụ:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

Yêu cầu :

  • Python
  • NCBI BLAST 2.2.24
  • PAML 4.4
  • Kalign 2.04

Phần mềm tương tự

NEO
NEO

15 Apr 15

Syntainia
Syntainia

11 May 15

SyntenyMiner
SyntenyMiner

3 Jun 15

Ý kiến ​​để reciprocal_smallest_distance

Bình luận không
Nhập bình luận
Bật hình ảnh!