reciprocal_smallest_distance

ソフトウェアのスクリーンショット:
reciprocal_smallest_distance
ソフトウェアの詳細:
バージョン: 1.1.5
日付のアップロード: 20 Feb 15
ライセンス: 無料
人気: 42

Rating: 3.5/5 (Total Votes: 2)

reciprocal_smallest_distanceは、グローバル配列アラインメントと配列間の最大尤進化距離を正確にゲノム間の相同分子種を検出するために使用してペアワイズオルソロジーアルゴリズムです。
のtarアーカイブからのインストール
ダウンロードして、githubのから最新バージョンを解凍します:
CD〜
カール-L https://github.com/downloads/todddeluca/reciprocal_smallest_distance/reciprocal_smallest_distance-VERSION.tar.gz |タールXVZ
Pythonの2.7を使用して確認し、reciprocal_smallest_distanceをインストールします。
CDのreciprocal_smallest_distance-VERSION
Pythonはsetup.py installを
のOthologsを探すためにRSDを使用した
次のコマンド例はrsd_searchを実行するための主な方法を示しています。 rsd_searchのすべての呼び出しは、クエリおよび対象のゲノムと呼ばれる2つのゲノムのためのFASTAフォーマットの配列ファイルの場所を指定する必要があります。彼らの順序は任意ですが、--idsオプションを使用する場合、IDは、クエリゲノムから来なければならない。また、RSDアルゴリズムによって発見オルソログの結果を書き込むファイルを指定する必要があります。出力ファイルの形式は、1行に1つのオルソログが含まれています。各行には、配列の間(codemlで計算)クエリシーケンスID、対象シーケンスID、および距離が含まれています。オプションで、--idsオプションを使用してIDを含むファイルを指定することができます。その後、RSDはのみIDのオーソログを検索します。 --divergenceと--evalueを使用すると、デフォルトとは異なる閾値を使用するオプションがあります。
rsd_search、rsd_blast、またはrsd_formatを実行する方法についてのヘルプを取得します。
rsd_search -h
rsd_blast -h
rsd_format -h
デフォルトの発散とevalueのしきい値を使用して、クエリおよび対象のゲノム内のすべての配列間の相同分子種を探す
rsd_search -q例/ゲノム/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subjectゲノム=例/ゲノム/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
いくつかのデフォルト以外の発散とevalueのしきい値を使用してオーソログを探す
rsd_search -q例/ゲノム/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subjectゲノム=例/ゲノム/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.several.orthologs.txt
0.2 1E-20 --de 0.5 0.00001 --de 0.8 0.1 --de
これは、BLASTのためのFASTAファイルをフォーマットしたりrsd_searchがあなたのためにそれをしないので、BLASTヒットを計算する必要はありません。
あなたは、特に大規模なゲノムのために、同じゲノムのためrsd_searchを複数回実行することを計画している場合ただし、BLASTヒット事前計算にFASTAファイルとrsd_blastをプリフォーマットするrsd_formatを使用することにより、時間を節約することができます。 rsd_blastを実行している場合、あなたはrsd_searchに与えるつもり最大のevalueのしきい値と同じ大き--evalueを使用してください。
ここで所定の位置にFASTAファイルのペアをフォーマットする方法を示します。
rsd_format -g例/ゲノム/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
rsd_format -g例/ゲノム/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
そして、ここで別のディレクトリ(この場合は現在のディレクトリ)で結果を入れて、FASTAファイルをフォーマットする方法です
rsd_format -g例/ゲノム/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aaは-d。
rsd_format -g例/ゲノム/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aaは-d。
ここでフォワード計算し、(デフォルトはevalueを使用)ブラストヒットを逆にする方法を示します。
rsd_blast -v -q例/ゲノム/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subjectゲノム=例/ゲノム/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
--forwardヒットq_s.hits --reverse-ヒットs_q.hits
ここでは、フォワード計算し、爆風がrsd_searchのためにヒット逆転する方法です既に爆風のためにフォーマットされたゲノムを使用して、デフォルト以外のevalueの
rsd_blast -v -q Mycoplasma_genitalium.aa
--subjectゲノム= Mycobacterium_leprae.aa
--forwardヒットq_s.hits --reverse-ヒットs_q.hits
--no-形式0.1 --evalue
すでに爆風のためにフォーマットされているすべてのクエリ内の配列およびゲノムを用いて被験者ゲノム間のオルソログを探す
rsd_search -q Mycoplasma_genitalium.aa
--subjectゲノム= Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--no-フォーマット
すでに計算されたヒット曲を使用して、すべてのクエリ内のシーケンスと対象ゲノム間の相同分子種を探す。高炉のヒット以来、既にゲノムが爆風用にフォーマットする必要はありませんが計算されているため、--no-フォーマットが含まれていることに注意してください。
rsd_search -v --queryゲノムMycoplasma_genitalium.aa
--subjectゲノム= Mycobacterium_leprae.aa
-o Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa.default.orthologs.txt
--forwardヒットq_s.hits --reverse-ヒットs_q.hits --no-フォーマット
クエリのゲノム中の特定の配列のためのオルソログを検索します。わずか数配列のためのオルソログを見つけるための、--no-BLAST-キャッシュを使用すると、計算をスピードアップすることができます。メーリングリストへ。
rsd_search -q例/ゲノム/ Mycoplasma_genitalium.aa / Mycoplasma_genitalium.aa
--subjectゲノム=例/ゲノム/ Mycobacterium_leprae.aa / Mycobacterium_leprae.aa
-o例/ Mycoplasma_genitalium.aa_Mycobacterium_leprae.aa_0.8_1e-5.orthologs.txt
--ids例/ Mycoplasma_genitalium.aa.ids.txt --no-BLAST-キャッシュ
の出力フォーマット
オルソログは、rsd_searchの--outfmtオプションを使用して、いくつかの異なる形式で保存することができます。デフォルトのフォーマットは、-1 --outfmt、UniprotのDATファイルに触発3 --outfmtを指し、オルソログのセットは、エンドラインを持って、その後、パラメータ行で始まり0以上のオルソログのラインを持っています。 parametesクエリゲノム名、対象ゲノム名、発散閾値とevalueの閾値である。各オルソログは、クエリシーケンスID、対象配列ID、および最大尤度距離推定値をリストする一行である。この形式は、複数の単一ファイル内のパラメータのセットなどがないオルソログとパラメータのセットのためのオルソログを表すことができます。複数の発散とevalueのしきい値を指定するときにそれゆえ、rsd_searchでの使用に適している。
ここにはオルソログを持っていないそのうちの一つ2パラメータの組み合わせを含む例です。
PA tLACJO tYEAS7 t0.2 T1E-15
または tQ74IU0 tA6ZM40 t1.7016
または tQ74K17 tA6ZKK5 t0.8215
//
PA tMYCGE tMYCHP t0.2 T1E-15
//
RSDの元の形式は、1 --outfmt、下位互換性のために提供されています。各行は、対象配列IDを、問合せ配列ID、および最大尤度距離推定値として表され、オルソログを含んでいる。これは、ファイル内のオルソログの単一のセットを表すことができます。
例:
A6ZM40 tQ74IU0 t1.7016
A6ZKK5 tQ74K17 t0.8215
また、クエリー配列ID列が対象配列IDの前にあるを除いて、元のRSD形式のようなものですラウンドアップ(http://roundup.hms.harvard.edu/)によって内部で使用されるフ​​ォーマットは、下位互換性のために提供される。
例:
Q74IU0 tA6ZM40 t1.7016
Q74K17 tA6ZKK5 t0.8215

の要件

  • のPythonます。
  • NCBI BLAST 2.2.24ます。
  • PAML 4.4
  • Kalign 2.04ます。

同じようなソフトウェア

PySCeS
PySCeS

14 Apr 15

goby
goby

14 Apr 15

seriesoftubes
seriesoftubes

20 Feb 15

へのコメント reciprocal_smallest_distance

コメントが見つかりません
コメントを追加
画像をオンにする!