タンパク質のドメイン検索用マシン

植物の育種研究に携わるお客様より、BLASTによるDNA塩基配列の検索や、HMMERによるタンパク質のドメイン検索を行うためのマシンをご相談いただきました。
教員と複数の学生が使用し、学内の有線LAN経由でマシンにアクセスする使い方を想定しています。
また、BLASTでのクエリ配列は数百から数千程度で、データベース配列は10万程度。HMMERによるドメイン検索は、10万程度のクエリ配列を想定しています。
その他の用途として、マシン性能が十分であれば植物のゲノムde novo解析も行いたいと伺っています。
想定しているマシンスペックは以下の通りです。

・CPU:Intel Core i7 16コア以上
・メモリ:64GB
・ストレージ1:SSD 1TB S-ATA
・ストレージ2:HDD 8TB S-ATA
・ビデオカード:Geforce GT1030程度
・ネットワーク:ギガビットイーサネット対応

弊社からは、下記の構成をご提案しました。

CPU AMD Ryzen9 7950X (4.50Hz 16コア)
メモリ 64GB
ストレージ1 1TB SSD S-ATA
ストレージ2 8TB HDD S-ATA
ビデオ NVIDIA Geforce GT1030
ネットワーク on board (2.5G x1 10/100/1000Base-T x1) Wi-Fi x1
筐体+電源 ミドルタワー筐体 + 850W
OS Rocky Linux 8

データベースはHDD 8TBへの格納を想定していますが、サイズによってはストレージ容量が不足する場合があるため、容量面で問題ないことをお客様にご確認いただいています。

de novo解析の実行も可能な構成ですが、優先度の高い要件として考慮する場合には、仕様上の最大メモリ容量となる128GBを搭載するのが良いと思われます。

また、ネットワークアクセスで利用し、研究室内で小規模な簡易サーバーとして利用するのみでしたら、本事例の構成でもコスト重視の選択として成立します。ただし、学部レベルの人数で利用する想定の場合は、明らかにスペックが不足します。
マシンの重要度や求める可用性などの条件によっては、より本格的なサーバー構成を検討いただく必要があるため、お客様にはご提案と合わせてお伝えしています。

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

■FAQ

・BLASTとは
BLAST (Basic Local Alignment Search Tool) は、DNAの塩基配列やタンパク質のアミノ酸配列のシーケンスアライメントを行う相同性検索プログラム。手元にあるシーケンスで、シーケンスデータベースもしくはライブラリに対して検索を行うことにより、ある閾値以上のスコアで類似するシーケンス群を発見することができる。

参考:BLAST (NAtional Center for Biotechnology Information) ※外部サイトに飛びます

 

・HMMERとは
HMMERはシーケンス解析用のフリーソフトウェア。相同タンパク質またはヌクレオチド配列を特定し、シーケンスアライメントを実行する。

参考:HMMER ※外部サイトに飛びます

 

・de novo解析とは
タンデム質量分析からペプチドのアミノ酸配列を決定する方法。参照配列を必要とせず、非モデル生物の遺伝子解析で用いられる。