Nextseq2000システムで取得したNGSデータを解析するためのマシン

バイオ医薬品の研究開発に携わるお客様より、Nextseq2000システムで取得したNGSデータを解析するためのマシンをご相談いただきました。
ご希望の条件は以下のとおりです。

・CPU:Intel Xeon 24コア以上 x2
・メモリ:768GB程度
・ストレージ1:SSD 2TB M.2
・ストレージ2:HDD 4TB S-ATA
・OS:Ubuntu
・予算:200万円になるべく近くなるように

弊社からは、ご要望のCPUコア数を満たす構成として、以下のスペックをご提案しました。

CPU Xeon Gold 6338 (2.00Hz 32コア)
メモリ 512GB
ストレージ1 2TB SSD M.2
ストレージ2 8TB HDD S-ATA
ビデオ on board (VGAx1)
ネットワーク on board (1000Base-T x2)
筐体+電源 タワー型筐体 + 850W
OS Ubuntu 22.04

1CPUあたり28コア x2で合計56コアとなるようにCPUを選定しています。

第3世代Xeon Scalableは、メモリチャンネルが8ですので、ご要望の768GBを超える容量で最適な構成とした場合、1TBを選択する必要があります。
しかし、その場合には予算を大幅に超過してしまうため、ひとまずご希望よりも少ない容量でモジュール構成を最適化した512GBをご提案し、スペックと価格感をご確認いただく流れとしました。

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

■FAQ

・HISAT2とは
HISAT2は、次世代シーケンシングにおけるリード (DNAとRNAの両方) をヒトゲノムの集団および単一の参照ゲノムにマッピングするためアライメントプログラム。高速でメモリ使用量が少ない。

参考:HISAT2 ※外部サイトに飛びます

 

・Bowtie2とは
Bowtie2は、シーケンスリードを参照配列にアライメントするためのツール。哺乳類のような比較的長いゲノムのアライメントに優れている。

参考:Bowtie2 ※外部サイトに飛びます

 

・Samtoolsとは
Samtoolsは、ハイスループットなシーケンシングデータを扱うためのプログラム群である。「Samtools」「BCFtools」「HTSlib」という3つの独立したリポジトリから構成されている。

参考:Samtools ※外部サイトに飛びます

 

・Velvetとは
Velvetはゲノム配列をアセンブリするためのプログラム。de Bruijnグラフに基づくde novoアセンブリのためのツールであり、高いカバレッジを持つ短いリードデータに適している。また、de Bruijnグラフを操作することで、シーケンスエラーを除去し、リピートを解消するアルゴリズムが実装されている。

参考:Velvet ※外部サイトに飛びます