ベイズ統計用マシン

マーケティングの研究に携わるお客様より、統計解析用のマシンをご相談いただきました。
R (RStan) を用いたベイズ統計におけるMCMC法を行うためのマシンをご希望で、消費者アンケートデータの統計分析が中心です。扱うアンケートの量は、最大で1,000件程度です。
また、手法としてはBayoLinkSを用いたベイジアンネットワーク分析と、Rを用いたベイジアンネットワーク分析を想定されており、具体的な条件としては以下をご連絡いただきました。

・CPU:Core i9
・メモリ:64GB
・ストレージ:SSD 1TB
・OS:Windows 11
・ディスプレイ:23.8型 液晶ディスプレイ
・使用するソフトウェア:R、Rstudio、Python、BayoLinkS
・その他:MCMC法による4つの計算が並列して快適に実施できるようにしたい
・予算:50万円程度

ご連絡の内容を踏まえて、弊社からは以下の構成をご提案しました。

CPU Core i9-13900KS (3.20GHz 8コア + 2.40GHz 16コア)
メモリ 64GB
ストレージ 2TB SSD M.2
ビデオ on board (DPx1 HDMIx1)
ネットワーク on board (2.5GBase-T x1) Wi-Fi x1
筐体+電源 ミドルタワー筐体 + 850W
OS Microsoft Windows 11 Professional 64bit
その他

23.8型ワイド FullHD 液晶ディスプレイ

Rの利用とご予算条件から、CPUはご要望どおりCore i9が良いかと存じます。
4計算での利用でしたらクロックブーストが効く可能性が高いため、第13世代のCore i9でも単コア性能が高い製品を選定しています。Pコアのみを稼働させた実績では、8コア稼働で5.6GHz前後での動作を確認しています。
第12世代のCore i9-12900Kと比較した場合、CPUMarkの値として33%(シングルで12%)ほどの違いがあります。

参考:Intel Core i9-12900K vs Intel Core i9-13900KS (PassMark Software)

メモリはECCという選択肢もありますが、用途を考えますと64GB程度では必須とは言い難いことに加え、コストUPにつながるため、NonECC仕様としています。CPU自体はECCメモリに対応しているので、コストUPを許容できる場合には変更が可能です。もし、数週間レベルでの連続計算を想定している場合には、ECCメモリの利用をおすすめします。

また、R系の中間ファイルをストレージに吐き出す可能性がある場合、キャッシュとしてSSD側がコントロールするSLCエリアの大きい方がパフォーマンス向上につながるため、容量2TBの製品を選定しています。PCI-E Gen4に対応した高速なタイプです。

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

■FAQ

・Rとは
Rとはオープンソース・フリーソフトウェアの統計解析向けプログラミング言語/開発実行環境。統計処理のための計算やグラフ化で利用される。
多くのライブラリが存在するため、ライブラリを呼び出すだけで複雑な手法を扱うことができる。

参考:The R Project for Statistical Computing ※外部サイトに飛びます

 

・Rstudioとは
RstudioはRを使用するための統合開発環境。直感的で使いやすいユーザーインターフェースを提供し、プロジェクト管理機能、コードエディター、コードの自動補完、構文のハイライト、デバッガー、プロファイラー、マークダウン文書のサポート、パッケージの管理機能、グラフィックのインタラクティブな表示機能などの多彩な機能を備えている。

参考:RSTUDIO IDE (Posit) ※外部サイトに飛びます

 

・Pythonとは
Pythonは、Python Software Foundation (PSF) が著作権を保持する、オブジェクト指向プログラミング言語。プログラミングの構文がシンプルなため可読性が高く、目的に応じたライブラリやフレームワークといったコンポーネントが豊富に揃っていることも特徴。プログラミングの初学者から上級者に至るまで人気の言語。

参考:Python ※外部サイトに飛びます

参考:【特集記事】プログラミング言語 Python その人気の理由は?- Python プログラミングを加速するツールたち ※弊社オウンドメディア「TEGAKARI」に飛びます

 

・BayoLinkSとは
BayoLinkSは機械学習アルゴリズムを使用した予測分析を行うビジネスインテリジェンスツール。ベイジアンネットワーク分析に必要なツールを提供しており、データの収集や前処理から分析まで一貫して行うことができる。

参考:BayoLinkS (NTTデータ数理システム) ※外部サイトに飛びます

 

・ベイジアンネットワーク分析とは
ベイジアンネットワーク分析は、確率的な関係性を持つ複数の変数をグラフィカルに表現することができるデータ分析手法。変数間の因果関係を表現する有向グラフを構築し、それぞれの変数が与えられた条件下での確率分布を推定する。また、ベイジアンネットワークは、不確実性の高い状況下での意思決定や予測分析に適した手法であり、医療分野や金融分野で活用されている。ベイジアンネットワークを使用した分析は、予測の精度が高く、データの不確実性を考慮することができるため、データ解析において重要な役割を果たしている。