TEGAKARI
  • ホーム
  • 海外製品 新着情報 (ユニポス)
  • 研究開発用PC 構成事例 (テグシス)
  • 研究開発者向けサービス情報
    • レンタルサービス tegakari
  • 技術情報記事
  • バージョンアップ情報
  • テガラからのお知らせ
  • お問い合わせ
ピックアップ新着記事
  • [ 2025年7月14日 ] TKS事業部が選ばれる理由 | 届いてすぐに使えるシステム 海外製品 新着情報 (ユニポス)
  • [ 2025年7月11日 ] 電磁界解析向けワークステーション 研究用ワークステーション
  • [ 2025年7月9日 ] 大規模言語モデル計算処理向けマシン 研究用ワークステーション
  • [ 2025年7月8日 ] 大規模数値計算向けMAGMA専用マシン 研究用ワークステーション
  • [ 2025年7月7日 ] 第3回:若手研究×製品導入 導入実例で見る“研究の前進” 海外製品 新着情報 (ユニポス)

ホーム > 研究開発用PC 構成事例 (テグシス) > 生物学向け大規模言語モデルの学習用マシン

生物学向け大規模言語モデルの学習用マシン

2023年11月10日 テガラ株式会社 研究用ワークステーション, 生物学・農学, 人工知能, 研究開発用PC 構成事例 (テグシス)

医療関連製品の研究開発に携わるお客様より、生物学向け大規模言語モデルの学習用マシンをご相談いただきました。
ProteinBERT、 ChemBERTa、 HyenaDNAといった生物学で用いられる大規模言語モデルを事前学習から実行する想定です。

お客様からは、ProteinBERTはNvidia Quadro RTX 5000、ChemBERTaはNVIDIA Tesla T4、HyenaDNAはNVIDIA A100をそれぞれ学習に使用したとの情報があるため、GPUの性能を重視したい とご要望いただきました。

また、ご予算は300万円以内で、最も高速化できる構成であることと、ミドルタワー程度の筐体サイズで100Vの電源環境で利用できることをご希望です。

ご連絡いただいた条件を踏まえて、弊社からは下記の構成をご提案しました。

CPU Intel Xeon W5-2455X (3.20GHz 12コア)
メモリ 128GB REG ECC
ストレージ1 2TB SSD M.2
ストレージ2 4TB SSD S-ATA
ビデオ NVIDIA RTX A6000 48GB x2
ネットワーク on board (1GbE x1 /10GbE x1)
筐体+電源 ミドルタワー型筐体 + 1500W
OS Microsoft Windows 11 Professional 64bit

ご予算や利用環境を踏まえたうえで、GPU性能を重視したマシン構成案です。

GPUはNVIDIA RTX A6000 x2枚を搭載しています。
ProteinBERT開発元の公式サイトによると、学習済みモデルの構築にはNVIDIA RTX5000を用いて1か月ほど要したと記載されています。
A6000はRTX5000より世代が新しく、ラインナップ上でも上位モデルにあたる製品のため、RTX5000よりも高い処理性能が期待できます。

例として挙げていただいたNVIDIA Tesla T4は、推論向けとして利用されることが多い製品です。そのため、本構成ではNVIDIA TeslaT4よりも単体性能が高いA6000を採用しています。

また、NVIDIA A100は、A6000とは異なり、GPGPU専用カードです。
高いfp64性能を持ち科学計算に適した製品ですが、今回のようなDeepLearning用途ではfp64性能が利用されることはほとんどありません。
あわせて、価格に関してもA6000と比較して非常に高額で、かつ専用の筐体でなければ利用できないことから、今回の利用条件や用途におけるマッチングが高くないと判断しました。

ストレージに関しては、ProteinBERTの開発元よりユーザー自らモデルの学習を行う場合は1TB以上のストレージ容量を確保することが推奨されているため、2TBのシステムディスク、4TBのデータディスクを搭載しています。
なお、学習中に頻繁なデータアクセスが発生することを想定して、ストレージはすべてSSDとしています。

OSはWindows 11を選択しています。
ご使用予定の言語モデルは基本的にはPythonパッケージで提供されているもののため、Pythonを使用可能なOSであれば、ご希望に応じて変更も可能です。

本事例の構成は、お客様から頂戴した条件を元に検討した内容です。
いただいた条件に合わせて柔軟にマシンをご提案いたしますので、掲載内容とは異なる条件でご検討の場合でも、お気軽にご相談ください。

■キーワード

・DeepLearningとは
DeepLearningは機械学習の一種であり、多層のニューラルネットワークを用いて高度なパターン認識や予測を行う手法。一般的に大量のデータを必要とするため、データが豊富な場合に効果的な手法とされている。 また、DeepLeanigは画像認識や音声認識、自然言語処理などの分野で広く用いられている。複雑な特徴や関係性を学習することができるため、従来の機械学習手法よりも高い精度を発揮することができる。

参考:【特集記事】機械学習ってなんだろう ※弊社オウンドメディア「TEGAKARI」に飛びます

・Pythonとは
Pythonは、Python Software Foundation (PSF) が著作権を保持する、オブジェクト指向プログラミング言語。プログラミングの構文がシンプルなため可読性が高く、目的に応じたライブラリやフレームワークといったコンポーネントが豊富に揃っていることも特徴。プログラミングの初学者から上級者に至るまで人気の言語。

参考:Python ※外部サイトに飛びます

・BERTとは
BERT (Bidirectional Encoder Representations from Transformers) は、Googleが開発した自然言語処理 (NLP) モデル。与えられた文脈に基づいて単語を理解することができ、言語処理における幅広いタスクに適用される。
また、BERTは事前学習とファインチューニングの2つのフェーズで構成されている。事前学習では、大規模なコーパスから学習された汎用的な言語モデルが作成される。ファインチューニングでは、特定のタスクに適用するために、小規模なデータセットから学習されたモデルが調整される。
従来のNLPモデルに比べて高い精度を示し、複雑なタスクにも対応できることが特徴で、テキスト生成、質問応答、文書分類、言語翻訳などに応用されており、NLPの分野で最も有名なモデルの1つとして広く使われている。

・ProteinBERTとは
ProteinBERTは、BERTをベースにしたタンパク質言語モデル。 UniRef90データベース上の最大1億600万のタンパク質で事前学習されており、非常に長いタンパク質配列を含む、ほぼあらゆる長さのタンパク質配列を処理することが可能。

参考:GitHub – nadavbra/protein_bert ※外部サイトに飛びます

・ChemBERTaとは
ChemBERTaは、RoBERTa (BERTの亜種) を用いた、化学構造の表記方法であるSMILES記法の大規模言語モデル。 医薬品設計、化学モデリング、特性予測などに用いられている。

参考:GitHub – seyonechithrananda/bert-loves-chemistry: bert-loves-chemistry: a repository of HuggingFace models applied on chemical SMILES data for drug design, chemical modelling, etc. ※外部サイトに飛びます

・HyenaDNAとは
HyenaDNAは、ヒトゲノムを100万トークンの塩基配列として事前学習した大規模言語モデル。 単一ヌクレオチド単位 (ATGC) でのトークン化により、ヌクレオチド単位での解析が可能。

参考:GitHub – HazyResearch/hyena-dna: Official implementation for HyenaDNA, a long-range genomic foundation model built with Hyena ※外部サイトに飛びます

 

■ このPC事例に関する詳細、お問い合わせはこちら
生物学向け大規模言語モデルの学習用マシン

※事例の名称またはご希望の条件などをご記入ください。

  • 自然言語処理
  • 機械学習(マシンラーニング)

この記事を読んだ方はこんな記事も読んでいます

自動車・車両(vehicle)関連

【リリース情報】運転支援システムデバイス comma の新ラインアップ「comma three devkit」

2022年2月2日 テガラ株式会社 自動車・車両(vehicle)関連, 海外製品 新着情報 (ユニポス)

取り付けた車を「自動運転車」にする 運転支援システムデバイス comma の新しいラインアップ「comma three devkit」がリリースされました(20 […続きを見る]

センサー技術

【機能比較】Azure Kinect DK と Orbbec Femto Bolt の違いは?

2023年9月26日 テガラ株式会社 工学, 人工知能, ロボティクス, センサー技術, 開発キット・電子工作, アプリケーション開発・プログラミング, マルチメディア(映像・画像・音声)処理, 海外製品 新着情報 (ユニポス)

Azure Kinect Development Kit (以下 Azure Kinect DK)の生産終了を受け、代替品としてのOrbbec Femto Bo […続きを見る]

自動車・車両(vehicle)関連

取り付けた車を自動運転車にする 運転支援システムデバイス「comma two devkit」

2020年2月10日 テガラ株式会社 自動車・車両(vehicle)関連, 海外製品 新着情報 (ユニポス)

■こちらは、2020年2月10日に投稿された記事のため、情報の内容が古い可能性があります。 ユニポスWEBサイトに、取り付けた車を「自動運転車」にする 運転支援 […続きを見る]

サイト内検索:

テガラ株式会社 YouTube動画

【IR Pass Filter の効果】RealSense D435 と D435f でホワイトボードを撮影

最新の投稿動画を表示しています。
この他の動画はテガラ株式会社 Youtubeチャンネルをご覧ください

人気の記事 (過去7日間のアクセスランキング)

  • 多機能なターミナルソフト「MobaXterm」 2022年5月18日
  • 【製品紹介】MarineTraffic : 船舶に関するリアルタイム情報提供サービス(サブスクリプションプラン) 2023年4月6日
  • furix BetterWMF and CompareDWG tools for AutoCAD 【製品紹介】Beyond Compare:ファイル、フォルダの比較・統合・同期ユーティリティ 2022年11月18日
  • 3Dカメラ 8種類を 様々な環境で比較しました 【その② 屋内編】 2020年9月7日
  • 【製品紹介】Leap Motion Controller 2 – 手や指の動きを認識するハンドトラッキングカメラ 2023年6月9日

最新投稿記事

  • ターンキーシステムが、研究初動を加速!テガラのTKS事業部
    TKS事業部が選ばれる理由 | 届いてすぐに使えるシステム
    2025年7月14日
  • 電磁界解析向けワークステーション
    2025年7月11日
  • 大規模言語モデル計算処理向けマシン
    2025年7月9日
  • 大規模数値計算向けMAGMA専用マシン
    2025年7月8日
  • テグシスxユニポスxTKS 若手研究者応援キャペーン
    第3回:若手研究×製品導入 導入実例で見る“研究の前進”
    2025年7月7日

注目のタグ

解析ツール (56) 3Dカメラ (55) 機械学習(マシンラーニング) (53) AI (47) ロボティクス (45) VR (44) バイオインフォマティクス (42) ロボットアーム (42) RealSense (41) 統計解析 (39) 動画・映像 (37) DeepLearning (37) デプスカメラ (36) SBC (36) 小型SBC (35) IoT (35) 計装 (35) シミュレーション (33) スペクトル (33) データ解析 (31) Python (29) 第一原理 (29) サイバーセキュリティ (28) AR (27) JavaScript (27) 次世代シーケンサー (27) 化学 (27) .NET (26) LIDAR (25) 画像解析・画像検査 (25) Metashape (25) 画像処理 (25) 車載 (25) UI (24) MATLAB (24) フォトグラメトリー (23) 3Dモデル (22) 教育ロボット (22) プロトタイプ (22) サポート (22) 分子生物学 (22) Web開発・制作 (21) 計測器 (21) マテリアル (20) GIS (20) テストツール (20) 電磁界解析 (19) 可視化 (19) ロボットハンド (19) ドローン (19) ロボット (19) アニメーション (19) セキュリティー (19) 心理学 (19) ROS (19) モバイルロボット (19) 脳波 (18) 自律走行車 (18) プロトコル (18) 遺伝子 (18) プログラミング (18) ToF (18) 3Dプリンタ (17) トラッキング (17) DNA (17) ディープラーニング (17) 臨床 (17) CAE (17) モーションキャプチャ (17) Raspberry Pi (17) 3Dモデリング (16) バイオアッセイ (16) チャート (16) 教育 (16) 産業用 (16) モデリング (16) 構造解析 (16) 流体解析 (15) 分子動力学 (15) Arduino (15) 医薬品開発 (15) 動画編集 (15) AR/VR (15) 生物統計学 (15) RNA (15) 3Dスキャン (15) ライブラリ (15) 2022年7月 配信記事 (14) 刺激呈示 (14) 2022年8月 配信記事 (14) CUDA (14) 写真 (14) マルウェア (14) 周辺機器 (14) 装置制御 (14) 情報発信12月号 (14) CFD (14) 農業・農学 (14) SLAM (14) 開発・評価キット (13) 無線 (13) 音声処理 (13) STEM/STEAM教育 (13) ゲノム解析 (13) 24時間稼働 (13) 熱流体解析 (13) 監視 (13) 数値解析 (13) 制御 (13) IDE(統合開発環境) (13) 測量 (13) 3DCAD (13) ナノ構造材料 (13) デプスセンサ (13) DeepLabCut (12) 遠隔操作(リモートコントロール) (12) 情報発信22年4月号 (12) Looking Glass (12) CAD (12) キャプチャグローブ (12) 量子化学計算 (12) 情報発信22年3月号 (12) 自然科学 (12) GPGPU (12) FDTD法 (12)
分野別に情報を探す – Category
  •  人文学・社会科学
  •  数物系科学
  •  化学
  •  工学
  •  医学・看護学・薬学
  •  生物学・農学
  •  情報学
 
  •  人工知能
  •  ロボティクス
  •  センサー技術
  •  開発キット・電子工作
  •  デジタルガジェット
  •  自動車・車両(vehicle)関連
  •  産業用通信技術
  •  アプリケーション開発・プログラミング
  •  ネットワーク・セキュリティ
  •  マルチメディア(映像・画像・音声)処理
  •  業務支援・効率化ツール
Translate
お問い合わせフォーム – Contact
TEGAKARI へのお問い合わせはこちら
サイト内リンク
プライバシーポリシー
運営WEBサイト (サービス)
テガラ株式会社
テガラ株式会社コーポレートサイト

UNIPOS
研究開発者向け海外製品調達・コンサルテーションサービス

テグシス
研究用・産業用PCの製作・販売サービス
SNSアカウント
  • Twitter
  • YouTube
  • Facebook

テガラ株式会社

テガラは、研究開発者さまに有用な製品・サービス・情報を統合的 (integrated) に提供するプラットフォームです。「研究開発を加速するお手伝い」

Copyright © 2020 | テガラ株式会社