TEGAKARI
  • ホーム
  • 海外製品 新着情報 (ユニポス)
  • 研究開発用PC 構成事例 (テグシス)
  • 研究開発者向けサービス情報
    • レンタルサービス tegakari
  • 技術情報記事
  • バージョンアップ情報
  • テガラからのお知らせ
  • お問い合わせ
ピックアップ新着記事
  • [ 2025年10月9日 ] AlphaFold3を研究環境で動かすために ― 導入の全体像と安定運用のポイント テガラからのお知らせ
  • [ 2025年10月7日 ] RTX PRO 6000 Max-Q搭載 機械学習用ワークステーション 数物系科学
  • [ 2025年10月1日 ] Autodock Vina・GROMACS用ワークステーション 数物系科学
  • [ 2025年9月26日 ] J-OCTA推奨スペック準拠ワークステーション(50万円以内) 数物系科学
  • [ 2025年9月24日 ] JAX機械学習・Abaqus解析向けワークステーション 数物系科学

ホーム > 研究開発用PC 構成事例 (テグシス) > Llama-3対応自然言語処理用ワークステーション

Llama-3対応自然言語処理用ワークステーション

2025年8月22日 テガラ株式会社 研究用ワークステーション, 情報学, 人工知能, 業務支援・効率化ツール, 研究開発用PC 構成事例 (テグシス)

事例No.PC-10873をご覧の上、elyza の Llama-3-ELYZA-JP-8B を用いて、自然言語処理による文章要約を実行するためのPCを検討しているとご相談をいただきました。

現在の環境では1件あたり5分以上を要するため、処理時間短縮を目的に、税込146万円以内の予算で新規導入をご希望です。
また、大学提出用の参考資料としてパーツ構成と見積額の詳細を求められています。

お客様のご要望を踏まえ、計算時間の短縮を目的として、GPUおよびメモリ性能を重視した構成をご提案いたしました。

CPU Intel Core Ultra 9 285K 3.70GHz(8C/8T)+3.20GHz(16C/16T)
メモリ 合計128GB DDR5 6400 64GB x 2
ストレージ1 2TB SSD M.2 NVMe Gen4
ビデオ NVIDIA GeForce RTX5090 32GB
ネットワーク on board(2.5GBase-T x1) Wi-Fi,Bluetooth
筐体+電源 ミドルタワー型筐体 1600W 80PLUS TITANIUM
OS Microsoft Windows 11 Professional 64bit

LLMを高速に動かすために重要なGPU

LLMの推論処理では、GPUのVRAM容量と演算性能が処理時間に大きく影響します。
特に、十分なVRAM容量があることで、より大規模なモデルをGPU単体で処理できるようになり、効率的な推論が可能となります。
一方、VRAMが不足するとメモリスワップが発生し、GPUとCPU間のデータ転送がボトルネックとなって、処理速度が著しく低下します。

例えば、Llama-3-ELYZA-JP-8BをINT8量子化で運用する場合、約17GBのVRAMが必要です。
そのため、最低でも24GB以上のVRAMを搭載することが推奨されています。

RTX 5090は、最新のCUDAおよびTensorコアを搭載したモデルで、同じVRAM容量を持つRTX 5000 Adaと比較して、約2倍の推論速度を記録した検証結果が報告されています。
この性能差を踏まえ、今回の構成ではRTX 5090を採用しました。

詳細な検証結果は、下記の技術記事をご覧ください。
GeForce RTX 4090との比較検証結果も記載されております。

高負荷のLLM推論にも安定して対応できる計算性能を備えているため、実運用環境では処理時間の大幅な短縮が期待できます。

LLM推論におけるメインメモリの重要性

LLMの安定稼働には、GPUのVRAMに加えて、ホスト側メモリの確保が不可欠です。
モデルのロード時にはVRAMを超える一時メモリが必要となる場面があるほか、入力テキストや生成結果の保持にもメインメモリが消費されます。

こうした運用条件を踏まえ、本設計では128GB(64GB × 2)のDDR5メモリを標準搭載しました。
さらに空きスロット (4スロット中2スロット未使用) を活用することで、最大256GBまでのメモリ増設が可能です。
将来的なモデルの大規模化やバッチ処理の拡張にも、柔軟に対応できる構成です。

このような分野で活躍されている方へ

  • 自然言語処理
  • 人工知能
  • 情報学
  • 計算言語学
  • 知識情報処理

バッチサイズや量子化設定など、運用条件に応じた最適な構成をご提案いたします。具体的なご用途があれば、ぜひご相談ください。

キーワード

・Llama-3-ELYZA-JP-8B とは

Llama-3-ELYZA-JP-8Bは、株式会社ELYZAがMeta社の「Llama 3」を基に開発した、日本語に特化した大規模言語モデルです。
80億パラメータというコンパクトさと、日本語らしいニュアンスを捉える力を両立させており、情報工学・計算機科学分野や言語学研究に活用されています。ローカル環境で動作するため、機密データや社内情報を外部に出さずに処理できる点も特長です。

参考:elyza_Llama-3-ELYZA-JP-8B ※外部サイトに飛びます

■ このPC事例に関する詳細、お問い合わせはこちら
Llama-3対応自然言語処理用ワークステーション

※事例の名称またはご希望の条件などをご記入ください。

  • 自然言語処理
  • 大規模言語モデル

この記事を読んだ方はこんな記事も読んでいます

研究開発用PC 構成事例 (テグシス)

生物学向け大規模言語モデルの学習用マシン

2023年11月10日 テガラ株式会社 研究用ワークステーション, 生物学・農学, 人工知能, 研究開発用PC 構成事例 (テグシス)

医療関連製品の研究開発に携わるお客様より、生物学向け大規模言語モデルの学習用マシンをご相談いただきました。 ProteinBERT、 ChemBERTa、 Hy […続きを見る]

特集

【特集記事】音声コーパスに関連する人気商品のご紹介

2023年11月27日 テガラ株式会社 人文学・社会科学, 情報学, 人工知能, アプリケーション開発・プログラミング, 特集

ユニポスは、数多くの研究機関・教育機関のお客様からご支持いただいている研究開発者向け海外製品調達・コンサルテーションサービスです。 本ページでは、音声コーパスに […続きを見る]

人工知能

【製品紹介】MinIO AIStor | AI 向け 大規模 オブジェクトストレージ (Amazon S3 互換)

2024年12月27日 テガラ株式会社 情報学, 人工知能, アプリケーション開発・プログラミング, ネットワーク・セキュリティ, 業務支援・効率化ツール, 海外製品 新着情報 (ユニポス)

ユニポスWEBサイトに、AI・機械学習向けに設計された高性能オブジェクトストレージソリューション「MinIO AIStor」 のページを追加しました。 MinI […続きを見る]

サイト内検索:

テガラ株式会社 YouTube動画

【IR Pass Filter の効果】RealSense D435 と D435f でホワイトボードを撮影

最新の投稿動画を表示しています。
この他の動画はテガラ株式会社 Youtubeチャンネルをご覧ください

人気の記事 (過去7日間のアクセスランキング)

  • プロジェクションマッピングソフトウェア「MadMapper」の 最新バージョン 5 が正式リリースされました 2021年12月23日
  • 【製品紹介】Leap Motion Controller 2 – 手や指の動きを認識するハンドトラッキングカメラ 2023年6月9日
  • 【製品紹介】MarineTraffic : 船舶に関するリアルタイム情報提供サービス(サブスクリプションプラン) 2023年4月6日
  • 【リリース情報】リモートアクセス RealVNC VNC Connect | ライセンス形態変更のお知らせ 2023年6月29日
  • CGTrader 3D Model Marketplace 【製品紹介】CGTrader 3Dコンテンツ:AR/VRやCGプロジェクト向け3Dモデル 2023年2月14日

最新投稿記事

  • AlphaFold3を研究環境で動かすために ― 導入の全体像と安定運用のポイント
    2025年10月9日
  • RTX PRO 6000 Max-Q搭載 機械学習用ワークステーション
    2025年10月7日
  • Autodock Vina・GROMACS用ワークステーション
    2025年10月1日
  • J-OCTA推奨スペック準拠ワークステーション(50万円以内)
    2025年9月26日
  • JAX機械学習・Abaqus解析向けワークステーション
    2025年9月24日

注目のタグ

解析ツール (56) 3Dカメラ (55) 機械学習(マシンラーニング) (54) ロボティクス (50) AI (47) VR (44) バイオインフォマティクス (43) ロボットアーム (42) DeepLearning (41) RealSense (41) 統計解析 (40) 動画・映像 (37) デプスカメラ (36) SBC (36) 計装 (35) 小型SBC (35) IoT (35) シミュレーション (34) スペクトル (33) Python (31) データ解析 (31) 第一原理 (29) サイバーセキュリティ (28) JavaScript (27) 画像解析・画像検査 (27) AR (27) 次世代シーケンサー (27) 化学 (27) Metashape (26) MATLAB (26) .NET (26) 車載 (25) LIDAR (25) 画像処理 (25) UI (24) フォトグラメトリー (23) 3Dモデル (22) 教育ロボット (22) プロトタイプ (22) サポート (22) 分子生物学 (22) 計測器 (21) Web開発・制作 (21) 電磁界解析 (21) GIS (20) マテリアル (20) テストツール (20) ROS (20) 心理学 (19) ドローン (19) 可視化 (19) ロボット (19) アニメーション (19) モバイルロボット (19) ロボットハンド (19) 遺伝子 (19) セキュリティー (19) 自律走行車 (18) プロトコル (18) ToF (18) プログラミング (18) 脳波 (18) 3Dプリンタ (17) 分子動力学 (17) CAE (17) Raspberry Pi (17) トラッキング (17) モーションキャプチャ (17) 臨床 (17) バイオアッセイ (17) DNA (17) ディープラーニング (17) 教育 (16) モデリング (16) 構造解析 (16) チャート (16) 産業用 (16) 動画編集 (16) 3Dモデリング (15) AR/VR (15) Arduino (15) ライブラリ (15) 医薬品開発 (15) 流体解析 (15) 生物統計学 (15) 3Dスキャン (15) RNA (15) ゲノム解析 (15) 刺激呈示 (14) 2022年7月 配信記事 (14) 2022年8月 配信記事 (14) CFD (14) 農業・農学 (14) CUDA (14) 装置制御 (14) マルウェア (14) 周辺機器 (14) 情報発信12月号 (14) SLAM (14) 写真 (14) 開発・評価キット (13) 数値解析 (13) 監視 (13) デプスセンサ (13) Gaussian (13) 制御 (13) IDE(統合開発環境) (13) 音声処理 (13) STEM/STEAM教育 (13) 熱流体解析 (13) 24時間稼働 (13) 測量 (13) 無線 (13) ナノ構造材料 (13) 量子化学計算 (13) FDTD法 (13) 遠隔操作(リモートコントロール) (12) 3DCAD (12) 自然科学 (12) 情報発信22年4月号 (12) Looking Glass (12) DeepLabCut (12) GPGPU (12) キャプチャグローブ (12) 情報発信22年3月号 (12)
分野別に情報を探す – Category
  •  人文学・社会科学
  •  数物系科学
  •  化学
  •  工学
  •  医学・看護学・薬学
  •  生物学・農学
  •  情報学
 
  •  人工知能
  •  ロボティクス
  •  センサー技術
  •  開発キット・電子工作
  •  デジタルガジェット
  •  自動車・車両(vehicle)関連
  •  産業用通信技術
  •  アプリケーション開発・プログラミング
  •  ネットワーク・セキュリティ
  •  マルチメディア(映像・画像・音声)処理
  •  業務支援・効率化ツール
Translate
お問い合わせフォーム – Contact
TEGAKARI へのお問い合わせはこちら
サイト内リンク
プライバシーポリシー
運営WEBサイト (サービス)
テガラ株式会社
テガラ株式会社コーポレートサイト

UNIPOS
研究開発者向け海外製品調達・コンサルテーションサービス

テグシス
研究用・産業用PCの製作・販売サービス
SNSアカウント
  • Twitter
  • YouTube
  • Facebook

テガラ株式会社

テガラは、研究開発者さまに有用な製品・サービス・情報を統合的 (integrated) に提供するプラットフォームです。「研究開発を加速するお手伝い」

Copyright © 2020 | テガラ株式会社