TEGAKARI
  • ホーム
  • 海外製品 新着情報 (ユニポス)
  • 研究開発用PC 構成事例 (テグシス)
  • 研究開発者向けサービス情報
    • レンタルサービス tegakari
  • 技術情報記事
  • バージョンアップ情報
  • テガラからのお知らせ
  • お問い合わせ
ピックアップ新着記事
  • [ 2025年8月22日 ] Llama-3対応自然言語処理用ワークステーション 研究用ワークステーション
  • [ 2025年8月21日 ] NeuroImaging・統計解析対応ワークステーション 研究用ワークステーション
  • [ 2025年8月20日 ] グライコプロテオミクス解析用ワークステーション (おすすめ構成) 研究用ワークステーション
  • [ 2025年8月20日 ] グライコプロテオミクス解析用ワークステーション (エントリー構成) 研究用ワークステーション
  • [ 2025年8月19日 ] Metashape用点群データ解析ワークステーション 研究用ワークステーション

ホーム > 研究開発用PC 構成事例 (テグシス) > Llama-3対応自然言語処理用ワークステーション

Llama-3対応自然言語処理用ワークステーション

2025年8月22日 テガラ株式会社 研究用ワークステーション, 情報学, 人工知能, 業務支援・効率化ツール, 研究開発用PC 構成事例 (テグシス)

事例No.PC-10873をご覧の上、elyza の Llama-3-ELYZA-JP-8B を用いて、自然言語処理による文章要約を実行するためのPCを検討しているとご相談をいただきました。

現在の環境では1件あたり5分以上を要するため、処理時間短縮を目的に、税込146万円以内の予算で新規導入をご希望です。
また、大学提出用の参考資料としてパーツ構成と見積額の詳細を求められています。

お客様のご要望を踏まえ、計算時間の短縮を目的として、GPUおよびメモリ性能を重視した構成をご提案いたしました。

CPU Intel Core Ultra 9 285K 3.70GHz(8C/8T)+3.20GHz(16C/16T)
メモリ 合計128GB DDR5 6400 64GB x 2
ストレージ1 2TB SSD M.2 NVMe Gen4
ビデオ NVIDIA GeForce RTX5090 32GB
ネットワーク on board(2.5GBase-T x1) Wi-Fi,Bluetooth
筐体+電源 ミドルタワー型筐体 1600W 80PLUS TITANIUM
OS Microsoft Windows 11 Professional 64bit

LLMを高速に動かすために重要なGPU

LLMの推論処理では、GPUのVRAM容量と演算性能が処理時間に大きく影響します。
特に、十分なVRAM容量があることで、より大規模なモデルをGPU単体で処理できるようになり、効率的な推論が可能となります。
一方、VRAMが不足するとメモリスワップが発生し、GPUとCPU間のデータ転送がボトルネックとなって、処理速度が著しく低下します。

例えば、Llama-3-ELYZA-JP-8BをINT8量子化で運用する場合、約17GBのVRAMが必要です。
そのため、最低でも24GB以上のVRAMを搭載することが推奨されています。

RTX 5090は、最新のCUDAおよびTensorコアを搭載したモデルで、同じVRAM容量を持つRTX 5000 Adaと比較して、約2倍の推論速度を記録した検証結果が報告されています。
この性能差を踏まえ、今回の構成ではRTX 5090を採用しました。

詳細な検証結果は、下記の技術記事をご覧ください。
GeForce RTX 4090との比較検証結果も記載されております。

高負荷のLLM推論にも安定して対応できる計算性能を備えているため、実運用環境では処理時間の大幅な短縮が期待できます。

LLM推論におけるメインメモリの重要性

LLMの安定稼働には、GPUのVRAMに加えて、ホスト側メモリの確保が不可欠です。
モデルのロード時にはVRAMを超える一時メモリが必要となる場面があるほか、入力テキストや生成結果の保持にもメインメモリが消費されます。

こうした運用条件を踏まえ、本設計では128GB(64GB × 2)のDDR5メモリを標準搭載しました。
さらに空きスロット (4スロット中2スロット未使用) を活用することで、最大256GBまでのメモリ増設が可能です。
将来的なモデルの大規模化やバッチ処理の拡張にも、柔軟に対応できる構成です。

このような分野で活躍されている方へ

  • 自然言語処理
  • 人工知能
  • 情報学
  • 計算言語学
  • 知識情報処理

バッチサイズや量子化設定など、運用条件に応じた最適な構成をご提案いたします。具体的なご用途があれば、ぜひご相談ください。

キーワード

・Llama-3-ELYZA-JP-8B とは

Llama-3-ELYZA-JP-8Bは、株式会社ELYZAがMeta社の「Llama 3」を基に開発した、日本語に特化した大規模言語モデルです。
80億パラメータというコンパクトさと、日本語らしいニュアンスを捉える力を両立させており、情報工学・計算機科学分野や言語学研究に活用されています。ローカル環境で動作するため、機密データや社内情報を外部に出さずに処理できる点も特長です。

参考:elyza_Llama-3-ELYZA-JP-8B ※外部サイトに飛びます

■ このPC事例に関する詳細、お問い合わせはこちら
Llama-3対応自然言語処理用ワークステーション

※事例の名称またはご希望の条件などをご記入ください。

  • 大規模言語モデル
  • 自然言語処理

この記事を読んだ方はこんな記事も読んでいます

特集

【特集記事】音声コーパスに関連する人気商品のご紹介

2023年11月27日 テガラ株式会社 人文学・社会科学, 情報学, 人工知能, アプリケーション開発・プログラミング, 特集

ユニポスは、数多くの研究機関・教育機関のお客様からご支持いただいている研究開発者向け海外製品調達・コンサルテーションサービスです。 本ページでは、音声コーパスに […続きを見る]

研究開発用PC 構成事例 (テグシス)

音声解析研究用マシン

2023年4月27日 テガラ株式会社 研究用ワークステーション, 人工知能, アプリケーション開発・プログラミング, 研究開発用PC 構成事例 (テグシス)

電話用の音声認識システム開発を行うお客様より、OpenAI「Whisper」を利用するPCをご相談いただきました。 ご希望の条件は以下のとおりです。 ・CPU: […続きを見る]

人工知能

【製品紹介】MinIO AIStor | AI 向け 大規模 オブジェクトストレージ (Amazon S3 互換)

2024年12月27日 テガラ株式会社 情報学, 人工知能, アプリケーション開発・プログラミング, ネットワーク・セキュリティ, 業務支援・効率化ツール, 海外製品 新着情報 (ユニポス)

ユニポスWEBサイトに、AI・機械学習向けに設計された高性能オブジェクトストレージソリューション「MinIO AIStor」 のページを追加しました。 MinI […続きを見る]

サイト内検索:

テガラ株式会社 YouTube動画

【IR Pass Filter の効果】RealSense D435 と D435f でホワイトボードを撮影

最新の投稿動画を表示しています。
この他の動画はテガラ株式会社 Youtubeチャンネルをご覧ください

人気の記事 (過去7日間のアクセスランキング)

  • furix BetterWMF and CompareDWG tools for AutoCAD 【製品紹介】Beyond Compare:ファイル、フォルダの比較・統合・同期ユーティリティ 2022年11月18日
  • 【製品紹介】Leap Motion Controller 2 – 手や指の動きを認識するハンドトラッキングカメラ 2023年6月9日
  • 【製品紹介】MarineTraffic : 船舶に関するリアルタイム情報提供サービス(サブスクリプションプラン) 2023年4月6日
  • 【リリース情報】リモートアクセス RealVNC VNC Connect | ライセンス形態変更のお知らせ 2023年6月29日
  • 【機能比較】Azure Kinect DK と Orbbec Femto Bolt の違いは? 2023年9月26日

最新投稿記事

  • Llama-3対応自然言語処理用ワークステーション
    2025年8月22日
  • NeuroImaging・統計解析対応ワークステーション
    2025年8月21日
  • グライコプロテオミクス解析用ワークステーション (おすすめ構成)
    2025年8月20日
  • グライコプロテオミクス解析用ワークステーション (エントリー構成)
    2025年8月20日
  • Metashape用点群データ解析ワークステーション
    2025年8月19日

注目のタグ

解析ツール (56) 3Dカメラ (55) 機械学習(マシンラーニング) (53) AI (47) ロボティクス (45) VR (44) ロボットアーム (42) バイオインフォマティクス (42) RealSense (41) 統計解析 (39) DeepLearning (39) 動画・映像 (37) デプスカメラ (36) SBC (36) 計装 (35) 小型SBC (35) IoT (35) スペクトル (33) シミュレーション (33) データ解析 (31) Python (30) 第一原理 (29) サイバーセキュリティ (28) 化学 (27) AR (27) 次世代シーケンサー (27) JavaScript (27) Metashape (26) 画像解析・画像検査 (26) .NET (26) 画像処理 (25) MATLAB (25) LIDAR (25) 車載 (25) UI (24) フォトグラメトリー (23) 分子生物学 (22) サポート (22) プロトタイプ (22) 3Dモデル (22) 教育ロボット (22) 計測器 (21) Web開発・制作 (21) テストツール (20) GIS (20) マテリアル (20) ROS (19) 電磁界解析 (19) ロボットハンド (19) アニメーション (19) モバイルロボット (19) セキュリティー (19) 可視化 (19) ドローン (19) ロボット (19) 心理学 (19) プロトコル (18) 自律走行車 (18) 遺伝子 (18) プログラミング (18) ToF (18) 脳波 (18) ディープラーニング (17) 臨床 (17) CAE (17) モーションキャプチャ (17) バイオアッセイ (17) 3Dプリンタ (17) Raspberry Pi (17) DNA (17) トラッキング (17) モデリング (16) 3Dモデリング (16) 教育 (16) 産業用 (16) チャート (16) 構造解析 (16) RNA (15) 動画編集 (15) ライブラリ (15) 3Dスキャン (15) 流体解析 (15) 生物統計学 (15) 医薬品開発 (15) Arduino (15) AR/VR (15) 分子動力学 (15) 刺激呈示 (14) 2022年7月 配信記事 (14) SLAM (14) CFD (14) 周辺機器 (14) 農業・農学 (14) マルウェア (14) 情報発信12月号 (14) 装置制御 (14) 写真 (14) CUDA (14) 2022年8月 配信記事 (14) ナノ構造材料 (13) デプスセンサ (13) 数値解析 (13) STEM/STEAM教育 (13) 音声処理 (13) 測量 (13) 量子化学計算 (13) 開発・評価キット (13) 24時間稼働 (13) ゲノム解析 (13) 熱流体解析 (13) Gaussian (13) 3DCAD (13) 制御 (13) 無線 (13) IDE(統合開発環境) (13) 監視 (13) 遠隔操作(リモートコントロール) (12) CAD (12) GPGPU (12) 情報発信22年3月号 (12) Looking Glass (12) FDTD法 (12) DeepLabCut (12) 自然科学 (12) キャプチャグローブ (12) 情報発信22年4月号 (12)
分野別に情報を探す – Category
  •  人文学・社会科学
  •  数物系科学
  •  化学
  •  工学
  •  医学・看護学・薬学
  •  生物学・農学
  •  情報学
 
  •  人工知能
  •  ロボティクス
  •  センサー技術
  •  開発キット・電子工作
  •  デジタルガジェット
  •  自動車・車両(vehicle)関連
  •  産業用通信技術
  •  アプリケーション開発・プログラミング
  •  ネットワーク・セキュリティ
  •  マルチメディア(映像・画像・音声)処理
  •  業務支援・効率化ツール
Translate
お問い合わせフォーム – Contact
TEGAKARI へのお問い合わせはこちら
サイト内リンク
プライバシーポリシー
運営WEBサイト (サービス)
テガラ株式会社
テガラ株式会社コーポレートサイト

UNIPOS
研究開発者向け海外製品調達・コンサルテーションサービス

テグシス
研究用・産業用PCの製作・販売サービス
SNSアカウント
  • Twitter
  • YouTube
  • Facebook

テガラ株式会社

テガラは、研究開発者さまに有用な製品・サービス・情報を統合的 (integrated) に提供するプラットフォームです。「研究開発を加速するお手伝い」

Copyright © 2020 | テガラ株式会社