TEGAKARI
  • ホーム
  • 海外製品 新着情報 (ユニポス)
  • 研究開発用PC 構成事例 (テグシス)
  • 研究開発者向けサービス情報
    • レンタルサービス tegakari
  • 技術情報記事
  • バージョンアップ情報
  • テガラからのお知らせ
  • お問い合わせ
ピックアップ新着記事
  • [ 2025年6月24日 ] DeepLabCut用ワークステーション エントリーモデル (2025年6月版) 研究用ワークステーション
  • [ 2025年6月24日 ] DeepLabCut用ワークステーション ハイエンドモデル (2025年6月版) 研究用ワークステーション
  • [ 2025年6月24日 ] DeepLabCut用ワークステーション ミドルモデル (2025年6月版) 研究用ワークステーション
  • [ 2025年6月23日 ] 海外製品調達サービス「ユニポス」のWEBサイトをリニューアルしました 海外製品 新着情報 (ユニポス)
  • [ 2025年6月23日 ] ライフサイエンス研究開発向け 特別キャンペーンのご案内【テグシス】 医学・看護学・薬学

ホーム > 特集 > 【特集記事】音声コーパスに関連する人気商品のご紹介

【特集記事】音声コーパスに関連する人気商品のご紹介

2023年11月27日 テガラ株式会社 人文学・社会科学, 情報学, 人工知能, アプリケーション開発・プログラミング, 特集

ユニポスは、数多くの研究機関・教育機関のお客様からご支持いただいている研究開発者向け海外製品調達・コンサルテーションサービスです。

本ページでは、音声コーパスに焦点をあて、研究開発に携わるお客様から注目されている商品をピックアップしました。ぜひご覧ください。

目次

  • 音声コーパスとは
    • 言語音声コーパスの役割
  • ユニポスで人気の言語音声コーパス製品
    • Speechocean コーパス | 様々な言語 商用 研究用 コーパス
    • LDC Corpus | 言語 コーパス データベース
    • ELRA GLOBALPHONE | 多言語 音声 データベース
    • AISHELL コーパス | 人工知能 中国語 コーパス
  • 活用事例
  • 無償で提供されている言語音声コーパス
    • 筑波大 多言語音声コーパス (UT-ML)
    • 中国語MULTEXTコーパス (MULTEXT-C)
    • 身体情報付き男・女・子どもの母音音声データベース (JVPD)
    • 基盤研究(A)「日本語方言の地域差」方言音声コーパス (GSR-JD)
  • まとめ

音声コーパスとは

音声コーパスは、音声データの集合体を指し、その重要性は自然言語処理の研究や実用において大きな役割を果たしています。自然言語処理は、言語やコミュニケーションに関連する情報を解析する技術であり、その中で、言語音声コーパスは「言語データを構造化する重要な役割」をになっているため、AIの分野でも重要な位置を占めています。

具体的な自然言語処理の手法の一例として、音声解析が挙げられます。これは音声データから言語に関する情報を抽出する技術であり、音声認識や音声合成などの分野で幅広く利用されています。音声解析により、機械が音声を理解し、適切に応答するための基盤が築かれています。
また、自然言語処理の研究は、音声コーパスの活用やディープラーニングの進展に伴い急速に進んでいます。技術の進歩によって、ますます自然言語処理の応用範囲が広がり、新たな可能性が開かれています。音声コーパスというデータの集合体が、言語処理技術の発展に寄与していると言えます。

言語音声コーパスの役割

  • 学習データ提供: 多様な音声データを提供し、機械学習モデルの学習を強化
  • 音声認識の基盤: 音声解析により音声認識技術の基盤を整え、機械が音声をテキストに変換できるようにする
  • 対話型AIの発展: 対話型AIの進化を支え、機械が自然な言葉でユーザーとコミュニケートできるようにする
  • 音声合成技術の向上: 音声解析から得た情報を音声合成技術に活かし、自然な音声生成を可能にする
  • 実生活への適用: スマートホームの音声制御、クレーム対応、学習補助など、実際の生活において幅広く活用可能

 

ユニポスで人気の言語音声コーパス製品

音声コーパスは言語研究や音声認識技術、音声合成技術や言語処理技術など、様々な分野で活用されており、今後ますます需要が高まることが予想されます。

ユニポスでも、音声コーパス関連製品を多数お取り扱いしています。代表的なものをご紹介しますので、ぜひご覧ください。

Speechocean コーパス | 様々な言語 商用 研究用 コーパス

様々な言語の商用・研究用 コーパス

中国 Speechocean の取り扱っている各種コーパス。
ASR-Corpus(自動音声認識コーパス)、TTS-Corpus(音声合成コーパス)の他、コンピュータビジョンコーパス、語彙コーパス、 自然言語処理コーパスなど、
商用 約1,000種類、研究用 約150種類の数多くのコーパスを扱っています。

110以上の言語や方言 (アクセント) 、年齢、性別、録音時間、録音プラットフォームなどにより細かく種類分けされておりますので、お問合せの際は、ご希望のコーパスの名称、S.N (King-) をお知らせください。

Beijing Haitian Ruisheng Science Technology Ltd / DataOcean AI (メーカーサイト)

主な用途
– 自動音声認識コーパスv
– 音声合成コーパス
– テキストコーパス
– 多言語対応
– 商用と研究用の提供

LDC Corpus | 言語 コーパス データベース

様々な言語のコーパス (言語データベース)

米国ペンシルバニア大学に本部をおく、LDC (Linguistic Data Consortium) の扱っているコーパス。
テキストデータベース、音声データベース、レキシコン (辞典) など、豊富な語録とさまざまな形態のデータが揃っています。

お問い合わせの際にはご希望の商品名をお知らせください。

LDCコーパスカタログページ (メーカーサイト)

主な用途
– 自然言語処理 (NLP) の研究データ
– 言語データのアノテーション
– 構文解析や形態素解析に利用
– 音声資源コンソーシアムのデータ
– 大規模な注釈付き言語データの提供

ELRA GLOBALPHONE | 多言語 音声 データベース

多言語音声データベース

ヨーロッパの言語資源協会 ELRA (European Language Resources Association) より提供されている多言語音声データベース (コーパス)。
GlobalPhone シリーズは近接マイク (Sennheiser 440-6) で録音された、新聞紙面の読み上げ音声データです (16bit、16kHzモノラル)。 2023年現在、22言語のデータが提供されています。

主な用途
– 多言語音声認識システムの開発
– 自然言語処理 (NLP) 研究向けの音声データ
– 言語間の発音の比較研究に利用
– 言語技術の評価パッケージ作成
– 多様な言語の音声データの研究用途

AISHELL コーパス | 人工知能 中国語 コーパス

人工知能向けの中国語コーパス

中国 Beijing Shell Shell Technology社の取り扱っている、スマートホームや自動車 (スマートカー) 、ロボットといった音声によるインテリジェント製品向けの音声コーパス。データは用途シーン別にカテゴライズされています。

また学術研究用途向けのオープンソースコーパスも提供されています。

主な用途
– 音声認識システムトレーニング
– 中国語の自然言語処理研究
– 音声合成のデータベース
– マルチモーダル学習のためのデータセット
– 音声アノテーションと解析

活用事例

音声コーパスは自然言語処理 (NLP) の分野において重要な音声資源として活用されています。音声コーパスは、音声認識、テキスト変換、自動要約、機械翻訳、感情分析など、多くの自然言語処理タスクに活用されています。

1.音声認識
言語音声コーパスは、音声認識の訓練と評価に使用されます。コーパスに含まれる多様な発音、アクセント、言語表現を通じて、音声認識システムは異なる言語や方言に対応し、正確なテキストへの変換を実現します。
2.テキスト変換
言語音声コーパスを用いて、音声データをテキストデータに変換する作業が行われます。これにより、音声からテキストへの変換精度が向上し、NLPタスクの入力データとして使用できます。
3.自動要約
音声データから抽出されたテキストを自動要約の対象として使用します。これにより、大量の音声データから要約を生成し、情報を効率的に整理することが可能です。
4.機械翻訳
言語音声コーパスは、機械翻訳の訓練に活用されます。音声データからテキストデータへの変換を通じて、多言語間のコミュニケーションを支援する翻訳システムが開発されます。
5.感情分析
音声データに含まれる話者の感情や感情表現を分析するために言語音声コーパスが使用されます。これにより、商品の評判分析やカスタマーサービスの品質向上に貢献します。

音声コーパスはNLPアルゴリズムのトレーニングと評価に必要なデータソースであり、テキストデータに比べて豊富な情報を提供します。音声コーパスは音声データの有用性を最大限に引き出し、効率的な情報抽出と処理を可能にします。

無償で提供されている言語音声コーパス

音声コーパスには有償で提供されるものだけでなく、学術機関などが独自に収集、編纂、提供する無償のコーパスも存在します。利用においては一定の条件や手続きが必要となりますので、各サイトの情報を確認のうえ、ご利用ください。

筑波大 多言語音声コーパス (UT-ML)

筑波大 多言語音声コーパス (UT-ML) は、11カ国の言語に対応する音声データベースです。異なる言語、異なる性別の計98名の話者による音声が収録されています。CD/DVD版とオンライン配布から選択して申し込むことができます。

中国語MULTEXTコーパス (MULTEXT-C)

中国語MULTEXTコーパス(MULTEXT-C)は、ヨーロッパで作成されたMultilingual Text Tools and Corpora (MULTEXT) の中国語版です。1つが5~6分で構成される40の原稿を、できるだけ自然に話すように指示して収録されました。CD/DVD版とオンライン配布から選択して申し込むことができます。

身体情報付き男・女・子どもの母音音声データベース (JVPD)

日本語音声の標準的な科学資料としての公開を目的に作成された母音データベースです。話者数は385名で、このうち284名分については身長・体重の資料もあります。CD/DVD版とオンライン配布から選択して申し込むことができます。

基盤研究(A)「日本語方言の地域差」方言音声コーパス (GSR-JD)

読み上げ発話と自然談話を収録した日本語方言の音声コーパスです。9つの地域、計133名の音声が収録されています。CD/DVD版とオンライン配布から選択して申し込むことができます。

まとめ

一般的には音声コーパスの存在になじみがない方が多いかもしれませんが、音声コーパスを利用した研究開発の成果は、我々の身の回りにあふれています。
代表例としては、スマートフォンやスマートスピーカーなどの音声認識機能が挙げられますし、AI Chatを使った音声のテキスト変換や自動要約などの利用も珍しくありません。今後ますますニーズが高まり、用途も多様化していくことでしょう。

ユニポスでは、音声コーパス製品やそれに関連したハードウェア・ソフトウェアを世界中から調達し、お客様のビジネスや研究における成功をサポートいたします。ユニポスWEBサイトに掲載のない商品も喜んでお調べしますので、お気軽にご相談ください。

■ ユニポスのサービス紹介・お問い合わせについてはこちら

研究開発者向け海外製品調達・コンサルテーションサービス「ユニポス」

 

  • 自然言語処理
  • コーパス
  • 音声処理

この記事を読んだ方はこんな記事も読んでいます

海外製品 新着情報 (ユニポス)

外耳のモデルを作成する3Dスキャナ「eFit Scanner」

2016年10月25日 テガラ株式会社 医学・看護学・薬学, 海外製品 新着情報 (ユニポス)

■こちらは、2016年10月25日に投稿された記事のため、情報の内容が古い可能性があります。ユニポスWEBサイトに、外耳のモデルを作成する3Dスキャナ eFit […続きを見る]

人文学・社会科学

外国語教育のためのオンライン口頭練習システム「Speak Everywhere」

2014年12月10日 テガラ株式会社 人文学・社会科学, 業務支援・効率化ツール, 海外製品 新着情報 (ユニポス)

■こちらは、2014年12月10日に投稿された記事のため、情報の内容が古い可能性があります。ユニポスWEBサイトに、外国語教育のためのオンライン口頭練習・アセス […続きを見る]

研究開発用PC 構成事例 (テグシス)

音声解析研究用マシン

2023年4月27日 テガラ株式会社 研究用ワークステーション, 人工知能, アプリケーション開発・プログラミング, 研究開発用PC 構成事例 (テグシス)

電話用の音声認識システム開発を行うお客様より、OpenAI「Whisper」を利用するPCをご相談いただきました。 ご希望の条件は以下のとおりです。 ・CPU: […続きを見る]

サイト内検索:

テガラ株式会社 YouTube動画

【IR Pass Filter の効果】RealSense D435 と D435f でホワイトボードを撮影

最新の投稿動画を表示しています。
この他の動画はテガラ株式会社 Youtubeチャンネルをご覧ください

人気の記事 (過去7日間のアクセスランキング)

  • 【改修完了しました】ユニポスWEBサイト改修による アクセス不可期間のご連絡 (6月23日 17:00~) 2025年6月20日
  • 【製品紹介】MarineTraffic : 船舶に関するリアルタイム情報提供サービス(サブスクリプションプラン) 2023年4月6日
  • プロジェクションマッピングソフトウェア「MadMapper」の 最新バージョン 5 が正式リリースされました 2021年12月23日
  • furix BetterWMF and CompareDWG tools for AutoCAD 【製品紹介】Beyond Compare:ファイル、フォルダの比較・統合・同期ユーティリティ 2022年11月18日
  • 【製品紹介】Leap Motion Controller 2 – 手や指の動きを認識するハンドトラッキングカメラ 2023年6月9日

最新投稿記事

  • DeepLabCut用ワークステーション エントリーモデル (2025年6月版)
    2025年6月24日
  • DeepLabCut用ワークステーション ハイエンドモデル (2025年6月版)
    2025年6月24日
  • DeepLabCut用ワークステーション ミドルモデル (2025年6月版)
    2025年6月24日
  • 海外製品調達サービス「ユニポス」のWEBサイトをリニューアルしました
    2025年6月23日
  • ライフサイエンス研究開発向け 特別キャンペーンのご案内【テグシス】
    2025年6月23日

注目のタグ

解析ツール (56) 3Dカメラ (55) 機械学習(マシンラーニング) (53) AI (47) ロボティクス (45) VR (44) ロボットアーム (42) バイオインフォマティクス (42) RealSense (41) 統計解析 (39) 動画・映像 (37) デプスカメラ (36) DeepLearning (36) SBC (36) IoT (35) 小型SBC (35) 計装 (35) スペクトル (33) シミュレーション (33) データ解析 (31) Python (29) サイバーセキュリティ (28) JavaScript (27) 第一原理 (27) 次世代シーケンサー (27) AR (27) 化学 (27) .NET (26) LIDAR (25) 車載 (25) 画像処理 (25) 画像解析・画像検査 (25) Metashape (25) MATLAB (24) UI (24) フォトグラメトリー (23) 3Dモデル (22) プロトタイプ (22) 教育ロボット (22) 分子生物学 (22) サポート (22) 計測器 (21) Web開発・制作 (21) テストツール (20) マテリアル (20) GIS (20) ロボットハンド (19) ROS (19) 心理学 (19) セキュリティー (19) ドローン (19) アニメーション (19) ロボット (19) モバイルロボット (19) 可視化 (19) プログラミング (18) ToF (18) 自律走行車 (18) プロトコル (18) 脳波 (18) 電磁界解析 (18) 遺伝子 (18) モーションキャプチャ (17) 臨床 (17) CAE (17) Raspberry Pi (17) ディープラーニング (17) DNA (17) 3Dプリンタ (17) トラッキング (17) チャート (16) バイオアッセイ (16) モデリング (16) 教育 (16) 3Dモデリング (16) 産業用 (16) 構造解析 (16) Arduino (15) 流体解析 (15) 生物統計学 (15) 医薬品開発 (15) 分子動力学 (15) 動画編集 (15) ライブラリ (15) 3Dスキャン (15) RNA (15) AR/VR (15) 刺激呈示 (14) 情報発信12月号 (14) 2022年7月 配信記事 (14) CUDA (14) マルウェア (14) 周辺機器 (14) 2022年8月 配信記事 (14) 農業・農学 (14) 装置制御 (14) CFD (14) SLAM (14) 写真 (14) デプスセンサ (13) 熱流体解析 (13) ナノ構造材料 (13) 音声処理 (13) 測量 (13) 開発・評価キット (13) 制御 (13) 24時間稼働 (13) 監視 (13) IDE(統合開発環境) (13) ゲノム解析 (13) 3DCAD (13) STEM/STEAM教育 (13) 無線 (13) 数値解析 (13) 自然科学 (12) キャプチャグローブ (12) CAD (12) GPGPU (12) Looking Glass (12) 情報発信22年4月号 (12) 情報発信22年3月号 (12) 遠隔操作(リモートコントロール) (12) DeepLabCut (12) FDTD法 (12)
分野別に情報を探す – Category
  •  人文学・社会科学
  •  数物系科学
  •  化学
  •  工学
  •  医学・看護学・薬学
  •  生物学・農学
  •  情報学
 
  •  人工知能
  •  ロボティクス
  •  センサー技術
  •  開発キット・電子工作
  •  デジタルガジェット
  •  自動車・車両(vehicle)関連
  •  産業用通信技術
  •  アプリケーション開発・プログラミング
  •  ネットワーク・セキュリティ
  •  マルチメディア(映像・画像・音声)処理
  •  業務支援・効率化ツール
Translate
お問い合わせフォーム – Contact
TEGAKARI へのお問い合わせはこちら
サイト内リンク
プライバシーポリシー
運営WEBサイト (サービス)
テガラ株式会社
テガラ株式会社コーポレートサイト

UNIPOS
研究開発者向け海外製品調達・コンサルテーションサービス

テグシス
研究用・産業用PCの製作・販売サービス
SNSアカウント
  • Twitter
  • YouTube
  • Facebook

テガラ株式会社

テガラは、研究開発者さまに有用な製品・サービス・情報を統合的 (integrated) に提供するプラットフォームです。「研究開発を加速するお手伝い」

Copyright © 2020 | テガラ株式会社