LibriVox
LibriVox(リブリボックス、朗読図書館、音声図書館)は、パブリックドメインの著作を朗読した音声の記録(これは一般的にオーディオブックと称されるもの)を無償で配布しているサイト。英語の著作が主であるが、日本語も含めて他の言語も多数ある。プロジェクト・グーテンベルクと提携している。
LibriVox | |
---|---|
URL | |
librivox.org/ | |
タイプ | 無料オーディオブックの録音・配信 |
使用言語 | 主に英語 |
項目数 | 1000本以上のオーディオブック[1] |
聴取 | 無料 |
著作権 | パブリック・ドメイン |
資金 |
資金源なし[2] 1.オーディオファイルの配信はInternet Archiveが無償でサポート 2.ウェブサイトのホスティングはnyip.netが無償でサポート |
営利性 | なし |
設立 | 2005年8月[3] |
設立者 |
ヒュー・マクガイヤ[3] (Hugh McGuire) |
音声はサイトから直接ダウンロードするか、iTunes Storeからポッドキャストとして入手できる。
概要
編集LibriVox は、パブリックドメインのテキストを朗読・録音し、無料のパブリックドメインオーディオブックを作成し、ウェブサイトやインターネット上の他のデジタルライブラリーのホスティングサイトからダウンロードできるようにする、世界的なボランティアグループの一つである。2005年に Hugh McGuire によって設立され、その目的は「パブリックドメインの書籍の音響的解放」である[4]。パブリックドメインとなったすべての書籍について、LibriVox は音声ファイル形式にてインターネット上で無償提供することを目ざしている[5]。
このプロジェクトでは、2016年8月6日の時点で 10,000件、2021年2月14日の時点で 15,000件のオーディオブックを完成させた[6][7]。公開した作品の多くは言語が英語であるが、英語以外の作品も数多く公開している。複数の提携プロジェクトが追加的なコンテンツを提供している。LibriVox は、プロジェクトで利用するテキストの一部をProject Gutenbergから入手しており、またプロジェクトが公開する作品は Internet Archive がホストしている。そういった事情によって、提携プロジェクトと密接に連携している。
歴史
編集私たちはネット上で多くのボランティアを活用し、ポッドキャスティングでパブリックドメインの本を世に送り出すことができるのか? - ヒュー・マクガイア
LibriVox は、2005年8月、モントリオール在住の作家 Hugh McGuire が開始したプロジェクトである。彼は当時ブログを立ち上げて、上記のような質問を投げかけた[8][9]。最初のオーディオブックは、ジョセフ・コンラッドが書いた『The Secret Agent』であった[10]。
LibriVox の仕組みの主な特徴は開始当初からほとんど変わっていない。しかしながら、それを支える技術はウェブ開発の進展と共に、ボランティアの努力によって改善され現在に至っている。
派生コーパス
編集オーディオブックはテキスト読み上げの一種であるため、LibriVoxは大量の音声/テキストペアとも言える。この特性からLibriVoxは音声信号処理用のコーパスとしても注目されてきた。LibroVoxの一部を改良した様々なコーパスが提案されている。
名称 | コンテンツ | 特徴 | 論文 |
---|---|---|---|
LibriSpeech | 音声/スクリプト, 982時間, 2484話者 | ASR向け、音質clean/otherの分類 | Panayotov 2015[11] |
LibriTTS | 音声/スクリプト, 586時間, 2456話者[12] | LibriSpeechのTTS向け厳選/高品質版 | Zen 2019[13] |
LibriTTS-R | 音声/スクリプト, 586時間, 2456話者 | LibriTTSの音声品質改善版 | Koizumi 2023[14] |
Libri-light | [15] |
脚注
編集- ^ LibriVox reaches 1,000! - オーディオテープの本数が1000本に達した事を告げるアナウンス(2007年10月31日付)より。最終閲覧2007年11月7日
- ^ FREQUENTLY ASKED QUESTIONS - MONEY TALK - Where does LibriVox get its funding? より。最終閲覧2007年11月7日
- ^ a b FREQUENTLY ASKED QUESTIONS - GENERAL INFORMATION - Who started the crazy project? より。最終閲覧2007年11月7日
- ^ “LibriVox”. librivox.org. 2022年5月4日閲覧。
- ^ “About LibriVox | LibriVox About LibriVox | free public domain audiobooks” (英語). 2022年5月4日閲覧。
- ^ “Another LibriVox Milestone: 10,000 projects! | LibriVox Another LibriVox Milestone: 10,000 projects! | free public domain audiobooks” (英語). 2022年5月4日閲覧。
- ^ “LibriVox Celebrates 15,000 Audiobooks! | LibriVox LibriVox Celebrates 15,000 Audiobooks! | free public domain audiobooks” (英語). 2022年5月4日閲覧。
- ^ “Welcome to LibriVox | LibriVox Welcome to LibriVox | free public domain audiobooks” (英語). 2022年5月4日閲覧。
- ^ “LibriVox&action”. 2007年2月12日閲覧。
- ^ “LibriVox”. librivox.org. 2022年5月4日閲覧。
- ^ Panayotov, et. al.. (2015). Librispeech: An ASR corpus based on public domain audio books.
- ^ train-clean-100/360: 247話者/904話者 train-other-500: 1160話者
- ^ Zen, et. al.. (2019). LibriTTS: A Corpus Derived from LibriSpeech for Text-to-Speech.
- ^ Koizumi, et. al.. (2023). LibriTTS-R: A Restored Multi-Speaker Text-to-Speech Corpus.
- ^ Kahn, etl al.. (2019). Libri-Light: A Benchmark for ASR with Limited or No Supervision.