Loading AI tools
動画素材に含まれた字幕データを抽出するプログラム。GNU GPLフリーソフトウェア ウィキペディアから
SubRipは、DVDなどの動画に含まれている字幕を光学文字認識を使用して抽出する、Windows用のフリーソフトウェアプログラムである。GNU GPLの下でリリースされている。SubRipはこのソフトウェアによって作成されたテキスト字幕ファイル形式(.srtファイル)のフォーマット名としても知られている。
拡張子 | .srt |
---|---|
MIMEタイプ | application/x-subrip[3] |
マジック ナンバー | 31 0D 0A 30 30 3A (ASCII: "1↵00:" ) |
開発者 | Brain, Zuggy |
種別 | 字幕ファイル |
包含物 | 字幕の順序と時刻 |
拡張 | WebVTT |
オープン フォーマット | Yes |
ウェブサイト | www |
光学文字認識を使用して、SubRipは生放送のビデオやビデオファイル、DVDから字幕データを抽出し、抽出した字幕をそのタイミングでSubrip形式の テキストファイルとして記録する [4]。設定を変えれば、認識したビットマップ形式の字幕を保存し、別途ソースビデオから減算処理(消去)のために使うことが可能である[5][6]。
実際に動かす時には、認識するビデオソースと同じコーデック にSubRipを正しく設定し、字幕エリアやフォント、書式設定[7]、色およびビデオ処理に必要な要件[8]をユーザーが調整すると字幕を認識する。 試行と微調整が済めば、SubRipは再生しているビデオソースファイル全体の字幕を自動的に抽出できる。 そしてSubRipは各字幕の開始時刻と終了時刻、さらに字幕そのものの内容をテキスト形式の.srt
ファイルに記録する[9]。
SubRipはビデオ本体からフレームを抽出するのにAviSynthを使用する。このプログラムが対応するすべてのビデオファイルから字幕をリッピングすることが可能である。
マルチメディアコンテナフォーマットの WebサイトMatroskaに寄せられた報告によれば、このソフトウェアは「おそらくすべての字幕フォーマットの中で最も基本的なもの」である[10] という。SubRip(SubRip Text)ファイルは拡張子 .srt
で命名され、プレーンテキストを空行で区切りグループ化したフォーマットで構成され、字幕は1から順番に番号が付く。使用するタイムコード形式は時:分:秒,ミリ秒であり、時、分、秒は0詰めの2桁で、ミリ秒は0詰めの3桁で表記される(00:00:00,000)。秒以下を区切る小数点記号がコンマなのは、プログラムがフランスで書かれていることに由来する 。
-->
という記号、字幕が消える時刻例:
1 00:20:41,150 --> 00:20:45,109 字幕1行目 字幕2行目 2 00:21:34,567 --> 00:21:45,678 次の字幕
非公式だが、非常に基本的なテキストフォーマットがあり、レンダリング時に解釈するか無視するかは処理するアプリケーションに依存する。 書式は、太字、斜体、下線、色のHTMLタグから派生したものである。 [11]
タグは入れ子可能である。実装によっては行全体が1フォーマットのみで処理される。
SubRipの .srt
フォーマットは、Comparison of video player softwareに記載されているように多くのビデオプレイヤーソフトでサポートされている。 Windows上のソフトウェアビデオプレーヤーで字幕再生を直接サポートしていないものでも、VSFilter DirectX フィルターを通してSubripやその他の字幕フォーマットを表示可能である。 [12] SubRipフォーマットは、多くの字幕作成/編集ツール[13]や一部のハードウェアホームメディアプレイヤーでもそのまま使用可能である。 [14][15][16][17][18]
2008年8月、YouTubeはFlashビデオプレーヤーの字幕サポートを「クローズドキャプション」オプションで追加した。コンテンツ制作者は字幕をSubRip形式でアップロードできる[19]。Facebook や Twitter[20] もサポートしている。
SubRipのデフォルトの出力エンコーディングはWindows-1252(欧米向け)に設定されている 。 ただし、出力オプションで多くのWindowsコードページやUTF-8などのUnicodeエンコード(バイト順マーク(BOM)の有無も含めて)が選択可能である。したがって、 .srt
ファイルには公式の文字コードは存在せず、SubRipファイルを解析する際には文字コードを検出する必要がある。Unicode バイト順マーク(BOM) も検出を補助するためによく使用される。
YouTube の場合は、サポートされているのは UTF-8 のみである[21]。FFmpeg の字幕ファイルのデフォルトエンコーディングは UTF-8 である[22]。
多くの組込みハードウェアベースのプレイヤーは、市販のフォントを使用する際のライセンス費用のため、ASCIIまたは西ヨーロッパのフォントしかサポートしていない[要出典] 。
このフォーマットはもともとWebSRT(Web Subtitle Resource Tracks)と呼ばれていたもので、2010年10月にWeb Hypertext Application Technology Working GroupによりHTML5の <track>
要素として提案された。 それは.srt
ファイル拡張子を共有しており、SubRip形式(の一部)に"広範囲に基づいている"とされていたが、SubRipと完全な互換性のあるものではなかった。 [23][24] このフォーマットは後にWebVTT(Web Video Text Track)と改名された。 [25][26] GoogleのChromeとMicrosoftのInternet Explorer 10ブラウザが、HTML5ビデオ用のWebVTTファイルで<track>
タグをサポートした初のブラウザとなる。 Mozilla Firefoxはnightly builds(Firefox 24)でWebVTTを実装しており、Firefox 31(2014年7月24日)時点では、WebVTTがデフォルト実装となった。 [27] ただ、使うためには、Firefox上で「about:config」ページに移動して「media.webvtt.enabled」の値をtrueに設定し、この機能を有効にする必要があった。 [28] YouTubeは2013年4月にWebVTTサポートを開始した。 [29]
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.