2022年12月5日 星期一

字幕檔轉為 oTranscribe 線上聽打逐字稿工具的格式

2022年12月5日 星期一

寫在前面

有鑑於用原版的 oTanscribe 編輯字幕檔,需要將檔案轉換來又轉換去,實在太複雜了;經過三天的研究,將開源的 oTranscibe 改了一個我自己想要的版本,直接放在 Gihub 中。請參考較新的這一篇文章:

改過的版本,最重要的是加了以下的功能:

  • 可直接匯入 .srt 的字幕檔。
  • 可直接匯出 .srt 的字幕檔,或是去掉時間戳記的純文字檔。

哈!所以如果使用上面這個改過的 oTranscibe,本篇文章就可以忽略不看了。(記於 2023.03.16)

改良版的 oTranscribe


原始文貼文開始

oTranscribe」是一個線上聽打逐字稿的工具,我們可以將影音檔案,或是 Youtube 的網址指定給它,播放影音後,邊聽邊打逐字稿。用 oTranscibe 來聽打逐字稿跟自己以影音播放器播放後,邊聽邊打,有什麼不同?主要是它提供了一些快速按鍵可以比較簡便的操控影音,最重要的是可以用快速按鍵,或按按鈕,在文件上加上聲音播放到哪裡的「時間戳記」,之後,只要按一下「時間戳記」的連結,可以快速回放重聽,再修正或補充文字。

 oTranscribe 可以將編輯好的內容匯出成常見的格式儲存,如果匯出的是 oTranscribe 的格式(副檔名 .otr),日後重新匯入後,影音的「時間戳記」也會被重現。

oTranscribe .otr 的檔案內容,其實是 JSON 格式,主要分成「text」跟「media-time」兩部份;「text」中是使用 HTML 的語法,這裡面,涵蓋我們聽打時編輯的文字及時間戳記,只要了解時間戳記的表示語法,就可以將常見的影片字幕檔案(.srt、.vtt) 轉為 oTranscribe 的 .otr 格式。 這樣子,無論我們用「pyTranscriber」或是「剪映」將聲音轉為文字的 .srt 檔案,轉為 .otr 格式後,可以匯入 oTranscribe 中去邊聽,邊校正內容了。 

示範影片

格式轉換工具

底下這個工具可以將字幕檔轉為可供 oTranscribe 匯入的檔案。使用的方法很簡單:

  • 上載字幕檔案。將字幕檔,例如 .srt 或是 .vtt 檔案,拖曳到圓圈內;也可以按一下圓圈,再選取要轉換格式的字幕檔案。
  • 下載轉好的檔案。如果轉換成功,在圓圈的下方會出現「下載」的按鈕,按下去就能將 oTranscribe 格式的 .otr 下載並儲存在電腦中。

來試試這個格式轉換工具吧!

範例檔案下載

這裡我以 Vocaroo 錄了一分鐘左右的音檔,並利用「cSubtitle」線上聲音轉文字的工具(補記:轉字幕建議用這篇中的 Whisper「雄:使用 OpenAI Whisper 製作影音的字幕或逐字稿」,將 MP3音檔轉出字幕檔案。可以先下載 SRT 格式範例字幕檔來玩玩轉換 oTransribe 格式,然後將 MP3 檔案及轉好的 .otr 檔案匯入 oTranscribe 網站中試試它的聽打功能。

oTranscribe 檔案的匯入

如果已經將 .srt 的字幕檔案轉為 oTranscribe 格式的 .otr 檔案,就可以將 .otr 檔案匯入 oTranscribe 中測試。

進入 oTranscribe 的網站 ( https://gsyan888.github.io/oTranscribe/ ) 後,上方可以自行切換要使用哪一種語言,裡面也有繁體中文。好了就可以如 [圖1] 按「」開始使用:

[圖1] oTranscribe 網站的首頁

接著如 [圖2] 箭頭所示,按下後可以指定要使用哪一個影音檔(或是 Youtube)來檔聲音的來源:

[圖2] 指定要聽的影音檔案或 Youtube 網址

如果想匯入 oTranscribe 格式的 .otr 檔案,就按一下 [圖3] 箭頭所指的圖示

[圖3] 匯入 oTranscribe 格式的 .otr 檔案

成功匯入後,應該會類似 [圖4] 的樣子,按了上方的影音播放鈕後,按任何「時間戳記」,就可以快速地播放那個時間點的聲音。

[圖4] oTranscribe 的時間戳記可以跳到要聽的時間點

關於 oTranscribe 的操作,可以上方功能選單的「Help」查看。

修改完如何匯出或進行格式的轉換與修復,可參考另一篇文章:

相關連結

沒有留言:

張貼留言

 
雄::gsyan © 2009. Design by Pocket