2024年8月3日 星期六

以搖桿輔助 oTranscribe 製作 ICRT 字幕

2024年8月3日 星期六

最近一直在找適合練英文的材料,本來是下載 VOA Learning English 的音檔,再用 OpenAI Whisper 製作字幕檔;這幾天轉移陣地,將目標鎖定在 ICRT。ICRT 一樣也有音檔跟文字稿,但是可以依照不同程度,選用不同的單元。看一下 ICRT Pocast 的部份清單:

問了家中的小孩,原來國中吃午餐時,學校會播放 ICRT News Bites 的內容。那同學們有沒有在聽呢?答案是什麼,大家應該猜得出來吧!

ICRT 的音檔跟文稿看來是放在 SoundOn 中,利用訂閱的連結,就可以抓取文字內容與音檔的連結了。本來我只取了音檔,讓 OpenAI Whisper 進行語音辨識,製作 SRT 格式的字幕檔案。七月份節目八個 News Bites 的內容都辨識完,並且一個個邊聽、邊修正以後,有幾個發現:

  • OpenAI Whisper 真有「幻聽」的情形,有時會「胡說八道」,尤其是一大段英文,再來一段中文時;另外,雖然選擇的語言是英文,講中文時,它還是會辨識出中文,並輸出中文,如果出現簡體字,那就設定 prompt 為「以下是英文或繁體中文的句字」,可以大幅減少簡體字出現;英文、中文混用時,模型選用 large v3 比較不會有錯誤。
  • 如果有文稿跟音檔,使用 oTranscribe 手動加上時間截記,花的時間並不會比錯誤連連時的 OpenAI Whisper + 校正要多多少。

一樣是用 OpenAI Whisper 進行語音轉文字,校正自己影片的字幕檔,比校正 ICRT 的字幕檔要容易多了。哈!主要是 ICRT 的內容我並沒有完全掌握,要判斷得花更多時間。

玩了一天以後,我決定改用 ICRT 的音檔跟文稿,在 oTranscribe 中,邊聽,邊加上時間截記,以人工的方式來完成字幕檔。這樣一來,「輔具」就很重要了!

[圖1] 使用搖桿當 oTranscribe 的輔具

寫了一個小工具,可以由 ICRT 在 SoundOn 的訂閱資料檔中,解析出每一則文的以下欄位:

  • title : 標題。
  • pubDate : 發布時間。
  • link  : 該則在 SoundOn 的頁面網址。
  • enclosure : MP3 音檔的網址。
  • summary : 節目內容的文稿。

[圖2] 解析 ICRT RSS 的內容

將前述的內容複製到 oTranscribe ,並載入聲音檔以後,可以準備進行最花時間的聽打部份了。

oTranscribe 中,由於音檔的逐字稿已經有了,需要處理的就是逐句加上「時間戳記」。oTranscribe 使用 Esc 鍵來播放或暫停播放影音,使用 Ctrl + J 來插入「時間戳記」。本來我是很老實地照它預設的按鍵在操作,但是兩隻手實在忙到不可開交。拿出了簡報筆,但它的功能鍵似乎無法被 oTranscribe 接受。突然靈光一閃,「搖桿」!我之前買給學生玩的四支搖桿晾在一旁很久了,如果加上 JoyToKeyhttps://joytokey.net/en/ ) ,一定可以直接使用 oTranscribe 的預設按鍵來控制了。於是將搖桿的 [1] 按鈕對應到鍵盤的 Esc 鍵,[3] 按鈕對應到鍵盤的 Ctrl + J。哈!試了一下,果然效率大大地提升了。

[圖3] oTranscribe 匯出 SRT 字幕檔

為了更「神速」,乾脆幫 oTranscribe 加上「自動跳到下一句」的功能。如果在 oTranscribe 的網址後面加上 ?auto=1 ,有了 auto 的參數,當我們插入時間戳記後,游標會自動移到下一段的開頭。

後來請小孩來幫忙按搖桿,我負責控制「時間戳記」的插入點。哈!其實這工具我一隻手負責一項也能完成的。請她來幫忙是帶有心機的。昨天「玩」了一天的聽音校對文字,發現了一件事,因為要「專心」聽,校對完,內容也記得了,所以今天刻意請小孩來按搖桿,按完一篇,她也看完一篇了。哈!我這種小心機,也滿不錯的!

[圖4] 使用 HTML5 FUN Audio Player 來練英文

現在製作的字幕檔都會在最後面加上原文的網址及音檔的網址,一來好溯源,再來是使用 HTML5 FUN Audio Player 來載入字幕檔時,如果字幕檔有網址,而且網址中帶有影音的附檔名(ex. .mp3、.mp4 ......),就會自動載入該影音,可以少掉一個載入影音的步驟。哈!能偷懶,當然就偷懶囉!有沒有貼心 ^_^

相關連結


沒有留言:

張貼留言

 
雄::gsyan © 2009. Design by Pocket