2024年10月16日 星期三

YouTube 語言設定對 NotebookLM 的影響

2024年10月16日 星期三

Google NotebookLM (https://notebooklm.google.com/)有人稱它為第二個大腦,之前測試,只要是公開發布超過24小時的 YouTube 影片,而且帶有字幕者(其它限制參考 NotebookLM 的說明),就可以當 NotebookLM 的來源,讓它分析字幕的內容。昨天朋友發現原來可以匯入字幕的 YouTube 影片,變成無法匯入了,試了一下,真的不行了吔!哈!有變化,表示它還在持續進化中,也該高興的。

早上用各種方式交叉比對,發現解決自己影片無法匯入到 NotebookLM 的方法,也發現原本沒有字幕的 YouTube 影片,其實 NotebookLM 會自動產生逐字稿哦!(圖1)

[圖1] NotebookLM 自動產生的 YouTube 影片逐字稿

測試的影片如下:

以我自己的影片來說,「影片語言」平時都是使用預設的「中文(台灣)」,所以字幕的語言也是使用這個設定。測試完的結果,它應該就是造成我的影片 NotebookLM 不接受的主因。如果將語言「中文(台灣)」中的字幕「取消發布」,讓影片變成沒有字幕的狀態,它就能類似 [圖1],自動生成逐字稿。

如果想使用自己上載的字幕內容,就要有一個語言為「中文」的字幕,再重新將字幕上載到YouTube 「中文」的項目中。

[圖2] 語言為「中文」者可以抓到字幕「中文(台灣)」抓不到

到 NotebookLM 加入影片,就能底下 [圖3] 一樣,看到 YouTube 影片的字幕內容了。

[圖3] 抓到的字幕內容

個人是覺得「中文(台灣)」抓不到字幕這個狀況應該只是一時的臭蟲吧 (哈!語言設定的清單裡,中文的選項真多,有繁體、簡體、台灣、客語、香港......),多半是程式改一改,疏忽了,沒有去參照到「影片語言」的設定。有了這個經驗,以後我的 YouTube 影片的語言一律設定為「中文」就好了。

不過,以我同一支影片來比較,NotebookLM 產出的逐字稿(圖1),跟用 OpenAI Whisper 解譯出來的字幕(圖3),還是有差距的。

相關連結



    沒有留言:

    張貼留言

     
    雄::gsyan © 2009. Design by Pocket