顯示具有 Apple 標籤的文章。 顯示所有文章
顯示具有 Apple 標籤的文章。 顯示所有文章

2024年11月23日 星期六

以 OpenAI Whisper 轉語音備忘錄為字幕格式逐字稿

2024年11月23日 星期六
有老師問到,平常都用 iPhone 在錄音,也可以使用 OpenAI Whisper 來將錄音轉為逐字稿嗎?

使用我建構在 Google Colab 中的 OpenAI Whisper (或 Faster Whisper) ,只要有網頁瀏覽器,基本上就可以使用。它們的聲音來源接受影音網站公開分享的網址,也可用電腦或是裝置中的影音檔案。所以手機使用 OpenAI Whisper 來將錄音轉為逐字稿的關鍵,是將錄音工具中的語音儲存為檔案。

語音備忘錄儲存到檔案

以 iOS 中內鍵的錄音工具「語音備忘錄」來說,錄好的語音怎麼變成可上載的檔案?

  • 開啟「語音備忘錄」
  • 在錄音清單中,按一下想儲存的錄音。
  • 按一下標題右側「三個點點」的圖示「更多動作」(或是「分享」的圖示)。
  • 點選「儲存到檔案」(看不到就向下找找)。
  • 指定想儲存到哪個地方及檔案名稱。
  • 按「儲存」。

[圖1] iOS語音備忘錄儲存到檔案

那可以將錄音儲存到雲端硬碟中嗎?

當然沒問題,想儲存到哪個地方完全自己決定就好。

有了語音檔案了,接下來,就跟在電腦上操作 Colab 裡的 OpenAI Whisper 類似步驟。

OpenAI Whisper 轉語音備忘錄為逐字稿

經過前面的程序,將轉語音備忘錄儲存為檔案以後,我們就可以開啟 OpenAI Whisper 了。有兩個選擇,可以使用 OpenAI Whisper,或是 Faster Whisper,如果尚未使用過,可以先在電腦上,參考底下兩篇舊文,裡面有操作示範的影片:

如果想直接使用 Whisper ,就用底下的連結來開啟工具:

小技巧:

  • 上載音檔:
    在手機上,因為是直拿的版面,先按畫面左上角的「三條線」圖示,再按「顯示檔案瀏覽器」。這樣就可以看到「虛擬機」的檔案及目錄了(有時可能要稍等一下,等虛擬機啟動連線,請參考 [圖2] [圖3] 或示範影片)。
  • 格式選擇:
    2024.11.21 以後,格式的選項中,新增了「.srt.txt」的項目。它會輸出帶有時間的字幕格式逐字稿,但是因為檔名結尾為「.srt.txt」,在手機或是平板中會被視為純文字檔案,就可以直接開啟來查看內容。(請參考 [圖4])
  • 自動鎖定:
    手機、平板有省電的機置,可能會因為「自動鎖定」進入省電模式而自動關閉螢幕,導致 Whisper 的程序被中斷;所以在行動裝置在使用 Whisper,iOS 可能要暫時在「設定」「螢幕顯示與亮度」中,將「自動鎖定」關閉。建議如果時間較長的錄音檔,將錄音錄儲存到雲端硬碟,再使用電腦來轉逐字稿較理想。
在手機中上傳音檔的程序如 [圖2] 所示:
[圖2] 在手機中上傳音檔

上傳好音檔後,按一下檔名,再按一下右側的「三個點點」,出現選單就按「複製路徑」。
[圖3] 複製音檔的路徑
將音檔的路徑貼入 url 的欄位中,將格式設定為 .srt.txt ,其它選項則依需求自行設定,都設定完就按左上角的「播放」圖示來開始執行程序 [圖4]  :
[圖4] 設定 & 執行

完成後記得參考 [圖5] ,進行中斷連線並刪除程執行程序的動作:
[圖5] 中斷連線並刪除程執行程序

示範影片

註: 影片有中文字幕並分章節。

相關連結


2022年3月16日 星期三

HTML5 : iOS 15 虛擬鍵盤消失

2022年3月16日 星期三

 前天晚上心血來潮,啟動以前加到 iPad 主畫面的「筆順練習」,點了國字輸入區,本來應該彈出來的虛擬鍵盤居然沒出現,試了好幾次都沒反應。印象中在 iOS 14.x 上是沒問題的,心想,大概是前一陣子將 iPad 升上 15.3.1 後,自己的程式是否又有什麼地方得配合著改了,也就先放著沒管。

隔天剛好朋友討論到升級至 15.4 的問題,用「ios 15 webapp keyboard」的關鍵字查了一下,原來虛擬鍵盤在 WebApps 中出不來的問題不是只有我遇到。其中有人說,將載具做一下「Hard Reboot」就可以解決問題。

按著 iPad 的電源鈕和 Home 鈕不放,一會兒 iPad 重新開機,再開啟主畫面中的「筆順練習」,似乎有好一點,不過,試了好幾次,會有底下三種情形:

[圖1] 虛擬鍵盤不見
[圖2] 虛擬鍵盤擋住輸入區
[圖3] 正常的畫面

在我還沒將 iOS 升級至 iOS 15 以前,都是像 [圖3] 一樣的,哈!現在居然像摸彩一樣,還要看 iPad 的心情!

因為朋友說他試是沒問題的,於是把心一橫,直接按了 iOS 15.4 的升級按鈕。

經過一番等待,iPad 順利升級到  iOS 15.4 (19E241),再開啟我的筆順練習 WebApp,不會有如 [圖1] 無鍵盤可輸入的問題了。如果有出現 [圖2] 的情形,如果按一下右下角的按鈕,先隱藏虛擬鍵盤,再點一下輸入區,重新叫出虛擬鍵盤,就可以有像 [圖3] 的正常畫面了。

哈!看來這是 iOS 的問題,不是我 HTML5 程式的問題。真好!可以不用再除蟲了。

相關連結


2022年3月2日 星期三

iCloud : 匯入 Android 聯絡人

2022年3月2日 星期三

 有人的 Android 手機不明原因旳一直重新啟動,最後決定把那家曾經也風光過的大廠手機換成 iPhone。本以為舊手機中的資料沒救了,我亂玩一陣子以後(哈哈哈~當然還是沒救),突發奇想,在一開完機,立即長按電源開關,選「飛安模式」,它~居然沒再重開了。

準備進入「飛安模式」

趕緊將存在 Android 手機中的「聯絡人」匯出到 SD 卡中。

本以為將 SD 卡中的 .vcf 檔案直接透過 iCloud 匯入,這樣就能把 Android 手機中的聯絡人轉移到 iPhone 了,沒想到,iCloud 居然說無法匯入。

試著將 iCloud 的聯絡人匯出一筆資料,檔案裡有:

BEGIN:VCARD
VERSION:3.0
PRODID:-//Apple Inc.//iOS 15.2//EN

而由舊 Android 手機匯出的是:

BEGIN:VCARD
VERSION:2.1

從這個線索看來,目前用的 iCloud 並不支援 VCARD 2.1。其實也就格式上的問題,轉一下就好了,應該也沒有幾行程式碼就能解決的,居然懶得弄。再不然,至少也提示一下無法匯入的原因。

哈!現在知道不要老「自己造輪子」,上網找了一下,在 GitHub 中已經有人用 Python 寫了 VCARD 2.1 轉 3.0 的程式了:

把裡面的「vcard2to3.py」下載回來,後面再加上要轉的聯絡人匯出檔案的檔名即可:

用 Python3 執行 vcard2to3.py 轉格式

轉完的話,會在同目錄中多一個檔名字尾「.converted」的檔案。

在 iCloud 的聯絡人中,按畫面左下角的齒輪圖示以後,再點「匯入 vCard」

由 iCloud 匯入 vCard 檔

選定剛剛轉好的「XXX.converted」檔案,稍等一下下,Android 手機中的聯絡人就可以順利轉移到 iPhone 中囉!


 
雄::gsyan © 2009. Design by Pocket