会議の文字起こしを Whisper.API でやってみたけど、精度は YouTube の自動字幕とそれほど変わらない印象。
映像 → 音声への変換、音声の分割、コマンドプロンプトで Python 走らせるという工程を考えると (ここもやりようによっては自動化できるだろうが)、手間としても YouTube で済ませてしまうほうが結局楽であるという結論に行き着いた。
Conversation
Notices
-
Embed this notice
Mai Sukegawa (maisukegawa@fedibird.com)'s status on Friday, 24-Mar-2023 14:30:49 JST Mai Sukegawa