サービス概要
Whisperは OpenAIが公開するオープンソースの音声認識モデルです。日本語の単語誤り率(WER)は4.9%と、商用サービスを含めて最高水準の精度を誇ります。オープンソースのため無料で利用可能で、APIは$0.006/分。ただしリアルタイム文字起こしには対応していません。
メリット・デメリット
良い点
- 無料で使える(オープンソース)
- 日本語精度が最高水準(WER 4.9%)
- カスタマイズ可能
- 98言語対応
気になる点
- 技術知識が必要
- 日本固有名詞に弱い(礼金、築、内見など)
主な機能
高精度文字起こし
98言語対応
オープンソース
API利用可能
ローカル実行可能
Whisper (OpenAI)のよくある質問
A.
はい、オープンソースなのでローカル環境で無料で利用できます。APIを使う場合は$0.006/分の従量課金です。
A.
Whisper単体ではリアルタイム文字起こしに対応していません。バッチ処理での利用が前提です。
A.
ローカルで実行する場合はPythonの知識が必要です。APIを使う場合は比較的簡単に利用できます。
口コミ・評判
0件まだ口コミがありません
最初の口コミを投稿する評価の詳細
総合評価4.5
使いやすさ3.2
機能性4.8
コスパ5.0
サポート2.0
Whisper (OpenAI)との比較
Notta
4.4(0件)
無料〜¥2,000/月PLAUD
4.3(0件)
Rimo Voice
4.1(0件)
¥1,650/月〜LINE WORKS AiNote
4.0(0件)
¥1,440/月〜YOMEL
3.9(0件)
要問合せ