AI動画翻訳品質の評価 – 本当に重要な指標

動画を多言語に翻訳するには、文字起こし、翻訳、音声合成、タイミング調整など、多くの工程が必要です。Curifyでは、各工程が業界水準を満たすよう、堅牢な評価パイプラインを構築しています。
1. 文字起こし品質
エンジン: WhisperX
- WER(Word Error Rate)
- 句読点 F1(表現力と読みやすさのため)
2. 翻訳品質
エンジン: Helsinki, MarianMT
- BLEU(標準メトリック)
- COMET / chrF++(意味の類似性)
- 人間によるレビュー:流暢さ + 適切さ
3. 音声合成品質
エンジン: XTTS / YourTTS
- MOS(自然さ、類似性、表現力)
- スピーカー認証の精度
4. アライメントとリップシンク
- セグメントの長さの不一致
- Wav2Lip同期信頼度
- 時間的なずれの分析
5. 意味保持
翻訳後の音声が元の意味・トーン・感情を保持しているかを、GPT-4などのLLMで評価します。例:
この中国語(標準語)の書き起こしと英語音声を比較し、トーン・意図・内容が一致しているかを1〜5で評価し、理由を説明してください。
6. ユーザーフィードバックとGTM検証
- 製品カテゴリに適した音声品質
- 視聴者の滞在時間の向上
- 初期ユーザーからの採用意欲(例:1688のセラー)

