AI動画翻訳品質の評価 – 本当に重要な指標

動画を多言語に翻訳するには、文字起こし、翻訳、音声合成、タイミング調整など、多くの工程が必要です。Curifyでは、各工程が業界水準を満たすよう、堅牢な評価パイプラインを構築しています。
1. 文字起こし品質
エンジン: WhisperX
- WER(単語誤り率)
- 句読点F1(表現力と可読性)
2. 翻訳品質
エンジン: Helsinki, MarianMT
- BLEU(標準指標)
- COMET / chrF++(意味的類似度)
- 人手評価: 流暢さ + 十分性
3. 音声合成品質
エンジン: XTTS / YourTTS
- MOS(自然さ・類似性・表現力)
- 話者照合精度
4. アライメントとリップシンク
- セグメント長の不一致
- Wav2Lip同期信頼度
- 時間ドリフト分析
5. 意味保持
翻訳後の音声が元の意味・トーン・感情を保持しているかを、GPT-4などのLLMで評価します。例:
この中国語(標準語)の書き起こしと英語音声を比較し、トーン・意図・内容が一致しているかを1〜5で評価し、理由を説明してください。
6. ユーザーフィードバックとGTM検証
- 製品カテゴリへの音質適合性
- 視聴維持率の改善
- 初期ユーザー(例: 1688出店者)の導入意向