Bewertung von KI-gestützter Videoübersetzung – Relevante Qualitätsmetriken

Die Übersetzung von Videos über Sprachgrenzen hinweg erfordert mehr als nur Worte – sie umfasst Transkription, Übersetzung, Sprachsynthese, Timing und mehr. Curify nutzt ein strukturiertes Bewertungssystem, um höchste Qualität sicherzustellen.
1. Transkriptionsqualität
Motor: WhisperX
- Wortfehlerrate (WER)
- Interpunktions-F1 (für Lesbarkeit und Ausdruck)
2. Übersetzungsqualität
Motoren: Helsinki, MarianMT
- BLEU (Standard-Metrik)
- COMET / chrF++ (semantische Ähnlichkeit)
- Manuelle Bewertung: Lesbarkeit & Genauigkeit
3. Sprachsynthesequalität
Motoren: XTTS / YourTTS
- MOS-Bewertung: Natürlichkeit, Ähnlichkeit, Ausdruck
- Genauigkeit der Sprechererkennung
4. Timing & Lippensynchronisation
- Unterschiede in Segmentdauer
- Wav2Lip-Synchronwert
- Zeitliche Abweichung
5. Semantische Erhaltung
Wir verwenden große Sprachmodelle (wie GPT-4), um zu prüfen, ob Tonfall, Emotion und Bedeutung erhalten bleiben. Beispiel-Prompt:
Vergleiche das chinesische Transkript mit der englischen Sprachversion. Stimmen Ton, Absicht und Inhalt überein? Bewerte mit 1–5 und begründe.
6. Nutzerfeedback & GTM-Validierung
- Stimmqualität passend zum Produkttyp
- Erhöhte Zuschauerbindung bei lokalisierten Videos
- Nutzerbereitschaft zur Tool-Nutzung