Bewertung von KI-gestützter Videoübersetzung – Relevante Qualitätsmetriken

Die Übersetzung von Videos über Sprachgrenzen hinweg erfordert mehr als nur Worte – sie umfasst Transkription, Übersetzung, Sprachsynthese, Timing und mehr. Curify nutzt ein strukturiertes Bewertungssystem, um höchste Qualität sicherzustellen.
1. Transkriptionsqualität
Motor: WhisperX
- WER (Wortfehlerrate)
- Satzzeichen F1 (für Ausdruck und Lesbarkeit)
2. Übersetzungsqualität
Motoren: Helsinki, MarianMT
- BLEU (Standardmetrik)
- COMET / chrF++ (semantische Ähnlichkeit)
- Menschliche Überprüfung: Flüssigkeit + Angemessenheit
3. Sprachsynthesequalität
Motoren: XTTS / YourTTS
- MOS (Natürlichkeit, Ähnlichkeit, Ausdrucksstärke)
- Sprecher-Verifizierungsgenauigkeit
4. Timing & Lippensynchronisation
- Segmentdauerabweichung
- Wav2Lip-Synchronisationsvertrauen
- Analyse der zeitlichen Drift
5. Semantische Erhaltung
Wir verwenden große Sprachmodelle (wie GPT-4), um zu prüfen, ob Tonfall, Emotion und Bedeutung erhalten bleiben. Beispiel-Prompt:
Vergleiche das chinesische Transkript mit der englischen Sprachversion. Stimmen Ton, Absicht und Inhalt überein? Bewerte mit 1–5 und begründe.
6. Nutzerfeedback & GTM-Validierung
- Sprachqualität passend zur Produktkategorie
- Verbesserung der Zuschauerbindung
- Bereitschaft zur Übernahme durch frühe Benutzer (z. B. 1688-Verkäufer)

