-
Notifications
You must be signed in to change notification settings - Fork 170
Closed
Description
SacreBLEU version: 1.4.12
Python: 3.7
Issue: Using Python sentence_blue()
and the Command Line with the --sentence-level
flag (or -sl
) for only one sentence gives different scores.
Question: I need sentence_blue()
from Python to give the same output as the Command Line with the --sentence-level
flag (or -sl
), what should I do?
From the Command Line:
echo "Producția de zahăr primă va fi exprimată în ceea ce privește zahărul alb;" | sacrebleu -sl <(echo "producţia de zahăr brut se exprimă în zahăr alb;")
Output:
BLEU+case.mixed+numrefs.1+smooth.exp+tok.13a+version.1.4.12 = 8.5 35.7/15.4/4.2/2.3 (BP = 1.000 ratio = 1.400 hyp_len = 14 ref_len = 10)
From Python
Using sentence_blue()
ref = "producţia de zahăr brut se exprimă în zahăr alb;"
sys = "Producția de zahăr primă va fi exprimată în ceea ce privește zahărul alb;"
bleu = sacrebleu.sentence_bleu(sys, ref)
print(bleu.score)
Output:
0.0
Using corpus_blue()
ref = [["producţia de zahăr brut se exprimă în zahăr alb;"]]
sys = ["Producția de zahăr primă va fi exprimată în ceea ce privește zahărul alb;"]
bleu = sacrebleu.corpus_bleu(sys, ref)
print(bleu.score)
Output:
8.493098745313148
Metadata
Metadata
Assignees
Labels
No labels