huggingface · LysandreJik · Apr 14, 2022 · Apr 13, 2022
diff --git a/tests/bert_japanese/test_tokenization_bert_japanese.py b/tests/bert_japanese/test_tokenization_bert_japanese.py
@@ -173,7 +173,7 @@ def test_mecab_tokenizer_no_normalize(self):
         )
 
     def test_wordpiece_tokenizer(self):
-        vocab_tokens = ["[UNK]", "[CLS]", "[SEP]", "こんにちは", "こん", "にちは" "ばんは", "##こん", "##にちは", "##ばんは"]
+        vocab_tokens = ["[UNK]", "[CLS]", "[SEP]", "こんにちは", "こん", "にちは", "ばんは", "##こん", "##にちは", "##ばんは"]
 
         vocab = {}
         for (i, token) in enumerate(vocab_tokens):
@@ -246,7 +246,7 @@ def test_full_tokenizer(self):
         )
 
     def test_character_tokenizer(self):
-        vocab_tokens = ["[UNK]", "[CLS]", "[SEP]", "こ", "ん", "に", "ち", "は", "ば", "世", "界" "、", "。"]
+        vocab_tokens = ["[UNK]", "[CLS]", "[SEP]", "こ", "ん", "に", "ち", "は", "ば", "世", "界", "、", "。"]
 
         vocab = {}
         for (i, token) in enumerate(vocab_tokens):