[BUGFIX] Fix bugs in BERT export script (#944)

eric-haibin-lin · leezu · commit 5a4eae3bdd38 · 2019-10-03T11:17:38.000-07:00
* Fix export script

* add doc

* Fix lint

* Fix lint
diff --git a/scripts/bert/export.py b/scripts/bert/export.py
@@ -39,8 +39,7 @@
 
 import mxnet as mx
 import gluonnlp as nlp
-from gluonnlp.model import get_model
-from model.classification import BERTClassifier, BERTRegression
+from gluonnlp.model import get_model, BERTClassifier
 from model.qa import BertForQA
 
 nlp.utils.check_version('0.8.1')
@@ -84,7 +83,7 @@
 
 parser.add_argument('--seq_length',
                     type=int,
-                    default=384,
+                    default=64,
                     help='The maximum total input sequence length after WordPiece tokenization.'
                          'Sequences longer than this needs to be truncated, and sequences shorter '
                          'than this needs to be padded. Default is 384')
@@ -131,8 +130,7 @@
         pretrained=False,
         use_pooler=True,
         use_decoder=False,
-        use_classifier=False,
-        seq_length=args.seq_length)
+        use_classifier=False)
     net = BERTClassifier(bert, num_classes=2, dropout=args.dropout)
 elif args.task == 'regression':
     bert, _ = get_model(
@@ -141,18 +139,16 @@
         pretrained=False,
         use_pooler=True,
         use_decoder=False,
-        use_classifier=False,
-        seq_length=args.seq_length)
-    net = BERTRegression(bert, dropout=args.dropout)
+        use_classifier=False)
+    net = BERTClassifier(bert, num_classes=1, dropout=args.dropout)
 elif args.task == 'question_answering':
     bert, _ = get_model(
         name=args.model_name,
         dataset_name=args.dataset_name,
         pretrained=False,
         use_pooler=False,
         use_decoder=False,
-        use_classifier=False,
-        seq_length=args.seq_length)
+        use_classifier=False)
     net = BertForQA(bert)
 else:
     raise ValueError('unknown task: %s'%args.task)
@@ -187,24 +183,34 @@ def export(batch, prefix):
     assert os.path.isfile(prefix + '-symbol.json')
     assert os.path.isfile(prefix + '-0000.params')
 
-def infer(batch, prefix):
+def infer(prefix):
     """Evaluate the model on a mini-batch."""
     log.info('Start inference ... ')
 
     # import with SymbolBlock. Alternatively, you can use Module.load APIs.
     imported_net = mx.gluon.nn.SymbolBlock.imports(prefix + '-symbol.json',
                                                    ['data0', 'data1', 'data2'],
                                                    prefix + '-0000.params')
-    tic = time.time()
+
+    # exported model should be length-agnostic. Using a different seq_length should work
+    inputs = mx.nd.arange(test_batch_size * (seq_length + 10))
+    inputs = inputs.reshape(shape=(test_batch_size, seq_length + 10))
+    token_types = mx.nd.zeros_like(inputs)
+    valid_length = mx.nd.arange(test_batch_size)
+
     # run forward inference
-    inputs, token_types, valid_length = batch
+    imported_net(inputs, token_types, valid_length)
+    mx.nd.waitall()
+
+    # benchmark speed after warmup
+    tic = time.time()
     num_trials = 10
     for _ in range(num_trials):
         imported_net(inputs, token_types, valid_length)
     mx.nd.waitall()
     toc = time.time()
-    log.info('Inference time cost={:.2f} s, Thoughput={:.2f} samples/s'
-             .format(toc - tic, num_trials / (toc - tic)))
+    log.info('Batch size={}, Thoughput={:.2f} batches/s'
+             .format(test_batch_size, num_trials / (toc - tic)))
 
 
 ###############################################################################
@@ -213,4 +219,4 @@ def infer(batch, prefix):
 if __name__ == '__main__':
     prefix = os.path.join(args.output_dir, args.task)
     export(batch, prefix)
-    infer(batch, prefix)
+    infer(prefix)
diff --git a/scripts/tests/test_scripts.py b/scripts/tests/test_scripts.py
@@ -317,7 +317,7 @@ def test_finetune_train(early_stop, bert_model, dataset, dtype):
 @pytest.mark.integration
 @pytest.mark.parametrize('task', ['classification', 'regression', 'question_answering'])
 def test_export(task):
-    process = subprocess.check_call([sys.executable, './scripts/bert/export/export.py',
+    process = subprocess.check_call([sys.executable, './scripts/bert/export.py',
                                      '--task', task])
 
 @pytest.mark.serial