jidasheng · Roo4L · Dec 11, 2022 · Dec 11, 2022 · Jan 4, 2023 · Jan 4, 2023
diff --git a/bi_lstm_crf/app/predict.py b/bi_lstm_crf/app/predict.py
@@ -76,6 +76,8 @@ def main():
                         help='the training device: "cuda:0", "cpu:0". It will be auto-detected by default')
 
     args = parser.parse_args()
+    if args.sentence[0] == "[":
+        args.sentence = json.loads(args.sentence)
 
     results = WordsTagger(args.model_dir, args.device)([args.sentence])
     print(args.sentence)

diff --git a/bi_lstm_crf/app/train.py b/bi_lstm_crf/app/train.py
@@ -15,7 +15,7 @@ def __eval_model(model, device, dataloader, desc):
         losses, nums = zip(*[
             (model.loss(xb.to(device), yb.to(device)), len(xb))
             for xb, yb in tqdm(dataloader, desc=desc)])
-        return np.sum(np.multiply(losses, nums)) / np.sum(nums)
+        return torch.sum(torch.multiply(torch.tensor(losses), torch.tensor(nums))) / np.sum(nums)
 
 
 def __save_loss(losses, file_path):
@@ -90,7 +90,7 @@ def train(args):
     print("training completed. test loss: {:.2f}".format(test_loss))
 
 
-def main():
+def main(argv=None):
     import argparse
     parser = argparse.ArgumentParser()
     parser.add_argument('corpus_dir', type=str, help="the corpus directory")
@@ -114,7 +114,10 @@ def main():
     parser.add_argument('--num_rnn_layers', type=int, default=1, help='the number of RNN layers')
     parser.add_argument('--rnn_type', type=str, default="lstm", help='RNN type, choice: "lstm", "gru"')
 
-    args = parser.parse_args()
+    if argv is None:
+        args = parser.parse_args()
+    else:
+        args = parser.parse_args(argv)
 
     train(args)
 

diff --git a/bi_lstm_crf/app/utils.py b/bi_lstm_crf/app/utils.py
@@ -21,7 +21,7 @@ def build_model(args, processor, load=True, verbose=False):
     # weights
     model_path = model_filepath(args.model_dir)
     if exists(model_path) and load:
-        state_dict = torch.load(model_path)
+        state_dict = torch.load(model_path, map_location=running_device(args.device))
         model.load_state_dict(state_dict)
         if verbose:
             print("load model weights from {}".format(model_path))

diff --git a/bi_lstm_crf/model/model.py b/bi_lstm_crf/model/model.py
@@ -25,7 +25,7 @@ def __build_features(self, sentences):
         sorted_seq_length, perm_idx = seq_length.sort(descending=True)
         embeds = embeds[perm_idx, :]
 
-        pack_sequence = pack_padded_sequence(embeds, lengths=sorted_seq_length, batch_first=True)
+        pack_sequence = pack_padded_sequence(embeds, lengths=sorted_seq_length.cpu(), batch_first=True)
         packed_output, _ = self.rnn(pack_sequence)
         lstm_out, _ = pad_packed_sequence(packed_output, batch_first=True)
         _, unperm_idx = perm_idx.sort()

diff --git a/requirements.txt b/requirements.txt
@@ -0,0 +1,2 @@
+torch >= 1.13.0
+tqdm >= 4.64.1