Support internlm2 1.8b (modelscope#473)

Jintao-Huang · web-flow · commit 51cd071daf0e · 2024-02-29T15:29:07.000+08:00
diff --git a/README.md b/README.md
@@ -234,7 +234,7 @@ app_ui_main(infer_args)
     - [yi](https://github.com/01-ai/Yi) series: yi-6b, yi-6b-200k, yi-6b-chat, yi-34b, yi-34b-200k, yi-34b-chat.
     - [internlm](https://github.com/InternLM/InternLM) series:
       - internlm-7b, internlm-7b-chat, internlm-7b-chat-8k, internlm-20b, internlm-20b-chat.
-      - internlm2-7b-base, internlm2-7b, internlm2-7b-sft-chat, internlm2-7b-chat, internlm2-20b-base, internlm2-20b, internlm2-20b-sft-chat, internlm2-20b-chat.
+      - internlm2-1_8b, internlm2-1_8b-sft-chat, internlm2-1_8b-chat, internlm2-7b-base, internlm2-7b, internlm2-7b-sft-chat, internlm2-7b-chat, internlm2-20b-base, internlm2-20b, internlm2-20b-sft-chat, internlm2-20b-chat.
     - [deepseek](https://github.com/deepseek-ai/deepseek-LLM) series: deepseek-7b, deepseek-7b-chat, deepseek-67b, deepseek-67b-chat, deepseek-moe-16b, deepseek-moe-16b-chat.
     - [gemma](https://github.com/google/gemma_pytorch) series: gemma-2b, gemma-2b-instruct, gemma-7b, gemma-7b-instruct.
     - [openbmb-minicpm](https://github.com/OpenBMB/mlc-MiniCPM) series: openbmb-minicpm-2b-sft-chat, openbmb-minicpm-2b-chat.
diff --git a/README_CN.md b/README_CN.md
@@ -233,7 +233,7 @@ app_ui_main(infer_args)
     - [yi](https://github.com/01-ai/Yi) 系列: yi-6b, yi-6b-200k, yi-6b-chat, yi-34b, yi-34b-200k, yi-34b-chat.
     - [internlm](https://github.com/InternLM/InternLM) 系列:
       - internlm-7b, internlm-7b-chat, internlm-7b-chat-8k, internlm-20b, internlm-20b-chat.
-      - internlm2-7b-base, internlm2-7b, internlm2-7b-sft-chat, internlm2-7b-chat, internlm2-20b-base, internlm2-20b, internlm2-20b-sft-chat, internlm2-20b-chat.
+      - internlm2-1_8b, internlm2-1_8b-sft-chat, internlm2-1_8b-chat, internlm2-7b-base, internlm2-7b, internlm2-7b-sft-chat, internlm2-7b-chat, internlm2-20b-base, internlm2-20b, internlm2-20b-sft-chat, internlm2-20b-chat.
     - [deepseek](https://github.com/deepseek-ai/deepseek-LLM) 系列: deepseek-7b, deepseek-7b-chat, deepseek-67b, deepseek-67b-chat, deepseek-moe-16b, deepseek-moe-16b-chat.
     - [gemma](https://github.com/google/gemma_pytorch) 系列: gemma-2b, gemma-2b-instruct, gemma-7b, gemma-7b-instruct.
     - [openbmb-minicpm](https://github.com/OpenBMB/mlc-MiniCPM) 系列: openbmb-minicpm-2b-sft-chat, openbmb-minicpm-2b-chat.
diff --git a/ROADMAP.md b/ROADMAP.md
@@ -50,9 +50,6 @@ The development of SWIFT V1.7 is between Feb/1/2024 and Feb/29/2024 ideally.
 - *Support More LLM Models*:
   - codefuse-ai/CodeFuse-DeepSeek-33B
   - codefuse-ai/CodeFuse-13B
-  - Shanghai_AI_Laboratory/internlm2-1_8b
-  - Shanghai_AI_Laboratory/internlm2-chat-1_8b
-  - Shanghai_AI_Laboratory/internlm2-chat-1_8b-sft
   - 01ai/Yi-34B-Chat-4bits
   - 01ai/Yi-34B-Chat-8bits
   - 01ai/Yi-6B-Chat-4bits
diff --git a/docs/source/LLM/支持的模型和数据集.md b/docs/source/LLM/支持的模型和数据集.md
diff --git a/scripts/utils/run_dataset_info.py b/scripts/utils/run_dataset_info.py
@@ -1,6 +1,4 @@
 import os
-import re
-from typing import List
 
 from datasets import concatenate_datasets
 
@@ -15,7 +13,7 @@ def write_dataset_info() -> None:
     if os.path.exists(fpath):
         with open(fpath, 'r', encoding='utf-8') as f:
             text = f.read()
-        idx = text.find('|   | Dataset Name |')
+        idx = text.find('| Dataset Name |')
         pre_text = text[:idx]
         text = text[idx:]
         text_list = [t for t in text.split('\n') if len(t.strip()) > 0]
@@ -25,18 +23,18 @@ def write_dataset_info() -> None:
     res_text_list = []
 
     res_text_list.append(
-        '|   | Dataset Name | Dataset ID | Train Size | Val Size | Statistic (token) | Tags |'
+        '| Dataset Name | Dataset ID | Train Size | Val Size | Statistic (token) | Tags |'
     )
     res_text_list.append(
-        '| - | ------------ | ---------- | ---------- | -------- | ----------------- | ---- |'
+        '| ------------ | ---------- | ---------- | -------- | ----------------- | ---- |'
     )
     if len(text_list) >= 2:
         text_list = text_list[2:]
     else:
         text_list = []
 
     ignore_dataset = {
-        text.split('|', 3)[2].lstrip('🔥 '): text
+        text.split('|', 2)[1].lstrip('🔥 '): text
         for text in text_list
     }
     dataset_name_list = DatasetName.get_dataset_name_list()
@@ -53,7 +51,7 @@ def write_dataset_info() -> None:
         template_type = get_default_template_type(model_type)
         template = get_template(template_type, tokenizer)
         mapping[task_type] = template
-    for i, dataset_name in enumerate(dataset_name_list):
+    for dataset_name in dataset_name_list:
         dataset_info = DATASET_MAPPING[dataset_name]
         tags = dataset_info.get('tags', [])
         if 'audio' in tags:
@@ -64,7 +62,7 @@ def write_dataset_info() -> None:
             template = mapping['llm']
         if dataset_name in ignore_dataset:
             train_size, val_size, stat_str = ignore_dataset[
-                dataset_name].split('|')[4:7]
+                dataset_name].split('|')[3:6]
         else:
             train_dataset, val_dataset = get_dataset([dataset_name])
             train_size = len(train_dataset)
@@ -92,8 +90,9 @@ def write_dataset_info() -> None:
         if len(tags_str) == 0:
             tags_str = '-'
         res_text_list.append(
-            f"|{i+1}|{dataset_name}|[{dataset_info['dataset_id_or_path']}]({url})|{train_size}|"
+            f"|{dataset_name}|[{dataset_info['dataset_id_or_path']}]({url})|{train_size}|"
             f'{val_size}|{stat_str}|{tags_str}|')
+    print(f'数据集总数: {len(dataset_name_list)}')
     text = '\n'.join(res_text_list)
     text = pre_text + text + '\n'
     with open(fpath, 'w', encoding='utf-8') as f:
diff --git a/scripts/utils/run_model_info.py b/scripts/utils/run_model_info.py
@@ -1,15 +1,14 @@
-import re
-from typing import Dict, List, Tuple
+from typing import List
 
 from swift.llm import MODEL_MAPPING, ModelType
 
 
 def get_model_info_table() -> List[str]:
     model_name_list = ModelType.get_model_name_list()
     result = (
-        '|   | Model Type | Model ID | Default Lora Target Modules | Default Template |'
+        '| Model Type | Model ID | Default Lora Target Modules | Default Template |'
         ' Support Flash Attn | Support VLLM | Requires |\n'
-        '| - | ---------  | -------- | --------------------------- | ---------------- |'
+        '| ---------  | -------- | --------------------------- | ---------------- |'
         ' ------------------ | ------------ | -------- |\n')
     res: List[str] = []
     bool_mapping = {True: '&#x2714;', False: '&#x2718;'}
@@ -29,15 +28,16 @@ def get_model_info_table() -> List[str]:
         ]
         res.append(r)
     text = ''
-    for i, r in enumerate(res):
+    for r in res:
         url = f'https://modelscope.cn/models/{r[1]}/summary'
-        text += f'|{i+1}|{r[0]}|[{r[1]}]({url})|{r[2]}|{r[3]}|{r[4]}|{r[5]}|{r[6]}|\n'
+        text += f'|{r[0]}|[{r[1]}]({url})|{r[2]}|{r[3]}|{r[4]}|{r[5]}|{r[6]}|\n'
+    print(f'模型总数: {len(res)}')
     result += text
     #
     fpath = 'docs/source/LLM/支持的模型和数据集.md'
     with open(fpath, 'r') as f:
         text = f.read()
-    start_idx = text.find('|   | Model Type |')
+    start_idx = text.find('| Model Type |')
     end_idx = text.find('## 数据集')
     output = text[:start_idx] + result + '\n\n' + text[end_idx:]
     with open(fpath, 'w') as f:
diff --git a/scripts/utils/run_template.py b/scripts/utils/run_template.py
@@ -1,5 +1,3 @@
-from typing import Dict, List, Tuple
-
 from swift.llm import TemplateType
 
 if __name__ == '__main__':
diff --git a/swift/llm/infer.py b/swift/llm/infer.py
@@ -224,7 +224,7 @@ def llm_infer(args: InferArguments) -> None:
     if args.merge_lora:
         merge_lora(args, device_map='cpu')
     if args.infer_backend == 'vllm':
-        from swift.llm import prepare_vllm_engine_template, inference_stream_vllm, inference_vllm
+        from .utils import prepare_vllm_engine_template, inference_stream_vllm, inference_vllm
         llm_engine, template = prepare_vllm_engine_template(args)
     else:
         model, template = prepare_model_template(args)
diff --git a/swift/llm/utils/model.py b/swift/llm/utils/model.py
@@ -116,6 +116,9 @@ class ModelType:
     internlm_20b = 'internlm-20b'
     internlm_20b_chat = 'internlm-20b-chat'
     # internlm2
+    internlm2_1_8b = 'internlm2-1_8b'
+    internlm2_1_8b_sft_chat = 'internlm2-1_8b-sft-chat'
+    internlm2_1_8b_chat = 'internlm2-1_8b-chat'
     internlm2_7b_base = 'internlm2-7b-base'
     internlm2_7b = 'internlm2-7b'
     internlm2_7b_sft_chat = 'internlm2-7b-sft-chat'
@@ -1291,6 +1294,29 @@ def get_model_tokenizer_qwen1half_intx(model_dir: str,
                                          load_model, **kwargs)
 
 
+@register_model(
+    ModelType.internlm2_1_8b,
+    'Shanghai_AI_Laboratory/internlm2-1_8b',
+    LoRATM.internlm2,
+    TemplateType.default_generation_bos,
+    support_flash_attn=True,
+    support_vllm=True)
+@register_model(
+    ModelType.internlm2_1_8b_sft_chat,
+    'Shanghai_AI_Laboratory/internlm2-chat-1_8b-sft',
+    LoRATM.internlm2,
+    TemplateType.internlm2,
+    eos_token='<|im_end|>',
+    support_flash_attn=True,
+    support_vllm=True)
+@register_model(
+    ModelType.internlm2_1_8b_chat,
+    'Shanghai_AI_Laboratory/internlm2-chat-1_8b',
+    LoRATM.internlm2,
+    TemplateType.internlm2,
+    eos_token='<|im_end|>',
+    support_flash_attn=True,
+    support_vllm=True)
 @register_model(
     ModelType.internlm2_math_7b,
     'Shanghai_AI_Laboratory/internlm2-math-base-7b',

Original file line number	Diff line number	Diff line change
`@@ -1,5 +1,3 @@`
`1`		`-from typing import Dict, List, Tuple`
`2`		`-`
`3`	`1`	`from swift.llm import TemplateType`
`4`	`2`
`5`	`3`	`if __name__ == '__main__':`