Update README_zh.md

This commit is contained in:
changyeyu
2024-09-10 09:01:36 +00:00
parent 23bc1c6e78
commit df404b0af4

View File

@ -11,56 +11,13 @@
Index-1.9B-32K 是一个仅有 1.9B 参数、却具备 32K 上下文长度的语言模型(这意味着,这个超小精灵可以一次性读完 3.5 万字的文档)。该模型专门针对 32K 以上的长文本进行了持续预训练Continue Pre-Train和监督微调SFT主要基于我们精心清洗的长文本预训练语料、自建的长文本指令集进行训练。目前我们已在 Hugging Face 和 ModelScope 上同步开源。 Index-1.9B-32K 是一个仅有 1.9B 参数、却具备 32K 上下文长度的语言模型(这意味着,这个超小精灵可以一次性读完 3.5 万字的文档)。该模型专门针对 32K 以上的长文本进行了持续预训练Continue Pre-Train和监督微调SFT主要基于我们精心清洗的长文本预训练语料、自建的长文本指令集进行训练。目前我们已在 Hugging Face 和 ModelScope 上同步开源。
Index-1.9B-32K **以极小的模型体积体积约为GPT-4等模型的2%)实现了出色的长文本处理能力**。以下为与 GPT-4、GPT-3.5-turbo-16k 的对比评测结果: Index-1.9B-32K **以极小的模型体积体积约为GPT-4等模型的2%)实现了出色的长文本处理能力**。以下为与 GPT-4、GPT-3.5-turbo-16k 的对比评测结果:
<div style="text-align: center;">
<img src="media/pk-all.png" alt="" width="700">
<p><strong>Index-1.9B-32K与GPT-4等模型的长文本能力对比</strong></p>
</div>
Index-1.9B-32K在32K长度的大海捞针测试下评测结果优异如下图评测结果只在32K 长度,%10 深度区域有一处黄斑91.08分),其他范围表现优异,几乎全绿。
<div style="text-align: center;">
<img src="media/needle-bench-en.png" alt="" width="900">
<p><strong>大海捞针评测</strong></p>
</div>
## Index-1.9B-32K模型下载、使用、技术报告 ## Index-1.9B-32K模型下载、使用、技术报告
Index-1.9B-32K模型下载、使用方法、技术报告详见 Index-1.9B-32K模型下载、使用方法、技术报告详见
[**Index-1.9B-32K长上下文技术报告.md**](https://github.com/bilibili/Index-1.9B/blob/main/Index-1.9B-32K长上下文技术报告.md) [**Index-1.9B-32K长上下文技术报告.md**](https://github.com/bilibili/Index-1.9B/blob/main/Index-1.9B-32K长上下文技术报告.md)
---
---
---
---
---
---
## 使用:长文本翻译&总结Index-1.9B-32K
- 下载仓库:
```shell
git clone https://github.com/bilibili/Index-1.9B
cd Index-1.9B
```
- 下载模型到本地.
- 使用 pip 安装依赖:
```shell
pip install -r requirements.txt
```
- 运行长文本专用的交互工具demo/cli_long_text_demo.py
- 模型默认会读取该文件data/user_long_text.txt将对文本内容进行中文总结。
- 可以新建一个窗口,实时修改文件内容,模型会读取最新的文件内容并总结。
```shell
cd demo/
CUDA_VISIBLE_DEVICES=0 python cli_long_text_demo.py --model_path '/path/to/model/' --input_file_path data/user_long_text.txt
```
- 运行&交互效果翻译并总结哔哩哔哩公司于2024.8.22发布的英文财报 --- [英文财报原文在这里](https://github.com/bilibili/Index-1.9B/tree/main/demo/data/user_long_text.txt))
<div style="text-align: center;">
<img src="media/qa-mark.png" alt="" width="1000">
<p><strong>翻译总结哔哩哔哩公司于2024.8.22发布的英文财报)</strong></p>
</div>
## 局限性与免责申明 ## 局限性与免责申明