随着自然语言处理 (NLP) 世界中每天都会发现新的动物物种,因此有必要建立一个动物园 🦁 来容纳它们。
该项目收集了各种开源和闭源LLM的以下信息(ChatGPT发布后):
- 推出日期
- 型号尺寸
- 支持的语言
- 领域
- 训练数据
- 资源链接:GitHub、HuggingFace、演示、论文、官方博客
- [2023.05.03]首次发布!我们将定期更新🔄存储库以跟踪最新的法学硕士。我们欢迎👐对此项目做出任何贡献。请随时提出问题或提交拉取请求以包含新的法学硕士或更新现有法学硕士的信息🙏。
推出日期 | 模型 | 版本 | 尺寸 | 骨干 | 朗斯 | 领域 | 训练数据 | GitHub | 高频 | 纸 | 演示 | 官方博客 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
2023.02.27 | 骆驼 | 美洲驼-7b/13b/33b/65b | 7B/13B/33B/65B | - | zh | 一般的 | 细节1T 代币(英语 CommonCrawl、C4、Github、Wikipedia、Gutenberg 和 Books3、ArXiv、Stack Exchange) |
[关联] | [关联] | [关联] | - | [关联] |
2023.03.13 | 羊驼毛 | 羊驼-7b/13b | 7B/13B | 骆驼 | zh | 一般的 | 细节InstructGPT 生成的 52k 指令跟随数据 [ 关联] |
[关联] | [关联] | - | [关联] | [关联] |
2023.03.13 | 骆驼毛 | vicuna-7b/13b-delta-v1.1 | 7B/13B | 骆驼 | zh | 一般的 | 细节来自共享GPT 的 70K 样本 |
[关联] | [关联] | - | [关联] | [关联] |
2023.03.14 | 聊天GLM | chatglm-6b | 6B | 广义线性模型 | 中文、英文 | 一般的 | 细节监督微调、反馈引导和基于人类反馈的强化学习 |
[关联] | [关联] | - | - | [关联] |
2023.03.14 | 聊天GLM | chatglm-130b | 130B | 广义线性模型 | 中文、英文 | 一般的 | 细节监督微调、反馈引导和基于人类反馈的强化学习 |
[关联] | - | [关联] | [关联] | [关联] |
2023.03.16 | 原驼 | - | 7B | 骆驼 | 雅、中、英、德 | 一般的 | 细节多语言数据集 [ 关联] |
[关联] | [关联] | - | - | - |
2023年3月24日 | 多莉 | 多莉-v1-6b | 6B | GPT-J-6B | zh | 一般的 | 细节52k stanford alpaca 指令跟随数据 [ 关联] |
- | [关联] | - | - | [关联] |
2023年3月24日 | 聊天医生 | - | 7B | 骆驼 | zh | 药品 | [关联] | - | [关联] | [关联] | - | |
2023.03.25 | 骆驼 | 中国羊驼 | 7B | 骆驼 | 中文、英文 | 一般的 | [关联] | [关联] | - | - | - | |
2023年3月26日 | 美女 | 百丽-7B-0.2M/0.6M/1M/2M | 7B | BLOOMZ-7B1-mt | 中文、英文 | 一般的 | [关联] | [关联] | [关联] | - | - | |
2023年3月28日 | 伶荔 | Linly-Chinese-LLaMA 7b/13b/33b | 7B/13B/33B | 骆驼 | zh | 一般的 | [关联] | [关联] | - | - | - | |
2023年3月28日 | 伶荔 | Linly-ChatFlow 7b/13b | 7B/13B | 骆驼 | zh | 一般的 | [关联] | [关联] | - | - | [关联] | |
2023.04.01 | 百泽 | 百泽-7B/13B/30B | 7B/13B/30B | 骆驼 | zh | 一般的 | [关联] | [关联] | [关联] | [关联] | - | |
2023.04.03 | 考拉 | - | 13B | 骆驼 | zh | 一般的 | - | [关联] | - | [关联] | [关联] | |
2023.04.03 | 百泽 | 百泽-healthcare-7b | 7B | 骆驼 | zh | 药品 | [关联] | [关联] | - | - | - | |
2023.04.06 | 萤火虫 (流萤) | 萤火虫-1b4/2b6 | 1.4B/2.6B | 布卢姆-ZH | zh | 一般的 | [关联] | [关联] | - | - | - | |
2023.04.08 | 凤凰 | 凤凰聊天-7b | 7B | 布卢姆兹 | 多 | 一般的 | 细节对话数据[ 关联] |
[关联] | [关联] | - | - | - |
2023.04.09 | 凤凰 | 凤凰城-inst-chat-7b | 7B | 布卢姆兹 | 多 | 一般的 | 细节对话数据[ 关联]、指令数据 |
[关联] | [关联] | - | - | - |
2023.04.10 | 奇美拉 | 嵌合体聊天-7b/13b | 7B/13B | 骆驼 | 拉丁 | 一般的 | 细节对话数据[ 关联] |
[关联] | [关联] | - | - | - |
2023年4月11日 | 奇美拉 | 嵌合体-inst-chat-7b/13b | 7B/13B | 骆驼 | 拉丁 | 一般的 | 细节对话数据[ 关联]、指令数据 |
[关联] | [关联] | - | - | - |
2023年4月12日 | 多莉 | 多莉-v2-12b | 12B | pythia-12b | zh | 一般的 | 细节15k 个人工生成的提示/响应对 [ 关联] |
[关联] | [关联] | - | - | [关联] |
2023.04.14 | 医学羊驼 | 奖章 7b/13b | 7B/13B | 骆驼 | zh | 药品 | 细节来自闪存卡、wikidoc、stackexchange 和 ChatDoctor 的问答对 |
[关联] | [关联] | [关联] | - | - |
2023.04.19 | 美女 | 美女-LLaMA-7B/13B-2M | 7B/13B | 骆驼 | 中文、英文 | 一般的 | [关联] | [关联] | [关联] | - | - | |
2023.04.21 | 苔藓 | 苔藓-月亮-003-基地 | 16B | 代码生成器 | 中文、英文 | 一般的 | 细节100B中文代币和20B英文代币 |
[关联] | [关联] | - | [关联] | [关联] |
2023.04.21 | 苔藓 | 苔藓-月亮-003-sft | 16B | 苔藓-月亮-003-基地 | 中文、英文 | 一般的 | 细节1.1M多轮对话数据(由ChatGPT生成)[ 关联] |
[关联] | [关联] | - | [关联] | [关联] |
2023.04.21 | 苔藓 | moss-moon-003-sft-插件 | 16B | 苔藓-月亮-003-基地 | 中文、英文 | 一般的 | [关联] | [关联] | - | [关联] | [关联] | |
2023年4月22日 | 拥抱聊天 | oasst-sft-6-llama-30b | 30B | 骆驼 | 多 | 一般的 | 细节人工生成、人工注释的助理式对话语料库,包含 35 种语言的 161k 条消息 [ 关联] |
[关联] | [关联] | - | [关联] | - |
2023.06.19 | 知道LM | 智喜13b | 13B | 骆驼 | 中文、英文 | 一般的 | 细节人工生成、机器生成和知识图谱生成的中文和英文 [ 关联] |
[关联] | [关联] | - | - | - |
2023.06.21 | BayLing(百临) | 贝灵-7b/13b | 7B/13B | 骆驼 | 中文、英文 | 一般的 | 细节160K 人类生成、机器生成的多轮交互式翻译语料库、羊驼指令和 sharegpt 对话 [ 关联] |
[关联] | [关联] | [关联] | [关联] | [关联] |
2023.07.18 | 美洲驼2 | llama-2-7b/13b/70b-(聊天) | 7B/13B/70B | - | zh | 一般的 | 细节2T 代币(大部分为英文,来自公开来源的新数据组合) |
[关联] | [关联] | [关联] | - | [关联] |
推出日期 | 模型 | 版本 | 尺寸 | 朗斯 | 领域 | 演示 | 官方博客 | 纸 |
---|---|---|---|---|---|---|---|---|
2022年11月30日 | 聊天GPT | GPT-3.5-涡轮 | - | 多 | 一般的 | [关联] | [关联] | - |
2023.03.14 | 克洛德 | 克劳德即时 克劳德-v1 |
- | 多 | 一般的 | [关联] | [关联] | - |
2023.03.14 | GPT | GPT-4 | - | 多 | 一般的 | [关联] | [关联] | [关联] |
2023.03.16 | Ernie Bot (文心一言) | - | - | 中文、英文 | 一般的 | [关联] | [关联] | - |
2023年3月21日 | 诗人 | - | - | 多 | 一般的 | [关联] | [关联] | - |
2023.03.30 | 彭博GPT | - | 50B | zh | 金融 | - | [关联] | [关联] |
2023年4月11日 | 通义千问 | - | - | 多 | 一般的 | [关联] | [关联] | - |
2023.07.07 | OmModel(欧姆大模型) | - | - | 多 | 一般的 | [关联] | [关联] | - |
2023.07.11 | 克劳德 2 | 克劳德-v2 | - | 多 | 一般的 | - | [关联] | [关联] |
- 包括开源法学硕士
- 包括闭源法学硕士
- 包括对常见培训数据的系统审查
- 包括各种法学硕士的有趣用例
- 法学硕士在各种评估任务中的表现
如果您发现此存储库有用,请考虑引用。
@software{li2023llmzoo,
title = {LLM Zoo}
author = {Li, Xingxuan and Zhang, Wenxuan and Bing, Lidong},
url = {https://github.com/DAMO-NLP-SG/LLM-Zoo},
year = {2023}
}