Skip to content

LLM Zoo收集各种开源和闭源LLM的信息

License

Notifications You must be signed in to change notification settings

yuanxiaoming8899/LLM-Zoo

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

44 Commits
 
 
 
 
 
 

Repository files navigation

🏰法学硕士动物园

随着自然语言处理 (NLP) 世界中每天都会发现新的动物物种,因此有必要建立一个动物园 🦁 来容纳它们。

该项目收集了各种开源和闭源LLM的以下信息(ChatGPT发布后):

  • 推出日期
  • 型号尺寸
  • 支持的语言
  • 领域
  • 训练数据
  • 资源链接:GitHub、HuggingFace、演示、论文、官方博客

📰 新闻

  • [2023.05.03]首次发布!我们将定期更新🔄存储库以跟踪最新的法学硕士。我们欢迎👐对此项目做出任何贡献。请随时提出问题或提交拉取请求以包含新的法学硕士或更新现有法学硕士的信息🙏。

📖 开源法学硕士

推出日期 模型 版本 尺寸 骨干 朗斯 领域 训练数据 GitHub 高频 演示 官方博客
2023.02.27 骆驼 美洲驼-7b/13b/33b/65b 7B/13B/33B/65B - zh 一般的
细节1T 代币(英语 CommonCrawl、C4、Github、Wikipedia、Gutenberg 和 Books3、ArXiv、Stack Exchange)
[关联] [关联] [关联] - [关联]
2023.03.13 羊驼毛 羊驼-7b/13b 7B/13B 骆驼 zh 一般的
细节InstructGPT 生成的 52k 指令跟随数据 [ 关联]
[关联] [关联] - [关联] [关联]
2023.03.13 骆驼毛 vicuna-7b/13b-delta-v1.1 7B/13B 骆驼 zh 一般的
细节来自共享GPT 的 70K 样本
[关联] [关联] - [关联] [关联]
2023.03.14 聊天GLM chatglm-6b 6B 广义线性模型 中文、英文 一般的
细节监督微调、反馈引导和基于人类反馈的强化学习
[关联] [关联] - - [关联]
2023.03.14 聊天GLM chatglm-130b 130B 广义线性模型 中文、英文 一般的
细节监督微调、反馈引导和基于人类反馈的强化学习
[关联] - [关联] [关联] [关联]
2023.03.16 原驼 - 7B 骆驼 雅、中、英、德 一般的
细节多语言数据集 [ 关联]
[关联] [关联] - - -
2023年3月24日 多莉 多莉-v1-6b 6B GPT-J-6B zh 一般的
细节52k stanford alpaca 指令跟随数据 [ 关联]
- [关联] - - [关联]
2023年3月24日 聊天医生 - 7B 骆驼 zh 药品
细节52K 斯坦福羊驼毛 [ 关联]、100K HealthCareMagic [ 关联]、10K icliniq [ 关联]、5K GenMedGPT-5k [ 关联]
[关联] - [关联] [关联] -
2023.03.25 骆驼 中国羊驼 7B 骆驼 中文、英文 一般的
细节翻译后的 52k stanford alpaca 指令跟随数据 [ 关联]、guanaco [ 关联]
[关联] [关联] - - -
2023年3月26日 美女 百丽-7B-0.2M/0.6M/1M/2M 7B BLOOMZ-7B1-mt 中文、英文 一般的
细节0.2M/0.6M/1M/2M中文数据[ 关联]、52k stanford alpaca指令跟随数据[ 关联]
[关联] [关联] [关联] - -
2023年3月28日 伶荔 Linly-Chinese-LLaMA 7b/13b/33b 7B/13B/33B 骆驼 zh 一般的
细节中英平行语料库[ 关联]、中文维基百科、社区互动、新闻数据[ 关联]、科技文献[ 关联]
[关联] [关联] - - -
2023年3月28日 伶荔 Linly-ChatFlow 7b/13b 7B/13B 骆驼 zh 一般的
细节BELLE [ 关联]、pCLUE [ 关联]、CSL [ 关联]、GuanacoDataset [ 关联]、Chain-of-Thought [ 关联]、news_commentary [ 关联]、firefly [ 关联]
[关联] [关联] - - [关联]
2023.04.01 百泽 百泽-7B/13B/30B 7B/13B/30B 骆驼 zh 一般的
细节52K 斯坦福羊驼毛 [ 关联]、54K Quora [ 关联]、57K StackOverFlow [ 关联]
[关联] [关联] [关联] [关联] -
2023.04.03 考拉 - 13B 骆驼 zh 一般的
细节ShareGPT、HC3 [ 关联]、OIG [ 关联]、Stanford alpaca [ 关联]、Anthropic HH [ 关联]、OpenAI WebGPT [ 关联]、OpenAI Summarization [ 关联]
- [关联] - [关联] [关联]
2023.04.03 百泽 百泽-healthcare-7b 7B 骆驼 zh 药品
细节54K Quora [ 关联]、47K 医疗对话 [ 关联]
[关联] [关联] - - -
2023.04.06 萤火虫 (流萤) 萤火虫-1b4/2b6 1.4B/2.6B 布卢姆-ZH zh 一般的
细节中文问答对 [ 关联], [ 关联]
[关联] [关联] - - -
2023.04.08 凤凰 凤凰聊天-7b 7B 布卢姆兹 一般的
细节对话数据[ 关联]
[关联] [关联] - - -
2023.04.09 凤凰 凤凰城-inst-chat-7b 7B 布卢姆兹 一般的
细节对话数据[ 关联]、指令数据
[关联] [关联] - - -
2023.04.10 奇美拉 嵌合体聊天-7b/13b 7B/13B 骆驼 拉丁 一般的
细节对话数据[ 关联]
[关联] [关联] - - -
2023年4月11日 奇美拉 嵌合体-inst-chat-7b/13b 7B/13B 骆驼 拉丁 一般的
细节对话数据[ 关联]、指令数据
[关联] [关联] - - -
2023年4月12日 多莉 多莉-v2-12b 12B pythia-12b zh 一般的
细节15k 个人工生成的提示/响应对 [ 关联]
[关联] [关联] - - [关联]
2023.04.14 医学羊驼 奖章 7b/13b 7B/13B 骆驼 zh 药品
细节来自闪存卡、wikidoc、stackexchange 和 ChatDoctor 的问答对
[关联] [关联] [关联] - -
2023.04.19 美女 美女-LLaMA-7B/13B-2M 7B/13B 骆驼 中文、英文 一般的
细节2M中文数据[ 关联]、52k stanford alpaca指令跟随数据[ 关联]
[关联] [关联] [关联] - -
2023.04.21 苔藓 苔藓-月亮-003-基地 16B 代码生成器 中文、英文 一般的
细节100B中文代币和20B英文代币
[关联] [关联] - [关联] [关联]
2023.04.21 苔藓 苔藓-月亮-003-sft 16B 苔藓-月亮-003-基地 中文、英文 一般的
细节1.1M多轮对话数据(由ChatGPT生成)[ 关联]
[关联] [关联] - [关联] [关联]
2023.04.21 苔藓 moss-moon-003-sft-插件 16B 苔藓-月亮-003-基地 中文、英文 一般的
细节1.1M多轮对话数据[ 关联],300K插件增强数据(由InstructGPT生成)[ 关联]
[关联] [关联] - [关联] [关联]
2023年4月22日 拥抱聊天 oasst-sft-6-llama-30b 30B 骆驼 一般的
细节人工生成、人工注释的助理式对话语料库,包含 35 种语言的 161k 条消息 [ 关联]
[关联] [关联] - [关联] -
2023.06.19 知道LM 智喜13b 13B 骆驼 中文、英文 一般的
细节人工生成、机器生成和知识图谱生成的中文和英文 [ 关联]
[关联] [关联] - - -
2023.06.21 BayLing(百临) 贝灵-7b/13b 7B/13B 骆驼 中文、英文 一般的
细节160K 人类生成、机器生成的多轮交互式翻译语料库、羊驼指令和 sharegpt 对话 [ 关联]
[关联] [关联] [关联] [关联] [关联]
2023.07.18 美洲驼2 llama-2-7b/13b/70b-(聊天) 7B/13B/70B - zh 一般的
细节2T 代币(大部分为英文,来自公开来源的新数据组合)
[关联] [关联] [关联] - [关联]

📕 闭源法学硕士

推出日期 模型 版本 尺寸 朗斯 领域 演示 官方博客
2022年11月30日 聊天GPT GPT-3.5-涡轮 - 一般的 [关联] [关联] -
2023.03.14 克洛德 克劳德即时
克劳德-v1
- 一般的 [关联] [关联] -
2023.03.14 GPT GPT-4 - 一般的 [关联] [关联] [关联]
2023.03.16 Ernie Bot (文心一言) - - 中文、英文 一般的 [关联] [关联] -
2023年3月21日 诗人 - - 一般的 [关联] [关联] -
2023.03.30 彭博GPT - 50B zh 金融 - [关联] [关联]
2023年4月11日 通义千问 - - 一般的 [关联] [关联] -
2023.07.07 OmModel(欧姆大模型) - - 一般的 [关联] [关联] -
2023.07.11 克劳德 2 克劳德-v2 - 一般的 - [关联] [关联]

🏗 待办事项列表

  • 包括开源法学硕士
  • 包括闭源法学硕士
  • 包括对常见培训数据的系统审查
  • 包括各种法学硕士的有趣用例
  • 法学硕士在各种评估任务中的表现

📝 引文

如果您发现此存储库有用,请考虑引用。

@software{li2023llmzoo,
  title = {LLM Zoo}
  author = {Li, Xingxuan and Zhang, Wenxuan and Bing, Lidong},
  url = {https://github.com/DAMO-NLP-SG/LLM-Zoo},
  year = {2023}
}

About

LLM Zoo收集各种开源和闭源LLM的信息

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published