30 个优质 NLP 数据集和模型,一键使用 8 个 demo,建议收藏!| 超全大模型资源汇总(nlp的数据集)

AIGC动态欢迎阅读

原标题:30 个优质 NLP 数据集和模型

,一键使用 8 个 demo,建议收藏!| 超全大模型资源汇总

关键字:模型,数据,解读,系列,中文

文章来源:大数据文摘

内容字数:8335字

内容摘要:

大数据文摘受权转载自HyperAI超神经

近两年来,大模型的热度持续高涨,并且开始在更广泛的领域进行落地探索。随着行业整体的快速发展,越来越多的开源大模型涌入市场,进一步推动了上层应用的拓展。

对于开发者而言,挑选优质大模型和数据集对其后续的研发、模型微调至关重要。为了方便大家选择并下载适配开发需求的模型与数据集,HyperAI超神经为大家汇总了大模型相关资源:

* 优质公共数据集:15 个

* 优质开源模型:15 个

*优质教程精选:8 个

更多大模型资源,见官网:hyper.ai数据集精选1.seq-monkey 序列猴子开源数据集 1.0

序列猴子数据集是用于训练序列猴子模型的数据集,涉及领域包括:中文通用文本语料、古诗今译语料、文本生成语料。

直接使用:https://my5353.com/seqmon

2.IEPile 大规模信息抽取语料库

IEPile 是由浙江大学研发的大规模、高质量的双语(中英)信息抽取 (IE) 指令微调数据集,涵盖了医学、金融等多个领域。

直接使用:https://my5353.com/30064

3.LongAlign-10K 大模型长上下文对齐数

原文链接:30 个优质 NLP 数据集和模型,一键使用 8 个 demo,建议收藏!| 超全大模型资源汇总

联系作者

文章来源:大数据文摘

作者微信:BigDataDigest

作者简介:普及数据思维,传播数据文化

0
分享到:
没有账号? 忘记密码?