pCLUE:1200000+多任务提示学习数据集    项目地址 |  在线demo 提交样例           
     模型描述需包含关键词"pCLUE"; 2022-10-01: pCLUE榜启用;p指的是prompt learning即提示学习。由于包含了多种任务,也是多任务学习的数据集。任务类型分为四种类型:分类、阅读理解、推理、生成。
     提交需实名,即:队伍名称、模型名称、Url/Github、模型描述,需有真实有效。无意义的提交将被移除;有问题发邮件:CLUEbenchmark@163.com;有效的提交,需在一个模型上进行多任务学习并预测。

排行模型研究机构测评时间Score
阅读理解
F1 | EM
分类(acc)
推理(acc)
生成(rouge-l)*
1HumanCLUE22-10-010.8120.973 | 0.9180.8000.9030.600
2nlutest2-large-gennucky23-09-070.5890.790 | 0.6800.5790.6860.357
3nlutest2-gennucky23-08-290.5690.761 | 0.6510.5750.6380.357
4pvpvpvpvthreecolor22-11-270.5610.775 | 0.6490.5930.5800.359
5hemu_pclue_mergehemu23-02-210.5520.713 | 0.5850.5850.6270.347
6p_10_2_12threecolor22-11-210.5500.748 | 0.6210.5840.5750.356
7multi_rm_20_2_12threecolor22-11-230.5490.746 | 0.6150.5790.5770.358
8base_test_transformer_3_24_mthreecolor22-11-080.5480.747 | 0.6170.5830.5700.357
9multi_fv_10_2_12threecolor22-11-230.5480.750 | 0.6220.5780.5690.359
10pclue_mengzi_param7-truecxy22-11-230.5480.747 | 0.6180.5830.5700.357
11hemu_pclue_newhemu23-02-210.5480.713 | 0.5850.5710.6270.347
12p_20?_2_12threecolor22-11-210.5470.747 | 0.6190.5830.5680.354
13pclue_mengzi_param5cxy22-11-230.5470.748 | 0.6190.5830.5700.351
14pclue_mengzi_param6cxy22-11-230.5470.748 | 0.6190.5830.5700.353
15pclue_mengzi_param7cxy22-11-230.5470.748 | 0.6190.5830.5700.353
16single_rm_10_2_12threecolor22-11-230.5470.751 | 0.6210.5790.5650.359
17multi_rm_10_2_12threecolor22-11-230.5470.751 | 0.6220.5760.5660.359
18pclue_mengzi_param4cxy22-11-220.5460.748 | 0.6180.5830.5700.350
19mmodelmzy23-04-250.5460.736 | 0.5940.5960.5750.349
20ixmixm23-04-250.5460.736 | 0.5940.5960.5750.349

ALBERT(Ensemble)

GitHub/模型网址:

提交日期:9月17日

分数:9月17日

更多详情:

型号说明

阿尔伯特模型集合

参数说明

单任务微调。我们从MNLI为RTE、STS和MRPC优化的模型开始

总参数:-1

共享参数:-1

诊断信息

诊断主混淆矩阵

C N E
C 182 36 40
N 81 189 116
E 17 69 374

C = 对立

N = 不包含

E = 包含

类别相关马修分数

获取排行榜数据成功!