PDF OCR - 搜索 News

资讯

1 小时

75%预训练数据都能删，Jeff Dean新作：全自动筛除低质量数据

实验表明，经过DataRater筛选的数据大幅减少了训练所需的浮点运算次数（最高可达46.6%的净计算收益），并且可以提高跨多种预训练语料库（例如，Pile、C4/noclean）语言模型的最终性能。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果