ACM 2021: 生物医学域的语言模型
摘要
《Domain-Specific Language Model Pretraining for Biomedical Natural Language Processing》为微软研究院发表的论文,收录于 2021 年 ACM 中。论文旨在探讨,特定领域的预训练也可以从通用领域语言模型开始受益,这一假设是否适用于具有大规模未标记数据的领域(例如生物医学)。论文证实,相较于从通用领域继续预训练,从头开始训练预训练模型能够获得更好的性能。此外,论文还提出了一个新的生物医学 NLP 基准 BLURB,并创建了排行榜。