谷歌 LaMDA:高达 137B 参数的 “全能型” 聊天机器人
摘要
《LaMDA: Language Models for Dialog Applications》是谷歌于 2022 年发表的论文,收录在 arxiv 中。论文提出了一个名为 LaMDA(Language Models for Dialog Application)的对话模型,拥有 137B 参数,在 1.56T 公开对话数据和网页上预训练。实验证明,虽然模型扩展能够提升对话质量,但是在安全性和事实性方面的改进很小。而监督数据上的微调能够帮助模型利用外部知识源进行回复,显著改进了安全性和事实性两个指标。