EA-VQ-VAE 代码学习(1)
简介
之前学习 EA-VQ-VAE 的时候发现只读论文本身还是有很多细节问题不太懂,而 EA-VQ-VAE 的代码开源在 github 上。今天正好通过学习代码更深层地理解一下这个模型以及基础的 VQ-VAE 模型。
今天是我的生日,希望能看到这篇博客的你天天开心。如果今天还恰好是你的生日,希望你生日快乐!
EA-VQ-VAE 是微软团队于 2020 年发表的《Evidence-Aware Inferential Text Generation with Vector Quantised Variational AutoEncoder》中提出的模型,该文发表在 ACL 上。该文的主要工作是利用 VQ-VAE 进行推理文本生成。推理文本生成定义为,给定一个事件(例如 “A 偷看了 B 的日记”),从多个维度对该事件进行推断(“A 的心理状态”,“A 的目的”)。而 EA-VQ-VAE 中的 EA(Evidence-Aware)指的是利用证据来进行推理文本生成。
VQ-VAE(Vector Quantised - Variational AutoEncoder,量子变分自编码器)出自 2017 年 Google 团队的论文 Neural Discrete Representation Learning。顾名思义,VQ-VAE 是 VAE( Variational AutoEncoder,变分自编码器)的变种。主要是为了解决 VAE 所存在的” 后验坍塌 “问题。VQ-VAE 与 VAE 的主要区别在于: