摘要

书接上回,本次 lab 的实验目标是实现数据库的各种操作符,包含 filter、join、aggregate、insert、delete 等。此外,还需要实现第一节没有实现的页面调度算法,处理 BufferPool 满时的页面调度,此外还有脏页面写回等操作。

阅读全文 »

摘要

最近开始学数据库了,找到了 MIT 6.830 的 Lab,感觉质量还挺高的。打算从实现上了解下数据库的细节。MIT 6.830 的实验要求使用 JAVA 语言实现一个简易的关系数据库,支持常用的增删改查操作、事务、B + 树索引、恢复等功能。这次我分享下 Lab 1 的一些总结。我把课程资料也附在了后面,有兴趣一起学习的一起来学习讨论~

阅读全文 »

摘要

DeBERTa 是微软于去年在《DEBERTA: DECODING-ENHANCED BERT WITH DIS-ENTANGLED ATTENTION》中提出的预训练模型, 论文收录于 ICLR 2021 中。DeBERTa (Decoding-enhanced BERT with disentangled attention), 顾名思义,相较于普通的 BERT,DeBERTa 加强了其解码能力,解耦了注意力。DeBERTa 第一次在 SuperGLEU 基准上超越了人类, 在 MNLI、SQuAD、RACE 数据集上相较于 RoBERTa 也有较大的提升(0.9%-3.6%)。

阅读全文 »

摘要

本博客主要总结一下近期看到的一些关于极端多标签文本分类(Extreme Multi-Label Text Classification,XMTC)的相关工作。 之前尝试研究了一个月,发现 SOTA 复现不太出来,只能放弃了换方向了。希望这篇博客能帮到有缘人。

阅读全文 »

摘要

今天来介绍一个很好用的深度学习框架,PyTorch Lightning。从名字就可以看出,它是基于 PyTorch 的框架。它的核心思想是,将学术代码(模型定义、前向 / 反向、优化器、验证等)与工程代码(for-loop,保存、tensorboard 日志、训练策略等)解耦开来,使得代码更为简洁清晰。工程代码经常会出现在深度学习代码中,PyTorch Lightning 对这部分逻辑进行了封装,只需要在 Trainer 类中简单设置即可调用,无需重复造轮子。

阅读全文 »
0%