Recent Posts

dataloader

less than 1 minute read

dataloader output dimension 데이터 1개의 tuple을 쪼개서 배치 단위로 concat한다.

Trainer_API

6 minute read

사전 지식: Trainer: native pytorch 코드가 아니라 간단하게 training argument, 사용할 metric 함수, dataset만 던져 넣으면 알아서 학습을 돌려준다. 그러면 내부에서 epoch 마다 돌리고, step 마다 돌리고, loss 계산하고, gr...

Skim-RoBERTa

less than 1 minute read

Skim-RoBERTa RoBERTa(https://arxiv.org/pdf/1907.11692.pdf) Dynamic Masking 사용 에폭 마다 masking을 다르게 준다. N...