MERGE

This is the pytorch implementation of MERGE:

Requirements

For RQ-VAE: requirements_rqvae.txt For GR: requirements_gr.txt

Preprocess data

download raw esci data
preprocess

python data_process/extract_esci_item.py

Generate Doc Embeddings

python data_process/esci_text_emb_items_t5.py --root data --dataset esci --plm_name t5-base --plm_checkpoint [plm_model]

Train RQ-VAE in MERGE

bash ./RQ-VAE/train_tokenizer.sh 0.01 "1.0 0.75 0.25 0.0" "0.001 0.001 0.001 0.001" merge

Tokenize and Obtain DocIDs

bash ./RQ-VAE/tokenize.sh [model_path] [model_name]

Train GR model

bash ./GR_train/train.sh

Test

bash ./GR_train/test.sh

This code is based on https://github.com/HonghuiBao2000/LETTER.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

MERGE

Requirements

Preprocess data

Generate Doc Embeddings

Train RQ-VAE in MERGE

Tokenize and Obtain DocIDs

Train GR model

Test

About

Uh oh!

Releases

Packages

Uh oh!

Languages

Name		Name	Last commit message	Last commit date
Latest commit History 3 Commits
GR_train		GR_train
RQ-VAE		RQ-VAE
ckpt		ckpt
data		data
data_process		data_process
LICENSE		LICENSE
README.md		README.md
requirements_gr.txt		requirements_gr.txt
requirements_rqvae.txt		requirements_rqvae.txt

License

zhangfw123/MERGE

Folders and files

Latest commit

History

Repository files navigation

MERGE

Requirements

Preprocess data

Generate Doc Embeddings

Train RQ-VAE in MERGE

Tokenize and Obtain DocIDs

Train GR model

Test

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages