examples

Форк
0

README.md

Generative Pseudo-Labeling

This directory contains the code notebooks explained in the Generative Pseudo-Labeling (GPL) article. Notebooks include:

  • 00-download-cord-19.ipynb shows how to download the CORD-19 dataset. Open In Colab Open nbviewer

  • 01-query-gen.ipynb demonstrates the synthetic query generation data prep step. Open In Colab Open nbviewer

  • 02-negative-mining.ipynb works through the second data prep step of negative mining. Open In Colab Open nbviewer

  • 03-ce-scoring.ipynb details the final data prep step of pseudo-labeling. Open In Colab Open nbviewer

  • 04-finetune.ipynb shows how to use the data created in the previous notebooks to fine-tune a bi-encoder using Margin MSE loss. Open In Colab Open nbviewer

All of this content is part of a course called NLP for Semantic Search.

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.