dream

Форк
0

README.md

Sentence Segmentation model for Russian Language

Model adds punctuation marks (. and ?) in Russian lower-cased text.

Models is trained on Russian Open Subtitles dataset using ruBERT-based NER setup. The training scores are the following:

{
    "valid": {
        "eval_examples_count": 28977, 
        "metrics": {
            "ner_f1": 73.9806, 
            "ner_token_f1": 73.9806
        }, 
        "time_spent": "0:00:36"
    }
}
{
    "test": {
        "eval_examples_count": 28976, 
        "metrics": {
            "ner_f1": 74.1223, 
            "ner_token_f1": 74.1223
        }, 
        "time_spent": "0:00:35"
    }
}

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.