paddlenlp

Форк
0
/
sft_argument.json 
31 строка · 904.0 Байт
1
{
2
    "model_name_or_path": "facebook/opt-125m",
3
    "dataset_name_or_path": "./data",
4
    "output_dir": "./checkpoints/opt_sft_ckpts",
5
    "per_device_train_batch_size": 4,
6
    "gradient_accumulation_steps": 4,
7
    "per_device_eval_batch_size": 8,
8
    "eval_accumulation_steps":16,
9
    "num_train_epochs": 3,
10
    "learning_rate": 3e-05,
11
    "warmup_steps": 30,
12
    "logging_steps": 1,
13
    "evaluation_strategy": "epoch",
14
    "save_strategy": "epoch",
15
    "src_length": 1024,
16
    "max_length": 2048,
17
    "fp16": true,
18
    "fp16_opt_level": "O2",
19
    "do_train": true,
20
    "do_eval": true,
21
    "disable_tqdm": true,
22
    "load_best_model_at_end": true,
23
    "eval_with_do_generation": false,
24
    "metric_for_best_model": "accuracy",
25
    "recompute": true,
26
    "save_total_limit": 1,
27
    "sharding_parallel_degree": 4,
28
    "sharding": "stage2",
29
    "zero_padding": false,
30
    "use_flash_attention": false
31
  }

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.