llmware

dragon_gguf_fast_start.py
57 строк · 1.7 Кб
Перенос по словам
1

2
"""This example demonstrates running a 7B RAG-instruct fine-tuned DRAGON model locally on a laptop"""
3

4
import time
5
from llmware.prompts import Prompt
6

7
from datasets import load_dataset
8

9

10
# Pull a 200 question RAG benchmark test dataset from llmware HuggingFace repo
11
def load_rag_benchmark_tester_dataset():
12
    dataset_name = "llmware/rag_instruct_benchmark_tester"
13
    print(f"\n > Loading RAG dataset '{dataset_name}'...")
14
    dataset = load_dataset(dataset_name)
15

16
    test_set = []
17
    for i, samples in enumerate(dataset["train"]):
18
        test_set.append(samples)
19

20
    return test_set
21

22

23
# Run the benchmark test
24
def run_test(model_name, prompt_list):
25
    print(f"\n > Loading model '{model_name}'")
26
    prompter = Prompt().load_model(model_name)
27

28
    print(f"\n > Running RAG Benchmark Test against '{model_name}' - 200 questions")
29
    for i, entry in enumerate(prompt_list):
30

31
        start_time = time.time()
32

33
        prompt = entry["query"]
34
        context = entry["context"]
35
        response = prompter.prompt_main(prompt, context=context, prompt_name="default_with_context", temperature=0.3)
36

37
        # Print results
38
        time_taken = round(time.time() - start_time, 2)
39
        print("\n")
40
        print(f"{i + 1}. llm_response - {response['llm_response']}")
41
        print(f"{i + 1}. gold_answer - {entry['answer']}")
42
        print(f"{i + 1}. time_taken - {time_taken}")
43

44
    return 0
45

46

47
if __name__ == "__main__":
48

49
    ds = load_rag_benchmark_tester_dataset()
50

51
    #   Supported Q4_K_M GGUF Dragon Models:
52
    #       -- llmware/dragon-yi-6b-gguf
53
    #       -- llmware/dragon-mistral-7b-gguf
54
    #       -- llmware/dragon-llama-7b-gguf
55

56
    model_name = "llmware/dragon-yi-6b-gguf"
57

58
    output = run_test(model_name,ds)
59
llmware

Использование cookies