CSS-LM

Форк
0
/
extract_from_org.py 
29 строк · 877.0 Байт
1
import json
2

3
label_type = list()
4
train_list = list()
5
with open("org/train_5500.txt",encoding="ISO-8859-1") as f:
6
    for line in f:
7
        train_dict = dict()
8
        #print(line)
9
        line = line.strip().split(":")
10
        label_type.append(line[0])
11
        train_list.append({"sentence":line[1], "aspect":"QA", "sentiment":line[0]})
12
print(len(set(label_type)))
13
with open("train_all.json","w") as f:
14
    json.dump(train_list,f)
15
with open("dev.json","w") as f:
16
    json.dump(train_list,f)
17

18

19
#label_type = list()
20
test_list = list()
21
with open("org/test_10.txt",encoding="ISO-8859-1") as f:
22
    for line in f:
23
        text_dict = dict()
24
        #print(line)
25
        line = line.strip().split(":")
26
        #label_type.append(line[0])
27
        test_list.append({"sentence":line[1], "aspect":"QA", "sentiment":line[0]})
28
with open("test.json","w") as f:
29
    json.dump(test_list,f)
30

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.