CSS-LM

Форк
0
/
convert_xml_to_json_ABSA_TestData.py 
23 строки · 946.0 Байт
1
import json
2
from xmljson import badgerfish as bf
3
from xml.dom import minidom
4

5

6
file_1="../data/laptop_restaurant_2014/test/ABSA_TestData_PhaseA/Laptops_Test_Data_PhaseA.xml"
7
file_2="../data/laptop_restaurant_2014/test/ABSA_TestData_PhaseA/Restaurants_Test_Data_PhaseA.xml"
8
mydoc_1 = minidom.parse(file_1)
9
texts_1 = mydoc_1.getElementsByTagName('text')
10
all_data_list_1 = list()
11
for text in texts_1:
12
    all_data_list_1.append({"sentence":text.firstChild.nodeValue,"aspect":"laptops", "sentiment":"laptops"})
13

14
mydoc_2 = minidom.parse(file_2)
15
texts_2 = mydoc_2.getElementsByTagName('text')
16
all_data_list_2 = list()
17
for text in texts_2:
18
    all_data_list_2.append({"sentence":text.firstChild.nodeValue,"aspect":"restaurants", "sentiment":"restaurants"})
19

20
all_data_list = all_data_list_1 + all_data_list_2
21

22
with open('../data/laptop_restaurant_2014/test/ABSA_TestData_PhaseA/lap_rest_test.json', 'w') as outfile:
23
    json.dump(all_data_list, outfile)
24

Использование cookies

Мы используем файлы cookie в соответствии с Политикой конфиденциальности и Политикой использования cookies.

Нажимая кнопку «Принимаю», Вы даете АО «СберТех» согласие на обработку Ваших персональных данных в целях совершенствования нашего веб-сайта и Сервиса GitVerse, а также повышения удобства их использования.

Запретить использование cookies Вы можете самостоятельно в настройках Вашего браузера.