recsys_workshop

0

Описание

Языки

  • Jupyter Notebook96%
  • Dockerfile3,7%
  • Python0,3%
README.md

recsys_workshop

Набор данных для демонстрации работы рекомендательной системы

Содержание

Датасет содержит файлы

  • ноутбук
    recsys_demo_workshop.ipynb
  • csv
    data/user_item_views.zip
    на ~2 млн строк вида
user_iditem_idshow_timestampshow_duration
91294892015879350701119307323
  • архив
    data/content_catalog.zip
    содержит csv формата
item_idtitle
1593139110Тачки 3
  • архив
    data/json_views.tar.gz
    содержит single-line JSON вида
  • pickle
    data/ground_truth_dataset.pkl
    с просмотрами контента за 1 день по 13353 пользователям
  • pickle
    data/test_dataset.pkl
    с просмотрами контента за 180 предшествующих дней по 13353 пользователям

Бинарный файл

ground_truth_dataset.pkl
(
test_dataset.pkl
) это массив где каждый элемент представляет собой записи из
data/json_views.tar.gz
агрегированные по полю
user_id
в словарь вида
{item_id: value, ..., iеem_id: value}
, с флагом
is_validation=1
(
is_validation=0
).

Эксплуатация

В директории с ноутбуком запустить код

Если будем использовать mongo, redis - нужно подключить контейнер в общую сеть