recsys_workshop
Описание
Языки
- Jupyter Notebook96%
- Dockerfile3,7%
- Python0,3%
5 лет назад
5 лет назад
5 лет назад
5 лет назад
5 лет назад
5 лет назад
5 лет назад
README.md
recsys_workshop
Набор данных для демонстрации работы рекомендательной системы
Содержание
Датасет содержит файлы
- ноутбук recsys_demo_workshop.ipynb
- csv
на ~2 млн строк видаdata/user_item_views.zip
| user_id | item_id | show_timestamp | show_duration |
|---|---|---|---|
| 912948920 | 1587935070 | 1119307 | 323 |
- архив
содержит csv форматаdata/content_catalog.zip
| item_id | title |
|---|---|
| 1593139110 | Тачки 3 |
- архив
содержит single-line JSON видаdata/json_views.tar.gz
- pickle
с просмотрами контента за 1 день по 13353 пользователямdata/ground_truth_dataset.pkl - pickle
с просмотрами контента за 180 предшествующих дней по 13353 пользователямdata/test_dataset.pkl
Бинарный файл (ground_truth_dataset.pkl) это массив где каждый элемент представляет собой
записи из test_dataset.pkl агрегированные по полю data/json_views.tar.gz в словарь вида user_id,
с флагом {item_id: value, ..., iеem_id: value} (is_validation=1).is_validation=0
Эксплуатация
В директории с ноутбуком запустить код
Если будем использовать mongo, redis - нужно подключить контейнер в общую сеть