文件名称:seqrep:使用机器学习将序列表示为嵌入的框架
文件大小:430KB
文件格式:ZIP
更新时间:2024-03-09 03:50:46
machine-learning deep-learning word2vec embeddings recommender-system
序号 使用机器学习将序列表示为嵌入的框架。 楷模 跳过克负采样(SGNS) 流行的自然语言处理模型(例如word2vec和bert可以重新用于从任意项目序列中学习关系。 跳过图负采样是models模块的算法部分。 这可以在PyTorch组件中实现,也可以组成PyTorch Lightning模块。 两者都在relevent命名空间seqrep.models.sgns和seqrep.models.lighting.sgns 。 数据集 调频 数据集由音乐服务的大约1,000个用户的收听历史组成。 该数据集可在的项目主站点上并进行了预处理以方便使用。 dataset模块中的变量使用后者。 电影镜头 流行的推荐系统数据集可通过dataset模块以三种形式提供。
【文件预览】:
seqrep-master
----setup.py(263B)
----.gitignore(2KB)
----TODO(414B)
----seqrep()
--------datasets()
--------__init__.py(0B)
--------models()
----LICENSE(1KB)
----setup.cfg(39B)
----notebooks()
--------movielens-pytorch-dataset.ipynb(5KB)
--------lastfm-pytorch-dataset.ipynb(10KB)
--------movielens-dataset.ipynb(37KB)
--------movielens-pl.ipynb(283KB)
--------lastfm-pl.ipynb(309KB)
----README.md(1KB)
----.gitattributes(30B)