【文件属性】:
文件名称:purano:新闻注释和聚类
文件大小:1.11MB
文件格式:ZIP
更新时间:2021-02-07 21:34:03
nlp news clustering JupyterNotebook
PuraNo-新闻注释和聚类
安装
安装Git,DVC和pip:
$ sudo wget https://dvc.org/deb/dvc.list -O /etc/apt/sources.list.d/dvc.list
$ sudo apt-get update
$ sudo apt-get install git dvc python3-pip
克隆存储库并安装Python要求(建议使用Python 3.6+):
$ git clone https://github.com/IlyaGusev/purano
$ python3 -m pip install -r purano/requirements.txt
运行管道
$ dvc pull
$ dvc repro
$ cat output/metrics.json
警告:群集需要大于8GB的RAM,因为它存储所有N ^ 2的成对距离