文件名称:migdar-data-pipelines:收集有关migdar的数据
文件大小:132KB
文件格式:ZIP
更新时间:2024-04-07 09:25:19
JupyterNotebook
Migdar数据管道
快速开始
在本地运行管道
大多数管道都可以在本地运行,而对基础结构的依赖性最小。
安装一些依赖项(以下适用于最新版本的Ubuntu):
sudo apt-get install -y python3.6 python3-pip python3.6-dev libleveldb-dev libleveldb1v5
sudo pip3 install pipenv
安装管道依赖项
pipenv install
激活virtualenv
pipenv shell
列出可用的管道
dpp
运行管道
dpp run
【文件预览】:
migdar-data-pipelines-master
----tribunals_edited.csv(19KB)
----.dockerignore(245B)
----.github()
--------workflows()
----dpp_serve_wsgi.py(57B)
----notebooks()
--------parse judges CVs.ipynb(19KB)
--------Datasets.ipynb(61KB)
--------Organisations.ipynb(7KB)
----.travis.sh(1KB)
----QUICKSTART.ipynb(70KB)
----Dockerfile(1KB)
----pylama.ini(179B)
----QUICKSTART.md(26KB)
----render_notebook.sh(364B)
----requirements.txt(136B)
----Pipfile.lock(20KB)
----.travis_ci_operator_self_github_deploy_key.id_rsa.enc(3KB)
----datapackage_pipelines_migdar()
--------flows()
--------__init__.py(0B)
----LICENSE(1KB)
----.travis_ci_operator_migdar-k8s_github_deploy_key.id_rsa.enc(2KB)
----setup.py(546B)
----README.md(1KB)
----Pipfile(251B)
----.travis-ci-operator.yaml(2KB)
----docker-compose.yaml(838B)
----pipeline-spec.yaml(844B)
----.gitignore(2KB)
----download_search_results_unique_records.sh(536B)
----environment.yaml(268B)
----docker-dpp-run.sh(1KB)