baleen:博客的自动提取服务,可为NLP研究构建语料库

时间:2024-05-31 01:55:37
【文件属性】:

文件名称:baleen:博客的自动提取服务,可为NLP研究构建语料库

文件大小:835KB

文件格式:ZIP

更新时间:2024-05-31 01:55:37

Python

巴连 博客的自动提取服务,用于构建NLP研究的语料库。 快速开始 快速入门旨在使您在开发模式下使用Baleen进行设置(因为该项目仍在开发中)。 如果您想在生产环境中运行Baleen,请参阅。 克隆存储库 $ git clone git@github.com:bbengfort/baleen.git $ cd baleen 创建一个virtualenv并安装依赖项 $ virtualenv venv $ source venv/bin/activate $ pip install -r requirements.txt 通过virtualenv将baleen模块添加到$PYTHONPATH 。 $ echo $(pwd) > venv/lib/python2.7/site-packages/baleen.pth 创建本地配置文件。 使用与本地MongoDB服务器的连接详细信息对其


【文件预览】:
baleen-master
----conf()
--------uwsgi()
--------upstart()
--------baleen-example.yaml(385B)
----MANIFEST.in(144B)
----DESCRIPTION.txt(437B)
----fixtures()
--------fields.json(1KB)
----requirements.txt(838B)
----.travis.yml(377B)
----mkdocs.yml(642B)
----LICENSE(1KB)
----setup.cfg(40B)
----setup.py(4KB)
----README.md(5KB)
----Makefile(675B)
----docs()
--------index.md(2KB)
--------service.md(10KB)
--------components.md(5KB)
--------images()
--------about.md(8KB)
----docker-compose.yml(224B)
----tests()
--------fixtures()
--------test_feed.py(8KB)
--------test_opml.py(4KB)
--------__init__.py(1KB)
--------test_models.py(5KB)
--------test_ingest.py(4KB)
--------utils_tests()
--------test_export.py(2KB)
--------test_wrangle.py(7KB)
----.gitignore(765B)
----Dockerfile-app(471B)
----bin()
--------ldoc.py(631B)
--------doctimes.py(1005B)
--------baleen(834B)
----baleen()
--------exceptions.py(1KB)
--------console()
--------export.py(8KB)
--------utils()
--------config.py(2KB)
--------www()
--------feed.py(6KB)
--------__init__.py(792B)
--------models.py(7KB)
--------opml.py(3KB)
--------ingest.py(9KB)
--------wrangle.py(6KB)
--------version.py(1KB)

网友评论