tf-textanalysis-gcp:显示如何使用BigQuery,tf.hub,tf.transform和Dataflow执行文本预处理以执行文本相似性分析

时间:2024-06-01 15:41:17
【文件属性】:

文件名称:tf-textanalysis-gcp:显示如何使用BigQuery,tf.hub,tf.transform和Dataflow执行文本预处理以执行文本相似性分析

文件大小:15KB

文件格式:ZIP

更新时间:2024-06-01 15:41:17

machine-learning tensorflow text-analysis embeddings Python

在Google Cloud Platform上使用TensorFlow进行文本分析 目的是展示如何通过提取诸如TF.IDF和嵌入之类的特征来准备基于文本的数据集,以建立机器学习模型:除了使用提取的特征来提取文档分类(受监管)和文档聚类(不受监管)之外,执行文本(余弦)相似性分析。 除了先进的TensorFlow功能(例如tf.transform,tf.hub,预制tf.estimators和自定义TF估计器API)之外,该解决方案还将涉及多种GCP技术,包括Cloud Storage,BigQuery和Dataflow。


【文件预览】:
tf-textanalysis-gcp-master
----parameters.py(1KB)
----.gitignore(1KB)
----README.md(617B)
----pipelines()
--------process_docs.py(9KB)
--------__init__.py(0B)
----__init__.py(0B)
----requirements.txt(66B)
----.idea()
--------workspace.xml(11KB)
--------vcs.xml(180B)
--------misc.xml(371B)
--------modules.xml(290B)
--------dbnavigator.xml(22KB)
--------tf-textanalysis-gcp.iml(398B)
--------codeStyles()
----setup.py(289B)
----.DS_Store(6KB)
----run_pipeline.py(1KB)

网友评论