文件名称:patentprocessing:处理USPTO专利数据
文件大小:6.26MB
文件格式:ZIP
更新时间:2024-06-06 02:49:06
Scala
专利处理 处理和分析来自数据 网页排名 编译 sbt package 提交到集群 spark-submit -v --driver-library-path /usr/lib/hadoop/lib/native \ --class "PageRank" \ --master yarn-cluster \ --deploy-mode cluster \ --executor-memory 8G \ --num-executors 10 \ target/scala-2.10/patentpagerank_2.10-1.0.jar 杂项 用于DARPA的Memex集群
【文件预览】:
patentprocessing-master
----pagerank()
--------src()
--------simple.sbt(209B)
----Dockerfile(785B)
----patentprocessor.zip(6.31MB)
----LICENSE(1KB)
----ETL()
--------citation_to_csv.sh(75B)
--------clean.py(185B)
--------citation_to_csv.sql(24B)
--------preprocess-patent.py(452B)
--------preprocess-citation.py(474B)
----requirements.txt(194B)
----README.md(559B)