history-of-hadoop:可以在此处找到本文的更好版本

时间:2024-07-02 20:24:30
【文件属性】:

文件名称:history-of-hadoop:可以在此处找到本文的更好版本

文件大小:1.01MB

文件格式:ZIP

更新时间:2024-07-02 20:24:30

Hadoop 以一种已灭绝的大象物种命名,即所谓的黄色 Hadoop。 说真的,现在您一定已经听说过它如何得名的故事。 如今,Apache Hadoop 实际上是大数据的同义词(尽管 Apache Spark 正在快速追赶)。 我会告诉你一个关于一个热情而温柔的男人的史诗故事,他寻求让整个互联网都可以搜索。 故事开始于 1997 年某个阳光明媚的下午,当时 Doug Cutting(“男人”)开始编写 Lucene 的第一个版本。 你问什么是Lucene。 TLDR:一般来说,这就是让 Google 以亚秒级延迟返回结果的原因。 Lucene 是一个全文搜索库。 好的,很好,但什么是全文搜索库? FT 搜索库用于分析普通文本,目的是建立索引。 索引是一种将每个术语映射到其位置的数据结构(想想一本书末尾的索引,带有术语和一个或多个相应的页码),因此当您搜索一个术语时,它会立即知道该


【文件预览】:
history-of-hadoop-master
----resources()
--------IBM-HD-and-USB-stick_old_style.JPG(992KB)
--------Hadoop-Yarn-architecture-by-product.png(15KB)
--------Hadoop-MapReduce-architecture-products.png(8KB)
--------Hadoop-MapReduce-architecture-by-workload.png(8KB)
--------Hadoop-Yarn-architecture-by workload-type.png(9KB)
----LICENSE(1KB)
----README.md(24KB)

网友评论