Scala集合类型详解

Scala集合

Scala提供了一套很好的集合实现，提供了一些集合类型的抽象。

Scala 集合分为可变的和不可变的集合。

可变集合可以在适当的地方被更新或扩展。这意味着你可以修改，添加，移除一个集合的元素。而不可变集合类永远不会改变。不过，你仍然可以模拟添加，移除或更新操作。但是这些操作将在每一种情况下都返回一个新的集合，同时使原来的集合不发生改变。

集合中基本结构：

Scala集合类型详解

几种常用集合类型示例：

// 定义整型 List
val x = List(1, 2, 3, 4)

// 定义 Set
var x = Set(1, 3, 5, 7)

// 定义 Map
val x = Map("one" -> 1, "two" -> 2, "three" -> 3)

// 创建两个不同类型元素的元组
val x = (10, "Runoob")

// 定义 Option
val x: Option[Int] = Some(5)

Scala List(列表)

Scala 列表类似于数组，它们所有元素的类型都相同，但是它们也有所不同：列表是不可变的，值一旦被定义了就不能改变，其次列表具有递归的结构（也就是链接表结构）而数组不是。

列表的元素类型 T 可以写成 List[T]。例如，以下列出了多种类型的列表：

// 字符串列表
val site: List[String] = List("Sina", "Google", "Baidu")

// 整型列表
val nums: List[Int] = List(1, 2, 3, 4)

// 空列表
val empty: List[Nothing] = List()

// 二维列表
val dim: List[List[Int]] =
  List(
    List(1, 0, 0),
    List(0, 1, 0),
    List(0, 0, 1)
  )

构造列表的两个基本单位是 Nil 和 ::

Nil 也可以表示为一个空列表。

以上实例我们可以写成如下所示：（::）符号连接顺序是从右到左

// 字符串列表
val site = "Sina" :: ("Google" :: ("Baidu" :: Nil))

// 整型列表
val nums = 1 :: (2 :: (3 :: (4 :: Nil)))

// 空列表
val empty = Nil

// 二维列表
val dim = (1 :: (0 :: (0 :: Nil))) ::
  (0 :: (1 :: (0 :: Nil))) ::
  (0 :: (0 :: (1 :: Nil))) :: Nil

基本操作

Scala列表有三个基本操作：

head 返回列表第一个元素
tail 返回一个列表，包含除了第一元素之外的其他元素：（是一个列表或者Nil）
isEmpty 在列表为空时返回true

对于Scala列表的任何操作都可以使用这三个基本操作来表达。代码示例如下:

val site = "Sina" :: ("Google" :: ("Baidu" :: Nil))
val nums = Nil
//打印测试head、tail、isEmpty功能
println(site.head)
println(site.tail)
println(site.isEmpty)
println(nums.isEmpty)

打印结果为：

Sina
List(Google, Baidu)
false
true

连接列表

你可以使用 ::: 、 List.:::() 或 List.concat() 方法来连接两个或多个列表。

代码示例如下:

  val site1 = "Sina" :: ("Google" :: ("Baidu" :: Nil))
  val site2 = "Facebook" :: ("Taobao" :: Nil)

  // 使用 ::: 运算符
  var combine = site1 ::: site2
  println( "site1 ::: site2 : " + combine )

  // 使用 list.:::() 方法，注意：结果为site2列表元素在前，site1在后
  combine = site1.:::(site2)
  println( "site1.:::(site2) : " + combine )

  // 使用 concat 方法
  combine = List.concat(site1, site2)
  println( "List.concat(site1, site2) : " + combine  )
}

打印结果：

site1 ::: site2 : List(Sina, Google, Baidu, Facebook, Taobao)
site1.:::(site2) : List(Facebook, Taobao, Sina, Google, Baidu)
List.concat(site1, site2) : List(Sina, Google, Baidu, Facebook, Taobao)

List.fill()

我们可以使用 List.fill() 方法来创建一个指定重复数量的元素列表：

val site = List.fill(3)("Baidu") // 重复 Runoob 3次
println( "site : " + site  )

val num = List.fill(10)(2)         // 重复元素 2, 10 次
println( "num : " + num  )

打印结果为：

site : List(Baidu, Baidu, Baidu)
num : List(2, 2, 2, 2, 2, 2, 2, 2, 2, 2)

List.tabulate()

List.tabulate() 方法是通过给定的函数来创建列表。

方法的第一个参数为元素的数量，可以是二维的，第二个参数为指定的函数，我们通过指定的函数计算结果并返回值插入到列表中，起始值为 0，实例如下：

// 通过给定的函数创建 5 个元素
val squares = List.tabulate(6)(n => n * n)
println( "一维 : " + squares  )

// 创建二维列表
val mul = List.tabulate( 4,5 )( _ * _ )
println( "二维 : " + mul  )

打印结果为：

一维 : List(0, 1, 4, 9, 16, 25)
二维 : List(List(0, 0, 0, 0, 0), List(0, 1, 2, 3, 4), List(0, 2, 4, 6, 8), List(0, 3, 6, 9, 12))

List.reverse

List.reverse 用于将列表的顺序反转，实例如下：

val site = "Sina" :: ("Google" :: ("Baidu" :: Nil))
println( "反转前 : " + site )
println( "反转前 : " + site.reverse )

打印结果为：

反转前 : List(Sina, Google, Baidu)
反转前 : List(Baidu, Google, Sina)

列表缓存(ListBuffer)

List类能够提供对列表头部，而非尾部的快速访问。如果需要向结尾添加对象，则需要先对表头前缀元素方式反向构造列表，完成之后再调用reverse。

上述问题另一种解决方式就是使用ListBuffer，这可以避免reverse操作。ListBuffer是可变对象，它可以更高效的通过添加元素来构建列表。

使用ListBuffer替代List另一个理由是避免栈溢出风险。

ListBuffer使用示例：

val buf: ListBuffer[Int] = new ListBuffer[Int]
//往后添加
buf += 1
buf += 2

//前缀添加
val buf2 = 3 +: buf
println(buf2.toString())

//ListBuffer转List
println(buf2.toList.toString())

List常用方法

参考底部附录:

Scala队列和栈

队列

如果你需要先进先出序列，你可以使用Queue(队列)。Scala集合提供了可变和不可变的Queue。

不可变Queue代码示例：

//使用伴生对象创建一个queue
val que = Queue[Int]()

//使用enqueue为不可变队列添加元素
val que1 = que.enqueue(1)

//往队列添加多个元素，把集合作为enqueue的参数
val que2 = que1.enqueue(List(2,3,4,5))

//从队列头部移除元素，使用dequeue
//第一个参数为头部移除的元素，第二个参数为剩下的队列
val (elem1,que3) = que2.dequeue

//打印移除的元素
println(elem1)

//打印剩下的队列
println(que3)

打印结果为：

1
Queue(2, 3, 4, 5)

可变Queue代码示例：

//使用伴生对象创建一个可变queue
var que = scala.collection.mutable.Queue[String]()

//使用 += 符号添加单个元素
que += "A"

//使用 ++= 符号添加多个元素
que ++= List("B","C","D")

//使用dequeue移除头部元素
val a = que.dequeue

//打印移除的元素
println(a)

//打印队列中剩下的元素
print(que)

打印结果：

A
Queue(B, C, D)

栈

如果需要的是后进先出，你可以使用Stack，它同样在Scala的集合中有可变和不可变版本。元素的推入使用push，弹出用pop，只获取栈顶元素而不移除可以使用top。

可变栈示例：

//使用Stack类的伴生对象创建Stack对象
var stack = scala.collection.mutable.Stack[Int]()

//往栈stack中压如元素
stack.push(1)
stack.push(2)
stack.push(3)

//打印查看栈内元素
println(stack)

//获取栈顶元素的值
val tval = stack.top
println("栈顶元素为 : " + tval)

//移除栈顶元素
val pval = stack.pop()
println("移除的栈顶元素为 : " + pval)

//打印移除栈顶元素后，剩下的栈内元素
println(stack)

打印结果：

Stack(3, 2, 1)
栈顶元素为 : 3
移除的栈顶元素为 : 3
Stack(2, 1)

队列和栈常用操作

参考底部附录：

Scala Set(集)

Scala Set(集)是没有重复的对象集合，所有的元素都是唯一的。
Scala 集合分为可变的和不可变的集合。
默认情况下，Scala 使用的是不可变集合，如果想使用可变集合，需引用 scala.collection.mutable.Set 包。
默认引用 scala.collection.immutable.Set。

不可变集合实例如下：

val set = Set(1,2,3)
println(set.getClass.getName) //

println(set.exists(_ % 2 == 0)) //true
println(set.drop(1)) //Set(2,3)

打印结果为：

scala.collection.immutable.Set$Set3
true
Set(2, 3)

如果需要使用可变集合需要引入 scala.collection.mutable.Set：

import scala.collection.mutable.Set // 可以在任何地方引入 可变集合

val mutableSet = Set(1,2,3)
println(mutableSet.getClass.getName) // scala.collection.mutable.HashSet
//往集合内添加元素4
mutableSet.add(4)
//删除值为1的元素
mutableSet.remove(1)
//添加元素5
mutableSet += 5
//删除值为3的元素
mutableSet -= 3

println(mutableSet) // Set(5, 3, 4)

val another = mutableSet.toSet
println(another.getClass.getName) // scala.collection.immutable.Set

注意：虽然可变Set和不可变Set都有添加或删除元素的操作，但是有一个非常大的差别。对不可变Set进行操作，会产生一个新的set，原来的set并没有改变，这与List一样。而对可变Set进行操作，改变的是该Set本身，与ListBuffer类似。

Set集合基本操作

Scala Set集合有三个基本操作：

head 返回集合第一个元素
tail 返回一个集合，包含除了第一元素之外的其他元素
isEmpty 在集合为空时返回true

对于Scala集合的任何操作都可以使用这三个基本操作来表达。

代码示例如下:

val site = Set("Sina", "Google", "Baidu")
val nums: Set[Int] = Set()

println( "head : " + site.head )
println( "tail : " + site.tail )
println( "isEmpty : " + site.isEmpty )
println( "isEmpty : " + nums.isEmpty )

打印结果为：

head : Sina
tail : Set(Google, Baidu)
isEmpty : false
isEmpty : true

连接集合

你可以使用 ++ 运算符或 Set.++() 方法来连接两个集合。如果元素有重复的就会移除重复的元素。实例如下：

val site1 = Set("Sina", "Google", "Baidu")
val site2 = Set("Faceboook", "Taobao")

// ++ 作为运算符使用
var site = site1 ++ site2
println( "site1 ++ site2 : " + site )

//  ++ 作为方法使用
site = site1.++(site2)
println( "site1.++(site2) : " + site )

打印结果为:

site1 ++ site2 : Set(Faceboook, Taobao, Sina, Google, Baidu)
site1.++(site2) : Set(Faceboook, Taobao, Sina, Google, Baidu)

查找集合中最大与最小元素

你可以使用 Set.min 方法来查找集合中的最小元素，使用 Set.max 方法查找集合中的最大元素。实例如下：

val num = Set(5,6,9,20,30,45)

// 查找集合中最大与最小元素
println( "Set(5,6,9,20,30,45)  最小元素是 : " + num.min )
println( "Set(5,6,9,20,30,45)  最大元素是 : " + num.max )

打印结果为：

Set(5,6,9,20,30,45)  最小元素是 : 5
Set(5,6,9,20,30,45)  最大元素是 : 45

交集

你可以使用 Set.& 方法或 Set.intersect 方法来查看两个集合的交集元素。实例如下：

val num1 = Set(5,6,9,20,30,45)
val num2 = Set(50,60,9,20,35,55)

// 交集
println( "num1.&(num2) : " + num1.&(num2) )
println( "num1.intersect(num2) : " + num1.intersect(num2) )

打印结果为：

num1.&(num2) : Set(20, 9)
num1.intersect(num2) : Set(20, 9)

Scala Set 常用方法

参考底部附录：

Scala Map(映射)

Map(映射)是一种可迭代的键值对（key/value）结构。
所有的值都可以通过键来获取。
Map 中的键都是唯一的。
Map 也叫哈希表（Hash tables）。
Map 有两种类型，可变与不可变，区别在于可变对象可以修改它，而不可变对象不可以。
默认情况下 Scala 使用不可变 Map。如果你需要使用可变集合，你需要显式的引入 import scala.collection.mutable.Map 类
在 Scala 中你可以同时使用可变与不可变 Map，不可变的直接使用 Map，可变的使用 mutable.Map。

以下实例演示了不可变 Map 的应用：

// 空哈希表，键为字符串，值为整型
var A:Map[Char,Int] = Map()

// Map 键值对演示
val lang= Map("Java" -> "Oracle", "C#" -> "Microsoft")
或者
val lang= Map(("Java","Oracle"), ("C#" , "Microsoft"))

定义 Map 时，需要为键值对定义类型。如果需要添加 key-value 对，可以使用 + 号，如下所示：

A += ('t' ->10 )

Map 基本操作

Scala Map 几种基本操作：keys、values、isEmpty、赋值（可变映射）

代码示例：

Keys:

val lang = Map("Java" -> "Oracle",
  "C#" -> "Microsoft",
  "Swift" -> "Apple")
Values:
val nums: Map[Int, Int] = Map()
println( "lang 中的键为 : " + lang.keys )
println( "lang 中的值为 : " + lang.values )

isEmpty:

println( "lang 是否为空 : " + lang.isEmpty )
println( "nums 是否为空 : " + nums.isEmpty )

keys和isEmpty的打印结果为：

lang 中的键为 : Set(Java, C#, Swift)
lang 中的值为 : MapLike(Oracle, Microsoft, Apple)
lang 是否为空 : false
nums 是否为空 : true

赋值：

var lang= scala.collection.mutable.Map("Java" -> "Oracle", "C#" -> "Microsoft")
lang("Java") = "sun"
println(lang)

打印结果为：

Map(C# -> Microsoft, Java -> sun)

Map 合并

你可以使用 ++ 运算符或 Map.++() 方法来连接两个 Map，Map 合并时会移除重复的 key。以下演示了两个 Map 合并的实例:

val lang =Map("Java" -> "Oracle",
  "C#" -> "Microsoft",
  "Swift" -> "Apple")
val color = Map("blue" -> "#0033FF",
  "yellow" -> "#FFFF00",
  "red" -> "#FF0000")

//  ++ 作为运算符
var colors = lang ++ color
println( "lang ++ colors : " + colors )

//  ++ 作为方法
colors = lang.++(colors)
println( "lang.++(colors)) : " + colors )

打印结果为：

lang ++ colors : Map(blue -> #0033FF, C# -> Microsoft, yellow -> #FFFF00, Java -> Oracle, red -> #FF0000, Swift -> Apple)
lang.++(colors)) : Map(blue -> #0033FF, C# -> Microsoft, yellow -> #FFFF00, Java -> Oracle, red -> #FF0000, Swift -> Apple)

输出 Map 的keys 和values

以下通过 foreach 循环输出 Map 中的 keys 和 values：

val lang =Map("Java" -> "Oracle",
  "C#" -> "Microsoft",
  "Swift" -> "Apple")

lang.keys.foreach{ i =>
  print( "Key = " + i )
  println("\tValue = " + lang(i) )}

打印结果为：

Key = JavaValue = Oracle
Key = C#Value = Microsoft
Key = SwiftValue = Apple

查看 Map 中是否存在指定的Key

你可以使用 Map.contains 方法来查看 Map 中是否存在指定的 Key。实例如下：

val lang =Map("Java" -> "Oracle",
  "C#" -> "Microsoft",
  "Swift" -> "Apple")

if(lang.contains("Swift")) {
  println(lang("Swift")+"创造了 Swift 语言")
}

打印结果为：

Apple创造了 Swift 语言

迭代映射

val lang = Map("Java" -> "Oracle", "C#" -> "Microsoft")
for ((k, v) <- lang) {
  println(k + "  :  " + v)
}

打印结果为：

Java : Oracle
C# : Microsoft

映射中K，V反转

val lang = Map("Java" -> "Oracle", "C#" -> "Microsoft")
val lang2 = for ((k, v) <- lang) yield (v, k)
for ((k, v) <- lang2) {
  println(k + " : " + v)
}

打印结果为：

Oracle : Java
Microsoft : C#

已排序映射

//按照key的字典顺序排序。
val scores = scala.collection.immutable.SortedMap(("Bob", 8), ("Alice", 21), ("Fred", 17), ("Cindy", 15))
scores.foreach(person => println(person._1 + " : " + person._2))

打印结果为：

Alice : 21
Bob : 8
Cindy : 15
Fred : 17

Scala Map常用方法

参考底部附录：

Scala Tuple(元组)

与列表一样，元组也是不可变的，但与列表不同的是元组可以包含不同类型的元素。

元组的值是通过将单个的值包含在圆括号中构成的。例如：

//元组中定义了三个元素，对应的类型分别为[Int, Double, java.lang.String]。
val tuple1 = (1, 5.20, "Spark")
//或者
val tuple2 = new Tuple3(1,5.20,"Spark")

我们可以使用 tuple1._1 访问第一个元素， tuple1._2 访问第二个元素，如下所示：

//元组中定义了三个元素，对应的类型分别为[Int, Double, java.lang.String]。
val tuple1 = (1, 5.20, "Spark")

println(tuple1._1 + " : " + tuple1._2 + " : " + tuple1._3)

打印结果为：

1 : 5.2 : Spark

迭代元组

你可以使用 Tuple.productIterator() 方法来迭代输出元组的所有元素：

//元组中定义了三个元素，对应的类型分别为[Int, Double, java.lang.String]。
val tuple1 = (1, 5.20, "Spark")

tuple1.productIterator.foreach{i => println("value : " + i)}

打印结果为：

value : 1
value : 5.2
value : Spark

元组转为字符串

你可以使用 Tuple.toString() 方法将元组的所有元素组合成一个字符串，实例如下：

//元组中定义了三个元素，对应的类型分别为[Int, Double, java.lang.String]。
val tuple1 = (1, 5.20, "Spark")

println(tuple1.toString())

打印结果为：

(1,5.2,Spark)

元素交换

你可以使用 Tuple.swap 方法来交换元组的元素。如下实例：

//元组中定义了两个元素，对应的类型分别为[Int, java.lang.String]。
val tuple1 = (1, "Spark")
//注意：swap函数只能用于两个元素元组
println(tuple1.swap)

打印结果为：

(Spark,1)

使用模式匹配获取元组

代码示例：

val t = (1, 3.14, "Fred")
val (first, second, third) = t
println(first + " : " + second + " : " + third)

打印结果：

1 : 3.14 : Fred

拉链操作

val num = Array(1, 2, 3)
val str = Array("first", "second", "third")
val com = num.zip(str).toMap
println(com(1)+" : "+com(2)+" : "+com(3))

打印结果为：

first : second : third

元组常用方法

参考底部附录：

Scala Option(选项)

Scala Option(选项)类型用来表示一个值是可选的（有值或无值)。

Option[T] 是一个类型为 T 的可选值的容器：如果值存在， Option[T] 就是一个 Some[T] ，如果不存在， Option[T] 就是对象 None 。

代码示例：

val myMap: Map[String, String] = Map("key1" -> "value")
val value1: Option[String] = myMap.get("key1")
val value2: Option[String] = myMap.get("key2")

println(value1) // Some("value1")
println(value2) // None

打印结果为：

Some(value)
None

Option 有两个子类别，一个是 Some，一个是 None，当他回传 Some 的时候，代表这个函式成功地给了你一个 String，而你可以透过 get() 这个函式拿到那个 String，如果他返回的是 None，则代表没有字符串可以给你。

通过模式匹配来输出匹配值。

代码示例：

val lang =Map("Java" -> "Oracle",
  "C#" -> "Microsoft",
  "Swift" -> "Apple")

println(show(lang.get("Swift")))
println(show(lang.get("Scala")))

def show(x:Option[String]) = x match {
  case Some(s) => s
  case None => "?"
}

打印结果为：

Apple
?

getOrElse() 方法

你可以使用 getOrElse() 方法来获取元组中存在的元素或者使用其默认的值，实例如下：

val a:Option[Int] = Some(5)
val b:Option[Int] = Some(7)
val c:Option[Int] = None

println("a.getOrElse(0): " + a.getOrElse(0) )
println("b.getOrElse(1): " + b.getOrElse(1) )
println("c.getOrElse(10): " + c.getOrElse(10))

打印结果为：

a.getOrElse(0): 5
b.getOrElse(1): 7
c.getOrElse(10): 10

isEmpty() 方法

你可以使用 isEmpty() 方法来检测元组中的元素是否为 None，实例如下：

val a:Option[Int] = Some(5)
val b:Option[Int] = None
println("a.isEmpty: " + a.isEmpty )
println("b.isEmpty: " + b.isEmpty )

打印结果为：

a.isEmpty: false
b.isEmpty: true

Scala Option 常用方法

参考底部附录：

Scala Iterator(迭代器)

Scala Iterator（迭代器）不是一个集合，它是一种用于访问集合的方法。
迭代器 it 的两个基本操作是 next 和 hasNext。
调用 it.next() 会返回迭代器的下一个元素，并且更新迭代器的状态。
调用 it.hasNext() 用于检测集合中是否还有元素。

让迭代器 it 逐个返回所有元素最简单的方法是使用 while 循环：

val it = Iterator("Baidu", "Google", "Tencent", "Taobao")

while (it.hasNext){
  println(it.next())
}

打印结果为：

Baidu
Google
Tencent
Taobao

查找最大与最小元素

你可以使用 it.min 和 it.max 方法从迭代器中查找最大与最小元素，实例如下:

val ita = Iterator(20, 40, 2, 50, 69, 90)
val itb = Iterator(20, 40, 2, 50, 69, 90)

println("最大元素是：" + ita.max)
println("最小元素是：" + itb.min)

执行结果为：

最大元素是：90
最小元素是：2

获取迭代器的长度

你可以使用 it.size 或 it.length 方法来查看迭代器中的元素个数。实例如下：

val ita = Iterator(20, 40, 2, 50, 69, 90)
val itb = Iterator(20, 40, 2, 50, 69, 90)

println("ita.size : " + ita.size)
println("itb.length : " + itb.length)

打印结果为：

ita.size : 6
itb.length : 6

Scala集合类型详解

Scala集合类型详解

Scala集合

Scala List(列表)

基本操作

连接列表

List.fill()

List.tabulate()

List.reverse

列表缓存(ListBuffer)

List常用方法

Scala队列和栈

队列

栈

队列和栈常用操作

Scala Set(集)

Set集合基本操作

连接集合

查找集合中最大与最小元素

交集

Scala Set 常用方法

Scala Map(映射)

Map 基本操作

Map 合并

输出 Map 的keys 和values

查看 Map 中是否存在指定的Key

迭代映射

映射中K，V反转

已排序映射

Scala Map常用方法

Scala Tuple(元组)

迭代元组

元组转为字符串

元素交换

使用模式匹配获取元组

拉链操作

元组常用方法

Scala Option(选项)

getOrElse() 方法

isEmpty() 方法

Scala Option 常用方法

Scala Iterator(迭代器)

查找最大与最小元素

获取迭代器的长度

Scala Iterator 常用方法

附录：

List常用方法

队列和栈常用操作

Scala Set 常用方法

Scala Map常用方法

元组常用方法

Scala Option 常用方法

Scala Iterator 常用方法

相关文章