Scala集合类型详解
Scala集合
Scala提供了一套很好的集合实现,提供了一些集合类型的抽象。
Scala 集合分为可变的和不可变的集合。
可变集合可以在适当的地方被更新或扩展。这意味着你可以修改,添加,移除一个集合的元素。而不可变集合类永远不会改变。不过,你仍然可以模拟添加,移除或更新操作。但是这些操作将在每一种情况下都返回一个新的集合,同时使原来的集合不发生改变。
集合中基本结构:
几种常用集合类型示例:
// 定义整型 List
val x = List(1, 2, 3, 4)
// 定义 Set
var x = Set(1, 3, 5, 7)
// 定义 Map
val x = Map("one" -> 1, "two" -> 2, "three" -> 3)
// 创建两个不同类型元素的元组
val x = (10, "Runoob")
// 定义 Option
val x: Option[Int] = Some(5)
Scala List(列表)
Scala 列表类似于数组,它们所有元素的类型都相同,但是它们也有所不同:列表是不可变的,值一旦被定义了就不能改变,其次列表 具有递归的结构(也就是链接表结构)而数组不是。
列表的元素类型 T 可以写成 List[T]。例如,以下列出了多种类型的列表:
// 字符串列表
val site: List[String] = List("Sina", "Google", "Baidu")
// 整型列表
val nums: List[Int] = List(1, 2, 3, 4)
// 空列表
val empty: List[Nothing] = List()
// 二维列表
val dim: List[List[Int]] =
List(
List(1, 0, 0),
List(0, 1, 0),
List(0, 0, 1)
)
构造列表的两个基本单位是 Nil 和 ::
Nil 也可以表示为一个空列表。
以上实例我们可以写成如下所示:(::)符号连接顺序是从右到左
// 字符串列表
val site = "Sina" :: ("Google" :: ("Baidu" :: Nil))
// 整型列表
val nums = 1 :: (2 :: (3 :: (4 :: Nil)))
// 空列表
val empty = Nil
// 二维列表
val dim = (1 :: (0 :: (0 :: Nil))) ::
(0 :: (1 :: (0 :: Nil))) ::
(0 :: (0 :: (1 :: Nil))) :: Nil
基本操作
Scala列表有三个基本操作:
- head 返回列表第一个元素
- tail 返回一个列表,包含除了第一元素之外的其他元素:(是一个列表或者Nil)
- isEmpty 在列表为空时返回true
对于Scala列表的任何操作都可以使用这三个基本操作来表达。代码示例如下:
val site = "Sina" :: ("Google" :: ("Baidu" :: Nil))
val nums = Nil
//打印测试head、tail、isEmpty功能
println(site.head)
println(site.tail)
println(site.isEmpty)
println(nums.isEmpty)
打印结果为:
Sina
List(Google, Baidu)
false
true
连接列表
你可以使用 ::: 、 List.:::() 或 List.concat() 方法来连接两个或多个列表。
代码示例如下:
val site1 = "Sina" :: ("Google" :: ("Baidu" :: Nil))
val site2 = "Facebook" :: ("Taobao" :: Nil)
// 使用 ::: 运算符
var combine = site1 ::: site2
println( "site1 ::: site2 : " + combine )
// 使用 list.:::() 方法,注意:结果为site2列表元素在前,site1在后
combine = site1.:::(site2)
println( "site1.:::(site2) : " + combine )
// 使用 concat 方法
combine = List.concat(site1, site2)
println( "List.concat(site1, site2) : " + combine )
}
打印结果:
site1 ::: site2 : List(Sina, Google, Baidu, Facebook, Taobao)
site1.:::(site2) : List(Facebook, Taobao, Sina, Google, Baidu)
List.concat(site1, site2) : List(Sina, Google, Baidu, Facebook, Taobao)
List.fill()
我们可以使用 List.fill() 方法来创建一个指定重复数量的元素列表:
val site = List.fill(3)("Baidu") // 重复 Runoob 3次
println( "site : " + site )
val num = List.fill(10)(2) // 重复元素 2, 10 次
println( "num : " + num )
打印结果为:
site : List(Baidu, Baidu, Baidu)
num : List(2, 2, 2, 2, 2, 2, 2, 2, 2, 2)
List.tabulate()
List.tabulate() 方法是通过给定的函数来创建列表。
方法的第一个参数为元素的数量,可以是二维的,第二个参数为指定的函数,我们通过指定的函数计算结果并返回值插入到列表中,起始值为 0,实例如下:
// 通过给定的函数创建 5 个元素
val squares = List.tabulate(6)(n => n * n)
println( "一维 : " + squares )
// 创建二维列表
val mul = List.tabulate( 4,5 )( _ * _ )
println( "二维 : " + mul )
打印结果为:
一维 : List(0, 1, 4, 9, 16, 25)
二维 : List(List(0, 0, 0, 0, 0), List(0, 1, 2, 3, 4), List(0, 2, 4, 6, 8), List(0, 3, 6, 9, 12))
List.reverse
List.reverse 用于将列表的顺序反转,实例如下:
val site = "Sina" :: ("Google" :: ("Baidu" :: Nil))
println( "反转前 : " + site )
println( "反转前 : " + site.reverse )
打印结果为:
反转前 : List(Sina, Google, Baidu)
反转前 : List(Baidu, Google, Sina)
列表缓存(ListBuffer)
List类能够提供对列表头部,而非尾部的快速访问。如果需要向结尾添加对象,则需要先对表头前缀元素方式反向构造列表,完成之后再调用reverse。
上述问题另一种解决方式就是使用ListBuffer,这可以避免reverse操作。ListBuffer是可变对象,它可以更高效的通过添加元素来构建列表。
使用ListBuffer替代List另一个理由是避免栈溢出风险。
ListBuffer使用示例:
val buf: ListBuffer[Int] = new ListBuffer[Int]
//往后添加
buf += 1
buf += 2
//前缀添加
val buf2 = 3 +: buf
println(buf2.toString())
//ListBuffer转List
println(buf2.toList.toString())
List常用方法
- 参考底部附录:
Scala队列和栈
队列
如果你需要先进先出序列,你可以使用Queue(队列)。Scala集合提供了可变和不可变的Queue。
不可变Queue代码示例:
//使用伴生对象创建一个queue
val que = Queue[Int]()
//使用enqueue为不可变队列添加元素
val que1 = que.enqueue(1)
//往队列添加多个元素,把集合作为enqueue的参数
val que2 = que1.enqueue(List(2,3,4,5))
//从队列头部移除元素,使用dequeue
//第一个参数为头部移除的元素,第二个参数为剩下的队列
val (elem1,que3) = que2.dequeue
//打印移除的元素
println(elem1)
//打印剩下的队列
println(que3)
打印结果为:
1
Queue(2, 3, 4, 5)
可变Queue代码示例:
//使用伴生对象创建一个可变queue
var que = scala.collection.mutable.Queue[String]()
//使用 += 符号添加单个元素
que += "A"
//使用 ++= 符号添加多个元素
que ++= List("B","C","D")
//使用dequeue移除头部元素
val a = que.dequeue
//打印移除的元素
println(a)
//打印队列中剩下的元素
print(que)
打印结果:
A
Queue(B, C, D)
栈
如果需要的是后进先出,你可以使用Stack,它同样在Scala的集合中有可变和不可变版本。元素的推入使用push,弹出用pop,只获取栈顶元素而不移除可以使用top。
可变栈示例:
//使用Stack类的伴生对象创建Stack对象
var stack = scala.collection.mutable.Stack[Int]()
//往栈stack中压如元素
stack.push(1)
stack.push(2)
stack.push(3)
//打印查看栈内元素
println(stack)
//获取栈顶元素的值
val tval = stack.top
println("栈顶元素为 : " + tval)
//移除栈顶元素
val pval = stack.pop()
println("移除的栈顶元素为 : " + pval)
//打印移除栈顶元素后,剩下的栈内元素
println(stack)
打印结果:
Stack(3, 2, 1)
栈顶元素为 : 3
移除的栈顶元素为 : 3
Stack(2, 1)
队列和栈常用操作
- 参考底部附录:
Scala Set(集)
- Scala Set(集)是没有重复的对象集合,所有的元素都是唯一的。
- Scala 集合分为可变的和不可变的集合。
- 默认情况下,Scala 使用的是不可变集合,如果想使用可变集合,需引用 scala.collection.mutable.Set 包。
- 默认引用 scala.collection.immutable.Set。
不可变集合实例如下:
val set = Set(1,2,3)
println(set.getClass.getName) //
println(set.exists(_ % 2 == 0)) //true
println(set.drop(1)) //Set(2,3)
打印结果为:
scala.collection.immutable.Set$Set3
true
Set(2, 3)
如果需要使用可变集合需要引入 scala.collection.mutable.Set:
import scala.collection.mutable.Set // 可以在任何地方引入 可变集合
val mutableSet = Set(1,2,3)
println(mutableSet.getClass.getName) // scala.collection.mutable.HashSet
//往集合内添加元素4
mutableSet.add(4)
//删除值为1的元素
mutableSet.remove(1)
//添加元素5
mutableSet += 5
//删除值为3的元素
mutableSet -= 3
println(mutableSet) // Set(5, 3, 4)
val another = mutableSet.toSet
println(another.getClass.getName) // scala.collection.immutable.Set
注意: 虽然可变Set和不可变Set都有添加或删除元素的操作,但是有一个非常大的差别。对不可变Set进行操作,会产生一个新的set,原来的set并没有改变,这与List一样。 而对可变Set进行操作,改变的是该Set本身,与ListBuffer类似。
Set集合基本操作
Scala Set集合有三个基本操作:
- head 返回集合第一个元素
- tail 返回一个集合,包含除了第一元素之外的其他元素
- isEmpty 在集合为空时返回true
对于Scala集合的任何操作都可以使用这三个基本操作来表达。
代码示例如下:
val site = Set("Sina", "Google", "Baidu")
val nums: Set[Int] = Set()
println( "head : " + site.head )
println( "tail : " + site.tail )
println( "isEmpty : " + site.isEmpty )
println( "isEmpty : " + nums.isEmpty )
打印结果为:
head : Sina
tail : Set(Google, Baidu)
isEmpty : false
isEmpty : true
连接集合
你可以使用 ++ 运算符或 Set.++() 方法来连接两个集合。如果元素有重复的就会移除重复的元素。实例如下:
val site1 = Set("Sina", "Google", "Baidu")
val site2 = Set("Faceboook", "Taobao")
// ++ 作为运算符使用
var site = site1 ++ site2
println( "site1 ++ site2 : " + site )
// ++ 作为方法使用
site = site1.++(site2)
println( "site1.++(site2) : " + site )
打印结果为:
site1 ++ site2 : Set(Faceboook, Taobao, Sina, Google, Baidu)
site1.++(site2) : Set(Faceboook, Taobao, Sina, Google, Baidu)
查找集合中最大与最小元素
你可以使用 Set.min 方法来查找集合中的最小元素,使用 Set.max 方法查找集合中的最大元素。实例如下:
val num = Set(5,6,9,20,30,45)
// 查找集合中最大与最小元素
println( "Set(5,6,9,20,30,45) 最小元素是 : " + num.min )
println( "Set(5,6,9,20,30,45) 最大元素是 : " + num.max )
打印结果为:
Set(5,6,9,20,30,45) 最小元素是 : 5
Set(5,6,9,20,30,45) 最大元素是 : 45
交集
你可以使用 Set.& 方法或 Set.intersect 方法来查看两个集合的交集元素。实例如下:
val num1 = Set(5,6,9,20,30,45)
val num2 = Set(50,60,9,20,35,55)
// 交集
println( "num1.&(num2) : " + num1.&(num2) )
println( "num1.intersect(num2) : " + num1.intersect(num2) )
打印结果为:
num1.&(num2) : Set(20, 9)
num1.intersect(num2) : Set(20, 9)
Scala Set 常用方法
- 参考底部附录:
Scala Map(映射)
- Map(映射)是一种可迭代的键值对(key/value)结构。
- 所有的值都可以通过键来获取。
- Map 中的键都是唯一的。
- Map 也叫哈希表(Hash tables)。
- Map 有两种类型,可变与不可变,区别在于可变对象可以修改它,而不可变对象不可以。
- 默认情况下 Scala 使用不可变 Map。如果你需要使用可变集合,你需要显式的引入 import scala.collection.mutable.Map 类
- 在 Scala 中 你可以同时使用可变与不可变 Map,不可变的直接使用 Map,可变的使用 mutable.Map。
以下实例演示了不可变 Map 的应用:
// 空哈希表,键为字符串,值为整型
var A:Map[Char,Int] = Map()
// Map 键值对演示
val lang= Map("Java" -> "Oracle", "C#" -> "Microsoft")
或者
val lang= Map(("Java","Oracle"), ("C#" , "Microsoft"))
定义 Map 时,需要为键值对定义类型。如果需要添加 key-value 对,可以使用 + 号,如下所示:
A += ('t' ->10 )
Map 基本操作
Scala Map 几种基本操作:keys、values、isEmpty、赋值(可变映射)
代码示例:
Keys:
val lang = Map("Java" -> "Oracle",
"C#" -> "Microsoft",
"Swift" -> "Apple")
Values:
val nums: Map[Int, Int] = Map()
println( "lang 中的键为 : " + lang.keys )
println( "lang 中的值为 : " + lang.values )
isEmpty:
println( "lang 是否为空 : " + lang.isEmpty )
println( "nums 是否为空 : " + nums.isEmpty )
keys和isEmpty的打印结果为:
lang 中的键为 : Set(Java, C#, Swift)
lang 中的值为 : MapLike(Oracle, Microsoft, Apple)
lang 是否为空 : false
nums 是否为空 : true
赋值:
var lang= scala.collection.mutable.Map("Java" -> "Oracle", "C#" -> "Microsoft")
lang("Java") = "sun"
println(lang)
打印结果为:
Map(C# -> Microsoft, Java -> sun)
Map 合并
你可以使用 ++ 运算符或 Map.++() 方法来连接两个 Map,Map 合并时会移除重复的 key。以下演示了两个 Map 合并的实例:
val lang =Map("Java" -> "Oracle",
"C#" -> "Microsoft",
"Swift" -> "Apple")
val color = Map("blue" -> "#0033FF",
"yellow" -> "#FFFF00",
"red" -> "#FF0000")
// ++ 作为运算符
var colors = lang ++ color
println( "lang ++ colors : " + colors )
// ++ 作为方法
colors = lang.++(colors)
println( "lang.++(colors)) : " + colors )
打印结果为:
lang ++ colors : Map(blue -> #0033FF, C# -> Microsoft, yellow -> #FFFF00, Java -> Oracle, red -> #FF0000, Swift -> Apple)
lang.++(colors)) : Map(blue -> #0033FF, C# -> Microsoft, yellow -> #FFFF00, Java -> Oracle, red -> #FF0000, Swift -> Apple)
输出 Map 的keys 和values
以下通过 foreach 循环输出 Map 中的 keys 和 values:
val lang =Map("Java" -> "Oracle",
"C#" -> "Microsoft",
"Swift" -> "Apple")
lang.keys.foreach{ i =>
print( "Key = " + i )
println("\tValue = " + lang(i) )}
打印结果为:
Key = JavaValue = Oracle
Key = C#Value = Microsoft
Key = SwiftValue = Apple
查看 Map 中是否存在指定的Key
你可以使用 Map.contains 方法来查看 Map 中是否存在指定的 Key。实例如下:
val lang =Map("Java" -> "Oracle",
"C#" -> "Microsoft",
"Swift" -> "Apple")
if(lang.contains("Swift")) {
println(lang("Swift")+"创造了 Swift 语言")
}
打印结果为:
Apple创造了 Swift 语言
迭代映射
val lang = Map("Java" -> "Oracle", "C#" -> "Microsoft")
for ((k, v) <- lang) {
println(k + " : " + v)
}
打印结果为:
Java : Oracle
C# : Microsoft
映射中K,V反转
val lang = Map("Java" -> "Oracle", "C#" -> "Microsoft")
val lang2 = for ((k, v) <- lang) yield (v, k)
for ((k, v) <- lang2) {
println(k + " : " + v)
}
打印结果为:
Oracle : Java
Microsoft : C#
已排序映射
//按照key的字典顺序排序。
val scores = scala.collection.immutable.SortedMap(("Bob", 8), ("Alice", 21), ("Fred", 17), ("Cindy", 15))
scores.foreach(person => println(person._1 + " : " + person._2))
打印结果为:
Alice : 21
Bob : 8
Cindy : 15
Fred : 17
Scala Map常用方法
- 参考底部附录:
Scala Tuple(元组)
与列表一样,元组也是不可变的,但与列表不同的是元组可以包含不同类型的元素。
元组的值是通过将单个的值包含在圆括号中构成的。例如:
//元组中定义了三个元素,对应的类型分别为[Int, Double, java.lang.String]。
val tuple1 = (1, 5.20, "Spark")
//或者
val tuple2 = new Tuple3(1,5.20,"Spark")
我们可以使用 tuple1._1 访问第一个元素, tuple1._2 访问第二个元素,如下所示:
//元组中定义了三个元素,对应的类型分别为[Int, Double, java.lang.String]。
val tuple1 = (1, 5.20, "Spark")
println(tuple1._1 + " : " + tuple1._2 + " : " + tuple1._3)
打印结果为:
1 : 5.2 : Spark
迭代元组
你可以使用 Tuple.productIterator() 方法来迭代输出元组的所有元素:
//元组中定义了三个元素,对应的类型分别为[Int, Double, java.lang.String]。
val tuple1 = (1, 5.20, "Spark")
tuple1.productIterator.foreach{i => println("value : " + i)}
打印结果为:
value : 1
value : 5.2
value : Spark
元组转为字符串
你可以使用 Tuple.toString() 方法将元组的所有元素组合成一个字符串,实例如下:
//元组中定义了三个元素,对应的类型分别为[Int, Double, java.lang.String]。
val tuple1 = (1, 5.20, "Spark")
println(tuple1.toString())
打印结果为:
(1,5.2,Spark)
元素交换
你可以使用 Tuple.swap 方法来交换元组的元素。如下实例:
//元组中定义了两个元素,对应的类型分别为[Int, java.lang.String]。
val tuple1 = (1, "Spark")
//注意:swap函数只能用于两个元素元组
println(tuple1.swap)
打印结果为:
(Spark,1)
使用模式匹配获取元组
代码示例:
val t = (1, 3.14, "Fred")
val (first, second, third) = t
println(first + " : " + second + " : " + third)
打印结果:
1 : 3.14 : Fred
拉链操作
val num = Array(1, 2, 3)
val str = Array("first", "second", "third")
val com = num.zip(str).toMap
println(com(1)+" : "+com(2)+" : "+com(3))
打印结果为:
first : second : third
元组常用方法
- 参考底部附录:
Scala Option(选项)
Scala Option(选项)类型用来表示一个值是可选的(有值或无值)。
Option[T] 是一个类型为 T 的可选值的容器: 如果值存在, Option[T] 就是一个 Some[T] ,如果不存在, Option[T] 就是对象 None 。
代码示例:
val myMap: Map[String, String] = Map("key1" -> "value")
val value1: Option[String] = myMap.get("key1")
val value2: Option[String] = myMap.get("key2")
println(value1) // Some("value1")
println(value2) // None
打印结果为:
Some(value)
None
Option 有两个子类别,一个是 Some,一个是 None,当他回传 Some 的时候,代表这个函式成功地给了你一个 String,而你可以透过 get() 这个函式拿到那个 String,如果他返回的是 None,则代表没有字符串可以给你。
通过模式匹配来输出匹配值。
代码示例:
val lang =Map("Java" -> "Oracle",
"C#" -> "Microsoft",
"Swift" -> "Apple")
println(show(lang.get("Swift")))
println(show(lang.get("Scala")))
def show(x:Option[String]) = x match {
case Some(s) => s
case None => "?"
}
打印结果为:
Apple
?
getOrElse() 方法
你可以使用 getOrElse() 方法来获取元组中存在的元素或者使用其默认的值,实例如下:
val a:Option[Int] = Some(5)
val b:Option[Int] = Some(7)
val c:Option[Int] = None
println("a.getOrElse(0): " + a.getOrElse(0) )
println("b.getOrElse(1): " + b.getOrElse(1) )
println("c.getOrElse(10): " + c.getOrElse(10))
打印结果为:
a.getOrElse(0): 5
b.getOrElse(1): 7
c.getOrElse(10): 10
isEmpty() 方法
你可以使用 isEmpty() 方法来检测元组中的元素是否为 None,实例如下:
val a:Option[Int] = Some(5)
val b:Option[Int] = None
println("a.isEmpty: " + a.isEmpty )
println("b.isEmpty: " + b.isEmpty )
打印结果为:
a.isEmpty: false
b.isEmpty: true
Scala Option 常用方法
- 参考底部附录:
Scala Iterator(迭代器)
- Scala Iterator(迭代器)不是一个集合,它是一种用于访问集合的方法。
- 迭代器 it 的两个基本操作是 next 和 hasNext。
- 调用 it.next() 会返回迭代器的下一个元素,并且更新迭代器的状态。
- 调用 it.hasNext() 用于检测集合中是否还有元素。
让迭代器 it 逐个返回所有元素最简单的方法是使用 while 循环:
val it = Iterator("Baidu", "Google", "Tencent", "Taobao")
while (it.hasNext){
println(it.next())
}
打印结果为:
Baidu
Tencent
Taobao
查找最大与最小元素
你可以使用 it.min 和 it.max 方法从迭代器中查找最大与最小元素,实例如下:
val ita = Iterator(20, 40, 2, 50, 69, 90)
val itb = Iterator(20, 40, 2, 50, 69, 90)
println("最大元素是:" + ita.max)
println("最小元素是:" + itb.min)
执行结果为:
最大元素是:90
最小元素是:2
获取迭代器的长度
你可以使用 it.size 或 it.length 方法来查看迭代器中的元素个数。实例如下:
val ita = Iterator(20, 40, 2, 50, 69, 90)
val itb = Iterator(20, 40, 2, 50, 69, 90)
println("ita.size : " + ita.size)
println("itb.length : " + itb.length)
打印结果为:
ita.size : 6
itb.length : 6
Scala Iterator 常用方法
- 参考底部附录:
附录:
List常用方法
队列和栈常用操作
Scala Set 常用方法
Scala Map常用方法
元组常用方法
Scala Option 常用方法
Scala Iterator 常用方法