Scala集合类型详解
Scala集合
Scala提供了一套很好的集合实现,提供了一些集合类型的抽象。
Scala 集合分为可变的和不可变的集合。
可变集合可以在适当的地方被更新或扩展。这意味着你可以修改,添加,移除一个集合的元素。而不可变集合类永远不会改变。不过,你仍然可以模拟添加,移除或更新操作。但是这些操作将在每一种情况下都返回一个新的集合,同时使原来的集合不发生改变。
集合中基本结构:
几种常用集合类型示例:
// 定义整型 List val x = List(1, 2, 3, 4) // 定义 Set var x = Set(1, 3, 5, 7) // 定义 Map val x = Map("one" -> 1, "two" -> 2, "three" -> 3) // 创建两个不同类型元素的元组 val x = (10, "Runoob") // 定义 Option val x: Option[Int] = Some(5)
Scala List(列表)
Scala 列表类似于数组,它们所有元素的类型都相同,但是它们也有所不同:列表是不可变的,值一旦被定义了就不能改变,其次列表 具有递归的结构(也就是链接表结构)而数组不是。
列表的元素类型 T 可以写成 List[T]。例如,以下列出了多种类型的列表:
// 字符串列表 val site: List[String] = List("Sina", "Google", "Baidu") // 整型列表 val nums: List[Int] = List(1, 2, 3, 4) // 空列表 val empty: List[Nothing] = List() // 二维列表 val dim: List[List[Int]] = List( List(1, 0, 0), List(0, 1, 0), List(0, 0, 1) )
构造列表的两个基本单位是 Nil 和 ::
Nil 也可以表示为一个空列表。
以上实例我们可以写成如下所示:(::)符号连接顺序是从右到左
// 字符串列表 val site = "Sina" :: ("Google" :: ("Baidu" :: Nil)) // 整型列表 val nums = 1 :: (2 :: (3 :: (4 :: Nil))) // 空列表 val empty = Nil // 二维列表 val dim = (1 :: (0 :: (0 :: Nil))) :: (0 :: (1 :: (0 :: Nil))) :: (0 :: (0 :: (1 :: Nil))) :: Nil
基本操作
Scala列表有三个基本操作:
- head 返回列表第一个元素
- tail 返回一个列表,包含除了第一元素之外的其他元素:(是一个列表或者Nil)
- isEmpty 在列表为空时返回true
对于Scala列表的任何操作都可以使用这三个基本操作来表达。代码示例如下:
val site = "Sina" :: ("Google" :: ("Baidu" :: Nil)) val nums = Nil //打印测试head、tail、isEmpty功能 println(site.head) println(site.tail) println(site.isEmpty) println(nums.isEmpty)
打印结果为:
Sina List(Google, Baidu) false true
连接列表
你可以使用 ::: 、 List.:::() 或 List.concat() 方法来连接两个或多个列表。
代码示例如下:
val site1 = "Sina" :: ("Google" :: ("Baidu" :: Nil)) val site2 = "Facebook" :: ("Taobao" :: Nil) // 使用 ::: 运算符 var combine = site1 ::: site2 println( "site1 ::: site2 : " + combine ) // 使用 list.:::() 方法,注意:结果为site2列表元素在前,site1在后 combine = site1.:::(site2) println( "site1.:::(site2) : " + combine ) // 使用 concat 方法 combine = List.concat(site1, site2) println( "List.concat(site1, site2) : " + combine ) }
打印结果:
site1 ::: site2 : List(Sina, Google, Baidu, Facebook, Taobao) site1.:::(site2) : List(Facebook, Taobao, Sina, Google, Baidu) List.concat(site1, site2) : List(Sina, Google, Baidu, Facebook, Taobao)
List.fill()
我们可以使用 List.fill() 方法来创建一个指定重复数量的元素列表:
val site = List.fill(3)("Baidu") // 重复 Runoob 3次 println( "site : " + site ) val num = List.fill(10)(2) // 重复元素 2, 10 次 println( "num : " + num )
打印结果为:
site : List(Baidu, Baidu, Baidu) num : List(2, 2, 2, 2, 2, 2, 2, 2, 2, 2)
List.tabulate()
List.tabulate() 方法是通过给定的函数来创建列表。
方法的第一个参数为元素的数量,可以是二维的,第二个参数为指定的函数,我们通过指定的函数计算结果并返回值插入到列表中,起始值为 0,实例如下:
// 通过给定的函数创建 5 个元素 val squares = List.tabulate(6)(n => n * n) println( "一维 : " + squares ) // 创建二维列表 val mul = List.tabulate( 4,5 )( _ * _ ) println( "二维 : " + mul )
打印结果为:
一维 : List(0, 1, 4, 9, 16, 25) 二维 : List(List(0, 0, 0, 0, 0), List(0, 1, 2, 3, 4), List(0, 2, 4, 6, 8), List(0, 3, 6, 9, 12))
List.reverse
List.reverse 用于将列表的顺序反转,实例如下:
val site = "Sina" :: ("Google" :: ("Baidu" :: Nil)) println( "反转前 : " + site ) println( "反转前 : " + site.reverse )
打印结果为:
反转前 : List(Sina, Google, Baidu) 反转前 : List(Baidu, Google, Sina)
列表缓存(ListBuffer)
List类能够提供对列表头部,而非尾部的快速访问。如果需要向结尾添加对象,则需要先对表头前缀元素方式反向构造列表,完成之后再调用reverse。
上述问题另一种解决方式就是使用ListBuffer,这可以避免reverse操作。ListBuffer是可变对象,它可以更高效的通过添加元素来构建列表。
使用ListBuffer替代List另一个理由是避免栈溢出风险。
ListBuffer使用示例:
val buf: ListBuffer[Int] = new ListBuffer[Int] //往后添加 buf += 1 buf += 2 //前缀添加 val buf2 = 3 +: buf println(buf2.toString()) //ListBuffer转List println(buf2.toList.toString())
List常用方法
- 参考底部附录:
Scala队列和栈
队列
如果你需要先进先出序列,你可以使用Queue(队列)。Scala集合提供了可变和不可变的Queue。
不可变Queue代码示例:
//使用伴生对象创建一个queue val que = Queue[Int]() //使用enqueue为不可变队列添加元素 val que1 = que.enqueue(1) //往队列添加多个元素,把集合作为enqueue的参数 val que2 = que1.enqueue(List(2,3,4,5)) //从队列头部移除元素,使用dequeue //第一个参数为头部移除的元素,第二个参数为剩下的队列 val (elem1,que3) = que2.dequeue //打印移除的元素 println(elem1) //打印剩下的队列 println(que3)
打印结果为:
1 Queue(2, 3, 4, 5)
可变Queue代码示例:
//使用伴生对象创建一个可变queue var que = scala.collection.mutable.Queue[String]() //使用 += 符号添加单个元素 que += "A" //使用 ++= 符号添加多个元素 que ++= List("B","C","D") //使用dequeue移除头部元素 val a = que.dequeue //打印移除的元素 println(a) //打印队列中剩下的元素 print(que)
打印结果:
A Queue(B, C, D)
栈
如果需要的是后进先出,你可以使用Stack,它同样在Scala的集合中有可变和不可变版本。元素的推入使用push,弹出用pop,只获取栈顶元素而不移除可以使用top。
可变栈示例:
//使用Stack类的伴生对象创建Stack对象 var stack = scala.collection.mutable.Stack[Int]() //往栈stack中压如元素 stack.push(1) stack.push(2) stack.push(3) //打印查看栈内元素 println(stack) //获取栈顶元素的值 val tval = stack.top println("栈顶元素为 : " + tval) //移除栈顶元素 val pval = stack.pop() println("移除的栈顶元素为 : " + pval) //打印移除栈顶元素后,剩下的栈内元素 println(stack)
打印结果:
Stack(3, 2, 1) 栈顶元素为 : 3 移除的栈顶元素为 : 3 Stack(2, 1)
队列和栈常用操作
- 参考底部附录:
Scala Set(集)
- Scala Set(集)是没有重复的对象集合,所有的元素都是唯一的。
- Scala 集合分为可变的和不可变的集合。
- 默认情况下,Scala 使用的是不可变集合,如果想使用可变集合,需引用 scala.collection.mutable.Set 包。
- 默认引用 scala.collection.immutable.Set。
不可变集合实例如下:
val set = Set(1,2,3) println(set.getClass.getName) // println(set.exists(_ % 2 == 0)) //true println(set.drop(1)) //Set(2,3)
打印结果为:
scala.collection.immutable.Set$Set3 true Set(2, 3)
如果需要使用可变集合需要引入 scala.collection.mutable.Set:
import scala.collection.mutable.Set // 可以在任何地方引入 可变集合 val mutableSet = Set(1,2,3) println(mutableSet.getClass.getName) // scala.collection.mutable.HashSet //往集合内添加元素4 mutableSet.add(4) //删除值为1的元素 mutableSet.remove(1) //添加元素5 mutableSet += 5 //删除值为3的元素 mutableSet -= 3 println(mutableSet) // Set(5, 3, 4) val another = mutableSet.toSet println(another.getClass.getName) // scala.collection.immutable.Set
注意: 虽然可变Set和不可变Set都有添加或删除元素的操作,但是有一个非常大的差别。对不可变Set进行操作,会产生一个新的set,原来的set并没有改变,这与List一样。 而对可变Set进行操作,改变的是该Set本身,与ListBuffer类似。
Set集合基本操作
Scala Set集合有三个基本操作:
- head 返回集合第一个元素
- tail 返回一个集合,包含除了第一元素之外的其他元素
- isEmpty 在集合为空时返回true
对于Scala集合的任何操作都可以使用这三个基本操作来表达。
代码示例如下:
val site = Set("Sina", "Google", "Baidu") val nums: Set[Int] = Set() println( "head : " + site.head ) println( "tail : " + site.tail ) println( "isEmpty : " + site.isEmpty ) println( "isEmpty : " + nums.isEmpty )
打印结果为:
head : Sina tail : Set(Google, Baidu) isEmpty : false isEmpty : true
连接集合
你可以使用 ++ 运算符或 Set.++() 方法来连接两个集合。如果元素有重复的就会移除重复的元素。实例如下:
val site1 = Set("Sina", "Google", "Baidu") val site2 = Set("Faceboook", "Taobao") // ++ 作为运算符使用 var site = site1 ++ site2 println( "site1 ++ site2 : " + site ) // ++ 作为方法使用 site = site1.++(site2) println( "site1.++(site2) : " + site )
打印结果为:
site1 ++ site2 : Set(Faceboook, Taobao, Sina, Google, Baidu) site1.++(site2) : Set(Faceboook, Taobao, Sina, Google, Baidu)
查找集合中最大与最小元素
你可以使用 Set.min 方法来查找集合中的最小元素,使用 Set.max 方法查找集合中的最大元素。实例如下:
val num = Set(5,6,9,20,30,45) // 查找集合中最大与最小元素 println( "Set(5,6,9,20,30,45) 最小元素是 : " + num.min ) println( "Set(5,6,9,20,30,45) 最大元素是 : " + num.max )
打印结果为:
Set(5,6,9,20,30,45) 最小元素是 : 5 Set(5,6,9,20,30,45) 最大元素是 : 45
交集
你可以使用 Set.& 方法或 Set.intersect 方法来查看两个集合的交集元素。实例如下:
val num1 = Set(5,6,9,20,30,45) val num2 = Set(50,60,9,20,35,55) // 交集 println( "num1.&(num2) : " + num1.&(num2) ) println( "num1.intersect(num2) : " + num1.intersect(num2) )
打印结果为:
num1.&(num2) : Set(20, 9) num1.intersect(num2) : Set(20, 9)
Scala Set 常用方法
- 参考底部附录:
Scala Map(映射)
- Map(映射)是一种可迭代的键值对(key/value)结构。
- 所有的值都可以通过键来获取。
- Map 中的键都是唯一的。
- Map 也叫哈希表(Hash tables)。
- Map 有两种类型,可变与不可变,区别在于可变对象可以修改它,而不可变对象不可以。
- 默认情况下 Scala 使用不可变 Map。如果你需要使用可变集合,你需要显式的引入 import scala.collection.mutable.Map 类
- 在 Scala 中 你可以同时使用可变与不可变 Map,不可变的直接使用 Map,可变的使用 mutable.Map。
以下实例演示了不可变 Map 的应用:
// 空哈希表,键为字符串,值为整型 var A:Map[Char,Int] = Map() // Map 键值对演示 val lang= Map("Java" -> "Oracle", "C#" -> "Microsoft") 或者 val lang= Map(("Java","Oracle"), ("C#" , "Microsoft"))
定义 Map 时,需要为键值对定义类型。如果需要添加 key-value 对,可以使用 + 号,如下所示:
A += ('t' ->10 )
Map 基本操作
Scala Map 几种基本操作:keys、values、isEmpty、赋值(可变映射)
代码示例:
Keys:
val lang = Map("Java" -> "Oracle", "C#" -> "Microsoft", "Swift" -> "Apple") Values: val nums: Map[Int, Int] = Map() println( "lang 中的键为 : " + lang.keys ) println( "lang 中的值为 : " + lang.values )
isEmpty:
println( "lang 是否为空 : " + lang.isEmpty ) println( "nums 是否为空 : " + nums.isEmpty )
keys和isEmpty的打印结果为:
lang 中的键为 : Set(Java, C#, Swift) lang 中的值为 : MapLike(Oracle, Microsoft, Apple) lang 是否为空 : false nums 是否为空 : true
赋值:
var lang= scala.collection.mutable.Map("Java" -> "Oracle", "C#" -> "Microsoft") lang("Java") = "sun" println(lang)
打印结果为:
Map(C# -> Microsoft, Java -> sun)
Map 合并
你可以使用 ++ 运算符或 Map.++() 方法来连接两个 Map,Map 合并时会移除重复的 key。以下演示了两个 Map 合并的实例:
val lang =Map("Java" -> "Oracle", "C#" -> "Microsoft", "Swift" -> "Apple") val color = Map("blue" -> "#0033FF", "yellow" -> "#FFFF00", "red" -> "#FF0000") // ++ 作为运算符 var colors = lang ++ color println( "lang ++ colors : " + colors ) // ++ 作为方法 colors = lang.++(colors) println( "lang.++(colors)) : " + colors )
打印结果为:
lang ++ colors : Map(blue -> #0033FF, C# -> Microsoft, yellow -> #FFFF00, Java -> Oracle, red -> #FF0000, Swift -> Apple) lang.++(colors)) : Map(blue -> #0033FF, C# -> Microsoft, yellow -> #FFFF00, Java -> Oracle, red -> #FF0000, Swift -> Apple)
输出 Map 的 keys 和 values
以下通过 foreach 循环输出 Map 中的 keys 和 values:
val lang =Map("Java" -> "Oracle", "C#" -> "Microsoft", "Swift" -> "Apple") lang.keys.foreach{ i => print( "Key = " + i ) println("\tValue = " + lang(i) )}
打印结果为:
Key = JavaValue = Oracle Key = C#Value = Microsoft Key = SwiftValue = Apple
查看 Map 中是否存在指定的 Key
你可以使用 Map.contains 方法来查看 Map 中是否存在指定的 Key。实例如下:
val lang =Map("Java" -> "Oracle", "C#" -> "Microsoft", "Swift" -> "Apple") if(lang.contains("Swift")) { println(lang("Swift")+"创造了 Swift 语言") }
打印结果为:
Apple创造了 Swift 语言
迭代映射
val lang = Map("Java" -> "Oracle", "C#" -> "Microsoft") for ((k, v) <- lang) { println(k + " : " + v) }
打印结果为:
Java : Oracle C# : Microsoft
映射中K,V反转
val lang = Map("Java" -> "Oracle", "C#" -> "Microsoft") val lang2 = for ((k, v) <- lang) yield (v, k) for ((k, v) <- lang2) { println(k + " : " + v) }
打印结果为:
Oracle : Java Microsoft : C#
已排序映射
//按照key的字典顺序排序。 val scores = scala.collection.immutable.SortedMap(("Bob", 8), ("Alice", 21), ("Fred", 17), ("Cindy", 15)) scores.foreach(person => println(person._1 + " : " + person._2))
打印结果为:
Alice : 21 Bob : 8 Cindy : 15 Fred : 17
Scala Map常用方法
- 参考底部附录:
Scala Tuple(元组)
与列表一样,元组也是不可变的,但与列表不同的是元组可以包含不同类型的元素。
元组的值是通过将单个的值包含在圆括号中构成的。例如:
//元组中定义了三个元素,对应的类型分别为[Int, Double, java.lang.String]。 val tuple1 = (1, 5.20, "Spark") //或者 val tuple2 = new Tuple3(1,5.20,"Spark")
我们可以使用 tuple1._1 访问第一个元素, tuple1._2 访问第二个元素,如下所示:
//元组中定义了三个元素,对应的类型分别为[Int, Double, java.lang.String]。 val tuple1 = (1, 5.20, "Spark") println(tuple1._1 + " : " + tuple1._2 + " : " + tuple1._3)
打印结果为:
1 : 5.2 : Spark
迭代元组
你可以使用 Tuple.productIterator() 方法来迭代输出元组的所有元素:
//元组中定义了三个元素,对应的类型分别为[Int, Double, java.lang.String]。 val tuple1 = (1, 5.20, "Spark") tuple1.productIterator.foreach{i => println("value : " + i)}
打印结果为:
value : 1 value : 5.2 value : Spark
元组转为字符串
你可以使用 Tuple.toString() 方法将元组的所有元素组合成一个字符串,实例如下:
//元组中定义了三个元素,对应的类型分别为[Int, Double, java.lang.String]。 val tuple1 = (1, 5.20, "Spark") println(tuple1.toString())
打印结果为:
(1,5.2,Spark)
元素交换
你可以使用 Tuple.swap 方法来交换元组的元素。如下实例:
//元组中定义了两个元素,对应的类型分别为[Int, java.lang.String]。 val tuple1 = (1, "Spark") //注意:swap函数只能用于两个元素元组 println(tuple1.swap)
打印结果为:
(Spark,1)
使用模式匹配获取元组
代码示例:
val t = (1, 3.14, "Fred") val (first, second, third) = t println(first + " : " + second + " : " + third)
打印结果:
1 : 3.14 : Fred
拉链操作
val num = Array(1, 2, 3) val str = Array("first", "second", "third") val com = num.zip(str).toMap println(com(1)+" : "+com(2)+" : "+com(3))
打印结果为:
first : second : third
元组常用方法
- 参考底部附录:
Scala Option(选项)
Scala Option(选项)类型用来表示一个值是可选的(有值或无值)。
Option[T] 是一个类型为 T 的可选值的容器: 如果值存在, Option[T] 就是一个 Some[T] ,如果不存在, Option[T] 就是对象 None 。
代码示例:
val myMap: Map[String, String] = Map("key1" -> "value") val value1: Option[String] = myMap.get("key1") val value2: Option[String] = myMap.get("key2") println(value1) // Some("value1") println(value2) // None
打印结果为:
Some(value) None
Option 有两个子类别,一个是 Some,一个是 None,当他回传 Some 的时候,代表这个函式成功地给了你一个 String,而你可以透过 get() 这个函式拿到那个 String,如果他返回的是 None,则代表没有字符串可以给你。
通过模式匹配来输出匹配值。
代码示例:
val lang =Map("Java" -> "Oracle", "C#" -> "Microsoft", "Swift" -> "Apple") println(show(lang.get("Swift"))) println(show(lang.get("Scala"))) def show(x:Option[String]) = x match { case Some(s) => s case None => "?" }
打印结果为:
Apple ?
getOrElse() 方法
你可以使用 getOrElse() 方法来获取元组中存在的元素或者使用其默认的值,实例如下:
val a:Option[Int] = Some(5) val b:Option[Int] = Some(7) val c:Option[Int] = None println("a.getOrElse(0): " + a.getOrElse(0) ) println("b.getOrElse(1): " + b.getOrElse(1) ) println("c.getOrElse(10): " + c.getOrElse(10))
打印结果为:
a.getOrElse(0): 5 b.getOrElse(1): 7 c.getOrElse(10): 10
isEmpty() 方法
你可以使用 isEmpty() 方法来检测元组中的元素是否为 None,实例如下:
val a:Option[Int] = Some(5) val b:Option[Int] = None println("a.isEmpty: " + a.isEmpty ) println("b.isEmpty: " + b.isEmpty )
打印结果为:
a.isEmpty: false b.isEmpty: true
Scala Option 常用方法
- 参考底部附录:
Scala Iterator(迭代器)
- Scala Iterator(迭代器)不是一个集合,它是一种用于访问集合的方法。
- 迭代器 it 的两个基本操作是 next 和 hasNext。
- 调用 it.next() 会返回迭代器的下一个元素,并且更新迭代器的状态。
- 调用 it.hasNext() 用于检测集合中是否还有元素。
让迭代器 it 逐个返回所有元素最简单的方法是使用 while 循环:
val it = Iterator("Baidu", "Google", "Tencent", "Taobao") while (it.hasNext){ println(it.next()) }
打印结果为:
Baidu Google Tencent Taobao
查找最大与最小元素
你可以使用 it.min 和 it.max 方法从迭代器中查找最大与最小元素,实例如下:
val ita = Iterator(20, 40, 2, 50, 69, 90) val itb = Iterator(20, 40, 2, 50, 69, 90) println("最大元素是:" + ita.max) println("最小元素是:" + itb.min)
执行结果为:
最大元素是:90 最小元素是:2
获取迭代器的长度
你可以使用 it.size 或 it.length 方法来查看迭代器中的元素个数。实例如下:
val ita = Iterator(20, 40, 2, 50, 69, 90) val itb = Iterator(20, 40, 2, 50, 69, 90) println("ita.size : " + ita.size) println("itb.length : " + itb.length)
打印结果为:
ita.size : 6 itb.length : 6
Scala Iterator 常用方法
- 参考底部附录:
附录:
List常用方法
队列和栈常用操作
Scala Set 常用方法
Scala Map常用方法
元组常用方法
Scala Option 常用方法
Scala Iterator 常用方法