Concatenate example

sparkcodegeeks · sparkcodegeeks · commit 70c22cd52d3a · 2020-02-06T22:48:21.000-08:00
diff --git a/src/main/scala/com/sparkbyexamples/spark/dataframe/functions/collection/MapTypeExample.scala b/src/main/scala/com/sparkbyexamples/spark/dataframe/functions/collection/MapTypeExample.scala
@@ -9,7 +9,6 @@ object MapTypeExample extends App {
     .master("local[1]")
     .appName("SparkByExamples.com")
     .getOrCreate()
-  import spark.implicits._
 
   //Creating DF with MapType
   val arrayStructureData = Seq(
@@ -39,7 +38,7 @@ object MapTypeExample extends App {
   val mapTypeDF = spark.createDataFrame(
     spark.sparkContext.parallelize(arrayStructureData),arrayStructureSchema)
   mapTypeDF.printSchema()
-  mapTypeDF.show()
+  mapTypeDF.show(false)
 
   mapTypeDF.select(col("name"),map_keys(col("properties"))).show(false)
   mapTypeDF.select(col("name"),map_values(col("properties"))).show(false)
diff --git a/src/main/scala/com/sparkbyexamples/spark/dataframe/functions/string/SplitExample.scala b/src/main/scala/com/sparkbyexamples/spark/dataframe/functions/string/SplitExample.scala
@@ -0,0 +1,47 @@
+package com.sparkbyexamples.spark.dataframe.functions.string
+
+import org.apache.spark.sql.SparkSession
+import org.apache.spark.sql.functions._
+
+object SplitExample extends App{
+
+  val spark = SparkSession.builder()
+    .appName("SparkByExamples.com")
+    .master("local")
+    .getOrCreate()
+
+  val data = Seq(("James, A, Smith","2018","M",3000),
+    ("Michael, Rose, Jones","2010","M",4000),
+    ("Robert,K,Williams","2010","M",4000),
+    ("Maria,Anne,Jones","2005","F",4000),
+    ("Jen,Mary,Brown","2010","",-1)
+  )
+
+  import spark.sqlContext.implicits._
+  val df = data.toDF("name","dob_year","gender","salary")
+  df.printSchema()
+  df.show(false)
+
+  val df2 = df.select(split(col("name"),",").getItem(0).as("FirstName"),
+    split(col("name"),",").getItem(1).as("MiddleName"),
+    split(col("name"),",").getItem(2).as("LastName"))
+    .drop("name")
+
+  df2.printSchema()
+  df2.show(false)
+
+
+  val splitDF = df.withColumn("FirstName",split(col("name"),",").getItem(0))
+    .withColumn("MiddleName",split(col("name"),",").getItem(1))
+    .withColumn("LastName",split(col("name"),",").getItem(2))
+    .withColumn("NameArray",split(col("name"),","))
+    .drop("name")
+  splitDF.printSchema()
+  splitDF.show(false)
+
+  df.createOrReplaceTempView("PERSON")
+  spark.sql("select SPLIT(name,',') as NameArray from PERSON")
+    .show(false)
+
+
+}