ข้อแตกต่างของ Join & Union, Relationship และ Data Blending ใน Tableau Desktop

August 25, 2023

by Keattipong Daikarn

Tableau join relationship_resize

Tableau Desktop ถือเป็นอีกหนึ่งเครื่องมือด้าน Visual Analytics ที่ได้รับความนิยมจากผู้ใช้งาน มาอย่างยาวนาน ด้วยหน้าตาโปรแกรมที่ออกแบบมาให้ใช้งานได้ง่าย และมีรูปแบบของ Visualization ที่สวยงามโดยใจผู้ใช้งาน แต่เชื่อว่ามือใหม่หลายๆ ท่านน่าจะมีความสงสัยในโหมดการรวมตาราง หรือ รวมแหล่งข้อมูลของ Tableau ที่มีหลายรูปแบบ ไม่ว่าจะเป็น Join & Union, Data Blending และ Relationship. ว่ามันแตกต่างกันอย่างไร และจะเลือกใช้อย่างไรจึงจะเหมาะสม บทความนี้มีคำแนะนำให้ครับ

ตามปกติ หากเรานำข้อมูลเข้ามาวิเคราะห์ หรือสร้าง Visualization เพียงตารางเดียว เราไม่จำเป็นต้องเรื่องของ Join, Relationship หรือ Data Blending เพราะเราสามารถสร้างกราฟ หรือวิเคราะห์ข้อมูลได้เลยจากตารางที่นำเข้ามา

แต่ในกรณีที่เรามีแหล่งข้อมูลมากกว่า 1 ตาราง (หรือ 1 แหล่งข้อมูล) และต้องนำข้อมูลจากทุกตาราง มาวิเคราะห์ร่วมกัน เราจำเป็นต้องนำข้อมูลจากหลายๆ ตารางนั้น มารวมกันก่อน เพื่อให้สามารถทำการวิเคราะห์ข้อมูลร่วมกันได้ ซึ่งแนวทางการรวมข้อมูลของ Tableau Desktop สามารถทำได้ 3 รูปแบบ คือ Relationships, Join & Union และ Data Blending

Join & Union

จากภาพ เราต้องการนำตาราง Table 1 และ Table 2 เข้ามาวิเคราะห์ใน Tableau Desktop เราต้องทำการรวมตาราง 1 เข้ากับตาราง 2 ก่อน จึงจะสามารถนำข้อมูลมาวิเคราะห์ร่วมกันได้ โดยการรวมข้อมูลอาจทำได้ 2 รูปแบบคือ การ Join ข้อมูล (นำคอลัมน์ของตารางที่ 2 ให้ไปรวมกับตารางที่ 1) หรือ ใช้กาาร Union เพื่อรวมข้อมูลของทั้งสองตาราง (กรณีที่ตาราง 1, 2 เป็นข้อมูลแบบเดียวกัน มีโครงสร้างเหมือนกัน จึงจะเลือกใช้การ Union)

กรณีการ Join ข้อมูล ตาราง Table 1 และ Table 2 ต้องมีคอลัมน์ที่สามารถเชื่อมโยงกันได้ (คือคอลัมน์ที่มีข้อมูลที่อ้างอิงกันได้) จึงจะสามารถนำมา Join กันได้ หากไม่มีการสร้างคอลัมน์ดังกล่าวไว้ ก็ไม่สามารถทำการ Join ได้

กรณี Union ตารางทั้งสองตาราง จะต้องมีโครงสร้างข้อมูลที่เหมือนกัน เช่นตารางยอดขายเดือนมกราคม และยอดขายเดือนกุมภาพันธ์ เป็นต้น การ Union จะเป็นการนำแถวของข้อมูลของทั้งสองตารางมารวมกันนั่นเอง

ผลลัพธ์ของการ Join หรือ Union ก็คือ ข้อมูลจาก 2 ตาราง จะมารวมกันเป็น 1 ตาราง ตอนนำไปใช้งานก็สามารถใช้งานได้เสมือนว่าเรานำเข้าข้อมูล 1 ตารางนั่นเอง

Relationships

จากภาพ เราต้องการนำตาราง Table 1 และ Table 2 เข้ามาวิเคราะห์ร่วมกันใน Tableau Desktop เช่นเดียวกับกรณีแรก (จะเหมือนกับการ Join หรือการรวมคอลัมน์ของตารางที่ 1 และ 2) ในการเลือกใช้การรวมข้อมูลแบบ Relationship ข้อมูลในตาราง จะไม่ถูกนำมาร่วมกันจริงๆ แต่จะใช้การสร้างเส้นความสัมพันธ์ (Relationship) เพื่อเชื่อมข้อมูลของ 2 ตารางเข้าด้วยกันแทน ผลลัพธ์ที่ได้คือ เราสามารถนำข้อมูลจากทั้งสองตาราง มาวิเคราะห์ร่วมกันได้ เช่นเดียวกับการ Join ข้อมูลตามปกตินั่นเอง

ข้อดีของ Relationship คือจะเหมาะกับกรณีที่ตารางข้อมูลที่ต้องการนำมาวิเคราะห์มีขนาดใหญ่ (มีจำนวน Record, จำนวน Column มาก) ซึ่งหากใช้รูปแบบการ Join ตารางข้อมูล อาจทำให้ประสิทธิภาพของ Model ลง

ซึ่งการรวมข้อมูลแบบ Join และ Relationship นั้นจะให้ผลลัพธ์ที่เหมือนกัน (แม้ว่าตารางที่ออกมาอาจต่างกันเล็กน้อย) เราสามารถเลือกใช้รูปแบบใดก็ได้ตามความเหมาะสม และความถนัดของผู้ใช้งาน

Data Blending

จากภาพ เราต้องการนำตาราง Table 3 เข้าไปทำการวิเคราะห์ร่วมกับข้อมูลใน Data source แต่ติดปัญหาที่เราไม่สามารถนำข้อมูลไป Join หรือ สร้าง Relationship กับตารางที่มีอยู่แล้วได้โดยตรง เช่น คอลัมน์ที่ใช้ในการสร้างความสัมพันธ์ของตาราง Table 3 อาจมีไม่ครบตามที่ควรจะเป็น ทำให้ Join หรือ Relationship ไม่ได้

หากเราต้องการนำข้อมูลมาวิเคราะห์ อาจใช้รูปแบบ Data Blending เพื่อรวมข้อมูลชุดแรกเข้าด้วยกันก่อน (โดยการ Join หรือ Relationship) จากนั้น จึงนำตาราง Table 3 มาเชื่อมกับข้อมูลที่รวมกันเป็น Data source แล้ว โดยจะใช้รูปแบบการสร้าง หรือกำหนด Relationship ระหว่าง Data source กับ ตาราง Table 3 ขึ้นมาใหม่ ซึ่งจะทำให้สามารถใช้ข้อมูลในตาราง Table 3 ไปวิเคราะห์ร่วมกับข้อมูลหลักได้ตามต้องการ

ทั้งนี้ตาราง Table 3 ต้องมีคอลัมน์ที่สามารถเชื่อมกับ Data source ที่เป็นข้อมูลหลักด้วย หากไม่มี ก็จะไม่สามารถใช้งานได้

ข้อแตกต่างระหว่าง Data Blending กับการรวมข้อมูลแบบอื่นๆ

กรณีเราใช้การรวมข้อมูลแบบ Join, Union หรือ Relationship นั้น จะเป็นการรวมข้อมูลเพื่อสร้าง Data source ของ Tableau ทำให้สามารถนำข้อมูลที่ได้ไปสร้างเป็นรายงานได้มากกว่า 1 กราฟ

แต่ในกรณี Data Blending จะเป็นการรวมข้อมูลของ Data source (ที่มาจากการ Join หรือ Relationship) กับข้อมูลที่ต้องการ กรณีนี้ 1 Blend จะสามารถสร้างได้เพียง 1 กราฟเท่านั้น หากต้องการสร้างกราฟเพิ่ม ต้องทำการกำหนด Blend ใหม่เสมอ

Share this post:
Facebook
Twitter
LinkedIn
WhatsApp

Discover more articles