ตัวอย่างการสร้าง Portfolio Project สำหรับ Data Analyst

04-พ.ย.-22

คัมภีร์เทพ IT

Portfolio Project สำหรับคนที่เป็น Data Analyst อาจเป็นเรื่องที่ค่อนข้างยากทั้งการหาตัวอย่าง และ สำหรับบทความนี้จะมาแนะนำ ตัวอย่างการสร้าง Portfolio Project สำหรับ Data Analyst ที่จะครอบคลุมทั้ง ปัญหา, ข้อผิดพลาด และเราจะมาดูการทำ Project ไปทีละขั้นตอน

เรามาเริ่มต้นกันด้วยการตั้ง “เป้าหมาย” ซึ่งก็คือ การ Develop Database เพื่อ Analyze และ Visualize ข้อมูลของการจองโรงแรม

คำถาม

  • รายได้ (Revenue) ของโรงแรม เติบโตขึ้นทุกปีหรือไม่?
  • เราควรเพิ่มขนาดพื้นที่จอดรถ (Car Park Size) ของโรงแรมไหม?
  • เราเห็นแนวโน้ม (Trends) อะไรบ้าง ในข้อมูล?

FIG.1 PROJECT PIPELINE

ดังที่คุณเห็น Project Pipeline จากด้านบนนี้ เราจะดำเนินการการวิเคราะห์นี้ต่อไป โดยเริ่มขั้นตอนแรกด้วยการสร้าง Database

คุณสามารถดู Dataset ได้ที่นี่: HOTEL DATASET

ในการเริ่มจัดการ Dataset เราจะต้องเริ่มต้นด้วยการ Clean และ Join Tables ต่าง ๆ ของปี 2018, 2019 และ 2020 เนื่องจาก Dataset มีขนาดใหญ่มาก เราจึงใช้ SQL เพื่อ Join พวกมันเข้าด้วยกัน และทำให้เป็น Dataset ขนาดใหญ่เพียงชุดเดียว และหลังจากทำเสร็จแล้ว คุณจะมีข้อมูลมากกว่า 100,000 Rows ดังนั้น โปรดใช้ความระมัดระวังในขณะที่คุณเขียน Query เนื่องจากมีโอกาสที่คุณอาจได้เจอกับ Errors ต่าง ๆ

ด้านล่างนี้คือ SQL Query ที่ใช้ในการ Join Databases

FIG.2 SQL QUERY

หลังจากที่คุณ Join Dataset และทำให้มันเป็น Table เดียวเสร็จแล้ว เราจะไปยังส่วนการ Visualize กันต่อ ซึ่งเราจะใช้ POWER BI เป็น Visualization Tool

ก่อนที่เราจะเริ่มต้นใช้งาน Power BI เราจะต้องเชื่อมต่อกับ SQL Server และทำการ Import Data

หลังจาก Import Data แล้ว เราจะสร้าง Columns และ Measures (หน่วยวัด) เพิ่มเติมอีกเล็กน้อย ซึ่งถือเป็นสิ่งที่จำเป็นสำหรับการวิเคราะห์ให้เสร็จสิ้น

สำหรับ Dataset และงานที่เราต้องทำ เราจะต้องสร้าง Columns และ Measures

  • Revenue (Column):

Revenue = ([Stays in Week Nights+ Stays in Week days]) * (ADR) * (1-Discount)

หมายเหตุ: ADR คืออัตราเฉลี่ยรายวัน

  • Total Nights (Measure):

Total Nights = SUM(QueryStays_in_Week_Nights]) + SUM(QueryStays_in_Weekend_Nights])

  • Parking Percentage:

Parking Percentage = SUM(Query1[Required_Car_Parking_Spaces]) / [Total Nights]

ตอนนี้เราได้จัดเรียง Dataset ของเราและทุกอย่างก็พร้อมแล้ว ต่อไปเราจะเริ่มทำในส่วนของ Visualization แต่โปรดทราบว่า วิธีที่เราจะสร้าง Dashboard นั้นเป็นเรื่องที่สำคัญ เพราะเป็นส่วนที่เปิดกว้างให้คุณใส่ความคิดสร้างสรรค์และคุณสามารถสร้างพวกมันได้ตามที่ต้องการ

FIG.3 Power BI DASHBOARD

จาก Dashboard ด้านบน ถือเป็นวิธีหนึ่งที่คุณสามารถทำได้ ในขณะที่เราแบ่งออกเป็น 3 Sections พวกค่าที่สำคัญ ๆ ทั้งหมด จะถูกวางไว้ใน Section แรก โดยมีเส้นแสดง Trend ที่ด้านล่าง เพื่อให้ง่ายต่อการทำความเข้าใจกับ Trends

ใน Section ที่ 2 ประกอบด้วย วัตถุประสงค์หลักของ Project ซึ่งจะแสดง Revenue ตามสถานะของการจองห้องพัก เนื่องจากเป็นหนึ่งในแง่มุมที่มีประโยชน์ที่สุดของ Dashboard มันจึงถูกเก็บไว้ในส่วนตรงกลาง โดยที่ไม่มีการแสดงข้อมูลในส่วนอื่น ๆ

ส่วน Section ที่ 3 ซึ่งเป็น Section สุดท้ายมี Filters, Tables และ Pie-Charts ทั้งหมด ซึ่งเราอาจเรียกพวกมันว่า "Helping Hands" ซึ่งจะช่วยให้คุณสามารถค้นหาคำตอบที่แม่นยำและเฉพาะเจาะจงมากขึ้น

สรุป

มาถึงบทสรุปของ Project เราจะมาตอบคำถามที่เราถามในช่วงต้นกัน

1. Revenue: รายได้ นับเป็นสิ่งที่เห็นได้ชัดเจน คือมันเติบโตขึ้นตั้งแต่ปี 2014 ถึง 2019 แต่มันกลับลดลงในปี 2020 เนื่องจากสาเหตุที่พวกเราทราบกันดีอยู่แล้ว นั่นคือ Covid-19 ที่เกิดสถานการณ์ Shut Down ประเทศกันทั่วโลก

2. Car Park Size: เราไม่สามารถกำหนดขนาดที่สูงสุดของพื้นที่จอดรถได้ เนื่องจากข้อมูลยังไม่เพียงพอ เมื่อคุณเจาะลึกถึงรายละเอียดของโรงแรม คุณจะเห็นว่า อัตราการจอดรถไม่ผันผวนมากนัก

3. Trends: หนึ่งในแนวโน้มที่ชัดเจนที่สุดที่คุณจะเห็นได้ ก็คือ ADR จะอยู่ใน Resort Hotels ในฤดูกาลท่องเที่ยว มากกว่า เมื่อเทียบกับ City Hotels ในขณะที่ช่วงนอกฤดูกาลท่องเที่ยว City Hotels มี ADR มากกว่า Resort Hotels แต่มีอัตรากำไรที่เบาบางมาก

เชื่อว่า ในอนาคตคุณจะมี Portfolio Project ที่น่าทึ่งและมีสิ่งใหม่ ๆ ให้เรียนรู้เพิ่มขึ้นจากจากบทความนี้ และหวังว่าคุณจะหา Project ใหม่ ๆ ทำเพิ่มเติม เพื่อให้ Portfolio ของคุณมีความน่าสนใจมากขึ้น

ที่มา: https://blog.devgenius.io/

 

 

รับตำแหน่งงานไอทีใหม่ๆ ด้วยบริการ IT Job Alert

 

อัพเดทบทความจากคนวงในสายไอทีทาง LINE ก่อนใคร
อย่าลืมแอดไลน์ @techstarth เป็นเพื่อนนะคะ

เพิ่มเพื่อน

 

บทความล่าสุด