7 Data Visualization Libraries ใน Python ที่คุณควรลองใช้

28-เม.ย.-21

คัมภีร์เทพ IT

Data Visualization เป็น Process เพื่อทำความเข้าใจข้อมูลโดยละเอียดให้มากขึ้นโดยใช้การ Plot และ Graph บางตัว มี Libraries มากมายใน Python ที่ช่วยให้เราทำเช่นนั้น หนึ่งใน Libraries ที่มีชื่อเสียงที่สุดก็คือ matplotlib แต่ปัญหาเดียวก็คือมันใช้งานยากมากสำหรับผู้เริ่มต้น ในบทความนี้จะแนะนำ 7 Data Visualization Libraries ใน Python ที่คุณควรลองใช้ ซึ่งคุณสามารถใช้พวกมันแทน matplotlib ได้

1. Seaborn

Seaborn ถูกสร้างขึ้นเพื่อต่อยอด matplotlib Library มันมี Built-in Functions มากมายที่คุณสามารถใช้สร้าง Plot ที่สวยงามได้ด้วย Code ง่าย ๆ ไม่กี่บรรทัด มันมี Visualization Plots ในขั้น Advance ที่หลากหลายพร้อมกับ Syntax ที่เรียบง่าย เช่น Box Plots, Violin Plots, Dist Plots, Joint Plots, Pair Plots, Heatmap และอื่น ๆ อีกมากมาย

Features หลัก ๆ ของมัน: 

  • มันสามารถถูกใช้เพื่อกำหนดความสัมพันธ์ระหว่าง 2 ตัวแปร
  • ใช้แยกความแตกต่างเมื่อต้องวิเคราะห์ Uni-Variate Distributions หรือ Bi-Variate Distributions
  • ใช้ Plot Linear Regression Model สำหรับตัวแปรตาม
  • มี Multi-Grid Plotting ให้คุณได้ใช้

การติดตั้ง: pip install seaborn

Code ง่าย ๆ สำหรับแสดงแนวโน้มและการกระจายของข้อมูลใน iris dataset โดยใช้ Seaborn Pair Plots: 

นี่คือ Documentation ฉบับสมบูรณ์สำหรับคุณ ในการเริ่มต้นใช้งาน Library นี้

2. Plotly

Plotly เป็น Python Analytics Library ขั้น Advance ที่ช่วยในการสร้าง Interactive Dashboards โดย Graph ที่สร้างโดยใช้ Plotly จะเป็นการ Plot แบบ Interactive ซึ่งหมายความว่า คุณสามารถค้นหาค่าที่จุดใดจุดหนึ่งหรือ Session ของ Graph ได้อย่างง่ายดาย Plotly ยังทำให้การสร้าง Dashboard และการ Deploy บน Server ทำได้ง่ายขึ้น อีกทั้งมันยังรองรับภาษา Programming อย่าง Python, R และ Julia อีกด้วย

คุณสามารถสร้าง Graph โดยใช้ Plotly ได้หลากหลายแบบ:

  • Basic Charts
  • Statistical charts
  • Scientific charts
  • Financial Charts
  • Maps
  • Subplots
  • Transforms
  • Jupyter Widgets Interaction

Link: Plotly Documentation

Code สำหรับ Scatter Plot อย่างง่าย โดยใช้ Plotly จาก Official Document: 

3. Geoplotlib

มันเป็น Python Toolbox สำหรับแสดง Geographical Data และสร้างแผนที่ คุณสามารถสร้างแผนที่ได้หลากหลายแบบโดยใช้ Library นี้ ตัวอย่างบางส่วนของแผนที่ที่คุณสามารถสร้างได้ เช่น Heatmaps, Dot-Density Maps, Geographical Maps และอื่น ๆ อีกมากมาย

Source

การติดตั้ง: pip install geoplotlib

Documentation: User Guide สำหรับ Geoplotlib

4. Gleam

Gleam ได้รับแรงบันดาลใจจาก Shiny Package ของภาษา R มันจะช่วยให้คุณสามารถแปลง Graph ของคุณเป็น Web Apps ที่น่าทึ่งโดยใช้เพียง Python Code สิ่งนี้มีประโยชน์อย่างยิ่งสำหรับผู้ที่ยังไม่มีความรู้เกี่ยวกับ HTML และ CSS มากนัก แม้มันจะไม่ใช่ Visualization Library อย่างแท้จริง แต่คุณสามารถใช้งานมันร่วมกับ Visualization Library อื่น ๆ ได้

Documentation อย่างเป็นทางการและ Start Guide: Gleam Github Repo

Source

5. ggplot

ggplot มีการทำงานที่แตกต่างจาก matplotlib มันช่วยให้คุณสามารถเพิ่มหลาย ๆ Components เป็น Layers เพื่อสร้าง Graph หรือ Plot ที่สมบูรณ์ในท้ายที่สุด อย่างเช่น ในตอนเริ่มต้น คุณสามารถเพิ่มแกน(Axis) จากนั้นก็เป็นจุด(Point) และ Components อื่น ๆ เช่น Trend Line

โดยทั่วไป คุณคงได้ยินคำแนะนำที่ว่า คุณควรจัดเก็บ Data ของคุณใน Data Frame ก่อนที่จะใช้งาน ggplot เพื่อให้ได้ผลลัพธ์ที่ง่ายและมีประสิทธิภาพ

การติดตั้ง: pip install ggplot

หากต้องการข้อมูลเพิ่มเติมเกี่ยวกับ Library คุณสามารถเยี่ยมชมได้ที่ Github Repo ได้ นอกจากนี้ยังมี Webpage ที่มี Documentation อย่างเป็นทางการอีกด้วย

6. Bokeh

Bokeh Library ถูกสร้างขึ้นโดย Continuum Analytics เพื่อสร้าง Visualization ที่เป็นมิตรกับ Web Interfaces และ Browsers โดยทั่วไปแล้ว Visualizations ที่ถูกสร้างขึ้นโดย Bokeh Library จะเป็นลักษณะ Interactive ซึ่งจะช่วยให้คุณสามารถสื่อความหมายของข้อมูลได้มากขึ้น

Documents อย่างเป็นทางการ: Bokeh Docs

Tutorials เพื่อช่วยให้คุณ สามารถเริ่มต้นใช้งาน Library ได้:

7. Missingo

Data Science เป็นสิ่งที่เกี่ยวกับการค้นหาข้อมูลที่เป็นประโยชน์จาก Data ที่คุณมีอยู่ และทำให้ทุกคนสามารถมองเห็นและเข้าใจได้ ซึ่งวิธีที่ดีที่สุดคือ การนำ Data มาแสดงในรูปแบบที่เข้าใจง่ายขึ้น Package นี้น่าจะเป็นประโยชน์สำหรับ Data Scientist แทบทุกคน มันช่วยให้คุณค้นหา Missing Values ทั้งหมดและแสดงพวกมันในรูปแบบ Graphic ที่สวยงาม ใน Datasets ที่มีอยู่จริง ๆ โดยไม่ต้องปวดหัวกับ Code ให้มากมาย มันรองรับการแสดง Graphic เช่น Bar Plots, Charts, Heatmap, Dendrograms และอื่น ๆ

การติดตั้ง: pip install missingno

ลองมาใช้ Package เพื่อแสดง ค่า Null ทั้งหมดใน Titanic Dataset ที่มีชื่อเสียง และนี่ก็คือ Code:

Missing Values Visualization โดยใช้ missingno บน titanic dataset

ที่มา:  https://betterprogramming.pub/

 

 

รับตำแหน่งงานไอทีใหม่ๆ ด้วยบริการ IT Job Alert

 

อัพเดทบทความจากคนวงในสายไอทีทาง LINE ก่อนใคร
อย่าลืมแอดไลน์ @techstarth เป็นเพื่อนนะคะ

เพิ่มเพื่อน

 

บทความล่าสุด