Five Cool Python Libraries for Data Science

13-May-20

คัมภีร์เทพ IT

See the original english version Click here!

 

Python ถือเป็นเพื่อนที่ดีที่สุดสำหรับ Data Scientists ส่วนใหญ่ เนื่องจาก Python มี Library ที่ช่วยทำให้ชีวิตของพวกเขาง่ายขึ้น และในบทความนี้จะมาแนะนำ 5 Python Libraries สำหรับใช้งานใน Data Science ที่หลายคนอาจยังไม่รู้จักและน่าจะมีประโยชน์ในการนำไปประยุกต์ใช้ในงานของคุณ

1. Numerizer

Numerizer เป็น Library ที่น่าทึ่งสำหรับใช้ในการ Convert Text Numerics ไปเป็น Int และ Float สำหรับ Library นี้มีประโยชน์อย่างยิ่งสำหรับ NLP Projects หากคุณอยากทราบรายละเอียดเพิ่มเติมสามารถดูได้ที่ PyPI และ GitHub Repo นี้

การ Install:

ตัวอย่าง:

Output:

2. Missingno

มันถูกใช้งานอย่างแพร่หลายในการหา Missing Values (ค่าที่ขาดหายไป) ใน Dataset เราจำเป็นต้องทำความเข้าใจ Missing Values ก่อนที่จะนำข้อมูลไปใช้งาน โดย Missingno มีวิธีที่ใช้งานได้รวดเร็วและเป็นประโยชน์อย่างยิ่งในการแสดง Missing Values ให้เห็นอย่างชัดเจน

การ Install:

การใช้งาน:

ใน Dummy Dataset มี 11 Rows และ 4 Columns โดย Missing Values ถูกนำเสนอให้เห็นในตัวแปร Min, Temp และ City เราสามารถ Bar Graph และ Matrix เพื่อให้เห็นภาพที่ชัดเจนยิ่งขึ้น นอกจากนี้มันยังรองรับ Heatmap, Dendrogram อีกด้วย สำหรับรายละเอียดเพิ่มเติมสามารถดูได้ที่ Github Repository นี้

Output:

เราสามารถดู Missing Values ใน temp, min และ city จาก Bar Graph และ Matrix ด้านบน

3. Faker

เราอาจเจอสถานการณ์ที่เราจำเป็นต้องสร้าง Test Data หรือ Dummy Data เพื่อใช้ในการวิเคราะห์ของเรา ซึ่งวิธีหนึ่งที่ใช้ในการรับ Dummy Data คือการใช้ Faker Library โดย Library ตัวนี้จะสร้าง Fake Data ขึ้นมาให้คุณอย่างรวดเร็ว

การ Install:

ตัวอย่าง:

Output:

มันสามารถสร้าง Fake Data สำหรับหมวดหมู่ต่าง ๆ ได้ โดยคุณสามารถดูรายละเอียดเพิ่มเติมได้ที่นี่

4. EMOT

การรวบรวมและวิเคราะห์ข้อมูลโดยใช้ Emojis รวมทั้ง Emoticons จะช่วยให้เห็นข้อมูลในเชิงลึกที่เป็นประโยชน์ โดยเฉพาะอย่างยิ่งในการวิเคราะห์ความรู้สึก (Sentiment Analysis) ซึ่ง Emoji ก็คือ รูปภาพที่มีขนาดเล็กพอที่จะแทรกลงในข้อความเพื่อแสดงอารมณ์หรือความคิดได้ ส่วน Emoticon เป็นตัวแทนของการแสดงออกทางสีหน้าของมนุษย์ โดยใช้ตัวอักขระบน Keyboard  เช่น ตัวอักษร ตัวเลข และเครื่องหมายวรรคตอน 

Emot จะช่วยเราในการ Convert Emojis และ Emoticons ออกมาเป็นคำ สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับ Library นี้ สามารถดูได้ที่ Github Repo นี้ มันมี Collection ดี ๆ ของ Emoticons และ Emojis รวมทั้งความหมายที่เป็นคำของพวกมัน

การ Install:

 

การใช้งาน:

Output:

 

การ Convert Emoticon ให้อยู่ในรูปแบบของคำ

การใช้งาน:

Output:

 

5. Chartify

Chartify เป็น Visualization Library ที่มีจุดมุ่งหมายเพื่อช่วยทำให้ Data Scientists สามารถสร้าง Charts ได้ง่ายที่สุด มันมี Syntax ที่ใช้งานง่ายและมีกการจัด Format ของข้อมูลที่สอดคล้องกันอย่างยิ่งเมื่อเทียบกับ Tools อื่น ๆ มันใช้เวลาสั้น ๆ ในการสร้าง Charts ที่สวยงามและรวดเร็ว Library นี้ถูกพัฒนาขึ้นโดย Spotify Labs

จากตัวอย่างด้านล่างนี้ จะขอแสดงเฉพาะ Bar Chart สำหรับรายละเอียดเพิ่มเติมเกี่ยวกับ Chart คุณสามารถดูได้ที่ Documentation และ Github Repo นี้

การ Install:

การใช้งาน:

Output:

จากที่เห็นในตัวอย่างด้านบน หากคุณต้องการ Save Chart สามารถทำได้โดยการคลิกที่ Save Icon ที่ด้านบนขวาของ Chart

ที่มา:  https://medium.com/

 

 

รับตำแหน่งงานไอทีใหม่ๆ ด้วยบริการ IT Job Alert

 

อัพเดทบทความจากคนวงในสายไอทีทาง LINE ก่อนใคร
อย่าลืมแอดไลน์ @techstarth เป็นเพื่อนนะคะ

เพิ่มเพื่อน

 

บทความล่าสุด