Top 10 Data Science Libraries ที่ควรเรียนรู้ไว้

22-เม.ย.-20

คัมภีร์เทพ IT

สำหรับคนที่ทำงานด้าน Data Science นอกจากสามารถใช้ Libraries ยอดนิยมอย่าง Pandas หรือ Scikit-Learn แล้วยังมี Libraries อื่น ๆ อีกที่มีประโยชน์อย่างมาก ซึ่งจะช่วยเติมเต็มและทำให้ Projects ของคุณมีความน่าสนใจยิ่งขึ้น เรามาดู Top 10 Data Science Libraries ที่ควรเรียนรู้ไว้กัน

1. Missingno

Library นี้จะทำการแสดง Missing Data ออกมาให้เห็นและเข้าใจได้ง่ายขึ้น

 

2. Plotly

Library นี้จะช่วยทำให้การ Plot ข้อมูลซึ่งรวมถึง Maps และ 3D Graphs ของคุณน่าสนใจยิ่งขึ้นด้วยรูปแบบของ Interactive

 

คุณสามารถดูรายละเอียดเพิ่มเติมได้ที่นี่: https://plot.ly/python/ipython-notebook-tutorial/

3. Selenium

Selenium จะช่วยจัดการเกี่ยวกับ Automatic Mouse Movements (เช่น การ Click, การ Browse เป็นต้น)

4. Geopandas + Geopy

เมื่อใช้ Geopandas กับ Geopy จะมีประโยชน์อย่างยิ่งกรณีที่คุณต้องการสร้าง Maps

 

5. Py_translator

แน่นอนว่ามันใช้สำหรับการ Translate 

6. Graphviz

Library นี้จะช่วยสร้างภาพจำลอง Model ที่มีโครงสร้างเป็นแบบ Tree

7. Jupyterlab_spellchecker

มันใช้สำหรับตรวจเช็คตัวสะกดของ Markdown Text 

8. Nbextensions

ในทางเทคนิคแล้วมันไม่ใช้ Library แต่มันเป็น Extension ซึ่งจะช่วยให้คุณทำอะไรได้หลาย ๆ อย่าง ไม่ว่าจะเป็นการซ่อน/แสดง Code (Code Folding), สร้าง Table of Contents ให้อัตโนมัติ และทำให้ Code ดูดีหรืออ่านง่ายขึ้น 

คุณสามารถดูรายละเอียดเพิ่มเติมได้ที่นี่: https://github.com/ipython-contrib/jupyter_contrib_nbextensions

9. Twitter Scraper

มันจะช่วยดึงข้อมูลจาก Twitter ได้ตาม วันที่, สถานที่, คำ รวมทั้งอื่น ๆ ด้วย แต่ต้องแน่ใจว่า คิดในเรื่องของ Time Lag ไว้ในการดึงข้อมูลของคุณด้วย เพื่อหลีกเลี่ยงการ Log out จาก Twitter

10. Imbalanced-learn

มันสามารถช่วยจัดการกับเรื่องการสุ่มตัวอย่าง (Sampling) แบบอัตโนมัติในวิธีต่าง ๆ เพื่อ Balance Classes

ที่มา:  https://medium.com/

 

 

รับตำแหน่งงานไอทีใหม่ๆ ด้วยบริการ IT Job Alert

 

อัพเดทบทความจากคนวงในสายไอทีทาง LINE ก่อนใคร
อย่าลืมแอดไลน์ @techstarth เป็นเพื่อนนะคะ

เพิ่มเพื่อน

 

บทความล่าสุด