5 Open-Source Projects ที่ช่วยให้คุณเรียนรู้ Data Science ได้

20-เม.ย.-22

คัมภีร์เทพ IT

การเรียนรู้ Data Science ไม่ใช่เรื่องง่ายสำหรับทั้งมือใหม่และมืออาชีพ เนื่องจากแหล่งความรู้ต่าง ๆ อยู่กระจัดกระจาย หากปราศจากคำแนะนำที่ถูกต้อง อาจทำให้คนจำนวนมากหลงทางในเส้นทางการเรียนรู้ โชคดีที่มี Open-Source Project ที่มีประโยชน์กับคุณอยู่มากมาย และนี่ก็คือ 5 Open-Source Projects ที่ช่วยให้คุณเรียนรู้ Data Science ได้

1. Virgilio

Virgilio ได้รับการขนานนามว่าเป็น Mentor ใหม่สำหรับ Data Science E-Learning และมุ่งหวังให้ทุกคนมีโอกาสได้เรียนรู้ Data Science อีกทั้ง Virgilio ยังพยายามสร้างเส้นทางให้ผู้เรียนรู้มีการเรียนรู้แบบมีโครงสร้างเพื่อหลีกเลี่ยงความสับสนในระหว่างการศึกษา Data Science

Open-Source Project มีโครงสร้าง 3 Layers เพื่อรองรับความต้องการของทุกคน ซึ่ง Layer นี้ถูกเรียกว่า Paradiso สำหรับ High-Level Guide, Purgatorio สำหรับ Entry-Level และ Inferno สำหรับ Advanced-Level

การเรียนรู้เริ่มต้นจาก Paradiso Level ซึ่งมีเนื้อหาเป็นเรื่องเกี่ยวกับทฤษฎีและเหตุผลที่คุณควรเรียนรู้ Data Science (ไม่ต้องเขียน Code เลย) เช่น:

  • Machine Learning คืออะไรและแตกต่างจาก AI อย่างไร
  • คุณต้องใช้ Machine Learning หรือไม่?
  • Use Cases
  • Teaching Strategy

รวมทั้งอื่น ๆ อีกมากมาย อีกทั้ง Paradiso ยังเป็นจุดเริ่มต้นที่ดีเยี่ยมแบบสำหรับผู้ที่เริ่มต้นเส้นทางสาย Data Science และเข้าใจสายงานนี้มากขึ้น

คราวนี้เรามาต่อกันที่ Purgatorio Level ซึ่งที่ Level นี้ จะครอบคลุมพื้นฐานของ Data Scientist ตั้งแต่พื้นฐานไปจนถึงภาคปฏิบัติ เช่น:

  • Mathematics และ Statistic Fundamental
  • Programming Python Fundamental
  • Problem Definition
  • Data Exploration
  • Machine Learning Training

และอื่น ๆ อีกมากมาย คุณจะได้เรียนรู้ทุกสิ่งที่จำเป็นสำหรับการเริ่มต้นในสาย Data Science แต่ไม่ต้องกังวลกับเรื่องโครงสร้างไป เพราะ Purgatorio เริ่มต้นจากการใช้งานพื้นฐานไปจนถึงการใช้งานทั่วไป

สุดท้ายเป็น Advanced Level คือ Inferno Level ซึ่งส่วนนี้มีไว้สำหรับ User ที่มีความรู้ขั้น Advance ส่วนนี้จะสอนเกี่ยวกับการประยุกต์ใช้เฉพาะทางสำหรับ Data Science:

  • Time Series
  • Computer Vision
  • Natural Language Processing

นอกจากนี้ Inferno Level ยังได้จัดเตรียมสื่อการเรียนรู้สำหรับ Data Science Tools และ Libraries บางอย่าง และ List ของมันก็จะเพิ่มขึ้นตามเวลา ดังนั้น ขอให้คุณตรวจสอบ Project อยู่เรื่อย ๆ

Project Virgilio ได้รับการพัฒนาโดยทีมงานหลักและผู้ที่มีส่วนร่วม ซึ่งล้วนเป็นผู้เชี่ยวชาญในสาขานี้ หากคุณสนใจ สามารถพูดคุยกับทีมงานได้ที่นี่

2. MLCourse

MLCourse เป็น Open-Source Project ที่ริเริ่มโดย Yury Kashnitsky จาก OpenDataScience เพื่อเรียนรู้เพิ่มเติมเกี่ยวกับ Machine Learning ซึ่งผู้ที่เรียนรู้จะมีความสมดุลที่ดีเยี่ยมเกี่ยวกับทักษะทางด้านทฤษฎีและทางด้านปฏิบัติ เช่นเดียวกับชื่อของมันที่บอกเป็นนัย ๆ MLCourse คือการรวบรวม Courses Project ที่เราสามารถติดตามด้วยตัวคุณเองได้

อย่างไรก็ตาม Courses เหล่านี้ มีความตั้งใจจัดทำขึ้นสำหรับผู้ที่มีทักษะพื้นฐานทางด้าน Data Science ไม่ว่าจะเป็น Python และ Math แต่นั่นไม่ได้หมายความว่า ผู้ที่เป็นมือใหม่จะไม่สามารถทดลองเรียน Courses ต่าง ๆ ได้ เพราะคำแนะนำของพวกเขานั้นมักจะมีประโยชน์และเฉียบแหลม

ใน MLCourse จะมี 10 หัวข้อเพื่อให้ผู้คนได้เรียนรู้ ไม่ว่าจะเป็น:

  • EDA with Pandas
  • Visual Data Analysis
  • Classification, Decision Tree, and K-NN
  • Ordinary Least Squares and Linear Model
  • Bagging
  • Feature Engineering and Feature Selection
  • Unsupervised Analysis
  • Optimization
  • Time Series
  • Gradient Boosting

ทุกหัวข้อประกอบด้วย คำแนะนำที่ง่ายต่อการปฏิบัติตาม เช่น Notebook, Assignment และ Video Course

ข้อเสียของ MLCourse คือการพัฒนาในส่วนที่เป็นภาษาอังกฤษนั้น หยุดลงในปี 2019 (ส่วนภาษารัสเซียเริ่มกลับมาอัปเดตในปี 2022) อย่างไรก็ตาม เนื้อหาเหล่านี้ยังคงมีความเกี่ยวข้องกับสาขา Data Science ในปัจจุบัน โดยเฉพาะอย่างยิ่งสำหรับผู้ที่เป็นมือใหม่

3. ProjectLearn

ProjectLearn เป็น Open-Source Project ที่มีการรวบรวมรายการของ Tutorial Projects ไว้ ผู้ที่สร้าง ProjectLearn มีความมุ่งหวังเพื่อให้เรียนรู้เกี่ยวกับการใช้งานจริงมากกว่าแค่ภาคทฤษฎี ดังนั้น คุณจึงสามารถคาดหวังที่จะได้เรียนรู้ชุดทักษะเฉพาะทางมากกว่าทักษะทั่วไป

ProjectLearn ไม่ได้เจาะจงสำหรับ Data Science เพียงเท่านั้น เพราะคุณยังสามารถเรียนรู้การพัฒนา Web, Mobile, และ Game ได้อีกด้วย อย่างไรก็ตาม ยังมี Section พิเศษสำหรับ Machine Learning และ AI ซึ่งเป็นสิ่งที่หลายคนต้องการ

ML & AI Section

Projects ส่วนใหญ่เป็น External Link ที่เชื่อมโยงไปยังบทความหรือวิดีโออื่น แต่ Projects เหล่านี้ได้รับการดูแลจัดการแล้ว และเหมาะสำหรับคนที่ต้องการสำรวจว่า จะสามารถทำอะไรกับ Machine Learning ได้บ้าง

4. Deepkapha

Deepkapha เป็น Open-Source Project ที่รวบรวม Artificial Intelligence และ Deep Learning Tutorial ไว้เป็นจำนวนมากเพื่อให้ผู้คนได้เรียนรู้ หากลองดูที่ Deepkapha คุณอาจจะรู้สึกว่า Project นี้ มีไว้สำหรับผู้ที่มีความรู้พื้นฐานด้าน Data Science และ Programming ดังนั้น คุณควรสำรวจ Deepkapha เมื่อคุณมีความพร้อมจะดีกว่า

Deepkapha มักจะ Focus ไปที่ Deep Learning และ Framework Tutorial ต่าง ๆ ซึ่งเหมาะอย่างยิ่งหากคุณต้องการเรียนรู้แนวคิดของ Deep Learning และความแตกต่างระหว่าง Frameworks อย่างไรก็ตาม คุณยังสามารถสำรวจสื่อการเรียนรู้ต่าง ๆ ได้มากมาย แม้ว่าจะไม่ได้เจาะจงเรื่องใดเรื่องหนึ่งโดยเฉพาะก็ตาม

อีก Section หนึ่งที่ควรพิจารณาเป็นพิเศษก็คือ Deep Learning Blog Collection ซึ่งประกอบด้วย Writers และ Blogs ต่าง ๆ ของ Deep Learning และ Collection นี้ก็สมบูรณ์มากซะจนอาจต้องใช้เวลาหลายวันในการสำรวจดู Blogs จนครบทั้งหมด

5. Best-of ML Python

Best-of ML Python เป็น Part หนึ่งของ Best-of Open-Source Project ซึ่งได้รวบรวม Open-Source Packages และ Tools ต่าง ๆ ที่พวกเรามักใช้งานแทบจะทุกวัน Best-of ML Python เป็นมีความเฉพาะเจาะจงไปที่ Open-Source Machine Learning Packages สำหรับภาษา Programming อย่าง Python

Best-of” Series ไม่ได้มี Tutorials เกี่ยวกับ “How-to” หรือการเรียนรู้ Concept พื้นฐานโดยเฉพาะเพียงเท่านั้น แต่พวกมันมีการจัดหมวดหมู่ของ Python Package ที่ยอดเยี่ยมทั้งหมดเพื่อให้พวกเราได้ลองใช้งาน

Best-Of ML Python Project List

ดังที่คุณเห็นจากด้านบน มีรายการมากมายและถูกแบ่งหมวดหมู่ตามสิ่งที่คุณต้องการ มันแทบจะมีทุกหัวข้อที่คุณต้องการจะเรียนรู้ผ่าน Python Package ดังนั้น ขอแนะนำให้พยายามสำรวจให้มากที่สุดเท่าที่คุณจะทำได้

ที่มา:  https://towardsdatascience.com/

 

 

รับตำแหน่งงานไอทีใหม่ๆ ด้วยบริการ IT Job Alert

 

อัพเดทบทความจากคนวงในสายไอทีทาง LINE ก่อนใคร
อย่าลืมแอดไลน์ @techstarth เป็นเพื่อนนะคะ

เพิ่มเพื่อน

 

บทความล่าสุด