4 ทักษะ Data Science ที่เรียนรู้ได้ จากนอกตำราเรียน

16-ก.พ.-18

คัมภีร์เทพ IT

บทความนี้เป็นของคุณ Rachael Tatman ที่ได้แชร์ประสบการณ์ส่วนตัวว่า อันที่จริงคนที่ทำงานด้าน Data Science ไม่จำเป็นต้องจบมาโดยตรง นอกจากควรเรียนรู้วิธีจัดการกับข้อมูลที่ซับซ้อน รู้จักตั้งคำถามที่ดี เลือกเครื่องมือทางสถิติที่เหมาะสม และเรื่องอื่นๆ ที่เกี่ยวข้องแล้ว ยังมีอีกหลายเรื่องที่อาจไม่ได้เรียนในมหาวิทยาลัย ต้องมาเรียนรู้เอาเองจากการทำงาน มาดูกันว่ามีทักษะไหนบ้าง และจะเรียนรู้มันได้อย่างไร

1. SQL

Rachael Data Science R หรือ Python (หรือทั้งสองอย่าง) อีกทั้งมีคนจำนวนมากที่มีความรู้ SQL และนั่นก็อาจเป็นปัญหาได้ถ้าคุณไม่ค่อยมีความรู้เรื่องนี้ สำหรับ SQL เป็นภาษา Programming ที่ใช้งานกับฐานข้อมูล และมันถูกใช้แพร่หลายใน Industry นี้ แต่โชคดีที่พื้นฐานเรื่องนี้มันไม่ยากเกินที่จะเรียนรู้ และมี Resource มากมายให้คุณเริ่มต้นศึกษาและลองใช้งาน

จะศึกษา SQL ได้อย่างไร:

  • Take Course: มีคอร์สออนไลน์มากมายให้คุณได้เรียนจากทั้ง Khan AcademyDataCampStanford และ Udemy (หรือจากเว็บไซต์อื่นๆ ที่คุณเชื่อถือ) แต่หลักสูตรที่สอนโดยตัวบุคคล อาจมีไม่มากนัก หรือไม่ก็ลองสอบถามจากสถาบันการศึกษาต่างๆ ดู
  • สร้าง SQL Portfolio: การมีตัวอย่างการเขียน Queries ในฐานข้อมูลจริง ถือเป็นหลักฐานที่ดีว่า คุณคุ้นเคยกับมันเป็นอย่างดี  อีก Option คือ การเขียน kernels ใน BigQuery datasets บนเว็บไซต์ Kaggle ส่วนใน HackerRank และ SQLZOO ก็พอมีแบบฝึกหัด SQL อยู่บ้างเหมือนกัน

​2. เป็น Generalist

เมื่อคุณเรียนจบและทำงาน คุณจะเจาะลึกลงไปในเรื่องที่เฉพาะทาง สามารถตั้งคำถามที่แม่นยำยิ่งขึ้นในหัวข้อนั้นๆ จนเรียกได้ว่าเป็นผู้เชี่ยวชาญ แต่นั่นไม่ใช่แนวการทำงานด้าน Data Science เวลาทำงานจริง คุณจะถูกคาดหวังให้ทำงานหรือแก้ปัญหางานด้านอื่นๆ ที่อยู่นอกเหนือสายที่คุณเรียนจบมาทันที ไม่ใช่แค่นั้น อาจเป็นในสายงานที่คุณอาจไม่เคยได้ยินชื่อมันด้วยซ้ำ ซึ่งคุณควรต้องทำความคุ้นเคยกับสิ่งที่คุณไม่เชี่ยวชาญให้เร็วที่สุด

วิธีที่จะช่วยให้คุณเป็น Generalist:

  • อ่านหนังสือด้านอื่น: ในด้านวิชาการมีแนวโน้มจะใช้กลุ่มเครื่องมือทางสถิติที่เฉพาะทาง แต่ที่จริงก็มีวิธีการทางสถิติด้านอื่นๆ ให้ใช้อยู่มากมาย การอ่าน/ศึกษางานในสาขาต่างๆ จะทำให้คุณได้รับเทคนิคและปัญหาที่หลากหลายขึ้น อีกทั้งช่วยให้คุณสามารถทำงานในเรื่องใหม่ๆ ได้อย่างสะดวกและรวดเร็ว
  • ฝึกวิเคราะห์ข้อมูลประเภทใหม่ๆ บ้าง: Data scientists จำเป็นต้องทำงานกับข้อมูลหลากหลายประเภท คุณอาจมีประสบการณ์เชิงลึกกับข้อมูลประเภทหนึ่ง แต่ลองแยกประเภทดู คุณเคยทำงานกับ Time series? Text? Images? Video? Audio? Pre-trained models? Relational databases? ลองคิดดูว่าความรู้ของคุณยังมีช่องว่างมากน้อยแค่ไหน และลองทำงานกับแหล่งข้อมูลใหม่ที่แตกต่างกันดู
  • คุยกับคนในสายงานอื่นในด้าน Technical บ้าง: นอกจากคุณจะได้เรียนรู้ด้านอื่นๆ แล้ว ยังได้ฝึกอธิบายแนวคิดด้านเทคนิคให้คนที่ไม่ได้เรียนมาสาขาเดียวกับคุณให้เข้าใจได้อีกด้วย

3. Source/Version Control

นี่ก็เป็นหนึ่งในตัวช่วยที่ดีของ Rachael เธอเคยเรียนเรื่องนี้ในมหาวิทยาลัย Source Control หรืออาจเรียกว่า Version Control คือวิธีการจัดการการเปลี่ยนแปลงของ Document หรือ Code base แนวคิดพื้นฐานคือ คุณทำงานบนสำเนาของสิ่งที่คุณทำอยู่ และทุกครั้งที่คุณใช้สำเนา จะไปอัพเดทที่ต้นฉบับด้วย มันมีประโยชน์มากสำหรับการทำ Project (ช่วยให้คุณสามารถ Roll back ไปใช้เวอร์ชันก่อนหน้าได้ เพื่อกลับไปแก้สิ่งที่คุณทำผิด) อีกทั้งมันจำเป็นมากสำหรับการทำงานร่วมกันกับทีมงานคนอื่น

วิธีการใช้ Version Control:

  • ใช้ Version Control กับทุก Research Project/Paper: เรียกได้ว่า Rachael ใช้มันอย่างจริงจัง 100% เลยทีเดียวตอนที่ทำ วิทยานิพนธ์ ซึ่งมันมีประโยชน์กับเธอมาก
  • ใช้ GitHub กับ Personal Project ของคุณหรือสิ่งที่คุณต้องการแชร์ให้คนอื่น: มันจะมีประโยชน์มากหากคุณได้เข้าร่วมทีมกับคนที่ใช้ GitHub อยู่แล้ว นอกจากนี้ GitHub Profile ของคุณก็เป็นอีกหนึ่งช่องทาง ที่จะแสดงให้นายจ้าง(ในอนาคต)เห็นถึงกระบวนการทำงานและผลงานของคุณ

4. ขอแค่ “ดีเพียงพอ”

หากคุณทำงานในแวดวงวิชาการ คุณต้องแน่ใจว่าสิ่งที่คุณทำมันดีแล้วจริงๆ และหากผ่านการตรวจสอบจากผู้เชี่ยวชาญ บทความของคุณจะได้ตีพิมพ์เป็นเอกสารวิชาการ แต่ในแวดวงธุรกิจ ให้คิดถึงแค่ “ณ ตอนนี้” มัน “ดีเพียงพอ” แล้วหรือยัง มีคำศัพท์ใหม่ที่เธอ ได้รู้จักจากการทำงาน คือ MVP หรือ “Minimum Viable Product” ซึ่งมีแนวคิดคือ คุณสามารถแชร์บางสิ่ง เมื่อมัน “ดีเพียงพอ” สำหรับคนบางส่วนที่คาดว่าจะมีปฏิสัมพันธ์ด้วย สำหรับ Data Science หมายถึง คุณไม่สามารถตอบคำถามทุกข้อได้ด้วยข้อมูล  คุณสามารถใช้เวลาในการวิเคราะห์เชิงลึกหรือปรับแต่งข้อมูลในภายหลังได้ แต่คุณสามารถแชร์ Project ในขณะที่ผู้รับรู้สึกว่ามัน "ดีเพียงพอ" แล้วในขณะนี้

วิธีทำในสิ่งที่เรียกว่า “ดีเพียงพอ”

  • ให้คิดว่า ณ ตอนนี้อะไรที่คุณทำเสร็จแล้วบ้าง: ครั้งต่อไปที่คุณทำงานใน Project ให้หยุดคิดทุกครั้งก่อนที่คุณจะสรุปผลแต่ละวัน ให้นึกถึงว่าวันนี้คุณได้สร้างสิ่งที่มีประโยชน์บ้างแล้วหรือยัง ใช้เวลาเพื่อฝึกฝนว่า คุณจะอธิบายถึงสิ่งที่มีประโยชน์หรือน่าสนใจเกี่ยวกับสิ่งที่คุณได้ทำไปแล้วอย่างไรบ้าง
  • แชร์งาน Research ของคุณในระหว่างที่ทำอยู่: ถ้าเป็นไปได้ เวลาทำ Project ถัดไปอยากให้แชร์ Project ของคุณระหว่างที่ทำอยู่ อาจแชร์ผ่าน Blog หรือเพื่อนที่ทำงานกับคุณ แม้จะไม่ได้ยิ่งใหญ่อะไร แต่อย่างน้อยมันก็เป็นบทความวิเคราะห์ของคุณไม่ใช่หรือ คุณได้เรียนรู้ถึงสิ่งที่ควรค่าแก่การแชร์ระหว่างการรวบรวมข้อมูลหรือไม่ หรือ อะไรที่คุณทำแล้วมันดีเพียงพอหรือมีประโยชน์ต่อคนอื่นบ้าง

ที่มา : https://medium.freecodecamp.org/

 

 

อัพเดทบทความจากคนวงในสายไอทีทาง LINE ก่อนใคร
อย่าลืมแอดไลน์ @techstarth เป็นเพื่อนนะคะ

 

เพิ่มเพื่อน

 

 

บทความที่เกี่ยวข้อง