6 เครื่องมือยอดนิยม ที่ใช้วิเคราะห์ข้อมูล

16-ต.ค.-19

คัมภีร์เทพ IT

เมื่อพูดถึงเครื่องมือวิเคราะห์ข้อมูล เรามักมีคำถามอยู่เสมอ เช่น อะไรคือความแตกต่างระหว่างเครื่องมือวิเคราะห์ข้อมูล ที่มีอยู่ในท้องตลาด เครื่องมือไหนดีกว่ากัน? แล้วเราควรเรียนรู้เครื่องมือไหนก่อนดี? ซึ่งบทความนี้เป็นมุมมองของคุณ Lewis Chou ที่จะมาบอกถึง 6 เครื่องมือยอดนิยม ที่ใช้วิเคราะห์ข้อมูล

1. Excel

ด้วย Feature ที่มีประสิทธิภาพหลายอย่าง ไม่ว่าจะเป็น การสร้าง Form, PivotTable, VBA เป็นต้น ระบบของ Excel มีขนาดใหญ่มากเสียจนไม่มีเครื่องมือวิเคราะห์ใดที่สามารถทำได้โดดเด่นกว่าอีกแล้ว ซึ่งทำให้มั่นใจได้ว่า ผู้คนสามารถวิเคราะห์ข้อมูลได้ตามความต้องการ

อย่างไรก็ตาม บางคนอาจจะคิดว่า Excel ดูจะมีความสามารถในด้าน Computer Programming Languages และไม่ชอบใช้ Excel เป็นเครื่องมือวิเคราะห์ เพราะคิดว่า Excel ไม่สามารถจัดการกับ Big Data ได้ แต่คุณลองคิดดูสิว่า ข้อมูลที่เราใช้ ๆ กันในชีวิตประจำวันของเรามันมากเกินขีดจำกัดของ Big Data หรือไม่? Lewis คิดว่า Excel เป็นเครื่องมือที่มีความเป็นอเนกประสงค์ มันทำงานได้ดีอย่างมากสำหรับข้อมูลที่มีขนาดเล็ก และด้วย Plugins มันก็สามารถจัดการข้อมูลปริมาณมาก ๆ ได้เช่นกัน

สรุปแล้วขึ้น มันก็ขึ้นอยู่กับ Feature อันทรงพลังของ Excel และ Scale ของผู้ที่ใช้งานมัน ในความเห็นของ Lewis เขาคิดว่า Excel ถือเป็นเครื่องมือที่เรียกว่า “ขาดไม่ได้” หากคุณต้องการเรียนรู้การวิเคราะห์ข้อมูล Excel น่าจะเป็นตัวเลือกแรก ๆ ที่ควรพิจารณาอย่างแน่นอน

2. BI Tools

Business intelligence ถูกสร้างขึ้นมาเพื่อการวิเคราะห์ข้อมูลอย่างแท้จริง โดยจุดมุ่งหมายหลัก คือ การย่นระยะเวลาจากข้อมูลธุรกิจ (Business Data) ไปสู่ การตัดสินใจทางธุรกิจ (Business Decisions) รวมทั้งใช้ข้อมูลเพื่อเป็นข้อมูลประกอบการตัดสินใจ

แต่จุดมุ่งหมาย Product ของ Excel กลับไม่เป็นเช่นนี้ Excel สามารถทำสิ่งต่าง ๆ ได้มากมาย โดยคุณสามารถใช้ Excel เพื่อวาดหลักสูตร, สร้างแบบสอบถาม, ใช้เป็นเครื่องคิดเลข หรือใช้สำหรับวาดรูปก็ได้ ยิ่งถ้าคุณเชี่ยวชาญ VBA คุณก็สามารถสร้างเกมเล็ก ๆ ขึ้นมาได้ แต่สิ่งเหล่านี้ไม่ใช่ Function การวิเคราะห์ข้อมูลทั้งหมดเสียทีเดียว

แต่สำหรับ BI Tools แล้ว มันมีความสามารถในการวิเคราะห์ข้อมูลโดยเฉพาะ

BI Tools ที่เรารู้จักกันทั่วไป ก็มี Power BI, FineReport, และ Tableau เป็นต้น คุณจะพบว่า พวกมันได้รับการออกแบบตามแนวทางของกระบวนการวิเคราะห์ข้อมูล โดยขั้นแรกคือ Data Processing, Data Cleaning จากนั้นก็ทำ Data Modeling และขั้นสุดท้ายคือ Data Visualization ที่ใช้การนำเสนอ Chart เพื่อระบุปัญหาและใช้เป็นแนวทางเพื่อประกอบการตัดสินใจ

นี่เป็นวิธีที่ใช้ในการวิเคราะห์ข้อมูล แต่มันก็สร้างความยุ่งยากให้คนบางกลุ่มในกระบวนการนี้

ตัวอย่างเช่น ต้องทำงานที่ซ้ำ ๆ และมูลค่าเพิ่มที่ค่อนข้างน้อย ในการ Clean Data ซึ่งสิ่งเหล่านี้สามารถทำให้ง่ายขึ้นได้ด้วย BI Tools

หากปริมาณข้อมูลมีขนาดใหญ่ เครื่องมือดั้งเดิมอย่าง Excel จะไม่สามารถทำ PivotTable ให้สมบูรณ์ได้

หากเราใช้ Excel ในการแสดงส่วนที่เป็น Graphic อาจต้องใช้เวลานานในการแก้ไข Chart รวมถึงการ Setting ค่าของ สีและ Font

ปัญหายุ่งยากเหล่านี้ จะเป็นสิ่งที่ BI Tools สามารถนำเราไปสู่การเปลี่ยนแปลงและเพิ่มคุณค่า

ตอนนี้ เรามาเปรียบเทียบ BI Tools ยอดนิยมทั้ง 3 ในตลาดกัน

2.1 Tableau

อันที่จริงเนื้อแท้ของ Tableau คือ PivotTable และ PivotChart ของ Excel อาจกล่าวได้ว่า Tableau ตระหนักดีถึง Feature นี้ของ Excel และยังคงยึดถือกับ Core Value นี้ต่อไป

จากมุมมองของการ Develop ที่ผ่านมาและการตอบรับของตลาดในปัจจุบัน Tableau มีการพัฒนาในเรื่อง Visualization ได้ดีขึ้น ไม่เพียงเพราะความยอดเยี่ยมของ Chart เท่านั้น แต่เป็นเรื่องของการ Design, สี และ User Interface ที่ทำให้เรารู้สึกถึงความเรียบง่ายและน่าใช้งาน

จะว่าไปก็เหมือนการโฆษณาชวนเชื่อ คือ ทีมงานของ Tableau มีการลงทุนด้านวิชาการเป็นจำนวนมากเพื่อศึกษาและวิจัยว่า ผู้คนชอบ Chart แบบไหน และจะทำอย่างไร ผู้ใช้ถึงจะได้รับประสบการณ์ที่ดีในเรื่องการใช้งานและสิ่งที่ได้เห็น

นอกจากนี้ Tableau ยังเพิ่ม Data Cleaning Function และ Intelligent Analysis Functions เข้าไป ซึ่งถือเป็นข้อได้เปรียบที่สำคัญข้อหนึ่งของการพัฒนา Product ของ Tableau

2.2 Power BI

ข้อดีของ Power BI จะอยู่ในรูปของ Business Model และความสามารถทางด้าน Data Analysis

ก่อนหน้านี้ Power BI เคยเป็น Plug-in สำหรับ Excel และการพัฒนาถือว่ายังไม่ดีมากนัก ดังนั้น มันจึงถูกถอดจากการเป็น Plug-in ของ Excel มาเป็นการถูกพัฒนาเป็น BI Tool ในฐานะของเครื่องมือที่เกิดขึ้นที่หลัง Power BI มีการ Update สม่ำเสมอแทบจะทุกเดือนและทำได้อย่างรวดเร็วมาก

ขณะนี้ Power BI มีรูปแบบ License อยู่ 3 แบบ ได้แก่ Power BI Free, Power BI Pro และ Power BI Premium ซึ่งเช่นเดียวกับ Tableau คือ Feature ของ Free Version นั้นยังไม่สมบูรณ์ แต่มันก็เกือบจะเพียงพอสำหรับการใช้งานแบบส่วนบุคคล และการวิเคราะห์ข้อมูลของ Power BI นั้นทรงพลังมาก PowerPivot และ DAX Language จะช่วยให้คุณสามารถใช้เพื่อการวิเคราะห์ขั้นสูงที่ซับซ้อน ซึ่งมีลักษณะที่คล้ายคลึงกับการเขียนสูตรใน Excel

2.3 FineReport

สิ่งที่ทำให้ FineReport มีความแตกต่าง ก็คือ การวิเคราะห์ข้อมูลด้วยตนเองที่เหมาะสำหรับ Business Users ด้วยการDrag & Drop ที่เรียบง่าย คุณสามารถออกแบบ Style ต่าง ๆ ของ Report ด้วย FineReport และสร้างระบบวิเคราะห์การตัดสินใจข้อมูล (Data Decision Analysis System) ได้อย่างง่ายดาย

FineReport สามารถเชื่อมต่อโดยตรงกับ Database ทุกประเภท อีกทั้งมีความสะดวกและรวดเร็วในการปรับแต่ง Style ที่หลากหลายเพื่อสร้าง Report ไม่ว่าจะเป็นรายสัปดาห์ รายเดือน หรือรายปี ส่วน Format ของมันก็คล้ายกับ Interface ของ Excel สำหรับ Features ของ FineReport ประกอบด้วย Report Creation, Report Permission Assignment, Report Management, Data Entry เป็นต้น

นอกจากนี้ Visualization Function ของ FineReport ก็มีความโดดเด่นเป็นอย่างมาก โดยมันมี Dashboard Templates ที่หลากหลายและ Self-Developed Visual Plug-In Libraries เป็นจำนวนมาก

ส่วนในแง่ของราคานั้น คุณสามารถใช้งาน Personal Version ของ FineReport ได้แบบฟรี ๆ และ Feature ทั้งหมดก็ถูกเปิดให้ใช้งานได้อีกด้วย

3. R & Python

R และ Python เป็นเครื่องมือกลุ่มที่ 3 ที่จะขอกล่าวถึง แม้ว่า Software อย่าง Excel และ BI Tool จะได้รับการออกแบบมาด้วยความพยายามสูงสุดในการพิจารณาในแง่การใช้งานส่วนใหญ่ของการวิเคราะห์ข้อมูล พวกมันจะเน้นเรื่องการ Customize เป็นหลัก หาก Software ไม่ได้ออกแบบ Feature หรือพัฒนาปุ่มสำหรับ Feature มันก็มีโอกาสที่คุณจะไม่สามารถทำงานให้เสร็จสมบูรณ์ได้

แต่สำหรับภาษา Programming แล้ว กลับมีความแตกต่างออกไป มันทั้งมีประสิทธิภาพ ทรงพลังและมีความยืดหยุ่นสูง คุณสามารถเขียน Code เพื่อทำอะไรก็ได้ที่คุณต้องการ อย่างเช่น R และ Python เป็นเครื่องมือที่จำเป็นสำหรับ Data Scientist จากมุมมองของมืออาชีพ พวกมันมีประสิทธิภาพ และทรงพลังกว่า Excel และ BI Tool อย่างแน่นอน

คำถามคือ แล้วสถานการณ์ไหนบ้างที่เราจะใช้ภาษา R และ Python

3.1 Professional Statistical Analysis

ในแง่ของภาษา R เป็นการวิเคราะห์ทางสถิติที่ดีที่สุดในกรณี เช่น การแจกแจงแบบปกติ (Normal Distribution) การใช้ Algorithm ในการจำแนก Cluster และการวิเคราะห์การถดถอย (Regression Analysis) การวิเคราะห์แบบนี้ก็เหมือนกับการใช้ข้อมูลเป็น Experiment มันสามารถช่วยเราตอบคำถามต่อไปนี้

ตัวอย่างเช่น การแจกแจงข้อมูลแบบ Normal Distribution, Triangular Distribution หรือ Distribution ประเภทอื่น ๆ ? อะไรคือ Discrete Situation? มันอยู่ในช่วงการควบคุมทางสถิติที่เราต้องการจะทำให้ลุล่วงใช่หรือไม่? อะไรคือขนาดของผลกระทบของ Parameter ที่แตกต่างกันในผลลัพธ์? อีกทั้งยังมีการวิเคราะห์การจำลองสถานการณ์ที่สมมติขึ้นมา แต่หาก Parameter มีการเปลี่ยนแปลง จะเกิดผลกระทบมากแค่ไหน?

3.2 Individual Predictive Analysis

ตัวอย่างเช่น เราต้องการทำนายพฤติกรรมของผู้บริโภค เขาจะอยู่ในร้านของเรานานเท่าไหร่ พวกเขาจะใช้จ่ายเท่าไหร่ เราสามารถทราบสถานะทางเครดิตส่วนบุคคลของพวกเขา เพื่อที่จะเสนอเงินกู้ตามบันทึกการใช้จ่ายผ่านออนไลน์ของพวกเขา หรือไม่ก็สามารถเสนอสิ่งต่าง ๆ ตาม Browsing History บน Web Page ซึ่งสิ่งนี้ยังเกี่ยวข้องกับแนวคิดยอดนิยมในปัจจุบันของการเรียนรู้ของ Machine Learning และ Artificial Intelligence อีกด้วย

สรุป

จากข้อมูลข้างต้นพอจะสรุปได้คือ Excel, BI Tools หรือ Programming Language มี Function บางส่วนทำงานลักษณะเดียวกัน แต่พวกมันก็เป็นเครื่องมือที่ช่วยสิ่งเสริมให้ทุกอย่างสมบูรณ์ยิ่งขึ้น Value ของแต่ละเครื่องมือก็ขึ้นอยู่กับชนิดของ Application ที่กำลัง Develop และสถานการณ์ที่ต้องเจอ ณ เวลานั้น

ก่อนที่คุณจะเลือกเครื่องมือวิเคราะห์ข้อมูล คุณต้องเข้าใจงานของคุณก่อนว่า คุณจะใช้ในสถานการณ์ที่คุณจะใช้ หรือไม่ก็อาจเกี่ยวกับทิศทางสายอาชีพของคุณ ไม่ว่าจะเป็น Data Science หรือ Data Analysis

ที่มา:  https://towardsdatascience.com/

 

ดูตำแหน่งงานที่ใช้ทักษะภาษา Python ได้ที่นี่

 

รับตำแหน่งงานไอทีใหม่ๆ ด้วยบริการ IT Job Alert

 

อัพเดทบทความจากคนวงในสายไอทีทาง LINE ก่อนใคร
อย่าลืมแอดไลน์ @techstarth เป็นเพื่อนนะคะ

เพิ่มเพื่อน

 

บทความล่าสุด