Data Engineering and Machine Learning with RapidMiner Studio

วันที่ 9-11 พฤศจิกายน 2563 (9.00-16.00)

สถานที่ The Connecion Seminar Center

ในยุคที่ข้อมูลมีความสำคัญมีความหลากหลายและมีจำนวนมาก องค์กรต้องการการวิเคราะห์ข้อมูลที่สามารถนำไปต่อยอดในเชิงธุรกิจ อุตสาหกรรมหรืองานวิจัยได้อย่างมีคุณค่า จึงทำให้ Data Science หรือวิทยาการข้อมูลเป็นสาขาที่ได้รับความสนใจในหลากหลายภาคส่วน และ Data Mining หรือการทำเหมืองข้อมูลก็ถือว่าเป็นทักษะสำคัญที่ Data Scientist จำเป็นต้องมี
 

ในหลักสูตรนี้จะปูพื้นฐานให้ผู้อบรมได้เห็นภาพรวมของกระบวนการData Science โดยหลักสูตร 3 วันนี้จะแบ่งเป็น 2 ส่วนคือ 1) Data Engineering ในการดึงข้อมูล ทำความสะอาด และแปลงรูปแบบข้อมูล ไปจนถึงการเตรียมข้อมูล การคัดเลือกองค์ประกอบ และการตรวจสอบข้อมูลผิดปกติ
2) Machine Learning จะเน้นกระบวนการสร้างแบบจำลองแบบต่าง ๆ เมื่อนำไปใช้ในการตัดสินใจกับข้อมูลอื่น ๆ ในอนาคต ตั้งแต่กระบวนการพื้นฐานไปจนกระวนการที่มีความซับซ้อน 
 
หลักสูตรอบรมนี้จะใช้โปรแกรม RapidMiner Studio ซึ่งผู้อบรมจะไม่ต้องเขียนโค้ดโปรแกรม เพราะเราเชื่อว่า Mindset ของการวิเคราะห์ข้อมูล สร้างยากและสำคัญกว่า Mindset ในการเขียนโปรแกรม และจะนำไปสู่ Quick-win ในเชิงธุรกิจสำหรับ Business user และจะพัฒนาไปสู่องค์กรที่มี Citizen Data Scientist ที่มีการใช้ประโยชน์จากข้อมูลอย่างกว้างขวางในองค์กร
 
 
(ทั้งนี้ผู้อบรมต้องนำคอมพิวเตอร์โน้ตบุคมาในวันอบรมด้วย) 
 
   

เนื้อหาหลักสูตร

 

วันที่ เวลา เนื้อหาการอบรม
วันที่ 1 9.00 – 12.00
- Data Science Essential
- Data Mining Process
- Data Engineering Concepts
- Introduction to RapidMiner Studio
- Introduction to TurboPrep
- Data and Data Type
- Essential Data Engineering Functions with RapidMiner Operators
  • Data Ingestion
  • Data Blending
  • Missing Values Handling
  • Data Transformation
 
 
  13.00 - 16.00
- RapidMiner Process Control
  • Looping
  • Macro 
- ETL Process (Basic)
  • Data Ingestion
  • Data Transformation
- ETL Process (Intermediate)
  • Looping multiple files
  • Data Joining
  • Data Cleansing
  • Feature weighting
- ETL Process (Advanced)
  • Aggregation & Pivoting
  • Features generation 
 
 
วันที่ 2 9.00 - 12.00

- Machine Learning Concepts

- Essential Machine Learning Functions

  • Predictive Modeling
  • Decision Tree
  • K-Nearest Neighbors
  • Naïve Bayes
  • Linear Regression
  • Performance Measurements
  • Data Rebalancing
  • Outlier Detection
  • Ensemble Methods 

- Predictive Modeling (Basic)

  • Basic process & algorithms
  • Parameters setting 

- Predictive Modeling (Intermediate)

  • Ensemble method
  • Outlier detection
  • Performance measurement
  • Imbalanced Data Handling
  • Cost measurement 

 

  13.00 - 16.00
- Advanced Machine Learning Algorithms
 
  • Neural Network
  • Random Forest
  • Gradient Boosted Tree
  • Logistic Regression 
- Hyper parameter Tuning
- Predictive Modeling (Advanced)
 
  • Model comparison
  • Parameter Optimization 
- Unsupervised learning
 
  • Feature extraction
  • Clustering Methods 
 
  16.00 - 16.30
Q/A
วันที่ 3 9.00 - 12.00 - Optimization and Prescriptive analytics
- Model simulation and explanation
  13.00 - 16.00 - Introduction to Auto Model
- Predictive Modeling Operationalization
 
    Q/A

 

 

จัดโดย Datalent

ลงทะเบียนเข้าร่วมงาน คลิกที่นี่