Data Analytics

Journey as an AI Storyteller

From Data to Insight - My Evolution as an AI Student


An AI student on a mission

🌟 Do you know who i am?

Do you know who i am

นางสาว ทัศนาวลัย มานุษยานนท์💻


🔄 My Application of Agile Frameworks

Agile Methodology

ในโลกของ Data และ AI ข้อมูลมักจะมาพร้อมกับความไม่แน่นอน การวางแผนแบบดั้งเดิมที่ต้องรอให้ทุกอย่างสมบูรณ์แบบร้อยเปอร์เซ็นต์จึงไม่ตอบโจทย์

การทำงานแบบ Agile Methodology ที่เน้น:


📋 ขั้นตอน 5 ขั้นของ Agile Framework

Step 1: Sprint Planning & Empathize

ตั้งเป้าหมายและทำความเข้าใจ


Step 2: AI as a Pair Analyst

ใช้ GenAI ช่วยกำหนดทิศทาง


Step 3: Iterative Execution

ทำแบบวนลูป

  1. Data Cleansing ⚙️
    • การทำข้อมูลให้สะอาด
    • จัดการ Missing Values
    • Format ข้อมูลให้ถูกต้อง
  2. Visualization 📊
    • เมื่อข้อมูลพร้อม เริ่มสร้าง MVP
    • ในโปรเจกต์นี้ = “1-Chart Dashboard”

Step 4: Feedback Loop & Integration

เชื่อมโยงและปรับปรุง


Step 5: The Final Delivery

ส่งมอบผลลัพธ์

ผลลัพธ์สุดท้าย = 1-Chart Dashboard ที่:


🔍 The Accident Decoder Project

ถอดรหัสอุบัติเหตุทางถนนด้วย AI


📊 ข้อมูลหลัก

Open Data สถิติอุบัติเหตุทางถนนของประเทศไทย เป็นชุดข้อมูลที่มีความซับซ้อนสูง

บูรณาการการทำงานร่วมกับ Generative AI เพื่อ:


🤖 บทบาทของ GenAI

AI as an Analytical Catalyst

ประยุกต์ใช้เทคนิค Prompt Engineering โดยส่ง:

ให้ GenAI ทำการวิเคราะห์เบื้องต้น ซึ่งเปรียบเสมือนการมี:


🎨Key Insights Discovered


Insight 1: The Volume vs. Severity Paradox

ปริมาณรถติด ไม่ได้น่ากลัวเท่า “ถนนโล่ง”

Insight 1

คนทั่วไปคิดว่า กทม. มีคนตายเยอะเพราะอุบัติเหตุเกิดบ่อย ความจริง: “ยิ่งถนนโล่ง ยิ่งอันตรายถึงชีวิต”

  ปริมาณ อัตราเสียชีวิต
กรุงเทพฯ 1,528 ครั้ง (สูงสุด) 1.57% (ต่ำสุด)
จังหวัดห่างไกล น้อยกว่า 10 เท่า 33-35% (สูงสุด)

การปรับงบประมาณ:

  1. ลดงบโฆษณาในเมืองหลวง
  2. ติดตั้งอุปกรณ์ลดความเร็ว Rumble Strips
  3. ไฟส่องสว่างในทางหลวงชนบท

Insight 2: The Midnight Lethality

ช่วงเวลาแห่งความตาย

Insight 2

ช่วงเวลา ปริมาณ อัตราตาย
14:00-16:00 น. 📊 พีค ต่ำ
00:00-06:00 น. ต่ำ 📈 พีค (24.4%)
22:00-05:00 น. ปกติ ⚠️ สูงสุด

สาเหตุที่แตกต่าง:

การปรับงบประมาณ:

  1. จัดสรรกำลังคน → ช่วง 00:00-06:00 น. มากขึ้น
  2. Smart Lighting → ไฟอัจฉริยะบนถนนเสี่ยง

Insight 3: The Vehicle Size Discrepancy

อุบัติเหตุต่อการเสียชีวิตของประเภทยานพาหนะ

Insight 3

สถิติบอกเรา:

แต่ความจริง:

การปรับงบประมาณ:

  1. Segregation: เลนเฉพาะสำหรับรถจักรยานยนต์
  2. Telematics: บังคับใช้ในรถบรรทุก + Blind Spot Detection

Insight 4: The Holiday Illusion

อย่าใส่ใจแค่ช่วงเทศกาล

Insight 4

ข้อค้นพบที่น่าแปลก:

  อุบัติเหตุ อัตราตาย
เม.ย. / ธ.ค. (เทศกาล) สูง ปกติ
ตุลา-พฤศจิกายน (ปกติ) ปกติ สูงกว่า! 📈

ทำไม? เพราะเทศกาล = รถติด = ขับช้า = ลดเสียชีวิต

การปรับงบประมาณ:

  1. Always-on Campaign: ไม่ใช่เพียงเทศกาล ตลอดทั้งปี
  2. Dynamic Insurance Pricing: ปรับเบี้ยตามความเสี่ยงจริง

🔗 Live Lab

ความเกี่ยวข้องกับโปรเจกต์ Accident Decoder


📚

Lab 01.2.7: Navigate Database Design

เนื้อหา:

ประยุกต์ใช้ในโปรเจกต์:


Lab 05.1.4: Prepare Data in Different File Formats

เนื้อหา:

ประยุกต์ใช้ในโปรเจกต์:


🎯 Cross-Research Insight

🔄 การเชื่อมโยงระหว่าง 2 งานวิจัย

Accident Decoder + เพื่อน = ความสัมพันธ์ 5 Insight


♦ Insight 1: ปัจจัยด้านเวลา

ช่วงเวลา 19:00 น. เป็นช่วงที่มีอุบัติเหตุสูงสุด

Insight เวลา
เกิดอุบัติเหตุ 18:00-21:00 น.
เสียชีวิต 750 ราย @ 19:00 น.

การเชื่อมโยง:


♦ Insight 2: ปัจจัยด้านฤดูกาลและเทศกาล

เดือนมกราคมเป็นเดือนที่มีอัตราการเสียชีวิตสูงสุด (1,634 ราย)

การเชื่อมโยง:


♦ Insight 3: ปัจจัยด้านพฤติกรรมและเพศ

สถิติผู้เสียชีวิตเพศชายสูงกว่าเพศหญิงถึง 3 เท่า

พฤติกรรม:

❌ การละเลยการสวมหมวกนิรภัย

❌ การใช้ความเร็วเกินกว่ากฎหมายกำหนด

❌ การเมาแล้วขับ

การเชื่อมโยง:


♦ Insight 4: ปัจจัยด้านสรีรวิทยาและโครงสร้างสังคม

ลุ่มผู้สูงอายุ (อายุ 65 ปีขึ้นไป) คือกลุ่มที่มีอัตราการเสียชีวิตสูงสุด

สาเหตุ:

การเชื่อมโยง:


🎯 Insight 5: สมการแห่งความเสี่ยงสูงสุด

ผู้เสียชีวิต = 
  (เพศชาย + ผู้สูงอายุ) 
  × (รถจักรยานยนต์) 
  × (เวลา 18:00-21:00) 
  × (เดือน มกราคม-ธันวาคม)

🎨 Data Visualization as Functional Art

หนังสือ: ผศ.ดร.อานนท์ ศักดิ์วรวิชญ์
หลักการ: 5.2 มุมมองเชิงศิลปะของการออกแบบภาพนิทัศน์


หลักการสำคัญ

ข้อมูลต้องเด่นชัด

ในชาร์ต:


การเปรียบเทียบสายตา (Eyespan)

ทฤษฎี Stevens’ Psychophysics:

Spotlighting (เน้นจุดสำคัญ)

เมื่อต้องเจาะลึก:


💡 หลักการแก่นสาร

“หัวใจการออกแบบที่ดี ≠ ความสวยงาม”
“แต่ Clarity (ความชัดเจน) + Truthfulness (ความสัตย์)”

Dashboard ของฉัน:

  1. ✅ ลบความรก (Clutter Removal)
  2. ✅ ข้อมูลเด่น (Data Prominence)
  3. ✅ เปรียบเทียบได้ (Visual Comparison)
  4. ✅ เรื่องราวผ่านรูป (Narrative through Visuals)

📊 Dashboard

“Volume vs. Fatality” Scatter Plot


🔵 “ปริมาณอุบัติเหตุ (Accident Volume)” กับ 🔴 “ความรุนแรงของอุบัติเหตุ (Fatality Rate %)”

Scatter Plot Dashboard: Volume vs. Fatality Analysis ❌ ปัญหาหลัก “ไม่ใช่จำนวนอุบัติเหตุ” ✅ แต่คือ “ความรุนแรงของอุบัติเหตุ” —

Data Mapping มีความหมายอย่างไร?

X → Accident Count

Y → Fatality Rate

Bubble Size → Population

Color → Region


Insight สดใจ:

"กรุงเทพฯ = ขวาล่าง (High Volume + Low Fatality)
 → ให้งบ Awareness/Management เท่านั้น

จังหวัดห่างไกล = ซ้ายบน (Low Volume + High Fatality) ⚠️
 → ให้งบ Life-Saving Intervention เป็นลำดับแรก"

4 ส่วนของ Quadrant

  ตำแหน่ง ความหมาย ตัวอย่าง การตัดสินใจ
ขวาบน H.Vol + H.Fatal ปัญหา BIG & HARD -(ไม่มี) ติดตาม
ขวาล่าง H.Vol + L.Fatal ปัญหา BIG & SOFT กรุงเทพฯ Awareness
ซ้ายบน L.Vol + H.Fatal ปัญหา SMALL & HARD ⚠️ สุรินทร์ จัดสรรงบเพิ่ม!
ซ้ายล่าง L.Vol + L.Fatal ปัญหา SMALL & SOFT เชียงใหม่ The Safe Zone

📚 เอกสารอ้างอิง


The End