Ingest: เก็บความรู้เข้า wiki

Ingest คือการนำแหล่งข้อมูลดิบมาสังเคราะห์เป็น concept ใน wiki นี่คือหัวใจของการทำให้ wiki "รวยขึ้น"

หลักการสำคัญที่สุด: ingest ต้องมีคนกำกับ

🚫 อย่าทำ ingest อัตโนมัติเบื้องหลัง (background daemon)

นี่คือ anti-pattern ที่สำคัญที่สุด — daemon ที่กลืนทุกอย่างที่เห็นจะ สะสม noise เร็วเท่ากับสะสมสัญญาณ แล้ว wiki จะ เน่าอย่างเงียบ ๆ จนเชื่อถืออะไรไม่ได้

ให้ ingest เป็น คำสั่งที่คนตั้งใจสั่ง — การตัดสินใจของมนุษย์ว่า "แหล่งนี้คุ้มที่จะสังเคราะห์ไหม" คือ ประตูคุณภาพ (quality gate) ที่ตัดความล้มเหลวทั้งกองทิ้งไปได้

ขั้นตอน ingest (แบบมีคนกำกับ)

  1. อ่านแหล่ง ใน raw/
  2. อ่าน wiki/index.md เพื่อรู้ว่ามี concept อะไรอยู่แล้ว
  3. ดึง 5–15 ประเด็น (claim/decision/insight) ที่ควรเก็บ
  4. แสดงประเด็นที่ดึงมา + การ map ไปยัง concept ให้คุณอนุมัติ — แล้วรอ ก่อนเขียนอะไร
  5. ปรับข้อขัดแย้ง (reconcile) — ถ้าข้อมูลใหม่ขัดกับ concept เดิม ให้เติมธงในไฟล์เก่า:
    > **CONTRADICTION FLAG**: ผลใหม่แทนที่ค่านี้ ดู references/metrics/new-wau.md
    
  6. เขียน/อัปเดต concept (เริ่มจาก template) อัปเดต tags + timestamp
  7. อัปเดต index.md ที่เกี่ยวข้อง
  8. เพิ่มรายการลง log.md ใต้วันที่วันนี้
  9. รัน validate ก่อนถือว่าเสร็จ

ใช้ผ่าน AI agent

ถ้าติดตั้ง skill แล้ว แค่บอก:

ingest raw/q3-strategy.pdf เข้า wiki

agent จะทำตามขั้นตอนข้างบน — ดึงประเด็น แสดงให้คุณอนุมัติก่อน แล้วค่อยเขียน concept, อัปเดต index.md และ log.md ให้

ทำไมต้องปรับข้อขัดแย้งทุกครั้ง

สมมติมี paper บอกว่า "Model Z เก่งสุด" แต่ใน wiki มีหน้าเขียนว่า "Model X เก่งสุด"

  • RAG แบบเดิม: สองหน้าอยู่ด้วยกัน agent อาจดึงหน้าเก่ามาตอบผิดอย่างมั่นใจ
  • OKF (ingest แบบ agentic): ทุกครั้งที่เพิ่มความรู้ จะ ตรวจรอบ ๆ ว่าขัด/แทนที่/ยืนยันอะไร แล้วเขียนความสัมพันธ์นั้นลงไปชัด ๆ — หน้าเก่าได้ธาย "ถูกแทนที่แล้ว ดู B" หน้าใหม่ได้บริบท "ปรับปรุงจาก A" ทั้งสองหน้าถูกต้องพร้อมกัน wiki มี "ปัจจุบันกาล" ที่สอดคล้อง

เคล็ดลับ

  • ingest ทีละแหล่ง แล้วอยู่ร่วมตรวจ — อ่านสรุป เช็กการอัปเดต ชี้แนะว่าให้เน้นอะไร
  • แหล่งหนึ่งอาจแตะ 10–15 หน้าใน wiki (concept + entity + index + log)
  • เริ่ม ingest แบบ เลือกสรร ไม่ต้องเทเข้าทั้งหมดทีเดียว — ปัญหา cold-start เล็กกว่าที่คิด เพราะหัวข้อที่คุณสนใจที่สุดมักถูกครอบคลุมก่อน

ต่อไป: เมื่อมีความรู้แล้ว จะถามและค้นยังไง → Query และ Search