Andrej Karpathy คือใคร
Andrej Karpathy คือผู้ร่วมก่อตั้ง OpenAI อดีตผู้อำนวยการของ Tesla และเป็นผู้ทรงทรงอิทธิพลในวงการ AI, เขาได้กล่าวถึงแนวคิดที่เรียบง่ายแต่ใช้งานได้จริงและมีประสิทธิภาพ นั่นคือการบันทึกเอกสารหรือข้อมูลที่อยู่ในรูป markdown ให้กลายเป็นฐานข้อมูลส่วนตัวด้วย LLM และสามารถนำไปใช้ได้จริง

เขาเรียกสิ่งนั้นว่า LLM Wiki คือการจัดเก็บข้อมูลให้อยู่ในที่ที่เดียวกันในรูปแบบ markdown ไม่ต้องเก็บไว้กระจัดกระจายไปตามแอปต่างๆ จากนั้นจึงให้ Claude Code หรือ Coding Agent อื่นๆ ค้นหาคำตอบอ้างอิงจากคำถามของคุณจากข้อมูลของคุณเองไม่ใช่จากอินเทอร์เน็ตภาพนอก

LLM แบบปกติ
เวลาใช้ LLM หรือทำเกี่ยวกับเอกสารจะมักเป็น RAG คือการที่คุณนำเอกสาร, ข้อมูลชุดนึงใส่อัปโหลดเข้าไป LLM จะทำการดึงข้อมูลที่เกี่ยวข้องกับคำถามและสร้างคำตอบ นี่คือวิธีการที่เรารู้จักและใช้ได้ดีแต่ LLM นั้นจะไม่มีการจดจำคำตอบเก่าเวลาที่เราถามคำถามใหม่ LLM จะค้นหาและสร้างคำตอบใหม่ซึ่งอาจจะไม่แม่นยำ เช่นถ้าถามคำถามที่ซับซ้อน 5คำถาม LLM จะนำเอกสารที่เกี่ยวข้องมาเชื่อมกันแต่ไม่มีการเก็บบันทึกไว้ การอัปโหลดไฟล์ใน ChatGPT และ RAG ก็เป็นแบบเดียวกัน
LLM Wiki เพิ่มอะไรขึ้นมา
LLM Wiki นั้นได้เพิ่มการจดจำข้อมูลขึ้นมาเป็นแบบ Wiki ซึ่งจะเก็บข้อมูลที่อัปโหลดเข้าไปนั้นไว้ถาวรและเมื่อมีการอัปโหลดข้อมูลใหม่เข้าไป LLM จะมีการอ่านข้อมูล, เลือกหัวข้อสำคัญ, สรุปเนื้อหาและทำการเทียบข้อมูลใหม่กับข้อมูลเก่าเพื่ออัปเดตข้อมูลใน Wiki ของเราและในการดูแล Wiki นั้นก็เป็นหน้าที่ของ LLM ส่วนตัวเรามีหน้าที่ในการหาแหล่งข้อมูลอ้างอิงใหม่ๆมาอัปโหลดเพิ่มเติม
Wiki นั้นจะสะสมความรู้ไปเรื่อยๆจากการที่เราอัปโหลดข้อมูลใส่เพิ่มหรือจากการถามคำถามของเรา
ตัวอย่างการใช้ LLM Wiki ในงานต่างๆ
- ใช้สำหรับเรื่องส่วนตัว เช่น การบันทึกติดตามเป้าหมาย การออกกำลังกาย สุขภาพกาย บันทึกประจำวันบทความหรืออื่นๆ และค่อยๆสร้างภาพรวมของตัวคุณ
- ใช้สำหรับทางการวิจัย เช่น การศึกษาวิจัยนึงเป็นเวลานานๆ ค้นหาข้อมูลมาเพิ่มเรื่อยๆ จดบันทึก ค่อยๆพัฒนา Wiki จนครอบคลุมเนื้อหาและสามารถสรุปออกมาได้
- ใช้สำหรับบันทึกหนังสือ เช่น การแบ่งเก็บข้อมูลเป็นตัวละคร เมือง เหตุการณ์ที่เกิดขึ้น เนื้อเรื่องต่างๆ พออ่านไปเรื่อยๆก็จะสะสมข้อมูลเอาไว้ใน wiki ให้คนมาศึกษาต่อได้หรือเพื่อทวนความจำเป็น Fandom ของหนังสือนั้น
โครงสร้างของ LLM Wiki
สถาปัตยกรรมมี 3 ชั้น ได้แก่
- แหล่งข้อมูลดิบ (Raw Source) – แหล่งข้อมูลดิบที่เราหามา เช่น บันทึก เอกสารการวิจัย บทความ รูปภาพ ส่วนนี้จะเป็นส่วนที่ LLM ไม่สามารถแก้ไขได้
- Wiki – directory ของไฟล์ markdown ที่ LLM สร้างขึ้นมา สามารถอ่าน วิเคราะห์ เรียบเรียง และนำไปสรุปได้และเมื่อมีการอัปเดตข้อมูลใหม่ LLM ก็จะจัดการในหน้านี้
- The schema – เป็นที่เก็บไฟล์(เช่น CLAUDE.md สำหรับ Claude Code หรือ AGENTS.md สำหรับ Codex)ที่บอกให้ LLM เข้าใจโครงสร้างของ Wiki และทำตาม Work flow นั้นๆเมื่อได้รับข้อมูล นี่คือการตั้งค่าหลักที่ทำให้ LLM ที่มี Wiki ต่างจากแชทบอททั่วไป
การดำเนินงาน
- Ingest (รับข้อมูลเข้า) – คุณวางแหล่งข้อมูลใหม่ลงในชุดข้อมูลดิบ และบอก LLM ให้ประมวลผล
- Query (ค้นหา) – คุณถามคำถาม wiki LLM ค้นหาหน้าที่เกี่ยวข้อง อ่าน และวิเคราะห์คำตอบพร้อมการอ้างอิง คำตอบมีได้หลายรูปแบบขึ้นอยู่กับคำถาม
- Lint (ตรวจสุขภาพ) – เป็นระยะๆ ให้ LLM ตรวจสอบ wiki ดูว่ามีความผิดพลาดของข้อมูล ข้อมูลเก่าที่ถูกแหล่งข้อมูลใหม่แทนที่ อ้างอิงที่ขาดหายไป การหาข้อมูลใหม่มาเติมจะช่วยให้ LLM มีความแม่นยำและฉลาดขึ้น
สรุป LLM Wiki
เครื่องมือ LLM Wiki สร้างขึ้นมาเพื่อแก้จุด Pain point ในการจัดเก็บและอัปเดตข้อมูลให้ทันสมัยอยู่ตลอดเวลาและปัญหาต่างๆหลังจากอัปเดตข้อมูลใหม่แล้วเกิดการทับซ้อนกันของข้อมูลจนยุ่งเหยิงไปหมด ทำให้หลายๆคนทิ้ง Wiki ไว้ข้างหลังและหันไปหาเครื่องมืออื่นๆแทน แต่ด้วย LLM ที่นำมาประยุคก์ใช้ก็สามารถจัดการปัญหาเล่านี้ได้ ทั้งการอัปเดตข้อมูลใหม่ ตรวจสอบข้อมูลเก่า สรุปข้อมูลปัจจุบัน ทั้งหมดนี้เราก็ให้ LLM เป็นคนจัดการทั้งหมด
ส่วนเราก็มีหน้าที่ในการป้อนข้อมูลที่หามาใส่เข้าไปและถามคำถามที่อยากรู้แล้ว LLM ก็จะเป็นคนจัดการตั้งแต่ขั้นตอนบันทึกข้อมูลใหม่ เรียบเรียง วิเคราะห์ข้อมูลและสร้างคำตอบตามคำถามที่เราถามไป
เราสามารถมองได้ว่า LLM Wiki คือเครื่องมือในการลดภาระหน้าที่ของเรานั่นเอง
เรียบเรียง ภูดิศ โภคามาตย์
อ้างอิง
https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f#file-llm-wiki-md
https://www.mindstudio.ai/blog/andrej-karpathy-llm-wiki-knowledge-base-claude-code








