Claude Fable 5 การนับถอยหลังสำหรับการคิดค่าบริการตามปริมาณ วิธีใช้โมเดลที่แข็งแกร่งที่สุดโดยไม่ทำให้บิลพุ่งสูง?

TL;DR
· Claude Fable 5 กลับมาให้บริการอีกครั้งตั้งแต่วันที่ 1 กรกฎาคม หลังจากวันที่ 7 กรกฎาคม การใช้งานเพิ่มเติมจะเปลี่ยนไปใช้เครดิตการใช้งาน
· ราคาอย่างเป็นทางการคือ 10 ดอลลาร์ต่อ 1 ล้านโทเค็นสำหรับข้อมูลเข้า และ 50 ดอลลาร์สำหรับโทเค็นส่งออก การสนทนาที่ยาวและการวนซ้ำอัตโนมัติจะเพิ่มการบริโภค
· ผู้ใช้ควรมุ่งเน้นการใช้ Fable 5 ในขั้นตอนการวางแผนและการตรวจสอบ และมอบหมายงานให้กับโมเดลที่ราคาถูกกว่า

Claude Fable 5 ซึ่งเปิดให้บริการอีกครั้ง ผู้ใช้ต่างมุ่งเน้นการประหยัดค่าใช้จ่ายที่เกี่ยวข้องกับโทเค็นที่มีราคาสูง โมเดลเรือธงที่ Anthropic เรียกว่า "most capable widely released model" นี้ออกแบบมาสำหรับงานที่ต้องใช้การคิดวิเคราะห์และงานตัวแทนระยะยาว รองรับหน้าต่างบริบท 1 ล้านโทเค็น และเอาต์พุตสูงสุด 128,000 โทเค็น ความสามารถที่เพิ่มขึ้นนำมาซึ่งปัญหาโดยตรงที่ว่า ผู้ใช้ใน Claude Code, Managed Agents หรือการสนทนาที่ยาว อาจปล่อยให้โมเดลคิดต่อเนื่อง เรียกใช้เครื่องมือ ตรวจสอบซ้ำ ซึ่งจะทำให้ค่าใช้จ่ายเพิ่มขึ้นอย่างมาก

ตามหน้าเว็บทางการของ Anthropic Claude Fable 5 กลับมาให้บริการอีกครั้งตั้งแต่วันที่ 1 กรกฎาคม 2026 สำหรับผู้ใช้ Pro, Max, Team, Enterprise รวมถึงช่องทาง Claude Platform, AWS, Google Cloud, Microsoft Foundry ราคาอย่างเป็นทางการคือ 10 ดอลลาร์ต่อ 1 ล้านโทเค็นสำหรับข้อมูลเข้า และ 50 ดอลลาร์ต่อ 1 ล้านโทเค็นสำหรับข้อมูลออก ส่วนราคาสำหรับการอ่านจากแคชพรอมต์จะได้รับส่วนลดสูงสุด 90% ของราคาเข้า

Anthropic กล่าวในประกาศ "Redeploying Fable 5" ว่าผู้ใช้ Pro, Max, Team และ Enterprise บางส่วนสามารถใช้โมเดลนี้ได้สูงสุด 50% ของขีดจำกัดการใช้งานรายสัปดาห์ก่อนวันที่ 7 กรกฎาคม หลังจากนั้น การใช้งานต่อไปจะถูกเรียกเก็บเงินผ่านเครดิตการใช้งาน

Fable 5 จึงไม่เหมาะที่จะใช้เป็นโมเดลแชทเริ่มต้นแบบเปิดทิ้งไว้ มันเหมือนสถาปนิกและผู้ตรวจสอบที่มีราคาแพง เหมาะสำหรับการกำหนดทิศทางเมื่อเริ่มงาน และตรวจสอบก่อนงานจะเสร็จ ส่วนการทำงานจำนวนมากในระหว่างนั้นควรให้โมเดลที่ราคาถูกกว่าทำ

สิ่งที่แพงที่สุดไม่ใช่คำตอบเดียว แต่เป็นงานยาวที่ทำงานอัตโนมัติ

แรงกดดันด้านต้นทุนของ Fable 5 มาจากราคาต่อหน่วยก่อน

ที่ 10 ดอลลาร์ต่อ 1 ล้านโทเค็นข้อมูลเข้า และ 50 ดอลลาร์ต่อ 1 ล้านโทเค็นข้อมูลออก ทำให้มันเป็นโมเดลราคาสูง เมื่อถามสั้น ๆ ตอบสั้น ๆ ผู้ใช้อาจไม่รู้สึกมาก แต่เมื่อเข้าสู่สถานการณ์ลูกโซ่ยาว เช่น การแก้ไขโค้ด การจัดระเบียบข้อมูล แผนผลิตภัณฑ์ งานวิจัย งานตัวแทนอัตโนมัติ โทเค็นส่งออก บริบท การเรียกใช้เครื่องมือ และการแก้ไขหลายรอบจะรวมกัน

สิ่งที่ขยายการบริโภคได้ง่ายกว่าคือจุดแข็งของ Fable 5

เอกสารทางการจัดตำแหน่งให้เหมาะกับงานตัวแทนระยะยาว (long-horizon agentic work) มันสามารถแบ่งงานออกเป็นหลายขั้นตอน ตรวจสอบช่องว่างอย่างกระตือรือร้น และเรียกใช้เครื่องมือหรืองานย่อยต่อไปตามความจำเป็น สำหรับงานที่ซับซ้อน สิ่งนี้มีค่ามาก ผู้ใช้ไม่จำเป็นต้องแนะแนวทีละขั้นตอน โมเดลสามารถทำซ้ำรอบเป้าหมายได้เอง

แต่ถ้าเป้าหมายไม่ชัดเจน ขอบเขตกว้างเกินไป และใช้เวลานานเกินไป โมเดลอาจทำงานต่อไปเพื่อให้งานสมบูรณ์ยิ่งขึ้น ผู้เขียนต้นฉบับกล่าวว่าในชั่วโมงแรกของการทดสอบ พวกเขาเกือบจะหมดขีดจำกัดการใช้งาน แม้ว่าจะไม่ได้ทำงานพิเศษใด ๆ ก็ตาม ประสบการณ์นี้เป็นเหมือนคำติชมของผู้ใช้มากกว่า ซึ่งไม่ใช่การคำนวณต้นทุนอย่างเป็นทางการ แต่เป็นการเตือนถึงความเสี่ยงที่แท้จริง: การสนทนาที่ยาว การวนซ้ำอัตโนมัติ และการใช้ผิดวิธีโดยค่าเริ่มต้น จะกลายเป็นการบริโภคเครดิตโดยตรงมากขึ้นหลังจากวันที่ 7 กรกฎาคม

"10-80-10": ใช้ Fable เฉพาะที่ปลายทั้งสองที่สำคัญ

แนวทางหลักที่ผู้เขียนเสนอคือเปลี่ยน Fable 5 จาก "ผู้ดำเนินการตลอดทั้งกระบวนการ" เป็น "ผู้ตรวจสอบทั้งก่อนและหลัง"

ที่เรียกว่า "10-80-10" คร่าว ๆ สอดคล้องกับสามขั้นตอนของโครงการ AI

10% แรกใช้ Fable ในการวางแผน กำหนดโครงสร้างงาน เส้นทางการดำเนินการ เกณฑ์ความสำเร็จ ข้อจำกัด และรูปแบบการส่งมอบ สิ่งที่เหมาะสมที่สุดไม่ใช่การดำเนินการตามกลไก แต่เป็นการวางแผนที่ชัดเจนก่อนเริ่มงานที่ซับซ้อน

80% ตรงกลางเปลี่ยนไปใช้โมเดลที่ราคาถูกกว่าดำเนินการ โทเค็นจำนวนมากมักถูกบริโภคในการแก้ไขซ้ำ การปรับรูปแบบ การแก้ไขโค้ดเล็กน้อย การจัดระเบียบข้อมูล การสร้างทั่วไป และการทำซ้ำไปมา ส่วนนี้ไม่จำเป็นต้องให้ Fable 5 มีส่วนร่วมตลอดเวลา สามารถมอบให้ Opus, Sonnet, Haiku หรือโมเดลอื่นที่มีต้นทุนต่ำกว่า

10% สุดท้ายดึง Fable กลับมาทำการตรวจสอบอีกครั้ง หลังจากโมเดลราคาถูกทำงานหลักเสร็จ ให้ Fable ตรวจสอบผลลัพธ์เทียบกับแผนเดิม ว่ามีการเบี่ยงเบนจากเป้าหมายหรือไม่ มีอะไรที่ขาดหรือไม่ จุดไหนที่ต้องแก้ไข ถึงมาตรฐานการเผยแพร่หรือไม่ เพราะ ณ จุดนี้มันกำลังตรวจสอบผลผลิตที่มีอยู่ แทนที่จะสร้างเนื้อหาทั้งหมดตั้งแต่ต้น การบริโภคโทเค็นจะต่ำกว่ามาก

วิธีนี้ไม่ใช่สูตรการประหยัดต้นทุนที่รับประกันโดยทางการ ผู้เขียนกล่าวว่าในบางสถานการณ์ การเปลี่ยนชั้นการดำเนินการเป็นโมเดลราคาถูกสามารถลดค่าใช้จ่ายโทเค็นลงมากกว่า 50% แต่ควรถือเป็นประสบการณ์การใช้งาน สิ่งที่สามารถทำซ้ำได้จริงคือ โมเดลระดับสูงไม่จำเป็นต้องรับภาระงานที่ใช้โทเค็นหนาแน่นทั้งหมด มันเหมาะที่จะใช้ในขั้นตอนการตัดสินใจ สถาปัตยกรรม และการระบุข้อผิดพลาด

/goal และ /loop ทำให้ตัวแทนใช้งานได้ดีขึ้น แต่ค่าใช้จ่ายก็สังเกตได้ยากขึ้น

การเปลี่ยนแปลงอีกอย่างของ Fable 5 คือมันเหมาะกับเวิร์กโฟลว์แบบตัวแทนมากขึ้น

ในวิธีการพรอมต์แบบเดิม ผู้ใช้ถาม โมเดลตอบ ผู้ใช้ตรวจสอบแล้วถามต่อ การวนซ้ำถูกผลักดันโดยมนุษย์ ทุกขั้นตอนว่าจะดำเนินการต่อ แก้ไข หรือหยุด ผู้ใช้เป็นผู้ตัดสินใจ

ในสภาพแวดล้อม Claude Code /goal และ /loop เปลี่ยนกระบวนการนี้เป็นวิธีการดำเนินการอัตโนมัติมากขึ้น

เอกสาร Anthropic แสดงว่า /goal จะทำงานต่อเนื่องจนกว่าเงื่อนไขจะสมบูรณ์หรือผู้ใช้ยกเลิก และสามารถแสดงค่าใช้จ่ายโทเค็นได้ ทางการยังแนะนำให้ผู้ใช้เพิ่มขอบเขตเวลา เช่น "หยุดหลังจาก 20 รอบ" เป้าหมายที่ดีไม่ควรเป็นแค่ "ช่วยแก้ไขโค้ด" แต่ควรระบุว่าจะทำให้สำเร็จอะไร ตรวจสอบผลลัพธ์อย่างไร ข้อจำกัดใดที่ไม่ควรละเมิด และเมื่อใดควรหยุด

/loop ใช้สำหรับรันพรอมต์ซ้ำตามช่วงเวลา เช่น ตรวจสอบสถานะการปรับใช้ทุก 5 นาที หรือให้ Claude เลือกช่วงเวลาแบบไดนามิก เอกสารทางการแสดงว่างานแบบวนซ้ำมีกฎหมดอายุ 7 วัน ฟังก์ชันเหล่านี้เหมาะสำหรับการตรวจสอบ การทำซ้ำ การตรวจสอบ การซ่อมแซมระยะยาว และงานตัวแทน โดยโมเดลสามารถทำงานต่อไปได้โดยไม่ต้องรอให้ผู้ใช้แนะนำซ้ำ

ความเสี่ยงด้านค่าใช้จ่ายก็เกิดขึ้นที่นี่

การวนซ้ำอัตโนมัติเปลี่ยนจาก "มนุษย์ยืนยันขั้นตอนถัดไปด้วยตนเอง" เป็น "โมเดลทำงานต่อไปตามแผน" ถ้าเป้าหมายกว้างเกินไป เงื่อนไขสิ้นสุดไม่ชัดเจน ช่วงเวลาแน่นเกินไป หรือใช้เวลานานเกินไป Fable 5 อาจยังคงบริโภคโทเค็นต่อไปแม้ผู้ใช้ไม่อยู่ ยิ่งโมเดลเก่งในการค้นหาปัญหา เพิ่มขั้นตอน และตรวจสอบตัวเอง ยิ่งจำเป็นที่ผู้ใช้ต้องตั้งขอบเขตที่ชัดเจนล่วงหน้า

ดังนั้น 10-80-10 และวิศวกรรมลูป (loop engineering) ควรใช้ร่วมกัน: Fable 5 รับผิดชอบการออกแบบลูป กำหนดเป้าหมาย และเกณฑ์การยอมรับ ชั้นการดำเนินการควรมอบให้โมเดลราคาถูกที่สุด และเมื่อลูปปิด ผลลัพธ์ต้องการการตัดสินใจ หรือจุดสำคัญต้องการการตรวจสอบคุณภาพ จึงให้ Fable 5 เข้ามามีส่วนร่วม

หลังจากวันที่ 7 กรกฎาคม ต้องตรวจสอบการเลือกโมเดลและขีดจำกัดการใช้จ่ายอีกครั้ง

สำหรับผู้ใช้ทั่วไป ความเสี่ยงโดยตรงที่สุดไม่ใช่เวิร์กโฟลว์ที่ซับซ้อน แต่เป็นการใช้ผิดวิธี

ผู้เขียนเตือนว่าเมื่อเปิด Claude Code หรือแอป Claude โมเดลอาจถูกเลือกเป็น Fable โดยอัตโนมัติ คำพูดนี้เป็นเหมือนประสบการณ์ของผู้ใช้มากกว่า เอกสารทางการไม่ได้ระบุว่าเป็นกฎ统一 แต่ในช่วงที่โมเดลใหม่เปิดให้บริการอีกครั้งและแพลตฟอร์มสนับสนุนให้ผู้ใช้ทดสอบ ผู้ใช้บางคนอาจใช้โมเดลที่แพงที่สุดโดยไม่ตั้งใจในการสนทนาทั่วไป การจัดระเบียบง่าย ๆ หรืองานมูลค่าต่ำ

เมื่อการเรียกเก็บเงินตามเครดิตเริ่มต้นขึ้น การใช้ผิดวิธีนี้จะอ่อนไหวมากขึ้น การสนทนาง่าย ๆ การปรับเปลี่ยนเล็กน้อย การจัดรูปแบบ การสรุปทั่วไป ไม่จำเป็นต้องใช้ Fable 5 การตรวจสอบตัวเลือกโมเดลก่อนเริ่มการสนทนาทุกครั้งอาจกลายเป็นการกระทำพื้นฐานสำหรับผู้ใช้ที่ใช้งานบ่อย

อีกคำเตือนที่สำคัญคือการตั้งค่าขีดจำกัดการใช้จ่าย (spending cap)

เอกสารสนับสนุนของ Anthropic แสดงว่าเครดิตการใช้งานต้องเปิดใช้งานที่ Settings > Usage ผู้ใช้สามารถตั้งค่าช่องทางการชำระเงินและซื้อหรือเติมเครดิตล่วงหน้า พร้อมทั้งกำหนด monthly spending cap, auto-reload และ usage alerts Claude Code ยังใช้เครดิตการใช้งานได้ด้วย

หากไม่มีขีดจำกัดรายเดือน งานยาว การวนซ้ำอัตโนมัติ และการดำเนินการตัวแทนอาจสะสมค่าใช้จ่ายที่เห็นได้ชัดเจนในเวลาอันสั้น สำหรับผู้ใช้ที่ใช้งานบ่อย การตั้งค่าขีดจำกัดการใช้จ่ายรายเดือน การใช้การแจ้งเตือน และการเขียนเงื่อนไขหยุดที่ชัดเจนใน /goal หรือ /loop ไม่ใช่แค่การตั้งค่าทางการเงินอีกต่อไป แต่เป็นส่วนหนึ่งของการใช้โมเดลตัวแทน

นิสัยใหม่ที่โมเดลเช่น Fable 5 นำมาคือการจัดสรรโมเดลตามมูลค่าและความยากของงาน การวางแผน การตัดสินใจที่ซับซ้อน และการตรวจสอบครั้งสุดท้ายสมควรใช้ Fable ส่วนการดำเนินการซ้ำ การสร้างทั่วไป และการแก้ไขเล็กน้อย เหมาะกับโมเดลราคาถูกกว่า โมเดลระดับสูงกำลังเปลี่ยนจาก "แชทบอทที่ฉลาดกว่า" เป็น "ตัวแทนที่ทำงานอัตโนมัติได้" ยิ่งมีความสามารถมากเท่าไหร่ ผู้ใช้ยิ่งต้องกำหนดเป้าหมาย ขอบเขต เวลา และงบประมาณล่วงหน้ามากเท่านั้น มิฉะนั้น ค่าใช้จ่ายที่ไม่สามารถควบคุมอาจเกิดขึ้นเร็วกว่าความล้มเหลวของงาน

คลิกเพื่อดูตำแหน่งงานที่ BlockBeats กำลังเปิดรับ

ยินดีต้อนรับเข้าสู่ชุมชนทางการของ BlockBeats:

Telegram สมัครสมาชิก: https://t.me/theblockbeats

Telegram กลุ่มพูดคุย: https://t.me/BlockBeats_App

Twitter บัญชีทางการ: https://twitter.com/BlockBeatsAsia

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น