Google เปิดตัว Gemini 3.1 Flash-Lite โมเดล AI ที่เร็วและถูกที่สุดในตระกูล Gemini 3 อย่างเป็นทางการ โดยทำงานเร็วกว่า Gemini 2.5 Flash ถึง 2.5 เท่า พร้อมต้นทุนที่เป็นเพียง 1/8 ของ Gemini 3 Pro ทำให้เหมาะอย่างยิ่งสำหรับแอปพลิเคชันที่ต้องการประมวลผลจำนวนมากในราคาประหยัด
ประสิทธิภาพที่เหนือกว่า ในราคาที่ถูกกว่า
จากการทดสอบของ Artificial Analysis พบว่า Gemini 3.1 Flash-Lite มีความสามารถที่น่าประทับใจ ได้แก่
- เร็วกว่า Gemini 2.5 Flash ถึง 2.5× ในด้าน Time to First Answer Token
- ผลิต output เร็วกว่าเดิม 45%
- คุณภาพเทียบเท่า Gemini 2.5 Flash ในหลาย benchmark
- ถูกกว่า Gemini 3 Pro ถึง 8 เท่า
ราคาและการเข้าถึง
Gemini 3.1 Flash-Lite ให้บริการในราคา $0.25 ต่อ 1 ล้าน input token และ $1.50 ต่อ 1 ล้าน output token ซึ่งนับว่าถูกที่สุดในบรรดาโมเดล Gemini 3 ทั้งหมด ปัจจุบันเปิดให้ใช้งานในรูปแบบ Preview ผ่านช่องทาง
- Gemini API บน Google AI Studio
- Vertex AI สำหรับองค์กร
เหมาะกับงานอะไร?
Google ออกแบบ Gemini 3.1 Flash-Lite มาเพื่องาน high-volume, low-latency โดยเฉพาะ เช่น chatbot ที่ต้องตอบสนองเร็ว, การวิเคราะห์ข้อมูลขนาดใหญ่, การสร้างเนื้อหาอัตโนมัติ และ API ที่มีการเรียกใช้งานจำนวนมากในต้นทุนต่ำ
ด้วยความเร็วและความประหยัดที่โดดเด่น Gemini 3.1 Flash-Lite ถูกมองว่าเป็น โมเดลที่คุ้มค่าที่สุด ในตลาด AI ขณะนี้ เหมาะสำหรับ developer และบริษัทที่ต้องการปรับสมดุลระหว่างประสิทธิภาพและต้นทุน
ที่มา: Google Blog | VentureBeat


