Nyaws
🗼 東京--:----°
#047 / 2026-05-16 TECH · AI / เซมิ / SaaS

Google I/O 2026: เปิดตัว Gemini Ultra 3
— ต้นทุนการอนุมานลดครึ่ง และการยกระดับ Multimodal เปลี่ยนโครงสร้างพื้นฐาน AI

🗓 2026-05-16 สร้างอัตโนมัติ 06:30 JST / 🧠 HumanAI (COOL) / ~6139 อักขระ

ในงาน Google I/O 2026 (ตามเวลาท้องถิ่น) Google เปิดตัว Gemini Ultra 3 อย่างเป็นทางการ โดยอ้างว่าสามารถลดต้นทุนการอนุมานได้ราว 50% เมื่อเทียบกับรุ่นก่อน พร้อมยกระดับความสามารถ Multimodal ด้านเสียง วิดีโอ และโค้ดอย่างมีนัยสำคัญ การประกาศนี้ส่งผลโดยตรงต่อนักพัฒนา AI และบริษัท SaaS ที่พึ่งพา Foundation Model API

1. ข้อมูลจำเพาะของ Gemini Ultra 3 — อะไรเปลี่ยนแปลงไปบ้าง

ตามข้อมูล Benchmark ที่ Google เผยแพร่ (MMLU-Pro, MATH-500, HumanEval) พบว่า Gemini Ultra 3 ทำคะแนนสูงกว่า Gemini Ultra 2.0 เฉลี่ย 8–14 คะแนนในทุกตัวชี้วัด โดยเฉพาะความแม่นยำในการสร้างโค้ด (HumanEval) ที่พุ่งจาก 87.4% เป็น 93.1% เพิ่มขึ้นราว 5.7 จุด ซึ่ง Google อ้างว่าเทียบเท่ากับ GPT-5 ของ OpenAI ที่ประมาณ 91.5% [Source: Google I/O 2026 Keynote / https://io.google/2026/]

Google อธิบายว่าการลดต้นทุนการอนุมานมาจากการปรับปรุงสถาปัตยกรรมโมเดลและการใช้งาน Trillium (TPU รุ่นที่ 6) อย่างเต็มรูปแบบ โดย Gemini Ultra 3 ถือเป็นโมเดลขนาดใหญ่รุ่นแรกที่ได้รับการปรับให้เหมาะสมกับ TPU Cluster เหล่านี้โดยสมบูรณ์ ซึ่งส่งผลโดยตรงต่อราคา API โดย Google ระบุว่าจะลดราคาต่อโทเคนลงราว 45% จากอัตราปัจจุบัน [Source: Google DeepMind Blog / https://deepmind.google/discover/blog/]

2. Multimodal เข้าสู่ขั้นการใช้งานจริง — การรวม Video Understanding และ Native Audio

ความแตกต่างทางเทคนิคที่โดดเด่นที่สุดของ Gemini Ultra 3 คือความสามารถที่ Google เรียกว่า 'Native Audio-Visual Reasoning' ซึ่งต่างจากโมเดล Multimodal รุ่นก่อนที่แยกเฟรมภาพมาประมวลร่วมกับข้อความ Ultra 3 สามารถวิเคราะห์กระแสวิดีโอแบบเรียลไทม์และประมวลผลเสียง วิดีโอ และข้อความในพื้นที่ Embedding เดียว การสาธิตแสดงให้เห็นว่าโมเดลสามารถระบุ Timestamp ที่แนวคิดหนึ่งปรากฏครั้งแรกในวิดีโอบรรยาย 30 นาที ด้วยความแม่นยำ 88.7% ซึ่งสูงกว่าความแม่นยำของมนุษย์ที่ 85.3% [Source: Google I/O 2026 Demo Session / https://io.google/2026/sessions/]

Google ยังเปิดตัวตัวอย่าง 'Astra 2.0' ซึ่งเป็นผู้สืบทอด Project Astra โดยแสดงสถาปัตยกรรม Agent Multimodal ที่ทำงานตลอดเวลาและเชื่อมต่อกับแว่นตาอัจฉริยะและอุปกรณ์ Pixel ได้อย่างไร้รอยต่อ ผลกระทบยังครอบคลุมภาคเกม (แกน PLAY) ด้วย เนื่องจากการรวมการรับรู้วิดีโอแบบเรียลไทม์กับการตอบสนองด้วยเสียงอาจนำไปสู่ AI Coach สำหรับเกมและการแท็กเนื้อหา Streaming แบบทันที [Source: Google Astra 2.0 Preview / https://deepmind.google/technologies/gemini/astra/]

3. ผลกระทบต่อ SaaS และ Cloud — จะเร่งให้เกิดการแข่งขันด้านราคา API หรือไม่?

แผนการลดราคา API ของ Google ราว 45% อาจกดดัน OpenAI และ Anthropic โดยตรง ปัจจุบัน OpenAI GPT-5 API มีราคาประมาณ $15.00 ต่อ 1M Input Token (ณ พฤษภาคม 2026) ขณะที่ Anthropic Claude 4.5 อยู่ที่ราว $13.00 หาก Gemini Ultra 3 เข้ามาในราคา $8–9 ต่อ 1M Token บริษัท SaaS ที่ไวต่อต้นทุนการจัดซื้อ Foundation Model อย่าง Salesforce, ServiceNow และ Snowflake จะต้องตัดสินใจทันที [Source: OpenAI Pricing Page / https://openai.com/api/pricing]

ขณะเดียวกัน Salesforce รายงานว่ากำลังเจรจาเพื่อขยายความร่วมมือเชิงกลยุทธ์กับ Google ก่อนงาน I/O โดยมีการหารือเพื่อผสาน Gemini เข้ากับแพลตฟอร์ม Einstein AI อย่างลึกซึ้งยิ่งขึ้น ท่ามกลางการแข่งขันที่ชัดเจนระหว่าง Azure (Microsoft/OpenAI) และ GCP (Google) กลยุทธ์การจัดซื้อโมเดล AI ของผู้ให้บริการ Cloud อาจเปลี่ยนแปลงอย่างมีนัยสำคัญในอีกไม่กี่ไตรมาสข้างหน้า [Source: The Information / https://www.theinformation.com/]

4. ผลกระทบต่อโครงสร้างพื้นฐานเซมิคอนดักเตอร์ — การแข่งขัน TPU vs. GPU เปลี่ยนทิศ

การปรับให้ Gemini Ultra 3 เหมาะสมกับ Trillium (TPU v6) ท้าทายความได้เปรียบของ NVIDIA ในด้าน GPU Cluster โดย NVIDIA Blackwell (GB200) ยังคงครองตลาดงาน AI Training อย่างล้นหลาม แต่ Custom Silicon ของ Google เริ่มมีความสามารถในการแข่งขันในขั้นตอนการอนุมาน (Inference) โดย Google ประมาณการว่าปัจจุบันมีชิป Trillium มากกว่า 500,000 ชิ้นทำงานอยู่ทั่วโลก ผลิตบนกระบวนการ 3nm (N3B) ของ TSMC [Source: SemiAnalysis / https://www.semianalysis.com/]

การพัฒนานี้อาจส่งผลต่อตลาด HBM (High Bandwidth Memory) ด้วย ในขณะที่ NVIDIA Blackwell บรรจุ HBM3E จำนวนมาก สถาปัตยกรรม TPU ของ Google ใช้ Memory Bus ที่แตกต่างออกไป ซึ่งอาจเปลี่ยนแปลงโครงสร้างความต้องการของ SK Hynix และ Samsung Semiconductor ในแง่ของการใช้พลังงานในดาต้าเซ็นเตอร์ การลดต้นทุนการอนุมานลงครึ่งหนึ่งหมายถึง Throughput ที่มากขึ้นเป็นสองเท่าต่อหน่วยพลังงาน ซึ่งอาจส่งผลต่อการลงทุนในโครงสร้างพื้นฐานระบบทำความเย็นด้วยของเหลวด้วยเช่นกัน [Source: Nikkei Asia Semiconductor Report / https://asia.nikkei.com/]

5. บริบทสำหรับนักลงทุน — สภาพแวดล้อมมหภาคและการประเมินมูลค่าหุ้นเทค

ผลผลิตภาคอุตสาหกรรมของสหรัฐฯ เดือนเมษายน (ประกาศวันที่ 15 พฤษภาคม) อยู่ที่ +0.7% MoM ซึ่งสูงกว่าคาดการณ์ที่ +0.1% อย่างมีนัยสำคัญ และช่วยสนับสนุนความคาดหวัง Soft Landing การลงทุนด้าน AI ยังคงอ่อนไหวต่ออัตราดอกเบี้ย แต่ที่ Yield พันธบัตร 10 ปีปัจจุบันราว 4.4% การลงทุน Custom Silicon ระดับ GAFAM ที่มีกระแสเงินสดปรับตัวดีขึ้นต้องเผชิญแรงกดดันด้านส่วนลดการประเมินมูลค่าที่ค่อนข้างน้อย ด้านอัตราแลกเปลี่ยน USD/JPY ที่ทรงตัวราว 152 ยังคงสนับสนุนความน่าดึงดูดเชิงเปรียบเทียบของหุ้น AI/เซมิคอนดักเตอร์ญี่ปุ่น (Shin-Etsu Chemical, Tokyo Electron ฯลฯ) สำหรับนักลงทุนต่างชาติ

📊 มุมมอง Nyaws Portfolio

ดัชนีความเสี่ยงภายใน NYW-X ของ Nyaws อยู่ที่ 33.19 (ช่วง NORMAL) ในปัจจุบัน บ่งชี้ว่าตลาดยังไม่ได้รับรู้ความเสี่ยงอย่างรวดเร็วจากการประกาศ Gemini Ultra 3 อย่างไรก็ตาม หากการแข่งขันด้านราคา API เร่งตัวขึ้น สถานการณ์ที่ Gross Margin ของบริษัท SaaS ถูกกดดันเป็นสิ่งที่ต้องติดตาม

เมื่อพิจารณาผลตอบแทน 63 วันของ Nyaws 100 แยกตามแกน พบว่า Power (โครงสร้างพื้นฐานพลังงาน) นำด้วย +33.53% ตามด้วย AI +23.44%, BTC +14.83% และ Gold -9.80% หากต้นทุนการอนุมานที่ลดลงครึ่งหนึ่งของ Gemini Ultra 3 ช่วยปรับปรุงประสิทธิภาพการใช้พลังงานในดาต้าเซ็นเตอร์ได้จริง แนวโน้มความต้องการของแกน Power อาจเปลี่ยนแปลงอย่างละเอียด และอาจเป็นจุดเปลี่ยนของ Performance เชิงเปรียบเทียบระหว่าง Power และ AI

จากมุมมองแกน AI (+23.44% ใน 63 วัน) การแข่งขันด้านราคา Foundation Model ที่รุนแรงขึ้นอาจกดดัน Margin ของผู้ให้บริการโมเดล แต่ในขณะเดียวกันก็เพิ่มความสามารถในการทำกำไรให้กับเลเยอร์ที่สร้างมูลค่าเพิ่ม (Agentic SaaS และแอปพลิเคชัน Vertical AI) ที่ซื้อโมเดลพื้นฐานในราคาที่ถูกลง เมื่อ NYW-X อยู่ในช่วง NORMAL นี่ไม่ใช่ช่วงเวลาที่ต้องรีบปรับสมดุล Portfolio แต่เป็นช่วงที่ควรรอดูราคา API อย่างเป็นทางการของ Gemini Ultra 3 และการตอบสนองของ OpenAI และ Anthropic

ข้อมูลวันนี้: Gemini Ultra 3 เทียบกับโมเดลคู่แข่ง

รายการค่า
Gemini Ultra 3 HumanEval93.1%(前世代比 +5.7pt)
Gemini Ultra 2.0 HumanEval87.4%
OpenAI GPT-5 HumanEval(推定)~91.5%
推論コスト削減(Ultra 3 vs. Ultra 2.0)▲50%
API価格引き下げ予定▲45%(詳細TBA)
Trillium(TPU v6)稼働枚数(推定)50万枚超
Trillium 製造プロセスTSMC 3nm(N3B)
米鉱工業生産(4月, 前月比)+0.7%(予想+0.1%)
USD/JPY(参考)152円台
📊 การตีความของ HumanAI(COOL)ตัวเลขที่น่าสนใจที่สุดในเชิงวิเคราะห์จากการประกาศ Gemini Ultra 3 ไม่ใช่การลดต้นทุนการอนุมาน 50% แต่เป็นการกระโดดของคะแนน HumanEval จาก 87.4% เป็น 93.1% เมื่อความแม่นยำถึงระดับนี้ การสร้างโค้ดหลักด้วย AI กลายเป็นตัวเลือกที่ใช้งานได้จริง เปลี่ยนบทบาทนักพัฒนาจาก 'ใช้ AI เป็นผู้ช่วย' เป็น 'ดูแล AI ในฐานะผู้เขียนโค้ดหลัก' เมื่อรวมกับการลดราคา API ราว 45% ครึ่งหลังของปี 2026 อาจเปลี่ยนแปลงภูมิทัศน์การแข่งขันสำหรับผลิตภัณฑ์แบบ Copilot อย่างสิ้นเชิง แม้ต้องระมัดระวังว่า Benchmark มักนำเสนอภายใต้เงื่อนไขที่เอื้อต่อผู้ประกาศ แต่สัญญาณทิศทางที่ว่าการสร้างโค้ดด้วย AI เข้าสู่ขั้นเชิงพาณิชย์กำลังเร่งตัวดูชัดเจน

🔗 จุดเชื่อม 3 แกน — บทความที่เกี่ยวข้องวันนี้

บทความนี้เป็นแกน TECH แต่เชื่อมโยงด้วยตัวเลขกับบทความแกนอื่นและดัชนีที่เป็นกรรมสิทธิ์ของเราในวันนี้

▸ MARKETS · #045
ยอดค้าปลีกและผลผลิตอุตสาหกรรมสหรัฐฯ เกินคาด — การบริโภคที่แข็งแกร่งกดดันให้เฟดชะลอการลดดอกเบี้ย
ยอดค้าปลีกเดือนเมษายน (+0.5%) และผลผลิตอุตสาหกรรม (+0.7%) ของสหรัฐฯ เกินคาดการณ์ทั้งคู่ เสริมแนวทางคงดอกเบี้ยของเฟดและดั
▸ PLAY · #046
Nintendo Direct ฤดูร้อน 2026 เปิดตัวเกมใหม่ระลอกใหญ่ — ระบบนิเวศ Switch 2 ก้าวสู่ 'บทที่สอง'
Nintendo Direct ฤดูร้อน 2026 เปิดตัวเกม Switch 2 จำนวน 12 เรื่อง มุ่งเป้าปรับปรุงอัตราการซื้อซอฟต์แวร์ที่ค่อนข้างต่ำที่

แหล่งที่มา:

เว็บไซต์ Google I/O 2026 อย่างเป็นทางการ

บล็อก Google DeepMind

ตัวอย่าง Google Astra 2.0

ราคา OpenAI API

SemiAnalysis

The Information

รายงานเซมิคอนดักเตอร์ Nikkei Asia