ยุโรป พลังงาน และ AI: GLM 5.2 บน Ascend เทียบ Grok บน NVIDIA

posted in: Uncategorized | 0

เผยแพร่ มิถุนายน 2026 · บันทึกโครงสร้างพื้นฐานจาก 3DN

นี่ไม่ใช่แถลงการณ์ทางการเมือง และไม่ได้เขียนเพื่อทำให้ใครตกใจ เป็นบันทึกเรื่องไฟฟ้า — ข้อจำกัดที่น่าเบื่อแต่ตัดสินว่ากลยุทธ์ AI ทำได้จริงหรือเป็นแค่จินตนาการ ยุโรปใช้พลังงานมากกว่าที่ผลิตอยู่แล้ว การพึ่งพาน้ำมันและก๊าซนำเข้ายังสูง การฝึกโมเดลระดับ frontier บนคลัสเตอร์ GPU อเมริกันที่กินไฟมหาศาลทับ baseline นั้นไม่ใช่รายละเอียดเล็กน้อย มันคือบิล

การเปิดตัวล่าสุดทำให้บิลนั้นมองข้ามไม่ได้ นักวิเคราะห์อิสระที่ Epoch AI ประมาณการว่าการฝึก Grok 4 — โมเดลขั้นสูงสุดของ xAI จนถึงตอนนี้ — ใช้ไฟฟ้าราว 310 กิกะวัตต์-ชั่วโมง (GWh) ผูกกับประมาณ 246 ล้านชั่วโมง GPU ของ NVIDIA H100 บนซูเปอร์คอมพิวเตอร์ Colossus เทียบเท่ากับไฟฟ้าประจำปันของครัวเรือนหลายหมื่นแห่ง พร้อมคาร์บอนและน้ำที่ตามมา

ในขณะเดียวกัน Zhipu AI (Z.ai) ฝึก GLM-5 — รากฐานของ GLM 5.2 ที่เรารันในโปรดักชัน — บน Huawei Ascend ทั้งหมด: ชิป Ascend 910B จำนวน 100,000 ตัว โทเคนการฝึก 28.5 ล้านล้าน ไม่มีฮาร์ดแวร์ NVIDIA ใน stack (รายงานทางเทคนิค) Zhipu ไม่ได้เผยแพร่ตัวเลข GWh ที่ตรวจสอบได้ ใช้การคำนวณทางกายภาพแบบเดียวกับ Epoch สำหรับ Grok — กำลังเฉลี่ยต่ำกว่า TDP สูงสุด บวก overhead นอก GPU และ PUE ของดาต้าเซ็นเตอร์ — ช่วงประมาณการที่สมเหตุสมผลสำหรับ pre-training ของ GLM-5 อยู่ที่ 15–60 GWh เทียบกับ 310 GWh ของ Grok 4 ไม่ใช่ความคลาดเคลื่อนเล็กน้อย: ไฟฟ้าน้อยกว่าราว 5–20 เท่า สำหรับโมเดลในระดับเดียวกันบน benchmark ด้าน software engineering และ agentic

ทำไมช่องว่างนี้เป็นของจริง ไม่ใช่การตลาด

สามข้อเท็จจริงทางวิศวกรรมอธิบายส่วนใหญ่ของระยะห่าง:

  • กำลังต่อชิป. NVIDIA H100 SXM ที่ใช้ฝึกระดับ Colossus จัดอันดับสูงสุด 700 W Huawei Ascend 910B ที่ 400 W ชั่วโมงเดียวกันบนทั้งคู่ไม่ได้หมายถึงกิโลวัตต์-ชั่วโมงเท่ากัน
  • ประสิทธิภาพสถาปัตยกรรม. GLM-5 เป็นโมเดล mixture-of-experts 744B พารามิเตอร์ที่เปิดใช้เพียง 40B ต่อโทเคน และใช้ DeepSeek Sparse Attention (DSA) ลดต้นทุน attention บน context ยาว FLOPs ที่เสียไปต่อโทเคนที่มีประโยชน์น้อยลง
  • ทางเลือกด้านสเกล. แล็บ frontier อเมริกันแข่งกันด้วยการฝึกที่ใหญ่ที่สุด — Colossus วัดเป็นหลายแสน GPU และความทะเยอทะยานระดับกิกะวัตต์ ได้ความสามารถ แต่จ่ายด้วยพลังงานที่เพิ่มตาม GPU-ชั่วโมง

นี่ไม่ได้บอกว่า Ascend “ดีกว่า” ทุกมิติ แบนด์วิดท์ interconnect ความสุกของซอฟต์แวร์ และ throughput การอนุมานยังเอื้อ NVIDIA ในหลาย deployment แต่ พลังงานการฝึกต่อโมเดลระดับ frontier ไม่ใช่ขุมทรัพย์อเมริกันอีกต่อไป — และนั่นสำคัญถ้าทวีปของคุณขาดอิเล็กตรอนอยู่แล้ว

ต้นทุนฮาร์ดแวร์และซอฟต์แวร์สแตก

ต้นทุนลงทุน ไม่ใช่แค่วัตต์. ค่าไฟฟ้าเป็นเพียงส่วนหนึ่งของบิล รายงานอุตสาหกรรมเกี่ยวกับระบบฝึกอบรมและอนุมาน Ascend 910B แบบบูรณาการในจีนระบุอย่างสม่ำเสมอว่าราคา ต่ำกว่าชุด NVIDIA H100 ที่เทียบเคียงกัน 60–70%TrendForce และสื่อการค้าจีนอ้างอิงคอนฟิก Atlas และ FusionCube แบบ all-in-one ราว ¥2–10 ล้าน เทียบกับโซลูชันระดับ H100 ราว ¥20 ล้าน ชิป H100 SXM แยกขายในตลาดเปิดอยู่ที่ $25,000–$40,000 ต่อชิป Ascend 910B ไม่มีขายปลีกในตะวันตก แต่เซิร์ฟเวอร์ Ascend แบบบันเดิลถูกกว่า NVIDIA ต่อ FLOP และให้ประสิทธิภาพ FP16 ราว 60–70% ของ H100 ต่อชิป สำหรับทวีปที่นำเข้าพลังงานอยู่แล้วและเผชิญพรีเมียมการควบคุมการส่งออก GPU ช่องว่าง capex นี้สำคัญพอๆ กับช่องว่าง GWh

ไม่พึ่งพา CUDA. GLM-5 ฝึกอบรมโดยไม่มี GPU ของ NVIDIA แม้แต่ตัวเดียว ไม่มี CUDA runtime ไม่มี cuDNN ไม่มีคลัสเตอร์สแตกที่ผูกกับ NVLink ชั้นซอฟต์แวร์ของ Huawei คือ CANN (Compute Architecture for Neural Networks) — สภาพแวดล้อมการเขียนโปรแกรม Ascend ในระดับเดียวกับ CUDA — คู่กับ MindSpore เฟรมเวิร์ก deep learning ดั้งเดิมของ Huawei ในทางปฏิบัติ แล็บ frontier จีนรันทั้ง PyTorch ผ่าน torch_npu ซึ่งเป็นแอดอะปเตอร์ backend ของ Ascend มากกว่าเขียนโมเดลใหม่ทั้งหมดใน MindSpore CANN execution provider ของ ONNX Runtime เป็นอีกทางเลือกสำหรับการพกพา inference ประเด็นเชิงปฏิบัติการ: การฝึกอบรมและให้บริการระดับ frontier ไม่จำเป็นต้องใช้โมเดลการเขียนโปรแกรมกรรมสิทธิ์ของ NVIDIA

นี่คืออิสรภาพ หรือ lock-in อีกแบบ? คำตอบตรงไปตรงมา: ทั้งคู่ CANN เป็นกรรมสิทธิ์เฉพาะ Ascend NPU เช่นเดียวกับ CUDA ที่รันได้เฉพาะ GPU ของ NVIDIA การย้ายจาก CUDA ไป CANN ไม่เป็นกลาง — คุณแลกคูป้ายซอฟต์แวร์หนึ่งด้วยอีกคู่หนึ่ง สิ่งที่ต่างในทางปฏิบัติ:

  • การพกพา PyTorch. torch_npu ให้โค้ด PyTorch ที่มีอยู่กำหนดเป้า Ascend ได้โดยไม่ต้อง rewrite ทั้งหมด ลดแรงเสียดทานมากกว่าการพอร์ต MindSpore ใหม่ทั้งหมด (ChinaTalk)
  • น้ำหนักโมเดลเปิด. GLM-5 ออกภายใต้ใบอนุญาต MIT สแตกไม่ผูกกับผลิตภัณฑ์ API ปิดอย่างโมเดล frontier อเมริกันหลายตัว
  • ความสมบูรณ์ของระบบนิเวศ. CUDA ยังมีไลบรารีลึกกว่า ฟอรัมชุมชนใหญ่กว่า และเคอร์เนลที่ผ่านการทดสอบมากกว่า นักพัฒนา CANN รายงานอย่างสม่ำเสมอว่ามีขอบที่ยังหยาบ เอกสารแก้ปัญหาสาธารณะน้อย และต้องพึ่งวิศวกรภาคสนามของ Huawei สำหรับปัญหายาก — ช่องว่างความสมบูรณ์ที่มีเอกสารในปี 2025
  • ความเสี่ยงทางภูมิรัฐศาสตร์. lock-in ของ Ascend คือ lock-in ห่วงโซ่อุปทาน Huawei/SMIC lock-in ของ CUDA คือ lock-in ของ NVIDIA และการควบคุมการส่งออกสหรัฐฯ ไม่มีสแตกใดเป็นกลาง คำถามคือองค์กรของคุณจัดหา จ่ายไฟ และดูแลได้จริงแบบไหน

สำหรับผู้ประกอบการยุโรปที่ประเมิน Ascend ท่าทีที่สมจริงไม่ใช่ “หนี lock-in ทั้งหมด” แต่ เลือกสแตกที่คุณรันได้จริง — โดยรู้ว่าการฝึกอบรม frontier ที่มีประสิทธิภาพเกิดขึ้นแล้วโดยไม่มี CUDA บนฮาร์ดแวร์ที่ต้นทุนต่อ flop และต่อกิโลวัตต์-ชั่วโมงต่ำกว่าอย่างมีนัยสำคัญ

บริบทพลังงานของยุโรป

Eurostat ชัดเจน: EU เป็นผู้นำเข้าพลังงานสุทธิ การผลิตในประเทศครอบคลุมการบริโภคไม่ได้ เชื้อเพลิงฟอสซิลยังครองส่วนใหญ่ การไฟฟ้าในอุตสาหกรรม ความร้อน และการขนส่งเพิ่มขึ้น และโหลดดาต้าเซ็นเตอร์โตทับอีก สิ่งพิมพ์ของคณะกรรมาธิการยุโรปอธิบายการพึ่งพานำเข้าเป็นข้อเท็จจริงเชิงโครงสร้าง ไม่ใช่ภาวะคับคั่งชั่วคราว

ท่ามกลางนี้ การคัดลอกสคริปต์ xAI — เมกะคลัสเตอร์ H100/H200 หลายแสนตัวป้อนด้วยกังหันก๊าซใหม่ — ไม่ใช่ “นวัตกรรม” มันคือช็อกด้านอุปสงค์ที่ยุโรปแบกได้ยาก ทุก GWh ที่ผูกกับการฝึกคือ GWh ที่ไม่ว่างสำหรับเสถียรภาพกริด อุตสาหกรรม หรือครัวเรือน

“มีสามัญสำนึก” หน้าตาเป็นอย่างไร

ถ้ายุโรปตั้งใจเป็นผู้เล่น AI จริงจัง ไม่ใช่แค่ขายต่อ API อเมริกัน ต้องมีกลยุทธ์ฮาร์ดแวร์สอดคล้องกับความเป็นจริงด้านพลังงาน นั่นหมายถึง:

  1. ประเมิน Ascend และ stack นอก NVIDIA ตามคุณค่า — การดึงไฟ ประสิทธิภาพการฝึก open weights และความเหมาะในการปฏิบัติการ — แทนการใช้การสอดคล้อง export control แทนวิศวกรรม
  2. สร้างความร่วมมือกับซัพพลายเออร์และแล็บจีน ที่หลักฐานการฝึกอย่างมีประสิทธิภาพมาจากตอนนี้ GLM-5 อยู่ภายใต้ MIT license วิทยาศาสตร์เผยแพร่แล้ว ทำเป็นไม่มีอยู่ไม่ได้ประหยัดไฟฟ้า
  3. เลิกสับสน “พันธมิตร” กับ “ดีที่สุด” การพึ่งพา GPU vendor อเมริกันรายเดียวยังเป็นการพึ่งพา — และสำหรับผู้นำเข้าพลังงานสุทธิ มีต้นทุนส่วนเพิ่มต่อการฝึกสูง
  4. ลงทุน sovereign inference ก่อน คุณค่าส่วนใหญ่ของยุโรปอยู่ที่ deployment auditability และข้อมูลโดเมน — ไม่ใช่การใช้จ่ายมากกว่า Musk บนสัญญาไฟ Memphis ฝึกที่มีประสิทธิภาพ รันที่คุณเป็นอธิปไตย

ทิ้งสหรัฐและ NVIDIA ไม่ได้หมายถึงเลิกค้าข้ามแอตแลนติกหรือเลือกข้างอุดมการณ์ หมายถึงปฏิเสธที่จะล็อกนโยบายอุตสาหกรรมหลายทศวรรษไปกับเส้นทางที่กินไฟแพงที่สุด ในขณะที่ทางเลือกที่น่าเชื่อถือและประหยัดกว่าที่วัดได้กำลังส่งมอบอยู่ — บนชิปที่วอชิงตันอยากกันออกจากมือจีน และบนโมเดลที่ปล่อยสู่สาธารณะ

ข้อจำกัดที่เราไม่ข้าม

export control entity list ความปลอดภัยซัพพลายเชน และความเสี่ยงภูมิรัฐศาสตร์เป็นปัญหาการจัดการจริง อยู่ในการจัดซื้อและ legal review ไม่ได้ลบฟิสิกส์ออก ทวีปที่นำเข้าพลังงานไม่สามารถมองการฝึก 310 GWh เป็นปัญหาของคนอื่นตลอดไป

เรารัน GLM 5.2 บนโลหะของเราเพราะอธิปไตยและ scheduling สำคัญต่อ ops เราจับตา Ascend เพราะเลขไฟสำคัญต่อยุโรป สองข้อโต้ตอบกัน

สรุป

GLM 5.2 สืบทอดจากโมเดล frontier ที่ฝึกบน Huawei Ascend ด้วยงบไฟฟ้าเศษเสี้ยวของที่ประมาณการสำหรับ Grok 4 บน NVIDIA การบริโภคของยุโรปเกินการผลิตในประเทศอยู่แล้ว ถ้านักนโยบายมีสามัญสำนึก พวกเขาจะมองฮาร์ดแวร์ AI จีนที่มีประสิทธิภาพและโมเดลเปิดเป็นโอกาส bootstrap — ไม่ใช่ taboo — และหยุดเดิมพันกริดกับ chipmaker อเมริกันรายเดียว

มีคำถามเกี่ยวกับโครงสร้างพื้นฐานหรือแนวทางโฮสติ้งของเรา? ติดต่อเรา

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องข้อมูลจำเป็นถูกทำเครื่องหมาย *