รู้ทันสถาปัตยกรรม NVIDIA Fermi (GF100) : Page 2 (2/2)
หลังจากเราได้ทราบถึงปัญหา วิธีการแก้ปัญหา และรวมถึงเทคโนโลยีทางด้านกราฟฟิคใหม่ๆอย่าง Tessellation ที่พร้อมจะมาเพิ่มภาระและ ปัญหาให้ GPU ของเราแล้ว มีหรือเจ้าพ่อแห่งวงการการ์ดจอ อย่าง NVIDIA จะไม่ทราบถึงปัญหาเหล่านี้ ดังนั้น NVIDIA จึงได้ใช้ความพยามรวมถึงความคิดสร้างสรรค์ บวกกับความใจเย็น (โดยไม่หวั่นไหวว่าคู่แข่งเขาจะออกผลิตภัณฑ์มาล่วงหน้าก่อนตนเองเป็นเวลา 6เดือนแล้ว และไม่หวั่นไหวด้วยว่าแฟนๆจะเข้าใจจะว่าอย่างไร) โดยเวลาทั้งหมดนี้ได้ทุ่มเทไปเพื่อให้ได้ GPU แห่งอนาคต และเพื่อเกมส์ในอนาคตที่กำลังจะมาถึง นั่นคือ GF100 นั่นเองครับ
ว่าแล้วก็มาชม Block Diagram ของ GF100 ที่ NVIDIA ทุ่มทั้งเวลาและความสามารถเพื่อให้ได้มันมา มาดูกันสิว่าหน้าตาของมันจะเป็นอย่างไรเป็นยังไงบ้างครับหน้าตา Block Diagram ของ GF100 เปลี่ยนแปลงไปจาก หน้าตา Block Diagram ของ G80 และ GT200 พอสมควรครับ (แต่กลับไปคล้ายๆกับ Block Diagram ของ Intel Larabee นะครับ ว่าไหม)
สำหรับ GF100 นี้ NVIDIA ได้แบ่งชุดการประมวลผลออกเป็น 4 ชุดโดยเหมือนๆกัน โดยทาง NVIDIA เรียกชุดการประมวลผลเหล่านี้ว่า GPC (Graphics Processing Clusters) โดยในแต่ละ GPC จะประกอบด้วย
1. Raster Engine 1 Unit
2. SM (Streaming Multiprocessors) จำนวน 4 ชุดต่อ 1 GPC โดยภายใน SM นี้จะประกอบด้วย
2.1. CUDA Core จำนวน 16 Cores (CUDA Core ก็คือ Stream Processor นั่นแหละครับพี่น้อง)
2.2. Texture Unit จำนวน 4 ตัวต่อ 1 SM
2.3. Texture Cache
2.4. L1 Cache 64 KB
2.5. PolyMorph Engine (ตัวนี้สำคัญมากเลยครับ NVIDIA บอกว่าเป็นเพราะตัวนี้นี่แหละครับ ที่ทำให้ GF100 ออกช้ากว่ากำหนด)
นอกจากนี้ใน GF100 ยังมี L2 Cache 768 KB สำหรับให้ GPC ทั้ง 4 ตัวมาใช้งานรวมกันด้วยครับ เราจะเห็นว่า NVIDIA ได้พยายามที่จะลดปัญหาคอขวดที่เคยปรากฎขึ้นในสถาปัตยกรรมรุ่นก่อนออกไป ด้วยการเพิ่ม Raster Engine เข้าไปในตัวชิพถึง 4 ยูนิต นอกจากนั้นยังเตรียมพร้อมสนับสนุนเทคโนโลยีใหม่อย่าง Tesellation โดยการเพิ่ม PolyMorph Engine เข้าไปใน SM ด้วย(ภายใน GF100 มี 16 SM ดังนั้น GF100 จึงมี PolyMorph Engine 16 Unit)ภาพแสดง pipe-line ของ Raster Engine ซึ่งเป็นฮาร์ดแวร์ที่จัดการเกี่ยวกับ Raster
** Rasterization คือ การแปลงข้อมูลที่อยู่ในรูปของ Vector ออกมาเป็น จุด หรือ Pixel
PolyMorph Engine คือยูนิตที่คอยจัดการเกี่ยวกับโครงสร้าง(Geometry) ของวัตถุ 3มิติ สิ่งที่ PolyMorph Engine จัดการได้แก่ Vertex Fetch, Tessellator, Viewport Transform, Attribute Setup และ Stream Output
การเพิ่ม PolyMorph Engine เข้าไปในชิพถึง 16 ยูนิตจะเพิ่มประสิทธิภาพในการประมวลผลทางโครงสร้าง 3มิติของ GF100 ให้เหนือกว่า GT200 เป็น อย่างมากมายเลยครับ และที่สำคัญ PolyMorph ยังช่วยให้ GF100 สามารถใช้เทคนิคใหม่ที่ไม่มีใน GT200 ได้อีกด้วยเช่น Tessellation เป็นต้น
คุณภาพ และประสิทธิภาพของการลงลอยหยักที่เพิ่มขึ้น
GT200 16XQ (8CSAA + 8MSAA)
ด้วยระบบลบรอยหยักแบบใหม่ เนียนกว่าเดิมกันอย่างเห็นได้ชัดครับ
3D Surround
จริงๆก็ไม่มีอะไรมากครับ ก็แค่คุณสมบัติคุณสมบัติต่อหลายจอเท่านั้นเองครับ โดยการ GF100 ตัวหนึ่งจะสามารถต่อออกได้ 2 จอภาพ แต่หากอยากจะต่อภาพออก 3 จอก็ต้องนำการ์ดมาต่อ SLi กันก่อนนะครับ
สรุปสุดท้ายนี้เราก็ได้ทราบถึงสิ่งใหม่ๆที่เพิ่มเข้ามาใน GF100 กันแล้ว สิ่งเดี่ยวทีค้างคาใจใครต่อใครหลายๆคนคือ GF100 นี้จะแรงขนาดไหนพอเล่นเกมส์จริงๆแล้วมันจะเป็นยังไงบ้าง สิ่งเหล่าเราคงจะได้รับคำตอบในเดือนมีนาคม ที่นี่ อย่างแน่นอนครับ