รู้ทันสถาปัตยกรรม NVIDIA Fermi (GF100) : Page 2 (2/2)

Article by IonRa On January 28, 2010 8,758 views
รู้ทันสถาปัตยกรรม NVIDIA Fermi (GF100)
 < 1 2
รู้จักสถาปัตยกรรมของ GF100

หลังจากเราได้ทราบถึงปัญหา วิธีการแก้ปัญหา และรวมถึงเทคโนโลยีทางด้านกราฟฟิคใหม่ๆอย่าง Tessellation ที่พร้อมจะมาเพิ่มภาระและ ปัญหาให้ GPU ของเราแล้ว มีหรือเจ้าพ่อแห่งวงการการ์ดจอ อย่าง NVIDIA จะไม่ทราบถึงปัญหาเหล่านี้ ดังนั้น NVIDIA จึงได้ใช้ความพยามรวมถึงความคิดสร้างสรรค์ บวกกับความใจเย็น (โดยไม่หวั่นไหวว่าคู่แข่งเขาจะออกผลิตภัณฑ์มาล่วงหน้าก่อนตนเองเป็นเวลา 6เดือนแล้ว และไม่หวั่นไหวด้วยว่าแฟนๆจะเข้าใจจะว่าอย่างไร) โดยเวลาทั้งหมดนี้ได้ทุ่มเทไปเพื่อให้ได้ GPU แห่งอนาคต และเพื่อเกมส์ในอนาคตที่กำลังจะมาถึง นั่นคือ GF100 นั่นเองครับ

ว่าแล้วก็มาชม Block Diagram ของ GF100 ที่ NVIDIA ทุ่มทั้งเวลาและความสามารถเพื่อให้ได้มันมา มาดูกันสิว่าหน้าตาของมันจะเป็นอย่างไร

001_gf100

เป็นยังไงบ้างครับหน้าตา Block Diagram ของ GF100 เปลี่ยนแปลงไปจาก หน้าตา Block Diagram ของ G80 และ GT200 พอสมควรครับ (แต่กลับไปคล้ายๆกับ Block Diagram ของ Intel Larabee นะครับ ว่าไหม)

สำหรับ GF100 นี้ NVIDIA ได้แบ่งชุดการประมวลผลออกเป็น 4 ชุดโดยเหมือนๆกัน โดยทาง NVIDIA เรียกชุดการประมวลผลเหล่านี้ว่า GPC (Graphics Processing Clusters) โดยในแต่ละ GPC จะประกอบด้วย

1. Raster Engine 1 Unit

2. SM (Streaming Multiprocessors) จำนวน 4 ชุดต่อ 1 GPC โดยภายใน SM นี้จะประกอบด้วย

2.1. CUDA Core จำนวน 16 Cores (CUDA Core ก็คือ Stream Processor นั่นแหละครับพี่น้อง)

2.2. Texture Unit จำนวน 4 ตัวต่อ 1 SM

2.3. Texture Cache

2.4. L1 Cache 64 KB

2.5. PolyMorph Engine (ตัวนี้สำคัญมากเลยครับ NVIDIA บอกว่าเป็นเพราะตัวนี้นี่แหละครับ ที่ทำให้ GF100 ออกช้ากว่ากำหนด)

นอกจากนี้ใน GF100 ยังมี L2 Cache 768 KB สำหรับให้ GPC ทั้ง 4 ตัวมาใช้งานรวมกันด้วยครับ เราจะเห็นว่า NVIDIA ได้พยายามที่จะลดปัญหาคอขวดที่เคยปรากฎขึ้นในสถาปัตยกรรมรุ่นก่อนออกไป ด้วยการเพิ่ม Raster Engine เข้าไปในตัวชิพถึง 4 ยูนิต นอกจากนั้นยังเตรียมพร้อมสนับสนุนเทคโนโลยีใหม่อย่าง Tesellation โดยการเพิ่ม PolyMorph Engine เข้าไปใน SM ด้วย(ภายใน GF100 มี 16 SM ดังนั้น GF100 จึงมี PolyMorph Engine 16 Unit)

002_raster

ภาพแสดง pipe-line ของ Raster Engine ซึ่งเป็นฮาร์ดแวร์ที่จัดการเกี่ยวกับ Raster

** Rasterization คือ การแปลงข้อมูลที่อยู่ในรูปของ Vector ออกมาเป็น จุด หรือ Pixel

003_polymorph

PolyMorph Engine คือยูนิตที่คอยจัดการเกี่ยวกับโครงสร้าง(Geometry) ของวัตถุ 3มิติ สิ่งที่ PolyMorph Engine จัดการได้แก่ Vertex Fetch, Tessellator, Viewport Transform, Attribute Setup และ Stream Output

การเพิ่ม PolyMorph Engine เข้าไปในชิพถึง 16 ยูนิตจะเพิ่มประสิทธิภาพในการประมวลผลทางโครงสร้าง 3มิติของ GF100 ให้เหนือกว่า GT200 เป็น อย่างมากมายเลยครับ และที่สำคัญ PolyMorph ยังช่วยให้ GF100 สามารถใช้เทคนิคใหม่ที่ไม่มีใน GT200 ได้อีกด้วยเช่น Tessellation เป็นต้น

คุณภาพ และประสิทธิภาพของการลงลอยหยักที่เพิ่มขึ้น

gt200_badgrass

GT200 16XQ (8CSAA + 8MSAA)

gf100goodgrass

ด้วยระบบลบรอยหยักแบบใหม่ เนียนกว่าเดิมกันอย่างเห็นได้ชัดครับ

3D Surround

จริงๆก็ไม่มีอะไรมากครับ ก็แค่คุณสมบัติคุณสมบัติต่อหลายจอเท่านั้นเองครับ โดยการ GF100 ตัวหนึ่งจะสามารถต่อออกได้ 2 จอภาพ แต่หากอยากจะต่อภาพออก 3 จอก็ต้องนำการ์ดมาต่อ SLi กันก่อนนะครับ

สรุป

สุดท้ายนี้เราก็ได้ทราบถึงสิ่งใหม่ๆที่เพิ่มเข้ามาใน GF100 กันแล้ว สิ่งเดี่ยวทีค้างคาใจใครต่อใครหลายๆคนคือ GF100 นี้จะแรงขนาดไหนพอเล่นเกมส์จริงๆแล้วมันจะเป็นยังไงบ้าง สิ่งเหล่าเราคงจะได้รับคำตอบในเดือนมีนาคม ที่นี่ อย่างแน่นอนครับ

 < 1 2