Loop Stream Detector ที่ถูกปรับปรุงให้ดีขึ้น
โดยปกติแล้วขั้นตอนการประมวลของ ซีพียูจะมี 3 ขั้นตอนดังนี้
1. Fetch คือ การไปอ่านข้อมูล(Data) หรือคำสั่ง(Instructions)มาเพื่อที่จะนำไปใช้งานต่อไป
2. Decode คือ การถอดรหัสข้อมูล หรือคำสั่งที่ได้จากการ Fetch ออกเป็นภาษาของซีพียู(Micro-op)
3. Execute คือ การประมวลผลข้อมูล หรือคำสั่งที่ได้จากการ Decode แล้ว
ภาพข้างบนแสดงขั้นการทำงานของซีพียูทั่วๆไป
ทางอินเทลได้หาทางที่จะลดขั้นตอนการทำงานของ เพื่อที่ซีพียูจะได้ใช้เวลาในการประมวลผลข้อมูลน้อยลง ดังนั้นอินเทลจึงได้สร้าง Loop Stream Detector ในระดับฮาร์ดแวร์ขึ้นไว้ในซีพียูครับ
1. Loop Stream Detector ของซีพียูในตระกูล Intel Core 2
- ซีพียูทำการ Fetch คำสั่งเข้า
- Loop Stream Detector จะทำการเก็บคำสั่งที่ได้จากการ Fetch โดย Loop Stream Detector สามารถเก็บคำสั่งได้ถึง 18 คำสั่ง
- นำข้อมูลในรูป Loop Stream Detector ไปทำการ Decode
- ทำการ Execute
- หากซีพียูต้องการใช้คำสั่งต่อไป เพื่อมาใช้ในการประมวลผลในครั้งต่อไป และซีพียูจะเข้าไปตรวจสอบคำสั่งที่ถูกเก็บไว้ใน Loop Stream Detector หากพบคำสั่งที่ต้องการอยู่ใน Loop Stream Detector ซีพียูก็จะนำคำสั่งนั้นไปทำการ Decode และ Execute ได้เลย โดยไม่ต้องทำการ Fetch ใหม่
ข้อดี ของการใช้ Loop Stream Detector คือ การลดขั้นตอนการทำงานของซีพียูลง สำหรับ Loop Stream Detector ในซีพียูตระกูล Core 2 ช่วยลดโอกาสที่จะทำให้ซีพียู Fetch ข้อมูลใหม่ลดลง
*หมายเหตุ
- Loop Stream Detector จะเก็บเฉพาะคำสั่งที่เคย Fetch มาแล้ว
- หากซีพียูตรวจสอบดูใน Loop Stream Detector ไม่พบคำสั่งที่ซีพียูต้องการ ซีพียูก็ต้องทำการ Fetch เข้ามาใหม่
แสดงการทำงานของ Loop Stream Detector ในซีพียูตระกูล Core 2
2. Loop Stream Detector ในซีพียูตระกูล Core i7
ในซีพียูตระกูล Core i7 อินเทลได้ทำย้ายตำแหน่งของ Loop Stream Detector ใหม่ เพื่อมาเก็บข้อมูลที่ได้จากการ Decode แล้ว ทำให้สามารถลดขั้นตอนการทำงานของซีพียูลงได้อีก 2 ขั้นตอนครับ เพราะหากซีพียูทำการ Excecute เสร็จ ซีพียูต้องการทำคำสั่งต่อไป ซีพียูก็มาเอาคำสั่งที่ถูก Decode เรียบร้อยซึ่งถูกเก็บอยู่ใน Loop Stream Detector ไป Execute ได้เลยครับ ไม่ต้อง Decode และ Fetch ใหม่ นอกเสียจากว่าคำสั่งนั้นๆจะไม่อยู่ใน Loop Stream Detector ครับ
นอกจากนี้ อินเทลยังได้เพิ่มขนาดของ Loop Stream Detector ให้สามารถเก็บคำสั่งเพิ่มขึ้นจากเดิมที่เคยเก็บได้เพียง 18 คำสั่ง มาเป็น 28 คำสั่งครับ
ภาพแสดงการทำงานของ Loop Stream Detector ในซีพียู Intel Core i7