sexta-feira, 19 de junho de 2009

Prescott

ct

Prescott


O Prescott representa a terceira geração do Pentium 4, produzido a partir de 2004, utilizando uma técnica de fabricação de 0.09 micron. A mudança arquitetural mais significativa foi a adição de 11 novos estágios ao já longo pipeline do Northwood. Com isso, o Prescott atingiu a impressionante marca de 31 estágios de pipeline, um número sem precedentes entre os processadores x86.

Em um processador atual, o uso de um pipeline mais longo não é exatamente uma boa notícia, muito pelo contrário. Como vimos, aumentar o número de pipelines do processador permite que cada estágio execute um volume menor de processamento. Com isso, o processador passa a ser capaz de operar a freqüências mais altas, mas, em compensação, as instruções demoram um número maior de ciclos de clock para serem processadas (já que precisam percorrer todo o pipeline), o que aumenta brutalmente o tempo perdido em operações de tomada de decisão, onde o processador precisa aguardar o resultado de uma operação para poder processar a seguinte.

Se as alterações parassem por aí, o Prescott seria capaz de operar a freqüências mais elevadas, mas em troca seria brutalmente mais lento que um Northwood do mesmo clock. Para evitar essa sombria perspectiva, a Intel realizou um conjunto de melhorias na arquitetura, de forma a anular, ou pelo menos reduzir a perda.

A primeira melhoria foi feita no circuito de branch prediction, responsável por "prever" o resultado de operações de tomada de decisão e assim permitir que o processador adiante o processamento das instruções seguintes enquanto a instrução inicial é processada. O Prescott é especialmente dependente do desempenho do circuito de branch prediction, pois cada instrução precisa percorrer um longo caminho ao longo dos 31 estágios do pipeline. Sem ele, o projeto do Prescott seria inviável, pois o processador perderia muito tempo em operações de tomada de decisão.

Em um processador atual, o circuito de branch prediction é capaz de indicar o caminho correto em mais de 95% das operações. Tal precisão é possível, porque ele se baseia em um histórico de operações já realizadas. Sempre que é preciso "adivinhar" o caminho mais provável de uma operação, ele pesquisa pelo resultado de operações semelhantes anteriormente realizadas. A maioria dos programas realiza um grande número de operações repetitivas (sobretudo aplicativos pouco otimizados, ou escritos em linguagens de alto nível), o que permite que o circuito de branch prediction execute seu trabalho com grande precisão.

O grande problema é que, sempre que ele erra, o processador precisa descartar todo o trabalho adiantado e começar de novo a partir do ponto inicial. Neste caso, são perdidos não apenas os 31 ciclos que a instrução inicial demora para percorrer o pipeline, mas também os ciclos necessários para remover os dados anteriores e carregar os registradores com as novas instruções a processar.

Quanto mais longo é o pipeline, maior é a penalidade a cada erro, o que coloca o Pescott em uma situação complicada, já que as operações de tomada de decisão representam até 14% das operações realizadas por um aplicativo típico.

Para reduzir a perda, o circuito de branch prediction do Prescott foi sensivelmente aprimorado, e passou a ser capaz de trabalhar com um índice de acerto maior que o do Northwood. O scheduler (o circuito que ordena as instruções, de forma que as unidades de execução possam processar o número máximo de instruções a cada ciclo) também foi melhorado, resultando em outro pequeno ganho.

Foram feitas ainda duas pequenas modificações nas unidades de execução, que resultaram em mais um pequeno ganho, muito embora o número de unidades não tenha sido alterado.

O primeiro e mais significativo, foi a adição de um circuito dedicado de multiplicação de números inteiros. Até o Northwood, todas as operações de multiplicação eram enviadas à FPU (o coprocessador aritmético), processadas separadamente e então devolvidas. Com o Prescott, as unidades de processamento de números inteiros ganharam a habilidade de processá-las diretamente, o que representa uma grande economia de tempo.

Como vimos, o Pentium 4 possui três unidades de execução de números inteiros. Duas delas são "double-pumped", ou seja, são capazes de processar duas instruções simples por ciclo de clock. Um conjunto específico de instruções, que incluem operações um pouco mais complexas, são enviados para a terceira unidade de execução, que trabalha à freqüência normal. No Prescott, uma das duas unidades "rápidas" ganhou um novo bloco, capaz de processar operações shift/rotate (usadas em várias situações), que antes precisavam ser processadas na unidade mais lenta. Com isso, a terceira unidade foi desafogada, resultando em mais um pequeno ganho.

O Prescott ganhou também um novo bloco de instruções, o conjunto SSE3. Ele é composto por 13 novas instruções, que complementam os dois conjuntos anteriores, dando sua cota de contribuição em aplicativos otimizados.

Finalmente, temos as mudanças no cache. O bloco de dados do cache L1 foi aumentado de 8 para 16 KB e o bloco de instruções (o trace-cache) recebeu pequenas melhorias, embora a capacidade tenha permanecido a mesma. O cache L2 dobrou de tamanho, saltando de 512 KB para 1 MB, mas o aumento teve como efeito colateral o aumento dos tempos de latência, que aumentaram em aproximadamente 40%. Em outras palavras, o Prescott tem um cache L2 maior, porém mais lento, o que anula grande parte do benefício.

Com relação à fabricação, o Prescott foi o primeiro processador Intel a ser produzido utilizando a técnica Strained Silicon. Ela consiste em "esticar" a superfície do wafer de silício, colocando-o sobre um substrato especialmente desenvolvido. Aumentando a distância entre os átomos do wafer, é reduzida a resistência à passagem dos impulsos elétricos. Essa técnica não tem nenhum efeito direto sobre o desempenho, mas ajuda a reduzir o consumo e a dissipação térmica do processador, além de (pelo menos em teoria) permitir que ele seja capaz de operar a freqüências mais elevadas.


Slide demonstrando a técnica Strained Silicon

De uma forma geral, o Pentium 4 baseado no core Prescott é um pouco mais lento que um Northwood do mesmo clock. Ele ganha por uma pequena margem em alguns aplicativos otimizados (graças ao aumento no tamanho do cache e às novas instruções SSE), mas na prática acabamos tendo um empate técnico entre os dois cores.

Isso não é surpresa já que, como vimos, os aperfeiçoamentos feitos no Prescott tiveram como principal objetivo anular a perda de performance causada pelo aumento no número de estágios do pipeline e não a realmente melhorar o desempenho por ciclo de clock. Na época o plano era melhorar o desempenho do processador com sucessivos aumentos na freqüência de clock e não com base no aumento da eficiência.

O projeto de um novo processador demora de 3 a 5 anos para ser desenvolvido, até o ponto em que está testado e pronto para entrar em produção. Mesmo em casos onde um projeto já existente é modificado, como no caso do Prescott, o desenvolvimento não toma menos do que 2 anos. Ou seja, é preciso planejar quais modificações realizar com uma antecedência muito grande e, qualquer erro estratégico (como o uso das memórias Rambus) acaba demorando muitos anos para ser consertado.

Como o Prescott foi lançado no início de 2004, podemos imaginar que a Intel começou a desenvolvê-lo pouco depois do lançamento do Pentium 4 Willamette, colocando em prática as idéias que vigoravam na época.

Já que o desempenho por ciclo de clock era praticamente o mesmo, as vantagens de possuir um Prescott em vez de um Northwood recaiam apenas sobre a maior margem de overclock. Para quem não pretendia fazer overclock, não existiam realmente grandes vantagens em utilizar um Prescott em relação a um Northwood do mesmo clock.

Devido ao aumento no número de estágios do pipeline e das melhorias feitas nas unidades de execução, o Prescott dissipa mais calor que um Northwood do mesmo clock, mesmo sendo produzido em uma técnica de 0.09 micron. Se isso lhe soa estranho, basta ter em mente que apesar da técnica mais avançada de produção, ele possui 125 milhões de transístores, contra apenas 55 milhões do Northwood.

O TDP (Thermal Design Power, que no caso dos processadores Intel indica o consumo típico do processador) do Northwood de 3.4 GHz é de 89 watts, enquanto o do Prescott da mesma freqüência é de 103 watts, ou seja, 14 watts a mais.

Um consumo tão elevado torna necessário o uso de uma fonte de alimentação de 400 watts ou mais, capaz de fornecer 16 Amperes na saída de 12V (consulte a etiqueta com as especificações da fonte), um cooler adequado e um gabinete com uma boa ventilação, com (de preferência) um exaustor adicional instalado na abertura lateral, soprando ar sobre o processador.

Sem uma ventilação adequada, o processador pode facilmente ultrapassar o limite de temperatura estabelecido, fazendo com que o Thermal Throttling entre em ação, reduzindo a freqüência do processador, sem contar que um gabinete abafado causa prejuízos à vida útil e à estabilidade dos demais componentes.

Para evitar confusão, os modelos baseados no core Prescott que operam à mesma freqüência dos Northwood recebem a letra "E", como em:

Pentium 4 3.40E
Pentium 4 3.20E
Pentium 4 3.00E
Pentium 4 2.80E

Todos estes modelos utilizam bus de 800 MHz, por isso é necessário que exista suporte por parte da placa-mãe. No caso das placas com chipset Intel, o suporte foi introduzido a partir da série i865, no caso dos chipsets da SiS a partir da série FX (SiS648FX, SiS655FX e SiS661FX) e no caso dos da VIA a partir do PT800. A primeira safra de placas (produzidas na primeira metade de 2004) precisava de um upgrade de BIOS para reconhecer corretamente o processador.

O Prescott acabou se revelando um grande fracasso. Devido ao massivo consumo e dissipação térmica do processador, a Intel não foi capaz de lançar versões do Prescott acima de 3.8 GHz, ou seja, apenas 400 MHz a mais que os Pentium 4 baseados no core Northwood, fabricados na antiga técnica de 0.13 micron. O aumento no número de estágios do pipeline e as outras mudanças arquiteturais feitas no processador acabaram sendo em vão.

Nenhum comentário:

Postar um comentário

FAÇA UMA DOAÇÃO PARA O NOSSO BLOG

MAKE A DONATION TO OUR BLOG/ HACER UNA DONACIÓN A NUESTRO BLOG/ FAI UNA DONAZIONE PER IL NOSTRO BLOG/ FAITES UN DON DE NOTRE BLOG/ Spenden AUF UNSERE BLOG/ บริจาคให้กับบล็อกของเรา/ 私達のブログに寄付する/

WATCHMEN – Trailer Oficial

TOP 100 GATAS


TABLE OF HOTNESS

100. Deanna Russo
99. Melissa Rycroft
98. Rebecca Mader
97. Marisa Tomei
96. Olivia Munn
95. Padma Lakshmi
94. Yvonne Strahovski
93. Michelle Obama
92. Joanna Krupa
91. Chelsea Handler
90. Roselyn Sanchez
89. Jamie Chung
88. Diane Kruger
87. Summer Glau
86. Ali Campoverdi
85. Michelle Trachtenberg
84. Minka Kelly
83. Whitney Port
82. Emma Watson
81. Heidi Montag
80. Jamie Gunns
79. Jaime King
78. Danica Patrick
77. Stacy Keibler
76. Cameron Richardson

75. Tricia Helfer
74. Amanda Bynes
73. Ashley Tisdale
72. Camilla Belle
71. Gabrielle Union
70. Maria Menounos
69. Jennifer Morrison
68. Ashley Greene
67. Emmy Rossum
66. Emma Stone
65. Amanda Righetti
64. Diora Baird
63. Milla Jovovich
62. Heidi Klum
61. Dania Ramirez
60. Carrie Underwood
59. Ana Ivanovic
58. Miranda Kerr
57. Audrina Patridge
56. Amber Heard
55. Christina Milian
54. Rachel Bilson
53. Kim Kardashian
52. Beyoncé
51. Sienna Miller

50. Taylor Swift
49. Freida Pinto
48. Arielle Kebbel
47. Katie Cassidy
46. Nicole Scherzinger
45. Fergie
44. Avril Lavigne
43. Elisha Cuthbert
42. Nikki Reed
41. Nadine Velazquez
40. Lily Allen
39. Anna Faris
38. Charlize Theron
37. Cameron Diaz
36. Hayden Panettiere
35. Anna Kournikova
34. Scarlett Johansson
33. Blake Lively
32. Ciara
31. Hilary Duff
30. Penélope Cruz
29. Zoe Saldana
28. Danneel Harris
27. Vanessa Hudgens
26. Angelina Jolie

25. Julianne Hough
24. Eva Mendes
23. Lindsay Lohan
22. Kate Beckinsale
21. AnnaLynne McCord
20. Moon Bloodgood
19. Chan Marshall
18. Marisa Miller
17. Britney Spears
16. Gina Carano
15. Katy Perry
14. Christina Aguilera
13. Jessica Alba
12. Leighton Meester
11. Jessica Biel

Click here to
see the top 10!


Gatas USA



2008
Jenna - Cuyahoga Falls, OH Shaun - Conroe, TX undefinedundefinedundefinedundefinedundefinedMegan - Parma, OH undefinedundefinedundefinedundefinedundefinedundefinedJacquelyn - Dayton, MD undefinedSarah - Baltimore, MD undefinedLucia - Burbank, CA undefinedEdnyr Marie - Orlando, FL undefinedundefinedChristina - Fresh Meadows, NY undefinedundefined
Debbie - Huntington Beach, CA
2007
2007