Необходимость повысить производительность при одновременном снижении стоимости сетевого оборудования (концентраторов, сетевых интерфейсных плат и коммутаторов), работающего с протоколами асинхронного режима передачи (ATM) и Fast Ethernet, вынуждает производителей обратить внимание на архитектуры с мощными RISC процессорами.
Однако внушительное количество операций в секунду над числами с фиксированной запятой решает в данном случае лишь часть проблемы.
Учитывая, что спрос на высокоскоростные сетевые изделия будет со временем только увеличиваться, компания Intel намерена модернизировать функции и повышать производительность процессоров семейства i960, сохраняя при этом их стоимостные характеристики, нo сетевые системы предъявляют к разработчикам и некоторые особые требования.
Конструирование самой высокопроизводительной модели с архитектурой i960 - процессора i960 Нх - начиналось с определения минимальных требований к быстродействию сетевых приложений, которые будут на нем работать.
Специальная бригада, куда вошли специалисты по техническому маркетингу, архитектуре и конструированию, составила подробную анкету для опроса заказчиков.
Процесс формального сбора информации среди существующих и предполагаемых заказчиков сетевых систем обеспечил необходимую обратную связь и позволил выявить специфические конструктивные особенности, характеристики, поддерживаемые инструменты и приемлемую цену нового изделия.
Целью опроса было изучение особенностей конструирования, производства и маркетинга, обусловленных запросами заказчиков. Это гарантировало, что изделие будет соответствовать реальным потребностям, а не просто отражать список желаемых характеристик, таких как ускоренная обработка прерываний или больший размер кэшей.
Затем бригада конструкторов Intel оценила собранную информацию с точки зрения выполнимости и необходимых затрат, после чего дизайнеры микросхем начали создавать новое устройство, воплощающее технические решения, удовлетворяющие пользователей.
Например, такая функция новой микросхемы, как быстрый вывод области данных из сферы операций, стала прямым результатом исчерпывающего исследования. Она позволяет производить эффективный анализ пакета данных и выводить из употребления независимые области кэша, сохраняя остальные данные.
Испытания на имитаторе
Прежде чем конструкторы остановились на сочетании усовершенствованного суперскалярного ядра, новых функций, расширенного набора команд и дополненной микроархитектуры, они имитировали ряд влияющих на производительность факторов.
Это помогло определить оптимальную производительность, сетевые свойства и стоимостные характеристики как микросхемы, так и системы в целом.
Таким образом удалось избежать расходов на разработку абсолютно новой структуры процессора, а сэкономленные ресурсы направить на расширение функциональных возможностей.
Сетевые приложения требуют удвоения производительности микропроцессоров каждые 18 месяцев, поэтому группа конструкторов i960 Нх должна была ориентироваться на утроенную производительность существующей серии суперскалярных микропроцессоров i960 Сх.
Ядро процессора Нх сохранило базовую конвейерную и суперскалярную организацию микросхем серии Сх.
Был расширен набор команд, увеличены кэши и добавлены специальные функции, полезные для сетевых приложений. Усовершенствования, внесенные в производственный процесс с технологической нормой 0.6 мкм, обеспечили производительность 150 MIPS при тактовой частоте 75 МГц даже с 25 МГц внешней шиной.
Самой сложной задачей, с которой столкнулась бригада разработчиков, оказалась оптимизация производительности процессора - и это несмотря на ограничение ширины полосы, налагаемое имеющимися на рынке дешевыми подсистемами памяти.
Конструкторы решили позволить ядру работать на нескольких частотах общей шины, применив технологию умножения частот.
Высвобождение частотных ресурсов процессора, обусловленных 0,6 мкм четырехслойным технологическим процессом, предъявляет повышенные требования к скорости доступа кристалла к внешней памяти.
Поэтому пришлось сократить, насколько это возможно, трафик по общей шине, оптимизируя ее операции.
При решении этой задачи самым важным стало применение гибкой встроенной памяти большого объема.
Процессор i960 Нх содержит кэш инструкции емкостью 16 Кбайт с четырехпортовой командно-зависимой организацией, которая делает эффективность большого кэша максимальной.
Кроме того, в каждый из четырех отделов кэша (объемом по 4 Кбайт) можно независимо загружать и фиксировать важный код или программу обработки прерывания.
Это позволяет разработчикам сетевых приложений предусматривать размещение 4, 8, 12 или 16 Кбайт кода внутри процессора, полностью исключая задержку, связанную с его доставкой из внешней памяти. Незафиксированная часть кэша продолжает функционировать как четырехпортовый командно зависимым кэш.
Столь гибкая стратегия позволила «замораживать» важные фрагменты кода без снижения скорости обработки процессором остальной его части.
Продолжение следует...
Часть 2: https://zen.yandex.ru/media/id/5db4834532335400ae49daad/specializirovannyi-processor-i960-hx-5db5e8e81febd400af66a605