С 1960 года самым быстрым стал "условно-суммный" сумматор Склянского. В 1973 году к нему приблизился параллельно префиксный сумматор Когге-Стоуна c radix'ом-2 [1], но с 2000 года самым быстрым стал 64-х битный сумматор Когге-Стоуна с radix'ом-4, опубликованный в статье Gurkaynak, Leblebici, Chaousnt и McGuinneess [2], а в 2001 году radix-4, но не полностью [4,4,4], а частично [4,2,4], применил и Beaumont-Smith в 3-х ступенчатом 32-х битном параллельно префиксном сумматоре Склянского [3].
Рис.1. Снимок Figure 5. из статьи Beaumont-Smith'а.
В подписи к Figure 5. автор пишет о малой задержке в сумматоре и ставит свой сумматор на второе место после сумматора Когге-Стоуна c radix-2: "small delay solution (after Kogge-Stone adder)."
Рис.2. Диаграммы валентностей операторов P и G в 32-х битных сумматорах Когге-Стоуна, radix-2 и Beaumont-Smith'а, radix-4.
Операторы с вычислением только функции G обозначены тонкими цифрами на белом фоне, а с вычислением функций и G и P - жирными на сером фоне.
На рис.2. можно заметить, что 32-х битный, radix-2, сумматор Когге-Стоуна имеет 6 ступеней с нулевой и суммой, а 32-х битный, radix-4, сумматор Beaumont-Smith'а имеет 5 ступеней с нулевой и суммой.
На логических элементах типа TTL вычисления на нулевом шаге и вычисления итоговой суммы занимают время равное 1dt, где dt - delay time (среднее время задержки для логических элементов данного типа). Вычисления функций G и P на каждом шаге занимают время равное 2dt.
Итого, 32-х битный сумматор Когге-Стоуна, radix-2, на логических элементах типа TTL складывает два числа за время равное 10dt, а 32-х битный сумматор Beaumont-Smith'а, radix-4, за время равное 8dt, т.е. 32-х битный сумматор Beaumont-Smith'а, radix-4, быстрее 32-х битного сумматора Когге-Стоуна, radix-2. Хоть и поздно, но справедливость восстановлена.
Следует отметить, что на логических элементах типа "ключ" ("Key gates", "ключевые клапаны" или просто "ключи") с проводимостью только в одном направлении вычисления на нулевом шаге, вычисления итоговой суммы и вычисления функций G и P на каждом шаге занимают время равное по 1dt на каждый шаг, т.е. 6dt для сумматора Когге-Стоуна, radix-2, 32-бита, и 5dt для сумматора Beaumont-Smith'а, radix-4, 32-бита.
Следует так же отметить, что сумматор Склянского, radix-8, 32-х битный, и сумматор Когге-Стоуна, radix-8, 32-х битный, складывают два числа за 4dt, т.е. на 1dt быстрее, чем сумматор Beaumont-Smith'а, radix-4, 32-х битный.
Если редуцировать сумматор Beaumont-Smith'а, radix-4, до radix-2, то получится сумматор Склянского, radix-2, но Beaumont-Smith применил несколько иной способ перехода от сумматора Склянского, radix-2, к radix-4. На втором шаге Beaumont-Smith оставил валентность равную 2, т.е. сумматор Beaumont-Smith'а - это не полный переход от сумматора Склянского, radix-2, к radix-4 [4, 4, 4, ...], а промежуточный [4, 2, 4, ...].
Обновлена до версии 2024.09.17.
Литература:
3. Parallel Prefix Adder Design. Beaumont-Smith and Cheng-Chew Lim.
4. Сумматор Beaumont-Smith'а, radix-4, 8-ми битный. Куликов А. С.
5. Сумматор Beaumont-Smith'а, radix-4, 16-ти битный. Куликов А. С.
6. Сумматор Beaumont-Smith'а, radix-4, 32-х битный. Куликов А.С.