?

Log in

No account? Create an account
Multiclet - dz

> Свежие записи
> Архив
> Друзья
> Личная информация
> DZ Online

Август 28, 2012


Previous Entry Поделиться Next Entry
10:54 am - Multiclet
Нашёл время поинтересоваться новым Российским процессором Мультиклет.

Коротко: Плюс - реально уникальная архитектура. Минус - неочевидно, что это приведёт к реально хорошей производительности.

Предваряя вопросы: процессор уже в железе, но не содержит MMU и интерфейса внешней памяти, поэтому общецелевым его считать нельзя. Скорее - это микроконтроллер со способностями DSP. Целевые направления - что-то типа FFT - числодробилка. Максимальной производительности достигает на обработке пар 32-битных флоатов (комплексных чисел).

Уникальность:

Операндом команды может быть указан результат другой команды - без регистра! Непосредственно указанием смещения вверх. Команды собираются в линейные блоки - параграфы. Внутри параграфа связи между командами расшиваются согласно количеству исполняющих юнитов процессора и запускаются на вычисление.

Плюсы:


- один и тот же бинарник можно прогнать на процессорах с разным числом исполняющих юнитов, и он будет распараллелен максимально возможным для этого кода и этого процессора способом. (все независящие друг от друга операции будут запущены параллельно)

- отказ исполняющего юнита не означает отказа процессора - просто будет работать медленнее. (это ещё надо реализовать, но в теории - реально). Кстати, это позволяет снизить отбраковку при производстве - отключать изначально дохлые исполняющие юниты.

Минусы:

- реальный код содержит не так уж и много паралеллизма. Хотя - видео и звук, особенно многоканальный.

- рост числа исполняющих юнитов потребует усложнения интерконнекта, и для 128*128 это выглядит уже очень фантастично.

В любом случае авторам от меня - респект, желаю удачи и - помним, что дорогу осиливает идущий.

PS: Для того, чтобы запустить на нём Фантом, нужен заметно более простой MMU, чем для Линукса. :)

(17 комментариев | Оставить комментарий)

Comments:


[User Picture]
From:anikitin
Date:Август 28, 2012 07:07 am

Офтопик

(Link)
Ничо не получил :)
[User Picture]
From:vit_r
Date:Август 28, 2012 09:50 am
(Link)
Плюс - реально уникальная архитектура.

С какой стати это плюс? Это больше наука чем индустрия.
[User Picture]
From:vanxant
Date:Август 28, 2012 12:17 pm
(Link)
Да очень много всего нужного параллелится: всякая графика (не только визуализация, но и машинное зрение), жоский матан (который на 99% сводится к решению СЛАУ), спектральный анализ... Тот же новомодный map-reduce как раз для этого и придуман. Собственно, не так уж много существует вычислительно-емких алгоритмов, которые НЕ параллелятся. Я вот так сходу и не назову ничего кроме пары классических рекурсивных алгоритмов, которыми никто "в лоб" не пользуется.
Ну и надо понимать, откуда у мультиклета растут уши и кто является "заказчиком №1" процессоров с отказоустойчивостью и сверхнизким энергопотреблением. Этому заказчику необходимо повысить "интеллект" своих "изделий", а нечем: классические CPU слишком много жрут и относительно медленно грызут числа, классические DSP быстро грызут числа, но не могут выполнять произвольные алгоритмы; а отказоустойчивые гибриды CPU с DSP до сих пор запрещено экспортировать за пределы стран ядра НАТО.
[User Picture]
From:dz
Date:Август 28, 2012 12:22 pm
(Link)
ну и слава богу. :)
[User Picture]
From:electrocat
Date:Август 28, 2012 03:55 pm
(Link)
а зачем военному заказчику встроенный эзернет?
[User Picture]
From:vanxant
Date:Август 28, 2012 04:42 pm
(Link)
Ну а как с платой работать, пока она на стенде стоит? Свой велосипедный интерфейс придумывать?
PS. Егор, ты чтоле? :)
[User Picture]
From:electrocat
Date:Август 28, 2012 05:43 pm
(Link)
да я, вроде, документацию по диагоналиоглавлению просмотрел. там интерфейсов как грязи. от usb до I2C. Если предположить что основное назначение - "изделия" - то на стенде работать можно хоть по юсб, хоть по последовательному, хоть по прочему зоопарку. в реальном устройстве с кем он по эзернету общаться будет?

Хотя это я, конечно, придираюсь. :)
PS Егор, да, а што?...
[User Picture]
From:vanxant
Date:Август 28, 2012 07:08 pm
(Link)
Когда у заказчика тысяча стендов подземного и мобильного базирования, подключать их к спутниковым тарелкам по USB неудобно:)
PS. Знакомы мы с тобой когда-то были.
[User Picture]
From:savechenkov
Date:Август 28, 2012 05:46 pm
(Link)
>запрещено экспортировать за пределы стран ядра НАТО
А кто, если не секрет, входит в это "ядро"? Там ведь всё не так просто, там "межымперилистические противоречия(tm)" ;)
[User Picture]
From:vanxant
Date:Август 28, 2012 07:10 pm
(Link)
Ну из того что я видел в каталогах, часто встречается либо полный запрет на экспорт из СШП, либо разрешено только в UK, Canada, Israel.
[User Picture]
From:savechenkov
Date:Август 28, 2012 07:55 pm
(Link)
Т.е. немцам тоже нельзя?
Хм. Если так, то - показательно ;)
[User Picture]
From:hedin
Date:Август 28, 2012 03:23 pm
(Link)
Интересно, а для более популярных задач, класса видео карты, эта архитектура пойдет?

Ее можно ускорить за счет потребления, или хрен остудишь потом?
[User Picture]
From:i_rinat
Date:Август 28, 2012 03:55 pm
(Link)
отказ исполняющего юнита не означает отказа процессора

Это только если он удачно откажет и отрапортует, а не будет сбоить где-то по мелкому, портя бит или два.

один и тот же бинарник можно прогнать на процессорах с разным числом исполняющих юнитов, и он будет распараллелен максимально возможным для этого кода и этого процессора способом. (все независящие друг от друга операции будут запущены параллельно)

С возможностью получить на 2k-клеточном скорость меньше, чем на k-клеточном, ибо

рост числа исполняющих юнитов потребует усложнения интерконнекта

Если каждый соединён с каждым, то число соединений k2. А ещё все имеют доступ к общему набору регистров. Не зря же у него на 180 нм частота в 100 МГц.

У AMD в видеочипах долгое время блоки состояли из 5 (логических) каналов: 4 относительно глупых ALU и одно умное, с корнями и прочими плюшками. Правда распределением занимался CPU, во время компиляции шейдеров. И у каждого такого блока свой кусочек памяти, для персонального использования. Доступ в общую память на каждый чих — слишком медленно.

[User Picture]
From:dz
Date:Август 28, 2012 05:46 pm
(Link)
Доступ к регистрам некритичен. Они не используются внутри параграфа. Да и вообще могут не использоваться. Интерконнект сложен, но никакой причины ему быть медленным я не вижу.
[User Picture]
From:daktfi
Date:Август 28, 2012 07:28 pm
(Link)
По поводу интерконнекта и к-квадрата в голову приходит ассоциация со swapfs - чтобы размер свопа не был ограничен размером наличной физической памяти (управление свопом). Для большого числа модулей логичной представляется иерархическая структура, разбивающая много-много юнитов на кванты по "осмысленно чуть-чуть" юнитов, которые в случае необходимости дополнительно квантуются этажом выше. А по мере выхода из строя отдельных юнитов эту пирамиду можно потихоньку схлопывать.
И про заказчиков. Не столько военные, сколько космос. Радстойкие камни есть, но стоят они преизрядно, и всё равно дохнут. Как я понял из описаний мультиклета, цель разработчиков - вместо полного отказа при накоплении критического уровня деградации дохнуть потихоньку, теряя производительность, но сохраняя работоспособность и полную функциональность. Наверняка основной упор сделан на диагностику сбоев и их изоляцию, и связность между юнитами - тоже должна контролироваться...
[User Picture]
From:prol_prolych
Date:Август 29, 2012 01:51 am
(Link)
Этот Мультиклет не содран ли случайно с ИНМОСовского транспьютера?
[User Picture]
From:growltress
Date:Август 29, 2012 08:06 pm
(Link)

Команды собираются в линейные блоки - параграфы. Внутри параграфа связи между командами расшиваются согласно количеству исполняющих юнитов процессора и запускаются на вычисление.

На процессорах с конвейером за один такт в среднем выполняется одна инструкция. По приведённому описанию у меня создаётся впечатление, что на мультиклете за один такт выполняется меньше, потому что начать исполнение можно только после сборки параграфа. Ну и если несколько инструкций в параграфе полезут в память -- они ведь будут обслужены последовательно?

> Go to Top
LiveJournal.com