Место для записи мыслей по развитию OpenTS, а также запросов от пользователей.

Пока вспоминается за 5 минут вот что:

* Отказоустойчивость. Вопрос перезрел. Есть патч для DMPI, но он не тестировался с PACX (только с LAM). Во-вторых, отказустойчивость важна, в первую очередь, для мета-кластеров, а там есть варианты , как лучше устраивать счёт, можно пробовать веб-сервисы делать, можно , например, в Х-Сом завернуть Open TS. Хорошая тема для семинара.

* Усовершенстование суперпамяти для более эффективной работы с большим числом узлов (К-1000). Думается, что когда все шлют данные о ресурсах всем - это плохо.

* Проэкспериментировать с массивом данных, который не влезает в оперативную память одного узла. Это запрос от Д. Ковалёва с ВМиК? , им нужно будет строить пятимерную сетку.

06.02.06

* Замена очередей задач. В настоящее время большинство кластеров оснащены "очередью заданий" - пользователь не имеет права запускать задачу на узлах, а передаёт её сначала в очередь. Там задача сначала дожидается высвобождения ресурсов - а запускается только через какое-то время. Это неудобно, поскольку нет возможности посмотреть промежуточный вывод задачи - может быть , расчёт пошел совсем не "туда", его надо остановить... Возможность остановки задачи и просмотра промежуточных результатов поддерживатеся редко - это называется "спекулятивным планированием". Для Т-программ можно реализовать "коллективистскую" стратегию планирования. Допустим есть пользователь - он запускает Т-приложение. Приложение запускается на всех доступных узлах кластера. Потом появляется второй пользователь, запускает своё Т-приложение. Планировщики приложений - "договариваются" и делят пополам кластер. Если надо, часть потоков запущенного приложения можно принудительно прекратить и перезапустить на нужных узлах кластера. Появляется следующий пользователь - кластер опять "делится". Если один из пользователей снимает своё приложение - ранее занятые им ресурсы передаются уже запущенным приложениям других пользователей. В результате нужда в "очередях заданий почти пропадает...

-- Alexander Moskovsky - 06 Feb 2006

This topic: OPENTS > WebHome > Design Ideas
History: r2 - 06 Feb 2006 - 19:59:31 - Alexander Moskovsky
 
This site is powered by the TWiki collaboration platformCopyright © by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback