15 лет развитию СПО в России

  • Не появился открытый и актуальный лист совместимости оборудования, hardware compatibility list (HCL) . Теоретически оно есть , а практически он такой скорости не дает (Хацкилевич) - по ссылкам найти сервер HPE и почти любую систему хранения данных – невозможно ни у кого из вендоров.

  • Не появился открытый и доступный онлайн стенд, hands-on lab. Такой. Или такой . Или такой

  • Нет публично доступных тестов и рекомендаций даже по простым операциям. Например - по выбору сетевого оборудования. Нет доступных сравнений работы в режимах 10G\25G\100\200G , доступности RDMA over Converged Ethernet (RoCE 1\2). Надо ли трогать offload (TCP offload - large send offload (LSO) TCP Chimney Offload, Receive Side Scaling (RSS)), как смотреть при этом strace и sysdig. Нет рекомендаций, как попутно изучить sriov и его применимость к Intel e710 и x520. Возможно, придется читать про standalone linux io tracer. В случае проприетарных решений обычно есть какие-то материалы вида «Make the Move to 100GbE with RDMA on VMware vSAN 8 with 4th Gen Intel® Xeon® Scalable Processors». Вместо этого придется читать Intel® Ethernet Controller Data Plane Development Kit (DPDK) 22.11/23.03 Configuration Guide – которого очень мало.

  • Нет публично доступных методик и результатов тестов по работе high availability, vmotion, storage vmotion, etc, особенно не в условиях «у нас есть целая одна виртуалка с 1 CPU / ядром и 1 Гб памяти, смотрите как легко .. » - нет, в условиях MS SQL базы в Always on на 256 Gb RAM и обработке 10к запросов в секунду. То есть, теоретически частично эти функции есть (например в таблице - а как они тестировались ? И почему не упомянуты CPU Compatibility Masks (они даже иногда есть) и Enhanced vMotion Compatibility (EVC) ? Где VUM и аналоги, если есть ? Что с  VM Customization \ Guest OS  Customization ? Как работает Restore VM snapshot ? Поддержка NVME? VM HA и HA host policy ? API хостов? Роли пользователей? Система прав? Насколько атомарна и сгруппирована система прав? Профили хостов? Редирект логов на внешние сервера? Требуемые минимальные права для взаимодействия с системами резервного копирования (СРК) (хотя это скорее к вендору СРК)? Режимы работы с СРК? Скорость? Возможность использования аппаратных прокси СРК? Работа с агентскими VM дедупликации? Работа в режиме реальной переподписки по CPU\RAM ? NUMA \ vNuma ? Green mode и его влияние на производительность? P\E-cores если у вас почему-то так? Сроки поддержки процессоров старых поколений?

  • Поедание овса (Open vSwitch) и овна (Open Virtual Network) – это отдельный предмет конкурсов, называется ovs-dpdk и /etc/kolla/globals.yml. Не уверен, что его можно сравнить c NSX-OVS, какой GENEVE это не обмазывай. Да и не всем нужно.

  • Даже не рассматривая работу «аналога vCenter или SCVMM» - как работает то что есть, есть ли разные варианты HA, как выполняется настройка, обновление, восстановление. Что там с GUI \ API \правами \ мульти доменами и мульти тенантами. Что с версионными зависимостями?

  • Сообщество «в массах» до сих пор не понимает, что бывает при миграции с, условно, Octopus на Pacific, когда OSD говорят «давай досвиданья» - и что это дает при расчете количества необходимых к закупке серверов, числа стоек, и стоимости всего оборудования. Особенно в свете заявления, что 640кб  5 киловатт должно хватить всем, и никакие межстоечные кондиционеры и молодильные холодильные двери 1165-95X Rear Door Heat Exchanger – нам на вовсе не нужны. Кто не понимает, про что речь – в некоторых случаях необходимо сначала сдвинуть куда-то данные с системы хранения, и потом пустую систему обновлять, хотя скорее это называется «собирать с ноля». То есть, для небольших по современным меркам объемов 200-500 ТБ (20-40 дисков по 15 тб, 1-2 полки) – надо где-то держать свободными еще 50-100 ТБ на другой системе, и проводить массу ручных операций. Это долго по времени на миграцию, дорого по человеко-часам, требует дорогих сотрудников (из тех, что остались), и резерва оборудования – что повышает общую стоимость владения. Но. Тут есть зайчатки оправдания – поскольку бизнес в РФ зачастую государственный или квази-государственный, то линейному работнику безразлична совокупная стоимость владения и сроки амортизации, а эффективной сове выгодно раздувать штат и повышать стоимость владения. Может, там и к зарплате от поставщика премия будет по итогам закупки, особенно если люди с чистыми тарелками горячим сердцем понимают глубину наших глубин и экологическую ситуацию. Да, такая сейчас экономическая экологическая обстановка.

  • Так и не появилось чего-то глобально - обзорного в части мониторинга, как и описания того, что именно надо мониторить на серверах, чтобы не приходил OOM. Кто-то, может, и своп выключает до сих пор. Вместо этого -разрозненные обрывки сопящих комьев воспоминаний и переводов.

  • (это не про виртуализацию, но очень показательно) Люди до сих пор хранят пароли в текстовых файлах или каких-то ручных менеджерах паролей. Excel тот же. Ни о каких заменах и аналогах Bit Warden \ Vault warden \ Last Pass \ Vault \ RatticDB \ 1Password \ Passwork \ KeePass - даже разговора нет. Хотя кому и в Касперском пароли хранить ок, без шифрования – см. Уязвимость менеджера паролей Kaspersky Password Manager, связанная с недостаточной стойкостью шифрования (Дата выявления: 20.04.2021)

  • Про российские системы резервного копирования лучше помолчать. Программы есть, но nt backup на скриптах по расписанию работал лучше, чем оба российских продукта. Кибер Бэкап от Киберпротект – это Акронис, со всеми его убогим наследием, начиная от тормозящего интерфейса (если надо сделать отчет в разрезе хранения кассет лет за пять), заканчивая то невозможностью обновления на следующую версию, то еще чем-то. Но! Хотя бы перестал хоронить данные - с невозможностью их последующего восстановления. RuBackup – это Астры кусок, но они (как-то) развиваются. Хотя, как сказать - в декабре 2023 в RuBackup 2.0 - 2.0 Update 2 добавили AD support , подробнее по ссылке . Что еще там не так – например, обновиться можно только с  2.0.99.U1.23, а если стоит более старая версия, то что? Получить NFR невозможно. Релиз ноты от RuBackup хорошо читать в барбершопе – волосы дыбом встают, стричь удобно.

  • Политика закрытости событий. Очень сомневаюсь, что даже спустя 5 лет (с 2018) – честный пост мортем по Росреестру и его падению – будет опубликован, с пояснениями - почему так зажевало данные в кашу, и что было с бекапами. Хотя - это не только российская традиция, по Datadog тоже не хотели делиться рассказами, в Four failed attempts to determine why Roblox was down for three days - скучный текст и нет картинок, как и в Inside the Longest Atlassian Outage of All Time и Bitten by a Kafka Bug – Postmortem. Хотя, возможно, наличие российских отчетов «что пошло не так» - помогло успокоить парочку эффективных сов на полгода.

  • Литература. Отставание в переводах увеличилось с 1..3 лет до «лицензионные переводы могут стать недоступными». По части продуктов – нет ни переводов, ни своей литературы - примерно с 2012-2015 года. По Google SRE переводы всех книг так и не сделаны.

  • Политика закрытости технической литературы. Вы сначала заплатите, потом будете сами читать 2-3 версии документации, какая актуальная и к какой версии относится – догадайтесь сами. Иногда проще в код посмотреть, или найти, откуда импортозаметили продукт и почитать документацию к исходному проекту. Я могу понять (нет), когда такое делает Netapp и IBM, но вы то не то и не другое.

  • Продуктовая линейка и ее дорожная карта. Openstack «вообще» объявлен заменой «всея виртуализации». Детали не важны, даже если в продукте не Openstack, а OpenNebula, или вовсе Cloudstack.

  • Сообщества. Сообществ не то чтобы нет, но то сообщество что осталось с РФ, а не уехало с 2008 года – завершило переход от технологического сообщества в архаику. От сообщества инженеров к цеховым мастерам. Отличия в том, что в цеховом сообществе знания передаются только лично, в форме предания или истории, а не в виде публичного учебника \ руководства. Делиться публично знаниями – стало вредно, а иногда знания и вовсе подлежат удалению. Знания снова приобрели возможность быть «идеологически неверными». Зато стало можно (всегда было) спрашивать про дремучее наследие Cooperative multitasking из времен NetWare 6.5. Кто не знает, что это такое, тот недостоин 300кк \ наносек.