Всем привет! Меня зовут Дмитрий Крупенин, я создаю внутренние и B2B ИТ-решения. Специализируюсь на цифровых продуктах для внутреннего использования в корпорациях. Недавно передо мной встала задача посчитать сколько будет стоить инфраструктура под одну из ИИ-инициатив. Т.к. я работаю в кровавом энтерпрайзе, мы не можем отдавать наши данные в облачные модели и вынуждены построить свой кластер для обучения и инференса. Хочу поделиться своими наработками - как можно посчитать стоимость, из чего она состоит, покажу формулы, которые мы использовали. А еще посчитаем небольшой практический пример. По ходу дела буду под кат засовывать теорию, чтобы статья не выглядела монструозной =) Итак, поехали...
Читать далееКаждые двенадцать часов Рубен Хассид публикует один гайд: как настроить Claude, как запилить диаграмму, как написать промт, как очеловечить тексты и другие полезности.
Одна тема - как работать с нейросетью.
Один инструмент - Claude.
Один шаблон - пошаговый гайд до 300 слов и картинка (инфографика, скрин).
Читать далееАрхитектурный конфликт между ISO/IEC 27001:2022 и MITRE ATT&CK во многом искусственен. Современная кибербезопасность требует интеграции governance, SOC, DFIR и telemetry-driven detection в единую adaptive security ecosystem.
Читать далееКлассический RAG индексирует исходный текст документа, предварительно разбивая на фрагменты. Потом рассчитывает векторное представление фрагментов и сохраняет их векторные представления в базу данных для поиска. Это дает возможность искать по сходству фрагментов текста и поискового запроса пользователя, но не дает возможность искать по более высокоуровневым резюме и смыслам, темам поднятым в тексте и прочему. Также не помогает с аналитикой по содержимому.
Бесплатный проект text-metadata-generator позволяет выполнять запросы к LLM по каждому документу из коллекции документов, результаты вывода LLM проверяются по JSON схеме.
Зачем может пригодиться эта программа и подход со структурированием текстовой информации:
Если нужна своя библиотека с каталогом - поиск по локальным документам с использованием комбинации SQL предикатов и семантического поиска
Аналитика по документам, возможность находить новое в текстах: комбинируя структурированные поля созданные LLM из исходного текста, и находя закономерности с уже существующими в документе метаданными. Например, связывая с рейтингом признак NSFW, тон повествования, полноту содержания итп.
Разгрести “авгиевы конюшни” личных заметок в Obsidian или git репозитарии с Markdown файлами
Рассмотрим как работает данный подход на 13275 статьях с Хабра, а также текстах трех песнен…
Читать далееБыл я как-то очередной раз в спортзале: делал упражнения, поглядывая на предыдущие значения из заметок и записывая новые туда же. Придя домой, я обновил файл новыми данными и решил, что больше не хочу заниматься этой фигнёй, и что мне нужен сервис, который мне с этим всем поможет.
Я даже не пытался искать готовое решение — яжпрограммист. Мне хотелось сделать что-то под себя, чтобы идеально подходило под мои потребности.
Читать далееКогда мы берем ипотеку или потребительский кредит, мы редко задумываемся о том, что банк, помимо денег, выдает нам сложный производный финансовый инструмент. Право в любой момент вернуть долг без штрафов — это классический call-опцион. Для заемщика это «бесплатная» страховка от падения ставок: если рынок пошел вниз, можно рефинансироваться и платить меньше.
Однако в финансах действует закон сохранения риска. Если у клиента есть право выбора, значит, у кого-то другого этого выбора нет. В структуре банка этим «кем-то» оказывается Казначейство (ALM).
Спустимся на уровень глубже в механику ценообразования банковских продуктов (Transfer Pricing, FTP) и попробуем оцифровать один из самых скрытых компонентов банковской маржи: Cost of Optionality.
Читать далееДефолтные параметры экономят время на развёртке, но оставляют критический разрыв в архитектуре безопасности. Инженер службы поддержки однажды получил ноутбук после гарантийного ремонта с полностью открытым системным разделом. Журналы входа показывали чистый стол. Данные ушли без следов сетевого трафика или срабатывания DLP. Случай заставил пересмотреть подход к предзагрузочному окружению.
Читать далееНедавно я был на отраслевой конференции, где встретил пару знакомых, с которыми начинал ещё в питерских студиях. В отличие от меня, который всегда работал на «дядю», они в какой-то момент выбрали тернистый путь создания инди, своих студий и (судя по тому, как они заказывали напитки) этот путь оказался значительно тернистее, чем выглядел десять лет назад. Хотя глаза у них горели ровно так же, как тогда. Что тогда, что сейчас эти горящие глаза одновременно вызывали и зависть, и лёгкое подозрение, что они просто не успели ещё по-настоящему устать.
Потом мы разговорились. Пусть будет Костя, с которым мы когда-то делали "симсов", уже год пилит гачу для очередных китайцев, чтобы платить зарплаты своим ребятам. А пусть будет Лёша, держит студию из четырёх человек и занимается код-ревью аишных коммитов, но теперь уже для индийских ребят, только тех, которые в солнечной Калифорнии, а не в прекрасном Дели. Тут я вспоминаю своё четвертьвековое легаси, и когда мне говорят, что искусственный интеллект скоро заменит программистов, тихо радуюсь: после стольких лет разработки большинство систем там устроено настолько коряво, что любая нейросеть сжирает все токены, просто пытаясь осмыслить, куда она попала. А значит, как минимум до конца поддержки игры у меня будут задачи.
Про запиливание гач и работу на китайцев инди-студии не очень любят рассказывать вслух, потому как ломается стереотип «свободных и независимых», особенно на отраслевых мероприятиях, где все ходят с одинаковыми бейджами и одинаково уверенными лицами. В целом попасть в инди относительно несложно, а вот прожить в нём дольше, чем длится цикл разработки одного среднего проекта, оказывается задачей со звёздочкой.
Читать далееВ данной статье представлены результаты сравнительных измерений бюджетного модуля для автоматической калибровки с модулем известного бренда. Дано описание метода,приведены графики, сделан вывод.
Читать далее13 мая была исправлена уязвимость в популярном для нагруженных систем веб-сервере nginx: CVE-2026-42945, потенциально могущая привести к RCE. Уязвимость появилась 18 лет (2008 год) назад в версии 0.6.27.
( читать дальше... )
Информация об уязвимости была предоставлена Zhenpeng (Leo) Lin из DepthFirst. Кроме того, он же сообщил о следующих проблемах, которые тоже исправлены:
И снова здравствуйте, дорогие любители синхронизации и те, кого просто принудили. Протокол PTP хорошо настоялся в темном чулане за 20 лет, свободные диапазоны частот в мобильной сети кончаются, LTE TDD шагает по стране широкой поступью, на подходе 5G, так что никуда вы, милые мои, не денетесь от прочтения всего цикла статей. Не сегодня завтра жизнь все равно заставит всех через одного уметь в синхру на пакетных сетях. Наслаждайтесь и
приятного аппетитаКак Александр Чачава купил пол-Рунета и как он может повлиять на публичные компании?
И причем тут КУОС Первого Главного управления КГБ СССР и Дворец Амина в Кабуле, Афганистан.
Читать далееDataclasses появились в Python 3.7 и быстро стали стандартом: меньше бойлерплейта, чем у обычных классов, проще, чем attrs, и не требуют зависимостей. Выглядят настолько просто, что кажется, что ломаться там нечему. Но у них есть три ловушки, которые не видны при написании.
Разобрать ошибкиДолгие 10 лет индустрия молилась на оптимизатор AdamW, слепо применяя его ко всем параметрам нейросети. Но весной 2026 года вышли DeepSeek-V4 и Kimi K2 от Moonshot AI, которые переписали правила игры. В их основе лежит Muon оптимизатор, который снижает затраты на обучение в два раза. В этой статье мы разберем, почему AdamW стал архитектурным рудиментом, как Muon использует итерации Ньютона-Шульца для ортогонализации градиентов, и почему этот алгоритм работает только с 2D-матрицами. Если вы все еще пытаетесь объяснить ИИ через философию, добро пожаловать в реальный мир спектральной нормализаци
Читать далееTelegram — технически самый сложных мессенджер в мире. В iOS приложении 2.1M+ строк, 700+ модулей, 86% Swift, 13 лет кодовой базы, и мало ObjC — это колоссальный труд.
Но при этом приложение лагает на флагманах, AsyncDisplayKit открывает по 10 дублей окон разом(а это явно тормозит ARC), крэши на редактировании изображений стабильны годами.
Почему?
Потому что 86% кода написаны на Swift, но разработчики мыслят все еще в парадигме ООП.
ООП в Swift — это не просто устаревший стиль, это потерянная производительность.
Читать далееВсем привет! Я продолжаю развивать TG Support Bot как open-source решение для поддержки клиентов в мессенджерах и в этом релизе хочу поделиться обновлением 7.1.0.
В этом релизе мы сфокусировались на снижении нагрузки на команды и добавили AI-помощника, который теперь работает сразу на трёх платформах, лучше учитывает контекст диалогов и может либо готовить черновики ответов для менеджера, либо отвечать клиенту напрямую — в зависимости от режима.
Это заметное обновление, которое расширяет возможности проекта и делает его удобнее для реальных сценариев поддержки.
Читать далее15 мая Vercel Labs релизнули Zero. Экспериментальный системный язык, который сами авторы называют "the programming language for agents". Версия 0.1.1, Apache 2.0, расширение .0, бинарники меньше 10 килобайт, без LLVM. На GitHub лежит компилятор, стандартная библиотека и примеры — можно ставить и щупать прямо сейчас.
Я прочитал доки, поставил себе, погонял пару примеров. Сижу с этой мыслью: серьёзно или очередной хайповый проект под волну агентного кодинга?
Если коротко — наверное серьёзно, но мне сейчас не нужно. Тебе, скорее всего, тоже. Сейчас расскажу, что там и почему я так думаю.
Читать далееКогда продакшен падает в три часа ночи, строка ERROR Something went wrong не помогает никому. В статье разбираем, почему привычные текстовые логи быстро превращаются в шум при реальной нагрузке, как перейти на structured logging, зачем каждому запросу нужен request_id и как настроить нормальные JSON‑логи в Python и Go без лишней инфраструктуры.
Читать далееНа майском HPC User Forum в Остине AMD рассказали о MI430X — ускорителе серии MI400, который позиционируется как инструмент для научных вычислений. Пока индустрия увлечена инференсом и считает токены в секунду на FP4, AMD напомнила, что CFD-код (Computational Fluid Dynamics) не интересует, насколько быстро чип умножает восьмибитные числа.
Привет, Хабр! Меня зовут Сергей Ковалёв, я менеджер выделенных серверов в Selectel. В этой статье мы мысленно «разберем» MI430X и обсудим, насколько новинка подходит для «ядерных расчетов» и машинного обучения. Подробности под катом!
Узнать подробностиКаждая AI-лаборатория прямо сейчас работает себе в убыток, обслуживая вашу компанию. Они это знают. И делают это намеренно.
OpenAI, Anthropic, Google и остальные реализуют отраслевую программу субсидирования в масштабах, не имеющих прецедента. Они продают предприятиям вычислительные мощности по ценам ниже себестоимости, называя это бизнес-моделью. Разрыв между тем, что ваша компания платит за AI-подписки, и тем, во что реально обходится их обслуживание, — это не погрешность округления, а пропасть. И любая организация, выстроившая рабочие процессы, продукты или целые бизнес-подразделения на основе субсидированных цен, стоит прямо на её краю.
Это должно быть в приоритете для каждого CTO, CFO и операционного директора. Когда цены скорректируются — а они скорректируются — компании, воспринимавшие AI как вечно дешёвую коммунальную услугу, получат счета, перед которыми их текущие расходы на SaaS покажутся мелочью.
Читать далее