Сборщик RSS-лент

Я созидатель, а ты ССД #2

Habr.com - пн, 05/18/2026 - 11:30

Из всех модных книжек про будущее ИИ я больше всего люблю «Сумму технологии». 1964 год, Лем сидит и пишет про гомеостаты, цереброматику, имитологические машины. Через тридцать лет родится WWW. Через пятьдесят — БЯМы. Лем про это уже знал. Не знал, но видел.

Я её перечитываю каждый год с 2017-го, когда пришёл в серьёзный deep learning — в G42 Institute of Artificial Intelligence в Абу-Даби. Тогда я запускал датацентры, набитые «золотыми» DGX — золотыми и по дизайну, и по цене, как будто специально спроектированными для ОАЭ — и смотрел, как наивные LSTM-чатботы пытаются связать пять слов подряд. Казалось дорогой игрушкой. Потом громыхнули свёрточные сети, и YOLOv3 стала видеть лучше человека. Потом громыхнули трансформеры. Потом GPT-2. Потом всё остальное.

И, как сейчас модно говорить, вы находитесь здесь.

Каждый раз, когда я перечитываю «Сумму», я с Лемом спорю. И каждый год — о разном. Первый год спорил о масштабе: казалось, он слишком далеко загнался, слишком цивилизационно, мы тут с YOLO разбираемся, какая там цереброматика. Второй год — спорил о темпе: казалось, он недооценил, как быстро. Третий — о темпе, но в другую сторону: казалось, переоценил. К 2026-му я уже понимаю, что Лем спорить со мной не будет.

Читать далее

Менторинг vs коучинг vs консалтинг: разбор для тех, кто платит

Habr.com - пн, 05/18/2026 - 11:20

Три профессии путают, потому что они происходят из одного семантического поля «помогаю предпринимателю». Но продают разные вещи. У ментора, коуча и консультанта разные точки опоры, разные сроки, разная ответственность и разный результат на выходе.

Ниже сравнительная таблица по 7 параметрам, три отличия в услуге с примерами, кейс из практики и фреймворк выбора нужного помогатора. Главный вывод: если вы платите за менторинг, а получаете консалтинг, это всегда вина обеих сторон, и обычно лечится переформулировкой запроса до подписания контракта, а не после.

Читать далее

Шахматные программы III. Дерево перебора

Habr.com - пн, 05/18/2026 - 11:09

В третьей части мы взглянем на дерево перебора в общем контексте поиска. Увидим, каким образом методы отсечений из предыдущей части влияют на дерево в целом или на значительные его части, а также для полноты картины оценим влияние этих методов в историческом контексте. Эту и следующую части можно пропустить, если общего описания основных методов ограничения перебора ранее кажется достаточным.

Читать далее

Как создать ИИ-агента для бизнеса за 10 шагов. Гайд с учётом российской специфики API

Habr.com - пн, 05/18/2026 - 11:03

Нейросети можно объединять в полноценные рабочие системы. Такие системы называют ИИ-агентами. Их используют в поддержке, продажах, аналитике, HR, логистике и внутренних процессах — везде, где есть повторяемые задачи, понятные правила и данные, к которым можно подключиться.

Но при сборке ИИ-агента важно учитывать российскую специфику API.

Читать далее

Мой личный вызов 2026 года: «не ищу работу, а меняю сферу» – дорога в IT из госсектора

Habr.com - пн, 05/18/2026 - 11:01

Я управленец из госсектора с 8‑летним стажем. В 2026 году решил перейти в IT. В статье — честный разбор моего пути: анализ 30+ вакансий с помощью ИИ, трезвая оценка компетенций, выявление пробелов, подбор точечных курсов и создание дашборда для отслеживания прогресса. Рассказываю, что помогло, где ошибался. Спойлер: оффера пока нет, но карта действий уже готова.

Читать далее

Математическое моделирование непосредственно в 1С

Habr.com - пн, 05/18/2026 - 11:00

Сказ о том, как я воткнул в 1С модули математической оптимизации, а они оказались рабочими и расплодились до полноценной библиотеки. Теперь этот инфернальный софт пережевывает производственное планирование, маршрутизацию и прочие задачи комбинаторного космоса.

Читать далее

RAG в enterprise: 70-80% проблем не в модели, а в данных

Habr.com - пн, 05/18/2026 - 11:00

Эта статья родилась из работы над AlpinaGPT. Мы недавно зарелизили в нём по-настоящему крутых AI-ассистентов и AI-проекты: с подключаемыми базами знаний, общим контекстом чатов и нормальной памятью между сессиями. Я начал смотреть, как RAG сделан у других — и оказалось, что во многих продуктах на рынке всё гораздо проще и грубее, чем нам кажется. 

Идея RAG проста: дать языковой модели доступ к внутренним документам компании, чтобы она отвечала не из общих знаний, а по конкретным регламентам, инструкциям и базам знаний. На практике большинство команд проходят один и тот же путь: быстро собирают прототип, показывают его на демо, получают одобрение, а через пару недель в продакшне обнаруживают, что система путает версии документов, теряет контекст и уверенно выдаёт ответы, которых нет ни в одном источнике.

В этой статье — разбор конкретных причин, по которым RAG ломается в enterprise, стратегии чанкинга, антипаттерны архитектуры и практический чек-лист внедрения. 

Читать далее

Как оживить фото нейросетью Kling 3.0: пошаговый гайд с промптами в SpeShu.AI

Habr.com - пн, 05/18/2026 - 10:59

Kling 3.0 — текущий лидер в сегменте Image-to-Video. В отличие от предыдущих итераций, здесь глубже проработан Diffusion Transformer (DiT) — механизм внимания к исходному кадру. Благодаря ему нейросеть не дорисовывает кадры сама, а моделирует их на базе объектов.

В этой статье разберём, как оживить фото, сохранив анатомическую точность и текстуры. Бонусом 3 готовых промпта для теста модели.

Читать далее

Как создать свой бенчмарк: 6 уроков с туториала NeurIPS

Habr.com - пн, 05/18/2026 - 10:53


Посмотрела Туториал NeurIPS «The Art of Benchmarking» — панель с авторами SWE-bench, GPQA и ведущими исследователями из Google DeepMind, NYU и Berkeley.
Вот мой конспект. Делюсь с вами, так как бенчмарки теперь не только про науку, но и про безопасность, регуляторику и миллиардные решения о деплое.

* Тирания метрик
Оказывается, любая метрика имеет honey spots, которые модель может хакнуть. Проблема в том, что текущая мета-оценка (корреляция Пирсона) эти точки не показывает. А если метрика становится еще и reward'ом при обучении — могут быть проблемы

* Про долговечность
Бенчмарки действуют только определенный период, и нередко - далеко не 10 лет. Всё насыщается. ImageNet продолжает быть полезным, потому что его используют для 10 разных задач (диффузия, CLIP, zero-shot). А большинство бенчмарков теряют актуальность, но продолжают кочевать по paper'ам еще 5 лет — просто потому, что их удобно цитировать. Это плохая практика.


* Субъективность — везде
Даже в классификации изображений люди расходятся. Две принципиально разные причины: (а) задача плохо задана (underspecification), (б) люди реально думают по-разному. Проблема краудворкинга: если не кэпировать ответы, вы получите не мнение популяции, а мнение Боба, который сделал 80% аннотаций.

* LLM как источник оценки — это очень опасно
Они коррелируют с людьми только на той выборке, на которой их калибровали(!). Модель становится умнее — распределение данных меняется — корреляция падает. А при генерации бенчмарков LLM имеют сильнейший self-bias (даже с независимой метрикой). Единственный корректный подход — заставить модель генерировать примеры, на которых она ошибается

Читать далее

Ego is your limit или как мы сопротивляемся собственному развитию в контексте AI-революции

Habr.com - пн, 05/18/2026 - 10:40

В заметной части ИТ-сообщества до сих пор отмахиваются от AI-ассистентов: ругают за галлюцинации, смеются над «вайб-кодингом» и превозносят биологический мозг. Или это мне так кажется.

Я не сторонник вайб-кодинга и долгое время игнорировал существование агентов, но моё отрицание прогресса стало обходиться мне слишком дорого. И я шагнул на съедение страшным симуляторам программиста на подложке.

Внутри - рассуждение о том, почему главное место в современной дискуссии занимают не ИИ-агенты, а мы и наше эго, просто все дружно делаем вид, что обсуждаем другое. Рассуждение, основанное на наблюдении за собственным внутренним сопротивлением происходящим изменениям.

Да будет срач!

8 PoPs по миру за €46/мес: реальная экономика pet privacy-DNS в цифрах

Habr.com - пн, 05/18/2026 - 10:40

Я полгода в одиночку пилю VantageDNS, privacy-focused recursive DNS с фильтрацией. Аналог NextDNS, юрисдикция EU. Ниже честный построчный разбор того, во что мне на самом деле обходится сеть из 8 нод по миру и контрол-плейн. Не маркетинговое «около ста евро», а реальная цифра, которая каждый месяц списывается с карты: €46.27.

В конце таблица расходов и прикидка, сколько платных юзеров надо, чтобы это перестало быть хобби.

Показать счёт

Как люди использовали биометрию до компьютеров?

Habr.com - пн, 05/18/2026 - 10:00

Невероятно, но факт: человек понимал, что части нашего тела несут уникальную биометрическую сигнатуру еще когда эпос о Гильгамеше был самым популярным “шлягером” на вавилонских свадьбах и пирах.

Читать далее

Китае-американский визит десятилетия, а также первый коммерческий пилотируемый меха-робот

Habr.com - пн, 05/18/2026 - 09:50

Самые интересные новости финансов и технологий в России и мире за неделю: встреча Трампа и Си, новый глава ФРС заступил на должность, первое крупное ИИ-IPO Cerebras, на бирже обещают сделать фьючерсы на компьют, экономика РФ замедляется, мессенджер Max хочет заменить банковские SMS, айтишники в западных компаниях жгут токены почем зря, а также хорошая новость недели для всех скуфов.

Читать далее

Иллюзия сохранности, или Бэкап, который не спасает

Habr.com - пн, 05/18/2026 - 09:35

Случай, произошедший со стартапом PocketOS, выглядел бы комичным, если бы не обернулся реальной катастрофой. ИИ-агент Cursor, работавший на базе Claude Opus, за девять секунд уничтожил не только основную базу данных компании, но и все резервные копии.

Читать далее

GEO для Яндекс Нейро: 4 метрики, которые отвечают на главный вопрос «почему меня нет в выдаче»

Habr.com - пн, 05/18/2026 - 09:03

Когда в 2023-2024 году Яндекс и Google запустили генеративные ответы поверх поисковой выдачи, классические SEO-метрики начали ломаться по одной. Позиция «1 место в SERP» больше ничего не значит, если 40-70% коммерческих запросов в нише триггерят AI-ответ выше первой ссылки. Click-through rate упал даже у тех, кто формально сохранил топ-3 - AI-ответ перехватывает часть кликов, и появляется новый класс источников: домены, которые AI цитирует в своём ответе. Туда вы либо попадаете - либо нет.

Самое неприятное здесь - то, что обычно называется GEO (Generative Engine Optimization), сейчас почти никто реально не мерит. Классические SEO-инструменты (Ahrefs, Topvisor, SE Ranking) видят AI-ответы Нейро и AI Overview Google как «features», но не дают метрик, по которым можно работать. Команды смотрят позиции, видят что они на месте, а трафик при этом просел на 20-40%, и не понимают почему.

В этой статье разбираю 4 GEO-метрики, которые реально работают для Яндекс Нейро, показываю их формулы (включая реальную формулу композитного Visibility Score из нашего production-кода), и объясняю как собирать всё это через Yandex Cloud Search API + Wordstat + Apify без покупки enterprise-инструментов. По нашему опыту работы с этим стеком на десятках брендов в нишах от ремонта/монтажа до e-commerce и B2B-услуг - у 4 из 5 брендов Citation Rate в Нейро равен 0% по их же главным коммерческим запросам. Это и есть основная цифра, ради которой стоит начать мерить.

Читать далее

Насколько многомерным может быть многомерный точный индекс?

Habr.com - пн, 05/18/2026 - 09:01

Вот, например, Milvius(DiskANN) рассчитан на вектора размерности до 32 768, но это приближенный поиск.  Но как насчёт поиска точного?

В данной статье рассматривается работоспособность 1024 мерного индекса, хранилищем которого служит обычное B-дерево (насколько вообще может быть обычным такое дерево). Используемый диск - вполне себе “железный” старый добрый WD Purple, оперативная память сознательно ограничена 8 Гб. Можно ли что-то из этого выжать на рядовом десктопе за приемлемое время?

Читать далее

Wayback Machine как архив IDOR: как временные ссылки перестали быть временными

Habr.com - пн, 05/18/2026 - 09:00

В марте 2026 многие обсуждали ситуацию с доступом к изображениям из ЛС мессенджера MAX по ссылкам, сохранённым через WebArchive. Тогда же многих не устроил ответ компании.

К сожалению, ситуация хуже, чем кажется. Т.к. проблемы не видят не только в MAX, но и в других компаниях (столкнулся с этим, оповещая компании о похожих проблемах). В статье я расскажу, почему считаю ситуацию - проблемой для всех: пользователей, компании, багхантеров. И как связка "WebArchive + IDOR" может стать бомбы замедленного действия для компании.
Более того, эта ситуация - наглядный пример, как отлаженный механизм повышения безопасной разработки (что не найдут внутренние безопасники компании - отловят багхантеры) иногда даёт сбой.

Читать далее

Как связывание эмбеддингов душит трансформеры и уничтожает градиенты

Habr.com - пн, 05/18/2026 - 08:44

Долгие годы в NLP считалось правилом хорошего тона связывать матрицу входных эмбеддингов с матрицей выходного классификатора (Weight Tying), чтобы сэкономить память. В этой статье мы разберем геометрическую ошибку этого подхода. Вы узнаете, почему входные и выходные репрезентации имеют прямо противоположные математические цели, и как общая матрица приводит к физическому столкновению градиентов во время обратного распространения ошибки, лишая модель выразительности.

Читать далее

Qwen3.6 27B MTP весит на +0.3 Гб больше, а даёт ускорение в ~2 раза. С 60 t/s до 130 t/s без потерь. Что такое MTP

Habr.com - пн, 05/18/2026 - 07:28

В llama.cpp добавили поддержку MTP Qwen3.6. Дополнительные слои Multi-Token Prediction позволяют сгенерировать сразу несколько токенов за 1 проход, что ускоряет генерацию в 1.5-2 раза. Качество при этом остается lossless. Для моделей, которые не имеют встроенного MTP, есть альтернативы в лице EAGLE-3 и DFlash.

Читать далее

15 вещей, которые вы бы не хотели знать о мессенджере MAX: тайная запись звука с микрофона в звонках и много чего еще

Habr.com - пн, 05/18/2026 - 07:12

Я декомпилировал APK мессенджера MAX и проверил его поведение по коду. нашёл: скрытый SDK деанонимизации с отправкой реального IP в обход VPN на сторонний домен, недокументированную запись аудио со звонков по команде сервера, отключённую проверку TLS-сертификатов в QUIC-канале медиа, серверный C2-канал через WebSocket с командами выгрузки контактов и логов, аппаратный фингерпринт через Widevine DRM, ZipSlip в загрузчике моделей, передачу номера телефона по открытому HTTP, силовое обновление в обход Google Play, управление NFC-payload из мини-приложений, трекинг адресной книги в реальном времени и ещё несколько находок. Все находки сверены с реальным кодом, ссылки на файлы и классы в zarazaex69/m

Читать далее

Сейчас на сайте

Сейчас на сайте 0 пользователей и 7 гостей.
Ленты новостей