| Разработчики: | T-Bank AI Research (Центр искусственного интеллекта Т‑Банка) |
| Дата премьеры системы: | апрель 2025 г |
| Отрасли: | Информационные технологии |
История
2025: Создание продукта
Ученые из лаборатории исследований искусственного интеллекта T-Bank AI Research разработали новый метод под названием SAE Match, который позволяет понять механизмы принятия решений искусственного интеллекта (ИИ) и увидеть причины формирования тех или иных заключений в процессе вычисления. Об этом 10 апреля 2025 года сообщили представители исследовательской группы из Москвы.
Как сообщили в T-Bank AI Research, с помощью нового метода можно отслеживать, как ИИ генерирует ответы, и своевременно корректировать их. Это первый шаг к созданию более прозрачных, точных и понятных алгоритмов, что является критически важным при внедрении искусственного интеллекта в такие сферы, как медицина, финансы и безопасность.
Метод SAE Match относится к области интерпретируемости искусственного интеллекта, основная цель которой — сделать работу ИИ более прозрачной и понятной для человека. Это позволит отслеживать, как модель обрабатывает информацию, почему она принимает определенные решения, и в дальнейшем повышать точность ответов.Как построить цифровой фундамент для мебельного ритейла будущего
Современные языковые модели (LLM) состоят из нескольких слоев, каждый из которых использует результат предыдущего. Таким образом модель стремится улучшить свои предсказания от слоя к слою. Однако иногда модель может выдавать недостоверную или даже оскорбительную информацию. До настоящего времени не существовало метода, позволяющего проследить, как концепции трансформируются от слоя к слою.
SAE Match стал первым инструментом, который не просто фиксирует концепции на отдельных слоях, а анализирует их эволюцию в процессе вычислений. Эксперименты на различных моделях продемонстрировали, что он помогает отслеживать признаки, которые остаются неизменными на нескольких слоях сети, что делает поведение ИИ более предсказуемым и понятным.

