Разработчики: | Meta Platforms |
Дата последнего релиза: | январь 2019 г |
Технологии: | Речевые технологии |
2019: Раскрытие исходных кодов
В январе 2019 года Facebook раскрыла исходные коды инструмента LASER (Language-Agnostic Sentence Representations), предназначенного для понимания любой естественной речи. Этим шагом крупнейшая в мире социальная сеть внесла очередной ключевой вклад в то, чтобы ускорить перевод приложений, занимающихся обработкой естественно-языковых текстов и голосовых сообщений, на большее количество языков.
По сообщению издания SiliconANGLE, система LASER, базирующаяся на библиотеке глубокого обучения PyTorch, применяется Facebook для создания некой математической модели, которая может инкапсулировать и понимать все естественные языки, какими бы уникальными они ни были.
Исходники этого инструменты были выложены в открытый доступ спустя месяц после выхода исследования Facebook, в котором специалисты рассказали об обучении единой модели нейронной сети, которая может моделировать структуру из 93 языков в 34 отдельных алфавитах.
В конечном итоге Facebook получила, как сама компания называет это, «единое представление» или математическое преобразование предложений в форме векторов, которая включает в себя структурное сходство всех 93 языков. Дмитрий Бородачев, DатаРу Облако: Наше преимущество — мультивендорная модель предоставления облачных услуг
Это единственное представление затем использовалось для обучения алгоритмов по нескольким задачам, предполагавшим сопоставление предложений между парами языков, которые программа никогда раньше не видела. Например, был реализован перевод со шведского языка на суахили и метод, позволяющий изучать языки «с нуля».
Исследователь Facebook Хольгер Швенк (Holger Schwenk) говорит, благодаря LASER языки с «ограниченными ресурсами», как ожидается, можно будет изучать совместно с более популярными языками, чтобы можно было построить модели обработки естественного языка для их понимания.[1]
Примечания
Подрядчики-лидеры по количеству проектов
Группа компаний ЦРТ (Центр речевых технологий) (45)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (29)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (27)
SteadyControl (18)
Naumen (Наумен консалтинг) (15)
Другие (196)
Группа компаний ЦРТ (Центр речевых технологий) (5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
SteadyControl (4)
3iTech (ранее 3i Technologies) (2)
Naumen (Наумен консалтинг) (2)
Другие (17)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
Naumen (Наумен консалтинг) (3)
Voice Systems Robotics (VSR, VS Robotics) (3)
SteadyControl (2)
Другие (14)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Группа компаний ЦРТ (Центр речевых технологий) (18, 47)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4, 30)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (12, 29)
SteadyControl HoReCa (1, 23)
SteadyControl (1, 23)
Другие (381, 217)
Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
SteadyControl (1, 4)
SteadyControl HoReCa (1, 4)
SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
Другие (9, 13)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
Naumen (Наумен консалтинг) (1, 3)
SteadyControl (1, 3)
SteadyControl HoReCa (1, 3)
Другие (12, 16)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
SteadyControl (1, 7)
SteadyControl HoReCa (1, 7)
Другие (18, 30)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
Сбербанк (3, 5)
SteadyControl HoReCa (1, 5)
SteadyControl (1, 5)
СалютДевайсы (ранее SberDevices) (2, 4)
Другие (25, 39)
Распределение систем по количеству проектов, не включая партнерские решения
МТТ VoiceBox - 24
SteadyControl Система контроля и управления персоналом - 23
BSS Digital2Speech - 21
Voice2Med Система распознавания речи в медицине - 14
Naumen Erudite - 13
Другие 205
BSS Digital2Speech - 5
SteadyControl Система контроля и управления персоналом - 4
Voice2Med Система распознавания речи в медицине - 4
МТТ VoiceBox - 2
Neuro.net Голосовой робот - 2
Другие 11
МТТ VoiceBox - 11
BSS Digital2Speech - 6
SteadyControl Система контроля и управления персоналом - 3
Naumen Erudite - 3
VS Robotics: VS Робот-оператор - 3
Другие 14