«Мы достигли уровня человека. Это историческое достижение», - заявил главный ученый команды из подразделения Microsoft по работе с искусственным интеллектом (Microsoft Artificial Intelligence and Research ) Сюэдунь Хуань (Xuedong Huang). По признанию исполнительного вице-президента подразделения Гарри Шума (Harry Shum), еще пять лет назад сотрудники Microsoft полагали, что такое невозможно.
Исторический момент наступил после десятилетий исследований в этой сфере, начиная еще с 1970-х годов, работы совместно с Агентством по перспективным оборонным научно-исследовательским разработкам США (DARPA), перед которым была поставлена задача технологических прорывов в сфере национальной безопасности.
Напомним, Microsoft смогла так далеко продвинуться в сфере распознавания благодаря использованию глубоких нейронных сетей, работа которых напоминает биологические процессы в головном мозге человека. Нейронные сети считаются ключевой технологией в разработке не только распознавания речи, но и компьютерного зрения. Такая сеть состоит из нескольких слоев.
Говорить и видеть
«Чтобы достичь контрольной точки равенства с человеком, команда использовала ПО Microsoft’s Computational Network Toolkit, собственную систему для глубокого обучения, проекта с открытым исходным колом, распространяемого через Github», - отметили в Microsoft.
Участники исследовательской группы Microsoft Speech & Dialog