Хоть сейчас много где написано что VUI мол со смартфонов начался (по времени) но на самом деле голосовой ввод был реализован даже не в конце прошлого века а намного раньше, правда был не очень удобен, часто плохо работал или надо было "обучать" под конкретного пользователя и неслабо прибавлял к цене продукции.
Тот же Dragon NaturallySpeaking позволял не только диктуемые тексты переводить из голоса в текстовый формат но и управлять компьютером (движения курсора, нажатия кнопок, запуск программ) ещё в 1997 году под Windows (и через несколько лет и под Mac.
Есть и намного более ранние примеры в том числе интегрированные "в железо" были дисковые и даже кассетные видеоплееры управляемые голосом и прочая бытовая техника. Стоило дорого, удобство от такого способа было сомнительно - платить за стиралку включаемую голосом стоя рядом с ней в 5 раз дороже чем за обычную влючающуюся с кнопки - не каждый был готов.
Банальное "Включить свет" по голосовой команде было реализовано всего через несколько лет после того как было показано в фантастических фильмах. А по хлопку в ладоши и раньше.
Так что технологии в принципе были а вот массовое внедрение началось когда наценка за такое "удобство" стала намного меньше или вовсе отсутствовала например в телефоне УЖЕ есть динамик, микрофон, процессор способный распознать голос, остается только софт который и был реализован да ещё и так что ничего не стоил дополнительно для покупателя устройства. А голосовые помошники (без ИИ по современным меркам но имеющие полезный функционал) тоже были давно но пользование было по подписке за доп деньги к контракту с с опсосом.