Как компании правильно выбрать платформу голосовых роботов

Главный системный аналитик компании ITFB Group Николай Чекин поделился, как голосовые роботы могут помочь бизнесу в росте доходности за счет продаж новых продуктов и повышении эффективности благодаря делегированию части рутинных операций.

Как компании правильно выбрать платформу голосовых роботов
© ComNews.ru

Голосовые роботы сравнительно недавно появились и уже успели уверенно войти в повседневную жизнь. Обращаясь в контактный центр банка, страховой компании, телеком-оператора, клиент чаще всего начинает общение с голосовым помощником-роботом. Можно увидеть, как эволюционируют эти сервисы и насколько теперь проще от них можно получить нужную информацию. Мы ежедневно подвергаемся атаке десятков звонков с непрошенными предложениями различного вида услуг, сервисов, новых вкладов. И здесь, несмотря на скорее негативный оттенок, стоит отметить, что далеко не с первой фразы можно догадаться, общаетесь вы с роботом или с живым оператором.

Начнем с тех преимуществ, которые предлагают роботы по сравнению с возможностями осуществления звонков живыми операторами. Роботы могут работать 24/7, они не болеют, не ходят в отпуск, у них не бывает плохого настроения, но при этом есть определенные проблемы в реализации сложных задач.

"Голосовые технологии за последние пять лет ушли далеко вперед, так что с помощью современных роботов можно реализовать более сложные кейсы, чем прием звонков и телефонные продажи. Например, они способны не только пообщаться с клиентом по телефону, но и обработать полученную информацию, сделать краткое резюме по звонку, сгенерировать самостоятельно письмо, составить коммерческое предложение на основе услышанной информации, добавить сведения в CRM-систему заказчика, подключить услугу прямо на звонке", — рассказывает Кирилл Сергеев, генеральный директор компании КВИНТ.

"Голосовые роботы появились сравнительно недавно, но быстро развиваются и уже отлично зарекомендовали себя в сфере автоматизации и повышения эффективности бизнес-процессов. Важно отметить непрекращающееся развитие голосовых агентов, поскольку необходимо быть на шаг впереди потребностей бизнеса. Поэтому постоянно разрабатываются технологические и лингвистические решения на основе искусственного интеллекта. Их основная цель — создать максимально человекоподобного робота. Кроме того, цифровые агенты получают всё более сложные сценарии", — комментирует Александр Лошкарев, коммерческий директор компании Neuro.net.

"Благодаря стремительному развитию голосовых технологий роботы стали универсальным инструментом автоматизации типовых коммуникаций и неотъемлемой частью бизнес-стратегий многих компаний. Востребованность голосовых роботов легко объяснить их высокой эффективностью: боты способны обрабатывать тысячи звонков одновременно, таким образом заменяя целый штат операторов колл-центра и решая проблему пиковых нагрузок. При этом стоимость минуты работы бота существенно (в 5-6 раз) ниже, чем оператора, — отмечает Александр Коваль, коммерческий директор Robovoice компании SL Soft. — Голосовые роботы на базе ИИ широко применяются для задач маркетинга, клиентского сервиса, продаж и даже HR, так как они способны вести сложные нелинейные диалоги, отвечать на отвлеченные встречные вопросы и возвращать диалог в правильное русло, а также автоматизировать ряд сопряженных бизнес-процессов. Конечно, нельзя говорить о полном замещении сотрудников их виртуальными коллегами. Важно отметить, что, несмотря на все их преимущества, голосовые роботы максимально эффективны именно в рутинных коммуникациях с высоким трафиком".

Когда компания начинает задумываться об использовании голосовых роботов в своей работе — это чаще всего говорит о том, что размер бизнеса достиг столь крупных объемов, что возникает вопрос эффективности работы контакт-центра или службы телемаркетинга. Выбор платформы связан со значительными объемами клиентской базы, большими потоками входящих и исходящих звонков, существенным штатом сотрудников по обработке телефонных звонков и необходимости активной продажи различного вида продуктов и сервисов. Очевидно, что при малых объемах можно использовать арендованные услуги сторонних контакт-центров.

"Внедрение современных роботов уже давно перестало быть всего лишь установкой и отладкой ИТ-технологий. Роботы стали помощниками в достижении целевых показателей компаний. Вначале компания должна понять путь своего клиента, выяснить, где клиенту может помочь робот, а где — только оператор. После этого устанавливаются целевые параметры, которые не ограничиваются только автоматизацией. И только потом можно встраивать технологии в бизнес-процессы", — комментирует Юлия Вдовина, директор по продукту цифровизации клиентского сервиса в дистанционных каналах компании BSS.

Поскольку речь идет о довольно сложном проекте по внедрению ИТ-системы, необходима серьезная подготовка со стороны заказчика. Рассмотрим, как же компания должна подготовиться к выбору платформы и вендора. Начнем с вопроса: для какого рода телефонного трафика предлагается использовать голосовых роботов. В случае обработки входящих звонков роботам предстоит анализировать свободный поток речи. После анализа нужно будет вычленить сетевую информацию, которая позволит предоставить необходимые данные в режиме онлайн или переключить на нужного оператора контакт-центра. Это довольно сложная задача, и здесь важно внимательно отнестись к опыту вендора. Немаловажным фактором также является наличие отраслевого опыта.

"Голосовой робот для входящих звонков — один из самых сложных для реализации, поскольку инициатором таких звонков всегда является абонент, и заранее неизвестно, в какой логике будет вестись разговор. Поэтому важно, чтобы у вендора были внедрены хорошие модели обработки естественного языка (NLU) с использованием нейронных сетей. Сейчас для входящих голосовых роботов всё больше становится востребованным применение LLM — технологий c генеративными моделями ведения диалогов. Существует много критериев для выбора роботов, однако важно определиться, какие задачи будут решать голосовые роботы, так как от этого зависит выбор технологий, используемых для автоматизации звонков", — комментирует Кирилл Сергеев, генеральный директор компании КВИНТ.

"Разработка цифрового агента для входящей линии значительно отличается от исходящих кампаний. Хоть и используются те же технологии, но требования к ним предъявляются совершенно другие. Собственный набор Data Science и Machine Learning продуктов (ASR, TTS, NLU, LLM) помогает решать задачи клиентов. Свои решения можно адаптировать под конкретного клиента в кратчайшие сроки. Честно говоря, это давно уже стало индустриальным стандартом для любой компании, выпускающей роботов. А самое сложное в нашей работе — это анализ области знаний нашего клиента и дальнейшее обучение собственных продуктов", — комментирует Александр Лошкарев, коммерческий директор компании Neuro.net.

Для организации исходящих кампаний по телемаркетингу требования к голосовым роботам существенно возрастают, поскольку в случае входящего обращения клиент является заинтересованной стороной в получении информации и будет готов терпеть некоторые неудобства, а для телемаркетинга любая ошибка или некачественная настройка сценария приводит к тому, что клиент просто бросает трубку и никакого диалога не происходит. При выборе самой платформы важно обратить внимание на демонстрацию построения диалогов, опыт вендора, понимание специфики работы с голосом как с точки зрения распознавания, так и по генерации голоса из текста или использования предзаписанных элементов голосовых сообщений.

"Немаловажным фактором при выборе вендора также является возможность контентного бизнес-сопровождения при первичном внедрении робота и при его дальнейшем развитии. С точки зрения технологий сейчас можно реализовать любой сценарий обслуживания и продаж, но важно, чтобы этот сценарий приносил результат. То есть чтобы конечный пользователь при коммуникации с роботом чувствовал себя комфортно, процессы обслуживания были для него интуитивно понятны и просты в использовании, и в итоге он получал решение своего вопроса", — отмечает Юлия Вдовина, директор по продукту цифровизации клиентского сервиса в дистанционных каналах компании BSS.

Как показывают последние исследования, клиентам уже неважно, кто помогает в решении их вопроса — человек или робот. А чтобы вопрос был решен, и реализация проекта не превращалась в установку черного ящика с непонятным результатом, нужно использовать определенные инструменты. На этапе выбора платформы сложно точно спрогнозировать итоговый эффект в бизнес-метриках (процент автоматизации, Time to Market и т. д.), но по определенным параметрам оценить результат все-таки можно. Для выбора инструментария можно использовать чек-листы функциональности. Требования по ним более-менее стандартизованы, и чек-лист несложно сделать в процессе RFI, опросив нескольких вендоров. Для оценки моделей распознавания можно использовать стандартные метрики: WER для моделей распознавания устной речи, Precision/Recall/F1 для распознавания намерения. Помимо метрик качества, стоит обращать внимание на объем датасетов, необходимых для обучения моделей, и наличие инструментария. Важно помнить, что всё развитие нейросетей нацелено на максимизацию качества распознавания при минимизации усилий для их обучения.

Компании-заказчику при выборе платформы важно определиться, чьими силами и каким образом планируется настраивать сценарии работы. Опросы вендоров и участников рынка показали, что существует два кардинально разных подхода к этому вопросу. Часть вендоров считает, что настройка роботов должна производиться силами технической поддержки самого вендора. В этом случае опытные специалисты будут настраивать роботов, используя накапливаемый опыт многих проектов, существенно ниже будут требования к наличию удобных интерфейсов настройки. Но очевидно, что в таком выборе есть и недостатки — это будут не ваши сотрудники, да и стоимость такой услуги будет существенно выше, чем найм сотрудников в штат.

Альтернативный подход — это взращивание экспертизы внутри компании-заказчика. В этом случае руководитель службы телемаркетинга получает, помимо живых операторов, еще и штат роботов, который будет заниматься постоянным улучшением настроенных сценариев, используя весь спектр возможностей влияния на конверсию звонков. Очевидно, что в случае формирования собственной экспертизы важны фактор обучения, удобство работы с интерфейсом системы (идеально, когда есть Low-code конструктор, позволяющий создавать сценарии без привлечения ИТ-специалистов), наличие подробных инструкций и качественной поддержки бизнес-пользователей со стороны вендора.

Технические аспекты

Прежде всего важно определиться, в каком виде планируется использовать решение: в облаке, в закрытом контуре заказчика или комбинированном. Платформы голосовых роботов работают в режиме онлайн, являются высоконагруженными системами и весьма требовательны к серверному оборудованию, стоимость которого существенно влияет на TCO (совокупная стоимость владения) проекта. В ряде отраслей требования безопасности оставляют единственный вариант — размещение в закрытом контуре, при этом часть операций все-таки могут быть вынесены в облако, и тогда мы говорим о комбинированном варианте, который в ряде случаев позволяет достичь некоторой экономии средств. Следующий немаловажный фактор — вопросы производительности и масштабируемости. При проведении переговоров с вендором отдельно стоит сделать запрос относительно опыта реализации высоконагруженных систем и провести референсы действующих клиентов.

"Для обеспечения больших нагрузок необходимо огромное число серверов, и их администрирование требует профессиональных навыков. Однако эффективность использования можно повысить при наличии у вендора собственных решений по оптимизации работы серверов", — уточняет Кирилл Сергеев, генеральный директор компании КВИНТ.

"Если бот-платформу планируют разворачивать в контуре заказчика, стоить обратить особое внимание на необходимость использования GPU. Дело в том, что речевые технологии активно используют нейросети, а нейросети часто требуют GPU для работы. GPU в серверном исполнении и с поддержкой отказоустойчивости могут стоить миллионы рублей и предъявлять специфические требования к ЦОД заказчика. И на этапе выбора платформы нужно или планировать закупку GPU-карт, или выбирать платформы, которые работают в традиционной архитектуре на CPU", — подчеркивает Александр Крушинский, директор департамента голосовых цифровых технологий компании BSS.

Еще одним важным фактором является использование вендорами современного стека как с точки зрения технологий, так и с точки зрения доступности на территории РФ. Это история стандартная для всех ИТ-систем и чаще всего не является блокирующим фактором при выборе российских платформ голосовых роботов. Голосовые роботы относятся к классу сложного телекоммуникационного оборудования, и на него распространяются все требования, касающиеся эксплуатации системы, в том числе: организация резервирований и отработки сбоев в работе системы, логирование, администрирование, наличие эксплуатационной документации и качество оказания технической поддержки.

В связи с уходом западных вендоров образовавшийся вакуум начал заполняться российскими решениями, которые во многом успешно выполнили задачу первичного импортозамещения, когда нужно было обеспечить непрерывность эксплуатации системы по базовому функционалу, а уже во вторую очередь рассматривать полное замещение всего используемого, вопросы качества организации эксплуатации, эргономики. Не все решения, предлагаемые вендорами, были готовы поддерживать такую функциональность и продолжать реализовывать свой потенциал. В связи с этим при выборе платформы голосовых роботов рекомендуется внимательно отнестись к оценке деятельности вендора, поскольку при приобретении платформы вы выбираете решение на длительный срок и становитесь сильно зависимыми от партнера. Самое главное — надежность компании, которая может быть выражена в наличии сильного финансового партнера в составе учредителей, что гарантирует наличие необходимых инвестиций для растущего вендора, а также наличие планов развития платформы и соответствующей команды для их реализации. Следующий аспект, важный именно для платформ голосовых роботов, как сложной интеллектуальной системы, — наличие собственных разработок по этим модулям или использование и доработка Open Source-решений. Немаловажным является наличие у вендора модуля VAD, который позволяет отделить речь от фоновых шумов и пауз, чтобы улучшить качество распознавания и перебивания. Также стоит отметить уровень организации ключевых процессов по взаимодействию с клиентами: организации продаж, процесса развертывания и внедрения, обучения, технической поддержки, реализации сопровождения и доработок системы под требования заказчика.

Стоимость владения системой

Первой составляющей стоимости является лицензия. Стоимость лицензий может быть в виде продажи бессрочной или годовой подписки. Стоимость первой дороже в перспективе одного года, но существенно дешевле при расчете на несколько лет. Вендоры предоставляют скидки от объема, поэтому важно сразу определиться не только с текущими потребностями по каналам, но и спрогнозировать рост лицензий на ближайшие годы. Это дает возможность получать дополнительные скидки на общий объем. Важно добавить, что при рассмотрении крупных проектов внедрения платформ есть возможность сравнить первичные предложения вендоров, но финальная цена всегда формируется индивидуально.

"Сервис по использованию голосовых роботов может предоставляться разными способами: приобретение в контур заказчика по лицензии, облачный формат использования, самостоятельная настройка роботов или с помощью услуг вендора. Предоставление сервиса в облаке в виде SaaS-услуги — более гибкий формат, который набирает всё большую популярность в нашей компании. Это быстро, дешево, удобно, не требует отвлечения ресурсов, к тому же существуют инструменты для обеспечения конфиденциальности и безопасности персональных данных при такой реализации", — рассказывает Кирилл Сергеев, генеральный директор компании КВИНТ.

Вторая составляющая — техническая поддержка вендора, которая, как и по другим ИТ-системам, составляет около 20–25 % от стоимости лицензий за годовой контракт. У ряда вендоров представлены различные тарифные планы в зависимости от SLA и возможного включения часов доработки.

Третья составляющая — стоимость развертывания и внедрения системы. Помимо базового развертывания, в проект внедрения входит настройка интеграций с телефонными системами заказчика. В целом, разнообразие телефонных систем ограничивается 3-4 базовыми телеком-платформами, с которыми все крупные вендоры имеют значительный опыт работы, и эта часть внедрения не вызывает особых проблем при реализации. Следующая часть связана с необходимостью получения данных из различных учетных систем заказчика как для информирования клиентов на входящих звонках, так и для организации обзвона их на исходящих линиях. Здесь представлено большое разнообразие как самих ИТ-систем, так и соответствующих вендоров. Для расчета стоимости таких интеграций требуется более глубокое погружение в технические вопросы, но в целом вопросы настройки не являются большой проблемой.

Четвертой значимой составляющей является стоимость аренды/покупки серверного оборудования. Платформы голосовых роботов, в силу особенностей обработки информации в онлайн-режиме, весьма требовательны к "железу", что существенно отражается на TCO.

И наконец, настройка сценариев голосовых роботов. Здесь, в зависимости от выбранного варианта, либо требуется обучение сотрудников и частичная поддержка в настройке, либо настройка всех сценариев осуществляется вендором по специальной программе поддержки и оплачивается на основе соответствующих тарифных планов.

Сроки внедрения

Стандартные сроки внедрения с момента подписания договора между заказчиком и вендором составляют от 1 до 3 месяцев в зависимости от сложности настройки интеграций.

"Модель окупаемости и сроки достижения финансовых эффектов являются сейчас одним из ключевых факторов успеха применения ИТ-технологий. И здесь немаловажным является комплексный подход, баланс между автоматизацией и клиентским опытом, возможность выстроить бесшовный путь клиента. Это приносит измеримые результаты и в части эффективности, и в части получения дополнительного дохода. Судя по нашему опыту, робот влияет на такие параметры эффективности, как Contact Rate, FCR, полная и частичная автоматизация, количество переключений за счет умной маршрутизации, AHT, а также на показатели продаж — долю озвученных предложений и конверсию. Именно они закладываются в финансовые калькуляторы для оценки рентабельности проекта, а также для контроля и мониторинга достижения ключевых метрик успеха", — резюмирует Юлия Вдовина, директор по продукту цифровизации клиентского сервиса в дистанционных каналах компании BSS.

"Сроки реализации проектов зависят от конкретной задачи, которая делегируется роботу, а также сложности интеграции с инфраструктурой заказчика. Для простых кейсов без интеграций или с "коробочной" интеграцией запуск бота может занимать один день, — отмечает Александр Коваль, коммерческий директор Robovoice компании SL Soft. — Однако для сложных комплексных проектов мы рекомендуем закладывать больше времени и обязательно учесть период на итерационное тестирование бота, посредством которого выявляются неточности в работе робота на небольших базах и совершенствуются его коммуникативные навыки".

Выводы

Поскольку речь идет о довольно сложном и дорогостоящем продукте — платформе голосовых роботов, — то, несомненно, со стороны заказчика требуется проведение предварительной работы для погружения в тему и формулирования первичных требований, с которыми уже можно будет начинать первичный отбор шорт-листа платформ и проведение переговоров, включая демонстрации решений.

При выборе и сравнении платформ рекомендуем комплексно подойти к оценке предложенных решений, рассматривая все описанные в данной статье критерии выбора, а именно: TCO, соответствие функциональности заявленным требованиям, вопросы развертывания, внедрения и дальнейшей эксплуатации систем, а также опыт и уровень надежности и развития вендора.