Мы занимаемся тем, что прослушиваем звонки сотрудников компаний и контролируем качество их работы, внося определенные данные из звонков в таблицу Гугл. Мы собираем звонки каждый вечер (1000-1500 за день). И к следующему утру должны дать отчет в форме таблицы.
Сейчас это делается вручную. Нам нужно это автоматизировать через ИИ, чтобы стоимость обработки одного звонка была не более 1.5-1.7 центов (у нас таких звонков по 40-45 тыс. в месяц, длительностью 2-3 мин в среднем, так что каждый сэкономленный цент - это серьезная выгода для нас).
Но платят нам за анализ ТОЛЬКО звонков от НОВЫХ клиентов (целевые звонки). А таких звонков из общей массы только 5-7%
Нам нужно с помощью ИИ: 1) из общего потока аудио-файлов выявить только ЦЕлевые звонки (уже есть хорошо работающий промт на ChatGPT-3.5, транскрибация идет через ElebenLab) 2) из ЦЕлевых вытаскивать определенные данные и вносить из этих файлов данные в таблицу Гугл.
Задача: 1) создать готовый онлайн продукт, который сразу много наших сотрудников могут использовать из разных локаций и дублировать этот продукт, когда появляются новые клиенты.
Продукт должен таким: а) ежедневно забирать аудио-файлы из папки в Гугл (мы туда будем их загружать), б) отсеивать Целевые/Нецелевые звонки (транскрибация и промт уже готовы и проверены), в) заносить определенные данные из ЦЕлевых звонков в Таблицу.Гугл. г) и так каждый день повторяется
2) используя наш Промт, удешевить до 1.5 центов процесс транскрибации, анализа и внесения данных в таблицу (например, за счет использования GPU-хостинга на RunPod, у нас есть целая ночь (10-12 часов) для анализа 1000-1500 звонков, так что можно медленный сервер). Мы тестировали на make.com, получается дороговато. Сейчас мы экономим за счет того, что изначально транскрбириется не весь разговор, а только первые 60 сек. (хорошо отфильтровывает ЦЕлевые от НЕцелевых). А полностью аудио-файл анализируется, только если он ЦЕлевой. Но все равно надо снижать себестоимость анализа.