Содержание:
1. Описание механизма 1С Распознавания речи
2. Виды распознавания и цена на сервис 1С Распознавание речи при работе через облако
3. Основные возможности сервиса 1С Распознавание речи
4. Пример работы с файловой системой распознавания речи в системе программы 1С
1. Описание механизма 1С Распознавания речи
С выходом платформы версии 8.3.23 фирма 1С добавила новый механизм «Распознавание речи».
1С Распознавание речи – это механизм, который позволяет автоматически преобразовать аудио в текст. Данный сервис возможно использовать как в облаке, так и локально. Для использования в облаке необходим аккаунт на портале ИТС, и подписка 1С: ИТС КП.
Для использования локально необходимо скачать и установить модель «Распознавания речи» «https://portal.1c.ru/applications/1C-Speech-Recognition», это возможно если у Вас имеется действующий договор ИТС. Использование локальной версии 1С не подразумевает отправку информации на сторонние ресурсы, что обеспечивает сохранность конфиденциальной информации. Также использование локальной версии «Распознавание речи» бесплатно, в отличие от облачного.
В настоящее время функция «Распознавание речи» воспринимает речь на русском и на английском языках, но как утверждают разработчики фирмы 1С количество языков будет увеличиваться и функционал улучшаться.
2. Виды распознавания и цена на сервис 1С Распознавание речи при работе через облако
1С Распознавание речи имеет 2 типа: «Потоковое распознавание» и «Файловое распознавание». Как писалось выше в «Локальной» версии «1С Распознавание речи» работает бесплатно. Версия «Облачного» распознавания тарифицируется единицами.
Потоковое распознавание – 1 единица = 1 секунде распознавания. Списывать можно по 20 ед. Стоимость считается шагами в 20 секунд. Пример расчета стоимости «Потокового распознавания»: за 20 секунд распознавания спишется 20 единиц, за 36 секунд спишется 40 единиц, за 10 секунд спишется 20 единиц.
Файловое распознавание – 1 единица = 4 секунды распознавания. Списывать можно по 20 ед. Стоимость также считается шагами в 20 секунд. Пример расчета стоимости «Файлового распознавания»: за 1 секунду распознавания спишется 4 единицы, за 20 секунд спишется 5 единиц, за 18 секунд спишется также 5 единиц, за 40 секунд спишется 10 единиц.
3. Основные возможности сервиса 1С Распознавание речи
1. Потоковое распознавание - это когда в реальном времени человек надиктовывает текст в микрофон, а на выходе получает текст.
2. Максимальная продолжительность потокового распознавания аудио в облачном сервисе составляет 120 мин. У локальной версии ограничений нет.
3. Файловое распознавание позволяет осуществлять многоканальную обработку аудио. При этом по каждому каналу будет осуществляться независимое распознавание и тарификация.
4. Распознавание речи поддерживает следующие форматы аудио: WAV и Opus.
5. Ограничения по размеру аудиофайла – 1Гб или запись не более 4 часов максимум.
6. Распознанный текст доступен до 7 суток со дня выполнения задачи.
Далее рассмотрим пример подключения локального «Распознавания речи» и распознавания аудио файла в формате WAV файла.
4. Пример работы с файловой системой распознавания речи в системе программы 1С
Локальное подключение распознавание речи:
Как писалось ранее для подключения «Распознавание речи» локально необходима платформа версии 8.3.23 и выше.
Перед началом убедимся, что параметр «Функции для технического специалиста» у нас включены. Для этого делаем следующие действия:
В пользовательском режиме работы нажимаем на кнопку «Сервис и настройки» - «Настройки» - «Параметры» - в самом низу необходимо установить галку «Режим технического специалиста»:
6. В пользовательском режиме работы нажимаем на кнопку «Сервис и настройки» - «Функции для технического специалиста» - «Стандартные» - «Управление распознаванием речи».
После нажатия на «Управление распознаванием речи» откроется следующее окно:
После чего в данном окне нажимаем на кнопку «Подключить». Откроется окно (см. рисунок ниже), в нем устанавливаем галку «Подключить только в рамках сеанса» и нажимаем кнопку «Подключить».
После чего таблица заполнится доступными версиями «Распознавания речи». Необходимо выбрать нужную версию и нажать на кнопку «Установить».
Далее будет описание как внедрить «Файловое распознавание речи»:
Для примера использования создадим внешнюю обработку данных.
1. Создаем внешнюю обработку.
2. Создаем форму.
3. После чего нужно создать реквизиты формы («Путь к файлу») и таблицу значений («Список»). Переносим и располагаем их на форме. Получим следующий результат.
4. После чего заходим в модуль формы и пишем первую процедуру «ПутьКФайлуНачалоВыбора».
Данная процедура открывает диалоговое окно для выбора аудио файла. Файловое распознавание поддерживает 2 формата аудио записей: WAV и Opus.
5. Из процедуры «ПутьКФайлуНачалоВыбора» вызывается процедура «ВыполнитьЗагрузкуФайлов»
С помощью данной процедуры мы помещаем выбранный нами файл на сервер. Перед тем как наш файл попадет на сервер будет выполнено 3 этапа.
Первый этап: процедура «ПередНачаломПомещенияФайлов»
Второй этап: процедура «ПриВыполненииПомещенияФайлов»
Это процедура показывает процесс в процентном соотношении загрузки файла на сервер.
Третий этап: процедура «ПриЗавершенииПомещенияФайлов»
Данная процедура завершает загрузку файла на сервер, тем самым помещая данные о файле на сервере в структуру, а именно «Адрес», «Наименование» и «Расширение». После чего структура с данными переходит в следующую процедуру «НачатьРаспознаваниеРечиНаСервере».
6. Процедура «НачатьРаспознаваниеРечиНаСервере»
В этой процедуре мы преобразуем адрес файла расположение на сервере в двоичные данные. После чего двоичные данные мы преобразуем в ключ. Ключ – это УникальныйИндентификатор, который идентифицирует отложенное распознавание и позволяет получить результат, указав этот идентификатор в качестве ключа при получении результатов отложенного распознавания.
Данный ключ мы передаем в функцию «ПолучитьРезультатыОтложенныхРаспознаваний».
7. «ПолучитьРезультатыОтложенныхРаспознаваний»
В этой функции мы передаем ключ в функцию «МодульРаботаСРечью» для обработки этого ключа с помощью метода Вычислить.
В функцию «ПолучитьРезультатыОтложенныхРаспознаваний» возвращается массив.
В этом массиве мы видим «Завершено» = Истина, «Успешно» = Истина. Чтобы обработка получала обновленный статус в данной функции есть цикл.
После чего массив с результатом мы возвращаем в процедуру «НачатьРаспознаваниеРечиНаСервере». Результат распознавания мы отправляем в процедуру «ЗагрузитьРезультатРаспознаванияРечи».
8. «ЗагрузитьРезультатРаспознаванияРечи»
В этой процедуре мы помещаем данные в таблицу из «РезультатРаспознаванияРечи».
В итоге имеем следующий результат:
Всем спасибо кто прочитал данную статью до конца. Надеюсь она была вам полезна и познавательна.
Специалист компании "Кодерлайн"
Егор Маклашов