О ПРОДУКТЕ
Какие технологии используются в Scriber? На какие сервисы вы ориентировались в разработке?
Асет Мамыраимов: При создании Scriber мы использовали разные технологии распознавания речи и строили продукт так, чтобы быть независимыми от провайдера. Многие технологии расшифровки используют искусственный интеллект. Например, у OpenAI есть технология Whisper, мы на нее тоже смотрим и экспериментируем. Весной 2017 году вышел сервис Happy Scribe, его я взял на заметку. Сейчас этот сервис активно развивается, мы до сих пор поглядываем на них, хотя некоторые вещи отличаются от них сильно.
Асылхан Нәзір: Happy Scribe делает упор на расшифровку. У нас же другой подход: мы строим продукт вокруг текстового редактора, где расшифровка будет функционалом, а не основой. Наша цель — стать профессиональным инструментом для генерации текстового контента. Для этого мы планируем запустить платную подписку, где будет три часа расшифровки и встроенный в редактор ChatGPT, чтобы помогать генерировать текстовый контент (интервью было записано до релиза этой функции 29 марта – Авт.). Фокус пока на наш регион. Мы хотим здесь освоиться, выйти на поток и потом думать о развитии.
Вы запустились в ноябре 2022 года. Не могли бы вы привести статистику по сервису на данный момент?
Асет Мамыраимов: За эти пять месяцев зарегистрировались более 1 000 пользователей, расшифровали почти 300 часов аудио. За февраль — март было в среднем 160 пользователей, которые расшифровывали аудио, в первые месяцы их было 200–300 человек — отчасти за счет бесплатных минут. В среднем 12 % зарегистрированных начали пользоваться сервисом на платной основе.
Мы решили отказаться от Google Analytics и собираем основную статистику своими инструментами. Так мы учитываем количество сохранений, по которым понимаем, насколько активно люди пользуются редактором. На лендинге есть статистика по визитам, другие трекеры в самом сервисе мы не ставили, принимая во внимание конфиденциальность пользователей. При регистрации мы не просим указать страну, но, судя по платежам, помимо Казахстана, Scriber пользуются в Кыргызстане, Узбекистане, Армении, Грузии, Украине и Турции.
Scriber One распознает 8 языков. Какие языки распознаются лучше, а какие хуже? Также по информации на сайте, Scriber транскрибирует чистое аудио с аккуратностью 80 %. Что можно улучшить, чтобы повысить точность результата?
Асет Мамыраимов: У нас активно пользуются русским, английским и казахским языками. Некоторые пользователи пробовали расшифровку на португальском, итальянский и венгерском. Расшифровывается лучше всего английский — с точностью 92–95 %, русский — с точностью 86–88 %, редко 90 % — когда качество записи очень хорошее. Чтобы повысить точность результата, в первую очередь нужно попытаться записать хорошее аудио через петличку или в тихом пространстве.
Асылхан Нәзір: В дальнейшем мы будем прилагать все усилия, чтобы улучшить распознавание аудио.