Новости

Лікуємо головний біль журналістів: як зняти текст з диктофона

Головний біль журналістів: як зняти диктофонний запис і при цьому не витратити багато часу? Тестуємо деякі програми і веб-сервіси, які допоможуть перетворити мова в текст.

Для тестування ми надиктували ось такий текст з «Довідника журналіста» (Н.Богданов, Б.Вяземскій) 1971 року видання:

«У зв'язку з грандіозними успіхами радянської науки в завоюванні космосу американська преса підняла нестямний крик про те, що, мовляв, у російських є не тільки удачі, але і багато поразок і жертв. Американські газети навперебій стали смакувати брехливе повідомлення про те, що ще до того як Юрій Гагарін проклав дорогу в космос, загинуло багато радянських космонавтів ».

Тепер будемо «згодовувати» цей текст різними програмами і сервісів.

«Голосовий блокнот»

Веб-сервіс працює тільки в браузері Google Chrome (і його ФОРКОМ). Запис можна не тільки диктувати, а й завантажувати з інтернету - при цьому вони повинні бути в форматі html5. Це означає, що можна, наприклад, вказати ролик на YouTube, але свою диктофонний запис завантажити не вийде, тому ми використовуємо «милиця»: маємо диктофон навпаки мікрофона, підключеного до комп'ютера, натискаємо в браузері кнопку «включити запис» і одночасно включаємо відтворення на самому диктофоні. Сервіс досить впевнено почав розпізнавати наш текст, але під кінець все частіше став «спотикатися». У результаті вийшло таке:

«У зв'язку з грандіозними успіхами радянської науки в завоювання космосу американська преса підняла нестямний крик що замість російських є не тільки удачі моєї пропозиції Американські газети навперебій стали 40 0 повідомленнях як Юрій Гагарін в радянських космонавтів».

«Войсно ут»

Цей сервіс працює на тому ж Web Speech API - а значить, можна очікувати такого ж рівня розпізнавання, як в «Голосовому блокноті». Як і попередній сервіс, «Войсноут» дозволяє змінювати регістр букв і розставляти розділові знаки. Що ж, виконаємо контрольну перевірку. Ось що вийшло:

«Грандіозними засобами поради наутилус виживання в космосі американська преса підняла нестямний крик що замість російських співачок не тільки удачі і багато додатків американські газети навперебій стали створювати живі повідомлення що ще до того як юрій гагарин в космос радянських космонавтів».

Чомусь зараз якість розпізнавання виявилося відчутно гірше - з усього масиву незв'язного тексту зрозуміло лише, що американська преса підняла нестямний крик про щось, що сталося до Юрія Гагаріна.

На тому ж движку працюють сервіси Online Dictation і Talk Typer - вони також вимагають для роботи браузер Google Chrome.

RealSpeaker

Розробка компанії «РеалСпікер Лаб» з Казані - досить свіжий продукт: в описі на сайті сказано: «Ми працюємо майже 3 роки і в розробку технології вкладається праця більше 5 фахівців. Наша компанія запустила бета версію продукту для ОС Windows, яку на даний момент використовує понад 3 тис. Платних користувачів (станом на листопад 2014 року) ». Це самостійна програма для установки на комп'ютер - як стверджує виробник, підтримуються платформи Windows 7, 8 і навіть 10. Інсталятор «важить» майже 41 Мб, для установки потрібно 387 Мб вільного місця. Програма працює дуже нестабільно, кілька разів вона «вилітає», не давши нам дочитати текст. Довідка з «мануалом" не запускається зовсім. Текст розпізнається дуже довго: ти вже продиктував пропозицію і сидиш, чекаєш, поки на екрані з'явиться потрібний текст. А він може і зовсім не з'явитися - як ніби ти нічого і не надиктував. Окремі ділянки диктофонного запису довелося включати по два-три рази, щоб програма вивела на екран хоч який-небудь текст. У підсумку вийшло ось так:

«Грандіозними успіхами радянської науки в завоювання космосу американська преса підняла нестямний крик американські газети навперебій стали дивитися жива повідомлення що ще до того як юрій гагарин проклав дорогу загинуло радянських космонавтів».

Вдруге ми зачитали це ж повідомлення наживо. Читати доводиться повільно і дуже чітко, і все одно програма неодноразово помиляється:

«Зв'язку з грандіозними успіхами радянської науки в завоювання космосу американська преса підняла нестямний крик про те думав про російських є не тільки удачі багато поразок їжака американські газети навперебій стали сенс життя повідомлення про те що ще до того як юрій гагарин проклав дорогу в космос загинуло багато радянських космонавтів ».

В цілому можна визнати, що якість розпізнавання тексту ще гірше, ніж через веб-сервіси, розглянуті вище. Зате програма вміє чогось визначати ваше обличчя в веб-камері і заодно ваш рот на обличчі. Можливо, вгадування тексту ведеться не тільки по звуку, але і за допомогою артикуляції мовця. По крайней мере, при такому обсязі встановленої програми цього можна було очікувати, але на виході результат все одно плачевний. Вартість програми в залежності від версії - від 427 російських рублів (6,2 $, дійсна протягом місяця) до 2.025 рублів (29,37 $, необмежена за часом).

025 рублів (29,37 $, необмежена за часом)

Колись давно була популярна програма розпізнавання мови «Горинич» від російської компанії VoiceLock, але вона була не дуже проста в установці, для початку роботи потрібно пройти навчання, а користувачі відзначали загальну «глючность» програми і низька якість розпізнавання. Крім того, ось уже кілька років як розробка занедбана.

Перспективною виглядає програма DWS Speak Writer - остання версія 3.5 вийшла восени 2014 року. Правда, програма платна, і протестувати нам її не вдалося. Навряд чи і простому журналісту захочеться купити її, тому що з приводу вартості розробник повідомляє наступне:

«Повний розгортання з усіма модулями і матрицями навчання, на один сервер: ~ $ 1.750.000 (необхідно 4 фахівця для впровадження). Розгортання базових модулів (без web, online, poster та ін.) І базові матриці навчання, на один сервер: ~ $ 1.190.000 (необхідно 2 фахівця для впровадження). Розгортання базових модулів (без web, online, poster та ін.) Без матриць навчання, на один сервер: ~ $ 899.000 (необхідний 1 фахівець для впровадження). Повний розгортання отримати, практично, не реально. Зібрати 4 фахівця для роботи в один час в одному місці - дуже складно. Потрібен дуже сильний, емоційний проект, щоб він знайшов відгук у чотирьох наших друзів, готових допомогти вашій компанії ».

Схоже, розробка призначена для, скажімо, повного запису всіх діалогів «на льоту» якогось фільму. Звичайному користувачеві це навряд чи потрібно.

Словом, для журналістів все ж знайшлося кілька рішень з перетворення диктофонного запису в текст, але вони далекі від ідеалу. Запис повинен бути чіткою і без шумів, а ваш співрозмовник - хоча б Юрієм Левітаном. Але і це не застрахує вас від помилок розпізнавання.

Головний біль журналістів: як зняти диктофонний запис і при цьому не витратити багато часу?

Уважаемые партнеры, если Вас заинтересовала наша продукция, мы готовы с Вами сотрудничать. Вам необходимо заполнить эту форму и отправить нам. Наши менеджеры в оперативном режиме обработают Вашу заявку, свяжутся с Вами и ответят на все интересующее Вас вопросы.

Или позвоните нам по телефонам: (048) 823-25-64

Организация (обязательно) *

Адрес доставки

Объем

Как с вами связаться:

Имя

Телефон (обязательно) *

Мобильный телефон

Ваш E-Mail

Дополнительная информация: