Новини для українців всього свту

Wednesday, Sep. 30, 2020

Комп’ютер підробляє голос: придумали українці

Автор:

|

Січень 15, 2020

|

Рубрика:

Комп’ютер підробляє голос: придумали українці
Засновники Respeecher

Штучний інтелект (ШІ) підробляє будь-який голос? Нічого дивного, українці з Respeecher освоїли технологію і вже навіть уклали контракт із голівудською студією. Respeecher може навчитися імітувати будь-який голос. Для початку потрібні дві аудіодоріжки: на одній — запис оригінального голосу, на іншій — запис актора, який слово в слово повторює промовлений текст. На цьому етапі програма тренується: порівнює обидва записи і виявляє, чим один голос відрізняється від іншого.
Тепер, коли ШІ розуміє різницю, він здатен перетворювати голос актора на очікуваний — хоч який текст той зачитуватиме.
Щоб програма спрацювала ефективно, їй потрібно проаналізувати принаймні годину запису цільового голосу, який треба імітувати. З високою ймовірністю за цей час вона почує достатню різноманітність слів і звукосполучень, проаналізує особливості цільового голосу та зрозуміє, як їх відтворювати.
Нещодавно в Мережі з’явилося відео, на якому Ричард Ніксон, президент США в 1969-1974 рр., розповідає про загибель астронавтів місії «Аполлон-11», яка 1969-го доправила людей на Місяць. Насправді місія відбулася успішно, жоден із астронавтів не загинув. Відео створили в Массачусетському інституті технологій. Ніксона «змусили» зачитати промову, текст якої колись написали на випадок провалу космічної місії, але з якою президент так ніколи і не вийшов на публіку.
Для створення образу знадобилися дві основні технології: ШІ від Respeecher, який синтезує голос Ніксона, і ШІ від компанії Canny AI, який змінив архівний відеозапис однієї зі справжніх промов президента США так, щоб рухи губ і міміка Ніксона збігалися з тим текстом, який він промовляє.
Однак технологія підробки голосу за допомогою ШІ слугує не лише для наукових і розважальних цілей. У вересні 2019 року генеральний директор однієї британської енергетичної компанії поспілкувався телефоном зі своїм начальником — керівником головного офісу в Німеччині. Той попросив його терміново переказати угорському постачальнику майже 250 тис. USD. Гроші потрапили на рахунок угорського банку, а британський менеджер навіть і не запідозрив, що весь цей час розмовляв із роботом.
Голос на іншому кінці дроту був дуже схожий на голос його начальника: ШІ імітував не тільки манеру спілкування, а й легкий німецький акцент. Афера розкрилася, лише коли шахраї спробували провернути аферу вдруге.
Гроші кіберзлочинці відправили спершу до Мексики, а потім розподілили їх по різних рахунках. Поліція так і не змогла їх знайти. «Побоювання небезпідставні, але люди завжди схильні дещо перебільшувати. Поки що реалістичне синтезування голосу — це процес, що вимагає достатню кількість значних ресурсів. Є серйозні вимоги до якості записів, є великий обсяг роботи, який потрібно виконати, є чимало інших аспектів, що впливають на результат. Технологія ще не на тому рівні, коли хтось із легкістю може її використовувати в якихось нехороших цілях», — розповів Олександр Сердюк, засновник Respeecher.

About Author

Meest-Online

Comments are closed.

Leave A Reply