Стартап Deepcake запустил сервис для клонирования голоса и перевода любой речи
Американская компания с челябинскими корнями Deepcake разработала ИИ-сервис для локализации речи на 60 языков — Rask.ai.
Озвучка текста в мире искусственного интеллекта называется Text-to-Speech. Нейронные сети отлично справляются с этой задачей и представлены в интернете достаточно широко. Ассортимент данных программ пополнила разработка стартапа Deepcake. Их сервис Rask.ai дублирует слова спикера так, что речь попадает «точно в губы», и может озвучивать эту речь голосом самого спикера с использованием Voice Cloning.
Сервис бесплатный в пробном периоде. Стоимость базового тарифа составляет $39 в месяц, PRO-тарифа – $99 в месяц.
«Преодолейте языковые барьеры с помощью Rask AI! Переводите свой контент и делитесь им с глобальной аудиторией, увеличивая потенциальный охват и влияние вашего контента», — говорится в презентации проекта. Первые отзывы на сервис достаточно положительные: «отличный продукт и огромный потенциал, молодцы!».
Стоит добавить, что Deepcake основали челябинцы Мария Чмир, Александр Кувшинов и Леонид Иванов. Стартаперы активно используют технологию подмены лиц face swap, где ИИ редактирует видео, заменяя лицо героя другим, синхронизируя мимику до полного совпадения с оригиналом.
Благодаря их разработке в рекламе Сбера появился Жорж Милославский из к/ф «Иван Васильевич меняет профессию», а в рекламе сотовой компании «Мегафон» снялся звезда боевиков Брюс Уиллис, точнее его дипфейк. Теперь, несмотря на уход из кино из-за проблем со здоровьем, 68-летний актер сможет появляться на экранах посредством цифрового «двойника». Сметы на дипфейк-проекты уже не шокируют, а скорость реализации существенно превосходит аналогичные решения от CG, не уступая и даже превосходя их в реализме.
В настоящее время технология создания цифровых клонов открывает уникальные возможности для видеопродакшена: например, позволит актерам одновременно сниматься в нескольких проектах. Также артисты смогут сниматься, не покидая страну или город проживания, достаточно лишь будет одолжить лицо дублеру, можно «омолаживать», «старить» героев и даже «воскрешать». Это недоступный ранее инструмент для производителей видеоконтента — можно дорабатывать ролики даже после финала съемочного процесса без дорогостоящих вложений в 3D-моделирование или пересъемки.
Фото: Unsplash; Pexels
мероприятий