журнал стратегия

#журнал стратегия

Стартап Deepcake запустил сервис для клонирования голоса и перевода любой речи

Американская компания с челябинскими корнями Deepcake разработала ИИ-сервис для локализации речи на 60 языков — Rask.ai.

Озвучка текста в мире искусственного интеллекта называется Text-to-Speech. Нейронные сети отлично справляются с этой задачей и представлены в интернете достаточно широко. Ассортимент данных программ пополнила разработка стартапа Deepcake. Их сервис Rask.ai дублирует слова спикера так, что речь попадает «точно в губы», и может озвучивать эту речь голосом самого спикера с использованием Voice Cloning.

Сервис бесплатный в пробном периоде. Стоимость базового тарифа составляет $39 в месяц, PRO-тарифа – $99 в месяц.

«Преодолейте языковые барьеры с помощью Rask AI! Переводите свой контент и делитесь им с глобальной аудиторией, увеличивая потенциальный охват и влияние вашего контента», — говорится в презентации проекта. Первые отзывы на сервис достаточно положительные: «отличный продукт и огромный потенциал, молодцы!».

Стоит добавить, что Deepcake основали челябинцы Мария Чмир, Александр Кувшинов и Леонид Иванов. Стартаперы активно используют технологию подмены лиц face swap, где ИИ редактирует видео, заменяя лицо героя другим, синхронизируя мимику до полного совпадения с оригиналом.

Благодаря их разработке в рекламе Сбера появился Жорж Милославский из к/ф «Иван Васильевич меняет профессию», а в рекламе сотовой компании «Мегафон» снялся звезда боевиков Брюс Уиллис, точнее его дипфейк. Теперь, несмотря на уход из кино из-за проблем со здоровьем, 68-летний актер сможет появляться на экранах посредством цифрового «двойника». Сметы на дипфейк-проекты уже не шокируют, а скорость реализации существенно превосходит аналогичные решения от CG, не уступая и даже превосходя их в реализме.

В настоящее время технология создания цифровых клонов открывает уникальные возможности для видеопродакшена: например, позволит актерам одновременно сниматься в нескольких проектах. Также артисты смогут сниматься, не покидая страну или город проживания, достаточно лишь будет одолжить лицо дублеру, можно «омолаживать», «старить» героев и даже «воскрешать». Это недоступный ранее инструмент для производителей видеоконтента — можно дорабатывать ролики даже после финала съемочного процесса без дорогостоящих вложений в 3D-моделирование или пересъемки.

Фото: Unsplash; Pexels

анонсы
мероприятий
инновации

Основные сценарии применения ИИ в разработке

 

#, , ,
инновации

В Москве пройдет научно-технологический форум «Робототехника, интеллект машин и механизмов»

7 февраля 2025 года

#, , ,