О нас

> Главная > О нас

О НАс:

Где мы находимся: компания Movify.CY Ltd. зарегестрирована в регистре предприятий Республики Кипр 13.06.2024 с регистрационным номером ΗΕ461401 и номером налогоплатильщика 60077645I. Юридический и почтовый адрес компании Agia Zoni, 30a, Fantaros Court, Flat/Office 303, 3027, Limassol, Cyprus. Проверить данные о нашей компании можно бесплатно на сайте регистра предприятий Республики Кипр тут.

История создания: Проект был создан для того, чтобы люди с нарушением слуха могли смотреть и понимать видео-контент. Началось создание универсальной AI платформы для автоматического преобразования видео (любого) в субтитры для слабослышащих людей. В процессе разработки платформы к нам обратилась телевизионная компания из Латвии и предложила для 3 телеканалов создавать субтитры в режиме 24*7 на латышском яыке, а также создавать AI озвучивание фильмов на Латышском, Эстонском, Литовском языках. Позднее с похожим запросам к нам обратилась и телекомания из России. Так мы пришли к вопросам создания собственного синтеза речи для “небольших” языков.

Наша команда занимается разработкой AI для 100% автоматизации процесса локализации (в том числе для слоболышащих людей) любого видео или аудио контента (с любого на любой язык). Мы разрабатываем AI, который мог бы переводить любой контент с 100% точностью. Сейчас в создание проекта вовлечены 12 человек (програмисты, разметчики данных, филологи) из разных стран.

Текущие проблемы AI: Текущее развитие AI не позволяет полностью доверить искусственному интеллекту локализацию (перевод) контента (видео) с одного языка на другой язык. Искусственный интеллект не может:
– распознать и понять с качеством 100%, что говорят в видео. Шумы, музыка и спецэффекты не позволяют лучшим системам распознавания речи на 100% понять, что говорят в фильме. Из за этого появляются ошибки и галлюцинации.
– Ни одна система распознания речи не может на 100% точно определить голоса актеров. Кроме того в фильмах 2 и более персонажа могут говорить одновременно. Это еще более усложняет распознавание.
– Искусственный интеллект не может правильно (нормально) перевести идиомы, фразеологизмы и шутки.
– Автоматический переводчик видео ускоряет или замедляет речь, чтобы успеть в отведенное время проговорить переведенную фразу. Из за этого переведенное видео звучит неестественно.
– для языков, на которых говорят мало людей (до 10 млн., например латышский, литовский и эстонский) отсутствуют в настоящее время модели синтеза речи, которые бы говорили естественным образом, передавая эмоции человека. Существует множество систем синтеза речи для больших языков (на которых говорят сотни миллионов людей – например китайский или английский). А для “малых” языков такие системы отсутствует.

В соответствии с источником Микрософт Azure дает возможность использования 2 голосов для латышского (lv-LV-EveritaNeural, lv-LV-NilsNeural), эстонского (et-EE-AnuNeural, et-EE-KertNeural), литовского (lt-LT-OnaNeural, lt-LT-LeonasNeural) языков. В соответствии с источником Google дает возможность использования 1 голоса для латышского (lv-LV-Standard-B) и литовского (lt-LT-Standard-B) языков (эстонского язка – нет). В соответствии с источником Event Labs дает возможность использования только одного голоса для латышского (jessica),  литовского (jessica), эстонского (jessica). Используя сервис Tilde по синтезу речи сразу понимаешь, что голос синтезирован компьютером.

– Кроме того для обработки видео необходимы дорогие и энергоемкие сервера Nvidia. Использование энергоёмких серверов Nvidia сильно загрязняет окружающую среду. Мы используем Nvidia GPU с минимальным потреблением электричества.

Все эти пробелемы решает наша команда. Мы разрабатываем модели AI для малых языков, чтобы жители “небольших” по численности населения стран могли пользоваться преимуществами AI технологий.

Наши конкуренты:

1. Rask.ai. Поддержка языков: 130+ языков. Особенности: Автоматический перевод видео и аудио с возможностью масштабирования через API. Преимущества: Подходит для крупных проектов с ежедневными объемами контента.

Недостатки: для латышского, литовского, эстонсокго языка есть безэмоцианальные AI голоса Microsoft.

2. ElevenLabs. Поддержка языков: 29 языков.  Особенности: Сохранение оригинального голоса и стиля речи, автоматическое определение говорящих.

Преимущества: Подходит для креаторов и образовательного контента.

3. Dubformer. Поддержка языков: 130+ языков.

Особенности: Полный цикл дубляжа с клонированием голоса, эмоциональной передачей и автоматическим микшированием.

Преимущества: Оптимизирован для телевизионного контента, включая фильмы и сериалы.

4. Perso.ai. Поддержка языков: 32 языка. Особенности: Поддержка многоголосия, синхронизация с видео, редактирование скриптов и доступ к AI-аватарам.

Преимущества: Подходит для создания контента с индивидуальным стилем и визуальными элементами.

5. Maestra.ai. Поддержка языков: 125+ языков. Особенности: Автоматическая транскрипция, создание субтитров и озвучка видео и аудио файлов.

Преимущества: Универсальная платформа для различных типов контента.

6. Smartcat. Поддержка языков: 280+ языков. Особенности: AI озвучка и автоматические субтитры с возможностью редактирования в Smartcat Editor.

Преимущества: Подходит для профессиональных переводчиков и локализаторов.

7. VMEG.ai. Поддержка языков: 170+ языков. Особенности: Синхронизация с видео, поддержка 7000+ голосов, точная синхронизация губ.

Преимущества: Подходит для крупных проектов с высоким качеством локализации.

8. CAMB.AI. Поддержка языков: 150+ языков. Особенности: Реальное время локализации, включая спортивные трансляции.

Преимущества: Подходит для трансляций и прямых эфиров.

Преимущества Dubbing Studio:

Отзывы

Наши клиенты