Нов модел на Nvidia може да променя гласове и да създава звуци

Технологията е насочена към продуцентите на музика, филми и видео игри

25.11.2024 | 21:27 Редактор:
Новият модел на Nvidia е обучен с данни с отворен код.
Новият модел на Nvidia е обучен с данни с отворен код.

Нов модел с изкуствен интелект на Nvidia ще може да генерира нови звуци и да променя гласове. Технологията е насочена към продуцентите на музика, филми и видео игри, предаде Ройтерс.

Nvidia, най-големият в света доставчик на чипове и софтуер, използвани за създаване на системи с изкуствен интелект (AI), заяви, че няма планове за незабавно пускане на технологията, която нарича Fugatto, съкращение от Foundational Generative Audio Transformer Opus 1.

Тя се присъединява към други технологии, показани от стартъпи като Runway и по-големи играчи като Meta Platforms, които могат да генерират аудио или видео по текстова подкана.

Софтуерът на Nvidia генерира звукови ефекти и музика по текстово описание, включително нови звуци, например звук от тромпет, но лаещ като куче.

Това, което го прави по-различен от другите AI технологии, е способността му да приема и модифицира съществуващ звук, например като вземе линия, изсвирена на пиано, и я трансформира в изпята от човешки глас, или като взема запис на изговорена дума и променя използвания акцент или изразеното настроение.

Новият модел на Nvidia е обучен с данни с отворен код, а компанията твърди, че все още обсъжда дали и как да го пусне публично.

Четете повече в investor.bg.

Снимка: БГНЕС