Нова технология различава човешкия глас от този на изкуствения интелект

Функцията засича реч както в телефонни разговори, така и в цифрови медии

26.08.2024 | 19:57 Редактор:
Все повече компании се борят със заплахите от изкуствения интелект.
Все повече компании се борят със заплахите от изкуствения интелект.

Kомпанията за аудиотехнологии Pindrop Security Inc. с десетилетна история отдавна предоставя услуги за гласова проверка на автентичността на банки и застрахователи. Миналата седмица тя пусна нов продукт, за който твърди, че може да засича реч, генерирана от изкуствен интелект, както в телефонни разговори, така и в цифрови медии. Тя предлага тази функция на медийни организации, правителствени агенции и социални мрежи.

Pindrop е една от все по-големия брой компании, ориентирани към сигурността, които се стремят да се борят със заплахата от фалшификати и измами с изкуствен интелект. Сред тях са компании като Protect AI Inc. и Tools For Humanity Corp. на Сам Олтман или Worldcoin, която идентифицира хора с помощта на сканиране на очите им.

Със специализация в областта на аудиото Pindrop влезе в заглавията на медиите през януари, когато откри източника на deep fake на президента Джо Байдън, който призоваваше хората да не гласуват на първичните избори в Ню Хемпшир чрез обаждане по телефона. Мащабът на атаките се увеличава: Компанията заяви, че е регистрирала повече от петкратно увеличение на броя на опитите за атаки, насочени към нейни клиенти, от миналата година насам.

Технологията работи с 99% точност

Съоснователят Виджай Баласубраманиян започва да се замисля за проблема с аудиофалшификатите, след като се опитва да си купи костюм, докато пътува в Индия като докторант. Американската му банка му се обажда, за да потвърди транзакцията около 3 ч. сутринта негово време и го пита за номера на социалната му осигуровка. Без да може да провери кой е обаждащият се и без много информация от банката, той прекратил разговора.

Технологията на Pindrop работи чрез анализиране на звука, за да определи дали гласът е наистина човешки, или само подобен на човешки. Хората говорят, като издават специфични звуци, които образуват думи, казва Баласубраманиян. Но машините не произвеждат звуци по същия начин като хората и понякога генерират варианти, които не отговарят на физическите ограничения на начина, по който човешката уста произвежда звук. Тъй като всяка секунда от гласовия аудиозапис съдържа 8000 семпли, има хиляди точки, в които изкуственият интелект може да допусне грешка.

Компанията твърди, че новият ѝ инструмент може да идентифицира аудио, генерирано от изкуствен интелект, с 99% точност, но в индустрията все още се водят дебати относно ограниченията на откриването на изкуствен интелект. 

Четете повече в bloombergtv.bg.

Снимка: Pixabay