Как работят приложенията за превод на котешка реч?

Как работят приложенията за превод на котешка реч?

Вероятно сте виждали приложения, които твърдят, че превеждат това, което котката ви казва. Но наистина ли могат да преведат мяукането на котката ви на английски? Краткият отговор е да, нещо като. Трудно е поради уникалността на „езика“ на всяка котка, но те могат да се доближат доста с модерните технологии.





Приложенията за превод на котки като MeowTalk използват форма за разпознаване на реч, която подчертава машинното обучение. Нека погледнем по -отблизо.





Разпознаване на реч и машинно обучение

Мери Тереза ​​Маклийн/ Pixabay





Разпознаването на реч работи чрез записване на реч и превръщане на звука във файл с цифрови данни. Той кодира данни като височина и сила на звука като точки от данни, които приложението може да анализира и съпостави със значения. DPA микрофони обяснява, че тези точки от данни могат да изглеждат много различни в зависимост от фоновите звуци и начина на изговаряне на думата.

Понякога приемаме гласовото разпознаване за даденост, но това е невероятен технологичен подвиг. Особено като се има предвид колко сложна е човешката реч. Като Ученият обяснява, че всяка дума включва широк спектър от звуци или „фонеми“, смесени помежду си. Да се ​​научи компютърът да разбира речта е много трудно. Новата граница на котешки звуци ще бъде още по -трудна.



Приложенията, които използват разпознаване на реч, са програмирани с „речник“ от думи, наречени набор от данни. След това приложението съпоставя речта ви с най-близката опция в своя речник с данни.

Когато направи грешка, я коригирате и тя запазва тези данни за следващия път. Това е част от машинното обучение. Това е начинът, по който една програма се научава да разпознава речта дори когато не е идентична с набора от данни, с който е започнала.





Свързани: Какво представляват алгоритмите за машинно обучение? Ето как работят

Разпознаването на глас все още има проблеми, особено с речеви затруднения и акценти. Някои компании подобряват машинното обучение, за да преодолеят тези проблеми. С течение на времето машинното обучение може да превърне разпознаването на реч в мощен инструмент.





безплатен софтуер за създаване на музика за windows

Ето как разпознаването на реч работи при хората. Но дали работи за котки?

Разпознаване на реч срещу разпознаване на мяу

Ариана Суарес / Unsplash

Първо, трябва да разберем защо превеждането на определен вид мяукане като „гладен съм“ е различно от анализирането на човешката реч. Проблемът е най -вече в това, че котешката комуникация разчита по -силно на невербални знаци като стойката. Друг проблем е липсата на универсален „котешки език“.

Според ASPCA , възрастните диви котки никога не мяукат един на друг, само на хора. Други изследвания на хуманното общество добавя, че тези звуци „не се случват във вакуум“. Трябва да ги тълкуваме заедно с езика на тялото и други контексти. В много случаи тези безшумни сигнали са единствената разлика между мяу, което означава „гладен съм“, и този, който означава „искам да играя“.

В допълнение към този проблем, няма две котки с един и същ език. Котките разработват персонализирани „езици“ за своите собственици. Те отчасти се основават на имитация на гласа на собственика и отчасти на личността на котката. Няма две котки, които да звучат еднакво, дори когато предават едно и също желание или нужда. И така, как речевият речник на едно приложение може да се преведе за всички тях?

Гъвкаво машинно обучение за котки

Безплатни за използване на звуци/ Unsplash

Въпреки че няколко виртуални асистенти харесват Автоматичен опит за разбиране на тона и емоциите, разпознаването на речта все още е ужасно при невербални сигнали. Но това не означава, че е невъзможно да се тълкуват.

как да преоразмерите слоевете във Photoshop

MeowTalk използва по -гъвкав вид машинно обучение, за да помогне за преодоляване на тези проблеми.

Изтегли: MeowTalk за Android | ios (Безплатно)

Meowtalk е създаден от Хавиер Санчес, който също работи в екипа на Alexa. Той си представяше приложението като стъпка към интелигентни яки. Тези нашийници биха превели котешките звуци в човешка реч, въз основа на сложни стратегии за машинно обучение, за да помогнат на хората да разберат по -добре и да се грижат за котките си.

Екипът на MeowTalk компенсира проблемите с уникалността, като създаде по -специфични профили за всяка котка. В приложението регистрирате всяка котка поотделно. Наука Норвегия съобщава, че котенцата мяукат по различен начин от възрастните котки, така че приложението също пита за рождения ден на котката. Всеки профил генерира уникална мрежа от данни за котката, включваща малко дълбоко обучение в машинното обучение.

Свързани: Дълбоко обучение срещу машинно обучение срещу AI: Как вървят заедно?

За речник, MeowTalk започва с 10 звукови профила в своя набор от данни. Всеки има различно значение, като „щастлив“ или „лов“. Когато приложението чуе звук и се обърка, можете да го коригирате или да създадете нова интерпретация.

CATSOUNDS данни, събрани от Аквелон

Коригирането казва на приложението да замени основния речник с новия звук.

обектно ориентирано програмиране срещу процедурно програмиране

Например, можете да кажете на приложението да съответства на „Лов“ на къси чуруликания, вместо на дълъг виене. Този вид корекция е по -полезен от добавянето на множество звуци, за да съответства на един, който означава начинът на разпознаване на речта, което би било като да кажете на приложението, че дълъг виене и късо чуруликане и двете означава „обаждане на майката“.

Машинното обучение в приложенията за разпознаване на реч обикновено се противопоставя на този тип презапис. Това би било като да се опитате да научите Siri, че когато казвате „технологичен блог“, наистина имате предвид „круша“. Но по -гъвкавата форма на машинно обучение, която MeowTalk използва, може да се справи по -лесно с тази корекция.

Създаването на нова интерпретация добавя смисъл, който преди това не е кодиран. Например, ако котката ви има конкретно обаждане, когато иска любимата си играчка, можете да добавите „Искам мишката си“ като опция. Това е подобно на добавянето на дума към вашия речник за автоматично коригиране.

Свързани: Как да определите собствените си думи за автоматично коригиране на Android

С течение на времето можете да разработите високо персонализиран речев профил за вашата котка. В крайна сметка може дори да е достатъчно сложен, за да бъде полезен за гледачите на домашни любимци или за решаване на поведенчески проблеми. Ако не друго, това помага на собствениците на котки да станат по -внимателни към домашните си любимци.

Присъдата: Работят ли приложенията за превод на котки?

В крайна сметка „котешкият превод“ все още разчита много на това потребителят да научи приложението как котката им говори. Вероятно винаги ще е така поради това колко уникална е комуникацията на всяка котка.

Но фактът, че машинното обучение е стигнало толкова далеч, че разработчиците дори могат частично да успеят в това, е невероятен. Машинното обучение и ИИ напредват с невероятна скорост и нямаме търпение да видим къде отиват по -нататък.

Дял Дял Туит електронна поща Свързани теми
  • Обяснена технология
  • Учене на език
  • Машинно обучение
За автора Натали Стюарт(47 статии са публикувани)

Натали Стюарт е писател за MakeUseOf. Тя първо се интересува от технологиите в колежа и развива страст към медийното писане в университета. Фокусът на Натали е върху технологиите, които са достъпни и лесни за използване, а тя обича приложенията и устройствата, които правят живота по -лесен за обикновените хора.

Още от Натали Стюарт

Абонирайте се за нашия бюлетин

Присъединете се към нашия бюлетин за технически съвети, рецензии, безплатни електронни книги и изключителни оферти!

Щракнете тук, за да се абонирате