OpenAI дава на ChatGPT глас, за да отговаря на подкани и команди - |Обяснение на технологията|Интернет|

Читатели като вас помагат в подкрепа на MUO. Когато правите покупка чрез връзки на нашия сайт, ние може да спечелим комисионна за партньор. Прочетете още.

ChatGPT е настроен да се превърне в интерактивно генериращо AI изживяване. OpenAI разкри, че водещият в света AI чатбот ще може да говори и да отговаря на потребителски запитвания, използвайки синтезиран, вероятно генериран от AI, глас.

Заедно с новооткрития си глас, ChatGPT също ще може да отговаря и обсъжда конкретни изображения, качени в него или заснети, докато използвате приложението ChatGPT за Android или iOS. Функцията за разпознаване на изображения звучи подобно на Google Lens и други приложения, които използват невронни мрежи за точно откриване на данни и информация.

OpenAI дава глас на ChatGPT

На 25 септември 2023 г., разработчик на ChatGPT OpenAI разкри това ще даде глас на своя водещ в света генериращ AI чатбот. Потребителите на ChatGPT могат да говорят директно с чатбота и да го поискат да отговори, което ефективно позволява на ChatGPT да разговаря директно с глас за първи път.

как да получите интернет на лаптоп навсякъде

Примерният клип на OpenAI показва жена, която моли ChatGPT да създаде уникална приказка за лягане, на която ChatGPT надлежно отговаря с женски синтезиран глас.

Според С кабел , новият модел за синтезиран говор е разработен вътрешно. Той може да генерира „човешко“ аудио от текст и няколко секунди примерна реч ( използвайки модела OpenAI Whisper ) и говорете с различни тонове и стилове. Можете да намерите набор от гласови проби на Блогът на OpenAI .

Някои компании вече използват новия гласов модел на OpenAI. Например Spotify използва модела за преобразуване на текст в реч на OpenAI, за да превежда подкасти на различни езици, съчетавайки уменията на ChatGPT за езиков превод с новата му говорна способност.

защо моето siri не работи

Новият модел за преобразуване на текст в говор на ChatGPT е достъпен само за абонати на Plus и Enterprise, използващи официалните приложения за Android и iOS и се очаква да бъде въведен в рамките на следващите две седмици (започвайки от 25 септември 2023 г.). Освен това, новата гласова функция е ограничена до английски като начало, въпреки че очакваме това да се промени бързо.

ChatGPT може да разпознава и и снимки

Втората част от актуализацията на ChatGPT на OpenAI е възможността за анализиране и разговор на изображения, качени в инструмента. Опцията за визуален анализ на изображението беше представена във видеоклиповете за актуализация на GPT-4, но не е обсъждана много оттогава ( ChatGPT кодов интерпретатор настрана ).

Сега ChatGPT придобива функционалност, подобна на Google Lens. Можете да качите изображение в ChatGPT или да направите снимка с помощта на камерата на вашия смартфон в приложението ChatGPT и то ще детайлизира изображението, добавяйки повече контекст, където е необходимо.

Наричането му „подобно на Google Lens“ наистина го прави несправедливо. Възможността да чатите напред-назад за изображението, за да получите повече информация и контекст, го прави изключително полезно за широк набор от настройки. Въпреки това е важно да се отбележи дребният шрифт, като OpenAI изяснява, че е ограничил „способността на ChatGPT да анализира и прави директни изявления за хората“ от съображения за поверителност и точност. И все пак, може ли в бъдеще да работи задвижван от OpenAI инструмент „Кой е това“? (Да се надяваме, че не!)

Подобно на новия модел за синтез на реч, OpenAI ще пусне разпознаване на изображения през следващите две седмици, въпреки че ще бъде достъпно на всички платформи, не само в приложението ChatGPT.

Поверителност, сигурност и други проблеми

Последствията от гласовия ChatGPT са очевидни. Разбира се, вълнуващо е. Възможността обаче да се създаде уникален синтезиран глас, като се използва само кратък фрагмент като пример, има значителни проблеми с поверителността и сигурността. Потенциалът за злонамерените участници да експлоатират тези инструменти е огромен и както при всеки генеративен AI инструмент, след като духът излезе от бутилката, той абсолютно няма да се върне обратно. Никакво регулиране на AI от правителства или лидери на мисълта не може да върне назад приливът.

Дори предупреждението на OpenAI по темата изглежда заобикаля очевидното, въпреки че споменава проблемите:

Тези възможности обаче крият и нови рискове, като например потенциала за злонамерени участници да се представят за публични личности или да извършват измами. Ето защо ние използваме тази технология за захранване на конкретен случай на употреба – гласов чат.
защо не мога да чуя звук на компютъра си windows 10

Като се има предвид, че това е върхът на айсберга, очаквайте отпор срещу новооткрития глас на ChatGPT, особено след като има предвидим скок в неприятните заглавия, в които се твърди, че ChatGPT се използва за извършване на измами и т.н.

OpenAI прави ChatGPT приложението за изкуствен интелект

Колкото повече OpenAI добавя удобни за потребителя функции към ChatGPT, толкова повече той се превръща в генеративното AI приложение. Като първото, достигнало широка слава по време на първоначалния генеративен AI бум, ChatGPT все още води пътя и е единственото приложение, което някои използват, въпреки конкуренцията от Google Bard (и потенциално Google Gemini) и Claude от Anthropic.

Докато OpenAI може да продължи да добавя функции, които правят ChatGPT по-лесен за използване, той ще държи хората приковани и ще се приближава все по-близо до целта си за наистина мултимодален AI инструмент.