Оправдава ли MusicLM на Google рекламата?

Оправдава ли MusicLM на Google рекламата?
Читатели като вас помагат в подкрепа на MUO. Когато правите покупка чрез връзки на нашия сайт, ние може да спечелим комисионна за партньор. Прочетете още.

През януари 2023 г. Google обяви MusicLM, експериментален AI инструмент, който може да генерира музика въз основа на текстови описания. Заедно с новините, Google пусна зашеметяваща изследователска статия за MusicLM, която остави много хора заслепени от способността да създават музика от нищото.





MAKEUSEOF ВИДЕО НА ДЕНЯ ПРЕВЪРТЕТЕ, ЗА ДА ПРОДЪЛЖИТЕ СЪС СЪДЪРЖАНИЕТО

Като получи текстова подкана, моделът обеща да създаде висококачествена музика, която предоставя всякакви описания от жанр до инструмент до абстрактни надписи, описващи известни произведения на изкуството. Сега, когато MusicLM е отворен за обществеността, решихме да го изпробваме.





Опитът на Google да създаде AI музикален генератор

  Уеб приложение за Google's MusicLM AI music generator

Превръщането на текстова подкана като „релаксиращ джаз“ в готова за възпроизвеждане песен е може би светият граал на експериментите в AI музиката. Подобно на известни генератори на изображения с изкуствен интелект като Dall-E или Midjourney, не е нужно да имате и частица музикално ноу-хау, за да създадете песен, която има мелодия и ритъм.





През май 2023 г. тези, които се регистрираха в AI Test Kitchen на Google, можеха да изпробват демонстрацията за първи път. Посрещнат от удобна за потребителя уеб страница и няколко ръководни правила – електронните и класическите инструменти работят най-добре и не забравяйте да посочите „вибрация“ – създаването на музикален фрагмент е невъобразимо лесно.

Скоростта е едно от малкото неща, които MusicLM наистина предлага, наред със сравнително висококачествени семпли. Истинският тест обаче не трябваше да се измерва само с хронометър. Може ли MusicLM да създава истинска, слушаема музика въз основа на няколко думи? Не точно (ще стигнем до това след малко).



Как да използвате MusicLM в AI Test Kitchen на Google

Използването на MusicLM е лесно, можете да се запишете в списъка за чакане Кухнята за тестване на изкуствен интелект на Google ако искаш пробвай.

В уеб приложението ще видите текстово поле, където можете да съставите подкана от няколко думи до няколко изречения, описващи вида музика, която искате да чуете. За най-добри резултати Google съветва 'да бъдете много описателни', добавяйки, че трябва да се опитате да включите настроението и емоцията на музиката.





Когато сте готови, натиснете Enter, за да започнете обработката. В рамките на около 30 секунди два аудио фрагмента ще бъдат достъпни за прослушване. От двете имате опцията да присъдите трофей на най-добрата проба, която отговаря на вашата подкана, което от своя страна помага на Google да обучи модела и да подобри резултата му.

Как звучи MusicLM

Хората са правили музика отпреди най-малко 40 000 години без окончателна представа дали музиката се е появила преди, след или по същото време с развитието на езика. Така че в известен смисъл не е изненадващо, че MusicLM не е разбил напълно кода на това древно универсално изкуство.





Изследователската статия на Google MusicLM предположи, че MusicLM може да генерира музика от надписи, принадлежащи на известни произведения на изкуството, и да следва инструкции като промяна на жанр или настроение по плавен начин, следвайки последователност от различни подкани.

Преди обаче да се захванем с такива високи задачи, ние открихме, че MusicLM трябва първо да преодолее няколко основни проблема.

Трудност при придържане към темпото

Най-основната работа на всеки музикант е просто да свири в такт. С други думи, придържайте се към темпото. Изненадващо, това не е нещо, което MusicLM може да направи в 100% от времето.

Всъщност, използвайки една и съща подкана 10 пъти, което произвежда 20 музикални песни, само три бяха навреме. Останалите 17 проби бяха по-бързи или по-бавни от определеното темпо, което беше написано в 'удари в минута', широко използван термин за описване на музика.

В този пример използвахме подканата „соло класическо пиано, свирено с 80 удара в минута, спокойно и медитативно“. При по-внимателно слушане музиката често се ускорява или забавя в рамките на малката дължина на семпла.

как да проверя дали хард дискът ми е повреден

Музиката също нямаше силен ритъм и звучеше така, сякаш някой е натиснал play по средата на парчето. Независимо дали това е било умишлено или не, наистина е трудно да се прецени дали MusicLM действително може да композира правилно начало или край на музикално произведение, освен да се придържа към ритъма.

Произволен избор на инструмент

Може би MusicLM все още не се беше научил как да свири в строго синхронизиране, така че преминахме към друг често срещан музикален параметър. Искахме да видим дали ще изпълни молбата ни за определени инструменти.

Написахме няколко различни подкани, които включват описания като „Соло синтезатор“ и „Соло бас китара“. Други бяха по-големи ансамбли като 'Струнен квартет' или 'Джаз бенд'. Като цяло изглеждаше като 50:50 шанс да получите това, което поискахте.

какво е bixby на телефона ми samsung

Една от теориите е, че моделът свързва някои инструменти с популярни музикални жанрове. Вземете например подканата „Соло синтезатор, прогресия на акорда. Живо и оптимистично“. Вместо да получи сам звук от синтезатор, MusicLM създаде електронна песен, пълна с барабани и бас.

Възможно е моделът просто да не е имал достатъчно данни и достатъчно обучение, за да разбере конкретната заявка за инструмент.

Вокалите са извън уравнението

Според тогавашните ограничения, моделът не би продуцирал музика с вокали. Трудните проблеми на MusicLM с авторските права и бъгавите вокали е вероятен фактор, поради който Google избра да играе на сигурно, като зададе това ограничение.

Но след като експериментирахме с MusicLM известно време, осъзнахме, че контролът на Google върху изхода на модела не е точно железен. Странно, подсказка като „акустична китара“ ще произведе песен, която съдържа призрачни вокали на заден план, които звучат приглушено и далечно.

Въпреки че това не е често срещано явление, то ви кара да се чудите за способността на MusicLM да създава убедителни вокали на първо място.

Със софтуер като VOCALOID и Synthesizer V водещи Технология за вокален синтез с AI , пропускането на вокали от настоящия модел ни кара да се чудим дали все още не е достатъчно добър, за да се конкурира със съществуващата технология. MusicLM може би трябва да извърви дълъг път, преди музикантите да започнат да я възхваляват.

Бъдещето на AI музикалните генератори

  Различни бързи предложения в MusicLM's web application

Въпреки че MusicLM придвижи напред генеративната AI музикална технология, тя трябва да се върне в училище и да научи още няколко неща, преди да може да поеме практическа работа в музикалната индустрия.

Досега най-добрият опит за генеративна AI музика беше модел, наречен JukeboxAI от OpenAI. Не беше точно в състояние, готово за използване, и отне цели девет часа, за да изобрази само една минута музика.

Заради вашите усилия е вероятно да си върнете наистина извънземно звучаща песен, пълна с изкривяване на звука и артефакти. От друга страна, нямаше да скучаете слушайки причудливите творения, които Джубокс създава .

В светлината на това MusicLM постигна значителен напредък към удобен за потребителя AI музикален генератор. Почти бихме могли да простим на модела за неговите произволни изходи, когато спрете да се замислите колко сложно е да се генерира музика в сурова аудио форма.

След като пусна модела в работа обаче, MusicLM се чувства полуизпечен в сравнение с това, което Google публикува в първоначалната си изследователска статия. Рядко генераторът на изображения с изкуствен интелект получава погрешно изображението на Apple, по същия начин генераторът на музика с изкуствен интелект трябва да прави някои основни неща, като темпото и инструментите.

MusicLM на Google не отговаря на очакванията

С технологичните компании, които се надпреварват да се конкурират помежду си на фронта на ИИ, MusicLM се чувства така, сякаш е влязъл в публични изпитания, преди да е готов. Вместо да направи правилните основи, моделът изглежда възприема много по-неясен и субективен подход към продуцирането на музика.

Google може да ви насърчи да бъдете конкретни с вашата подкана, но не може да се справи добре с темпото и не е гарантирано, че ще получите инструментите, които сте поискали всеки път. MusicLM може да е интересна и добра демонстрация на мощен AI напредък, но ако музиката е крайната цел, все още трябва да се извърви дълъг път.