Lambrequim logo newsletter

a newsletter de cultura e tecnologia da Têmpora Criativa

blue headphone

MusicLM, a nova IA do Google que compõem músicas com base em texto

O Google desenvolveu uma inteligência artificial capaz de criar músicas a partir de descrições em texto, chamada MusicLM

Com a capacidade de criar faixas em uma variedade de estilos, a IA pode gerar músicas que seguem características especificadas pelo usuário, como trilhas sonoras de jogos de fliperama, solos de guitarra, jazz e música eletrônica. 

Além disso, o MusicLM pode criar faixas mais longas e trilhas sonoras para acompanhar histórias e narrações. 

Para treinar a IA, cerca de 280 mil horas de conteúdo de música foram utilizadas para gerar melodias coerentes para cada contexto. Embora as criações da IA não sejam completamente originais, elas não plagiaram as faixas já existentes, mas sim compõem com base nelas. 

Além de seguir descrições em texto, a IA também pode criar faixas com base em imagens ou gerar melodias a partir de um determinado instrumento. Algumas das criações do MusicLM foram expostas no GitHub, mas não se sabe se a IA consegue entregar resultados de alta qualidade em todos os casos. 

Segundo a empresa, “os experimentos mostram que o MusicLM supera os sistemas anteriores tanto em qualidade de áudio quanto em aderência à descrição de texto”. 

Para apoiar pesquisas futuras, a empresa disponibilizou publicamente o MusicCaps, um conjunto de dados composto por 5,5 mil pares de música-texto, com descrições de texto ricas fornecidas por especialistas humanos.

O Google está hesitante em disponibilizá-lo devido aos possíveis riscos envolvidos

O sistema não é o primeiro do tipo, visto que outras tentativas, como o Riffusion, que compõe música através de visualização, o Dance Diffusion, o AudioML do próprio Google e o Jukebox da OpenAI já foram desenvolvidos.

No entanto, devido às limitações técnicas e de treinamento, nenhum desses sistemas foi capaz de produzir músicas particularmente complexas ou com alta fidelidade. O MusicLM, por sua vez, é possivelmente o primeiro a atingir esse patamar.

Há também questões éticas envolvidas, como o risco de apropriação indébita de conteúdo criativo. 

Os pesquisadores do Google reconhecem essa questão e destacam a necessidade de mais trabalho futuro para lidar com os riscos associados à geração de música.

Eric Sunray, da Music Publishers Association, argumenta em um artigo que geradores de música de IA como o MusicLM violam os direitos autorais da música ao criar “tapeçarias de áudio coerente a partir das obras que ingerem no treinamento, infringindo assim a reprodução da Lei de Direitos Autorais dos Estados Unidos certo”. 

Os críticos também questionaram se o treinamento de modelos de IA em material musical protegido por direitos autorais constitui uso justo.

Vários processos que tramitam nos tribunais têm relação com a IA de geração de música, incluindo um referente aos direitos de artistas cujo trabalho é usado para treinar sistemas de inteligência artificial sem seu conhecimento ou consentimento

Isso também levanta preocupações semelhantes em relação aos dados de treinamento usados em sistemas de IA geradores de imagem, código e texto, que geralmente são extraídos da Web sem o conhecimento dos criadores

Essa é uma discussão muito complexa e levará um bom tempo para que seja resolvida. Mas é fato que as IAs estão evoluindo a cada dia e, em breve, farão parte das nossas vidas — tal como fazemos uma caminhada na rua.


Publicado

em

por