Fonte: TokenPost
Título Original: 미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다
Link Original:
A startup alemã de IA para geração de áudio Mirelo(Mirelo) está a captar atenção ao assegurar uma ronda de investimento seed de 41 milhões de dólares(cerca de 59,1 mil milhões de won). A rodada foi liderada em conjunto pela Index Ventures e Andreessen Horowitz, com apoio financeiro também da Atlantic Ventures e TriplePoint Capital.
A Mirelo concentra-se na funcionalidade de geração de áudio ajustada a vídeos, e o seu modelo principal, ‘SFX 1.5’, conseguiu reconhecer cenas de bateria em vídeos silenciados e gerar sons de bateria com precisão, semelhantes aos sons reais de bateria. Segundo avaliações de júris externos independentes, este modelo apresenta um desempenho significativamente superior aos modelos comerciais existentes de geração de áudio. Destaca-se especialmente por reduzir ruídos indesejados e por sincronizar com precisão o áudio e as cenas mesmo em vídeos de movimento rápido, conferindo-lhe uma vantagem competitiva diferenciada.
Este modelo é disponibilizado através da aplicação ‘Mirelo Studio’, que pode ser utilizada tanto via API como por utilizadores comuns. Os utilizadores podem gerar várias versões de áudio a partir de prompts de texto e selecionar a melhor para edição adicional. A plataforma foi desenhada para que não seja necessário ser um especialista em tecnologia para aceder facilmente à produção de áudio com IA.
Com este investimento, a Mirelo iniciou o desenvolvimento de um modelo de próxima geração que supera o SFX 1.5. Espera-se que o novo algoritmo fortaleça ainda mais a coerência e a ligação natural entre os áudios, com o objetivo de expandir para áreas de produção de conteúdos de alta qualidade, como filmes e videojogos.
A empresa também está a treinar os modelos usando clusters de alta performance baseados em GPUs Nvidia H100 e H200, operados através de um sistema de processamento distribuído Slurm(. O framework de IA adotado é o PyTorch)PyTorch( da Meta, com uso ativo da funcionalidade FSDP)Fully Sharded Data Parallel(, otimizada para treino distribuído de modelos de grande escala.
Atualmente, a Mirelo está a recrutar investigadores especializados em IA com foco em difusão)diffusion( e estruturas autoregressivas)autoregressive(. Em particular, a estrutura autoregressiva inclui arquiteturas Transformer, que estão a emergir como tecnologias centrais não só para modelos de linguagem, mas também para IA de áudio, como na geração de música.
Com os fundos obtidos, a Mirelo planeia reforçar a sua equipa de investigação, diversificar produtos e acelerar a entrada no mercado global, consolidando a sua posição de liderança no mercado de IA para geração de áudio.
Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
16 Curtidas
Recompensa
16
9
Repostar
Compartilhar
Comentário
0/400
gas_fee_therapist
· 7h atrás
ngl esta corrida de geração de áudio AI tem um pouco de competição, logo de início já são 41 bilhões... Mas adicionar sons de bateria a vídeos silenciosos? Essa funcionalidade é realmente inovadora
Ver originalResponder0
RebaseVictim
· 12-16 03:26
ngl esta tecnologia é um pouco interessante, colocar voz em vídeos mudos? Parece que no futuro os criadores de vídeos curtos vão ficar desempregados, hein
---
591 bilhões investidos, que grande investimento... mas não sei até que ponto o som de bateria gerado por IA é realista
---
Mais uma vez a a16z e a Index Ventures, essa equipe de financiamento é realmente impressionante, mas no campo da geração de áudio ainda parece estar em fase de exploração
---
Espera aí, isso realmente funciona? Ou é mais um projeto de hype...
---
Gerenciar áudio de IA na Alemanha, isso é um pouco novidade, geralmente é tudo Silicon Valley
---
Adicionar som de bateria a vídeos mute, o que eles querem fazer com isso... a ideia é interessante, mas a utilidade? Deixe uma interrogação mesmo
Ver originalResponder0
MissedAirdropAgain
· 12-16 02:13
Este montante de financiamento não é pequeno, mas será que a geração de efeitos sonoros por IA pode realmente ser aplicada na prática? Acho que ainda depende de como serão os resultados reais posteriormente.
Espere, o pessoal do Anderson está investindo em áudio AI? Essa competição está ficando acirrada.
---
591 bilhões de RMB investidos apenas para adicionar um som de tambor ao vídeo? Parece meio exagerado.
---
Mais uma vez, projetos de áudio gerado por AI, como esses geralmente conseguem financiamento...
---
Hmm, é um pouco interessante, mas qual seria o caminho de monetização dessas coisas?
---
Feito por uma equipe alemã, SFX 1.5 parece promissor, mas os estágios de financiamento parecem um pouco estranhos.
---
Dublagem de vídeos silenciosos? Só quero saber como fica o resultado, ou será que é mais uma rodada de financiamento por PPT?
---
A16z voltou, esses grandes fundos estão tão obcecados por AI de áudio...
---
Parece que podem fazer algo, mas será que alguém realmente vai usar?
---
Para ser honesto, estou otimista quanto a efeitos sonoros de AI, eles têm aplicação prática maior do que o AI de texto puro.
---
Com tanto dinheiro assim, não sei se não vão acabar estragando tudo.
Ver originalResponder0
DegenDreamer
· 12-16 02:08
Espera aí, 59,1 bilhões por um AI de áudio? Essa captação de recursos está demais, será que eu entendi errado?
SFX 1.5 adicionando efeitos sonoros aos vídeos... parece um pouco inútil, a menos que realmente consiga fazer sucesso.
O que significa a participação da a16z? Essa área realmente está em alta...
Não estou elogiando nem criticando, só acho que a ideia de colocar som em vídeos silenciosos é um pouco sem graça.
Este deve ser mais um projeto que precisa contar uma história para conseguir financiamento lol
591 bilhões?Este dinheiro consegue fazer algo, parece que a geração de áudio AI já foi muito explorada há muito tempo
SFX 1.5 consegue adicionar som de bateria a vídeos silenciosos? Parece bastante absurdo... Será que é realmente tão poderoso assim?
a16z, assim que entra, parece que consegue aumentar tudo, não importa como seja o resultado, de qualquer forma a história de financiamento é bem convincente
A geração de áudio, para ser honesto, não parece ter uma necessidade real, está muito atrás da geração de vídeo
Espera aí, equipe alemã? Como é que a Europa de repente ficou tão forte em startups de AI?
Ver originalResponder0
SatsStacking
· 12-16 01:52
41 bilhões de dólares investidos em IA de geração de áudio, essa rodada realmente é grande
Caramba, esse volume de financiamento, só A16Z e Index se atrevem a liderar juntos, parece que o setor de áudio está realmente em alta
SFX 1.5 consegue automatizar a dublagem de vídeos silenciosos... Para ser honesto, a tecnologia realmente é avançada, mas ainda precisamos ver se consegue se consolidar no mercado
Mais uma vez uma equipe alemã, a base de IA na Europa é sólida, só não sabemos como será a expansão do valuation posteriormente
Mirello, capta 59,1 mil milhões de investimento… Usa IA para adicionar sons de bateria a vídeos silenciosos
Fonte: TokenPost Título Original: 미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다 Link Original: A startup alemã de IA para geração de áudio Mirelo(Mirelo) está a captar atenção ao assegurar uma ronda de investimento seed de 41 milhões de dólares(cerca de 59,1 mil milhões de won). A rodada foi liderada em conjunto pela Index Ventures e Andreessen Horowitz, com apoio financeiro também da Atlantic Ventures e TriplePoint Capital.
A Mirelo concentra-se na funcionalidade de geração de áudio ajustada a vídeos, e o seu modelo principal, ‘SFX 1.5’, conseguiu reconhecer cenas de bateria em vídeos silenciados e gerar sons de bateria com precisão, semelhantes aos sons reais de bateria. Segundo avaliações de júris externos independentes, este modelo apresenta um desempenho significativamente superior aos modelos comerciais existentes de geração de áudio. Destaca-se especialmente por reduzir ruídos indesejados e por sincronizar com precisão o áudio e as cenas mesmo em vídeos de movimento rápido, conferindo-lhe uma vantagem competitiva diferenciada.
Este modelo é disponibilizado através da aplicação ‘Mirelo Studio’, que pode ser utilizada tanto via API como por utilizadores comuns. Os utilizadores podem gerar várias versões de áudio a partir de prompts de texto e selecionar a melhor para edição adicional. A plataforma foi desenhada para que não seja necessário ser um especialista em tecnologia para aceder facilmente à produção de áudio com IA.
Com este investimento, a Mirelo iniciou o desenvolvimento de um modelo de próxima geração que supera o SFX 1.5. Espera-se que o novo algoritmo fortaleça ainda mais a coerência e a ligação natural entre os áudios, com o objetivo de expandir para áreas de produção de conteúdos de alta qualidade, como filmes e videojogos.
A empresa também está a treinar os modelos usando clusters de alta performance baseados em GPUs Nvidia H100 e H200, operados através de um sistema de processamento distribuído Slurm(. O framework de IA adotado é o PyTorch)PyTorch( da Meta, com uso ativo da funcionalidade FSDP)Fully Sharded Data Parallel(, otimizada para treino distribuído de modelos de grande escala.
Atualmente, a Mirelo está a recrutar investigadores especializados em IA com foco em difusão)diffusion( e estruturas autoregressivas)autoregressive(. Em particular, a estrutura autoregressiva inclui arquiteturas Transformer, que estão a emergir como tecnologias centrais não só para modelos de linguagem, mas também para IA de áudio, como na geração de música.
Com os fundos obtidos, a Mirelo planeia reforçar a sua equipa de investigação, diversificar produtos e acelerar a entrada no mercado global, consolidando a sua posição de liderança no mercado de IA para geração de áudio.