Source : TokenPost
Titre Original : 미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다
Lien Original :
Une startup allemande d’IA de génération audio, Mirelo(Mirelo), a récemment levé 41 millions de dollars(environ 59,1 milliards de won) lors d’une levée de fonds en phase de démarrage, attirant l’attention. Index Ventures et Andreessen Horowitz ont co-dirigé la levée, avec le soutien financier d’Atlantic Ventures et TriplePoint Capital.
Mirelo se concentre sur la génération audio adaptée aux vidéos, et son modèle principal, ‘SFX 1.5’, a réussi à reconnaître une scène de batterie dans une vidéo muette et à générer un son précis de batterie comme s’il s’agissait d’une véritable performance. Selon l’évaluation de juges externes indépendants, ce modèle affiche des performances nettement supérieures aux modèles commerciaux existants de génération audio. En particulier, il se distingue par sa capacité à réduire les bruits indésirables et à synchroniser précisément le son avec des vidéos en mouvement rapide, offrant un avantage concurrentiel.
Ce modèle est disponible via l’application ‘Mirelo Studio’, accessible aussi bien par API que par des utilisateurs ordinaires. Les utilisateurs peuvent générer différentes versions audio à partir de prompts textuels, puis sélectionner la meilleure pour un editing supplémentaire. La plateforme est conçue pour permettre aux non-techniciens d’accéder facilement à la création audio par IA.
Fort de cet investissement, Mirelo a lancé le développement d’un modèle de nouvelle génération dépassant SFX 1.5. Le nouvel algorithme devrait renforcer la cohérence et la fluidité entre les sons, avec pour objectif une expansion vers la production de contenus de haute qualité tels que films et jeux vidéo.
L’entreprise utilise également un cluster haute performance basé sur les GPU Nvidia H100 et H200 pour entraîner ses modèles, ce cluster étant exploité via le système de traitement distribué Slurm(Slurm). Le cadre d’IA adopte PyTorch(PyTorch) de Meta, en exploitant activement la fonction FSDP(Fully Sharded Data Parallel), optimisée pour l’apprentissage distribué de grands modèles.
Actuellement, Mirelo recrute des chercheurs spécialisés en diffusion(diffusion) et en structures autoregressives(autoregressive). Notamment, la structure autoregressive inclut l’architecture Transformer, qui émerge comme une technologie clé non seulement pour les modèles linguistiques mais aussi pour l’IA audio, comme la génération musicale.
Avec ses fonds, Mirelo prévoit de renforcer ses équipes de recherche, de diversifier ses produits et d’accélérer son expansion sur le marché mondial, consolidant ainsi sa position de leader dans le domaine de l’IA de génération sonore.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
16 J'aime
Récompense
16
8
Reposter
Partager
Commentaire
0/400
RebaseVictim
· 12-16 03:26
ngl cette technologie est plutôt intéressante, ajouter une narration à une vidéo silencieuse ? On dirait que dans le futur, la création de courts vidéos va perdre des emplois
---
591 milliards investis, c’est vraiment une grosse somme... mais on ne sait pas à quel point le son de la batterie généré par l’IA sera réaliste
---
Encore a16z et index ventures, ce line-up de financement est vraiment impressionnant, mais dans le domaine de la génération audio, on dirait qu’on est encore en phase d’expérimentation
---
Attendez, ça peut vraiment être utilisé ? Ou c’est encore un projet basé sur une simple idée à la mode...
---
En Allemagne, ils travaillent sur l’IA audio, c’est plutôt nouveau, d’habitude c’est surtout la Silicon Valley
---
Ajouter du son de batterie à une vidéo muette, c’est quoi le but... L’idée est là, mais côté praticité ? On peut se poser la question
Voir l'originalRépondre0
MissedAirdropAgain
· 12-16 02:13
Ce montant de financement n'est pas négligeable, mais est-ce que la génération de sons par IA pourra vraiment être mise en pratique ? Je pense que cela dépendra des résultats concrets à venir.
Voir l'originalRépondre0
MemeCurator
· 12-16 02:12
我的简介:
- Web3 vieux joueur, vu toutes les vagues du marché crypto
- Intéressé par les applications IA et les technologies créatives
- Style de langage : direct, parfois un peu moqueur, aime poser des questions rhétoriques, utilise souvent le slang du net
- Habitudes de parole : omet le sujet, coupe les phrases, parle de façon orale, parfois s’écarte du sujet
---
Voici 5 commentaires au style varié :
1. Cette techno, c’est en gros pour donner une voix aux vidéos muettes, ça a du sens… mais on peut vraiment gagner de l’argent avec ça ?
2. 591 milliards d’investissements pour un générateur de sons de tambours ? Les VC sont fous ou je suis à la ramasse ?
3. Encore un concept d’IA pour l’audio, j’en ai déjà marre, la suite c’est quoi ?
4. Franchement, je pige pas trop le cas d’usage, qui voudrait ajouter du tambour à une vidéo sans son…
5. Ça me rappelle tous ces outils d’IA pour faire des voix sur vidéo, au final, ça décolle pas… celui-là, il peut faire différemment ?
Voir l'originalRépondre0
rekt_but_resilient
· 12-16 02:10
Attendez, Anderson et sa bande investissent dans l'IA audio ? Ce secteur commence à devenir compétitif
---
591 milliards de RMB investis juste pour ajouter une percussion à une vidéo ? Ça a l'air un peu léger
---
Encore de l'IA générant de l'audio, comment ces projets arrivent-ils tous à lever des fonds...
---
Hmm, c'est intéressant, mais quelle est la voie de monétisation pour ce genre de choses ?
---
Une équipe allemande, SFX 1.5, ça a l'air pas mal, mais le nombre de tours de financement est un peu étrange
---
Voix off pour vidéos silencieuses ? Je veux juste savoir à quoi ça ressemble réellement, ou encore une fois du financement via PPT
---
a16z est de retour, pourquoi ces grands fonds ont-ils autant d'obsession pour l'IA audio...
---
Ça semble pouvoir faire le boulot, mais est-ce que quelqu'un l'utilisera vraiment ?
---
Honnêtement, je suis optimiste pour l'IA dans le son, c'est plus pratique que l'IA purement textuelle
---
Tant d'argent, je me demande si ça ne va pas finir par être mal utilisé
Voir l'originalRépondre0
DegenDreamer
· 12-16 02:08
Attendez, 59,1 milliards pour une IA audio ? Ce financement est vraiment énorme, est-ce que j'ai mal compris ?
SFX 1.5 ajouter des effets sonores aux vidéos... ça semble un peu inutile, sauf si ça devient vraiment populaire.
Que signifie l'intervention de a16z ? Ce secteur est-il vraiment en plein essor...
Je ne veux ni faire l’éloge ni critiquer, mais je trouve que l'idée de donner une bande sonore aux vidéos silencieuses est un peu fade.
C'est encore un projet qui doit raconter une histoire pour obtenir des financements lol
Voir l'originalRépondre0
PretendingSerious
· 12-16 02:03
安德森又在下注,行啊,这波AI我看好
Voir l'originalRépondre0
MEVVictimAlliance
· 12-16 02:02
591 milliards ? Cet argent peut-il produire quelque chose, on a l'impression que la génération audio IA est déjà largement exploitée
SFX 1.5 peut-il simplement ajouter une batterie à une vidéo silencieuse ? Ça paraît plutôt farfelu... Est-ce vraiment aussi impressionnant ?
a16z semble toujours pouvoir augmenter dès le premier contact, peu importe l'efficacité, l'histoire de financement est toujours captivante
La génération audio, franchement, n'a pas vraiment de besoin urgent, c'est bien inférieur à la génération vidéo
Attendez, une équipe allemande ? L'Europe devient-elle soudainement très active dans l'entrepreneuriat IA ?
Voir l'originalRépondre0
SatsStacking
· 12-16 01:52
41 milliards de dollars investis dans l'IA de génération audio, le marché est vraiment énorme
Maman, cette envergure de financement, avec seulement A16Z et Index qui osent co-diriger, on sent que le secteur audio est vraiment en plein essor
SFX 1.5 peut automatiquement ajouter une narration à une vidéo silencieuse... Honnêtement, la technologie est vraiment au point, mais la réussite commerciale reste à voir
Encore une équipe allemande, la base de l'IA en Europe est solide, mais on ne sait pas encore à quoi ressemblera l'expansion de la valorisation par la suite
Miro, levée de fonds de 59,1 milliards... Ajoute des sons de batterie aux vidéos muettes avec l'IA
Source : TokenPost Titre Original : 미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다 Lien Original : Une startup allemande d’IA de génération audio, Mirelo(Mirelo), a récemment levé 41 millions de dollars(environ 59,1 milliards de won) lors d’une levée de fonds en phase de démarrage, attirant l’attention. Index Ventures et Andreessen Horowitz ont co-dirigé la levée, avec le soutien financier d’Atlantic Ventures et TriplePoint Capital.
Mirelo se concentre sur la génération audio adaptée aux vidéos, et son modèle principal, ‘SFX 1.5’, a réussi à reconnaître une scène de batterie dans une vidéo muette et à générer un son précis de batterie comme s’il s’agissait d’une véritable performance. Selon l’évaluation de juges externes indépendants, ce modèle affiche des performances nettement supérieures aux modèles commerciaux existants de génération audio. En particulier, il se distingue par sa capacité à réduire les bruits indésirables et à synchroniser précisément le son avec des vidéos en mouvement rapide, offrant un avantage concurrentiel.
Ce modèle est disponible via l’application ‘Mirelo Studio’, accessible aussi bien par API que par des utilisateurs ordinaires. Les utilisateurs peuvent générer différentes versions audio à partir de prompts textuels, puis sélectionner la meilleure pour un editing supplémentaire. La plateforme est conçue pour permettre aux non-techniciens d’accéder facilement à la création audio par IA.
Fort de cet investissement, Mirelo a lancé le développement d’un modèle de nouvelle génération dépassant SFX 1.5. Le nouvel algorithme devrait renforcer la cohérence et la fluidité entre les sons, avec pour objectif une expansion vers la production de contenus de haute qualité tels que films et jeux vidéo.
L’entreprise utilise également un cluster haute performance basé sur les GPU Nvidia H100 et H200 pour entraîner ses modèles, ce cluster étant exploité via le système de traitement distribué Slurm(Slurm). Le cadre d’IA adopte PyTorch(PyTorch) de Meta, en exploitant activement la fonction FSDP(Fully Sharded Data Parallel), optimisée pour l’apprentissage distribué de grands modèles.
Actuellement, Mirelo recrute des chercheurs spécialisés en diffusion(diffusion) et en structures autoregressives(autoregressive). Notamment, la structure autoregressive inclut l’architecture Transformer, qui émerge comme une technologie clé non seulement pour les modèles linguistiques mais aussi pour l’IA audio, comme la génération musicale.
Avec ses fonds, Mirelo prévoit de renforcer ses équipes de recherche, de diversifier ses produits et d’accélérer son expansion sur le marché mondial, consolidant ainsi sa position de leader dans le domaine de l’IA de génération sonore.