Nguồn: TokenPost
Tiêu đề gốc: 미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다
Liên kết gốc:
Start-up AI tạo âm thanh có trụ sở tại Đức, Mirelo(Mirelo), gần đây đã huy động được 41 triệu USD(khoảng 591 tỷ đồng) trong vòng gọi vốn seed, thu hút sự chú ý. Các quỹ Index Ventures và Andreessen Horowitz đã đồng dẫn đầu, cùng với Atlantic Ventures và TriplePoint Capital cũng đã hỗ trợ tài chính.
Mirelo tập trung vào chức năng tạo âm thanh phù hợp với video, trong đó mô hình chủ lực của họ, ‘SFX 1.5’, đã thành công trong việc nhận diện cảnh chơi trống trong video bị im lặng và tạo ra âm thanh chính xác như tiếng trống thực tế. Theo đánh giá của các giám khảo độc lập bên ngoài, mô hình này ghi nhận hiệu suất vượt trội rõ rệt so với các mô hình tạo âm thanh thương mại hiện có. Đặc biệt, khả năng giảm tiếng ồn không mong muốn và chính xác trong việc đồng bộ âm thanh với cảnh quay chuyển động nhanh đã tạo nên lợi thế cạnh tranh nổi bật.
Mô hình này được cung cấp qua ứng dụng ‘Mirelo Studio’, dễ sử dụng cho cả API lẫn người dùng phổ thông. Người dùng có thể tạo nhiều phiên bản âm thanh bằng cách nhập lệnh văn bản và chọn kết quả tối ưu để chỉnh sửa thêm. Nền tảng này được thiết kế để các người không chuyên về công nghệ cũng dễ dàng tiếp cận tạo âm thanh AI.
Dựa trên khoản đầu tư này, Mirelo đã bắt đầu phát triển các mô hình thế hệ tiếp theo vượt xa SFX 1.5. Thuật toán mới dự kiến sẽ tăng cường hơn nữa sự nhất quán và kết nối tự nhiên giữa các âm thanh, hướng tới mở rộng sang các lĩnh vực sản xuất nội dung chất lượng cao như phim ảnh hoặc trò chơi điện tử.
Công ty cũng đang sử dụng các cụm GPU cao cấp dựa trên NVIDIA H100 và H200 để huấn luyện mô hình, các cụm này hoạt động qua hệ thống xử lý phân tán Slurm(Slurm). Framework AI sử dụng PyTorch(PyTorch) của Meta và tích cực khai thác chức năng FSDP(Fully Sharded Data Parallel) tối ưu cho huấn luyện phân tán các mô hình lớn.
Hiện tại, Mirelo đang tuyển dụng các nhà nghiên cứu AI có chuyên môn về diffusion(diffusion) và cấu trúc autoregressive(autoregressive). Trong đó, phần autoregressive bao gồm kiến trúc transformer, vốn là công nghệ cốt lõi trong các mô hình ngôn ngữ và cũng ngày càng nổi bật trong lĩnh vực AI âm thanh như tạo nhạc.
Dựa trên nguồn vốn huy động, Mirelo dự định tăng cường nhân lực nghiên cứu, đa dạng hóa sản phẩm và đẩy nhanh mở rộng thị trường toàn cầu, nhằm giữ vững vị thế hàng đầu trong thị trường AI tạo âm thanh.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
Số tiền huy động này không nhỏ, nhưng liệu công nghệ tạo âm thanh bằng AI này có thể thực sự ứng dụng vào thực tế không? Tôi nghĩ còn phải xem hiệu quả thực tế sau này như thế nào.
Chờ đã, 591 tỷ cho AI âm thanh? Vốn đầu tư này quá mạnh rồi, chắc là tôi hiểu nhầm rồi
SFX 1.5 thêm hiệu ứng âm thanh cho video... cảm giác hơi vô dụng, trừ khi thật sự có thể nổi bật
a16z ra tay chứng tỏ điều gì? Thị trường này thật sự nóng hổi...
Không phét lác, không chê bai, chỉ là cảm thấy việc thêm âm thanh cho video im lặng này hơi nguội
Chắc lại là dự án cần kể câu chuyện để gọi vốn rồi lol
Xem bản gốcTrả lời0
PretendingSerious
· 12-16 02:03
安德森又在下注,行啊,这波AI我看好
Xem bản gốcTrả lời0
MEVVictimAlliance
· 12-16 02:02
591 tỷ? Số tiền này có thể làm gì được đây, cảm giác AI tạo âm thanh đã bị khai thác quá nhiều rồi
SFX 1.5 có thể thêm tiếng trống vào video âm thanh không có? Nghe có vẻ khá phi lý... Thật sự mạnh như vậy sao
a16z vừa bắt đầu đã cảm thấy có thể tăng trưởng, không quan tâm thành quả thế nào, dù sao câu chuyện huy động vốn cũng làm rất thuyết phục
Việc tạo âm thanh thành thật mà nói không có nhiều nhu cầu, so với tạo video thì còn kém xa
Chờ đã, đội ngũ Đức? Châu Âu sao đột nhiên lại mạnh mẽ như vậy trong lĩnh vực khởi nghiệp AI
Xem bản gốcTrả lời0
SatsStacking
· 12-16 01:52
41 tỷ USD đổ vào AI tạo âm thanh, quy mô này thực sự lớn quá rồi
Trời ơi, quy mô gọi vốn này, chỉ riêng A16Z và Index đã dám cùng nhau dẫn đầu, cảm giác ngành âm thanh này thật sự rất hot
SFX 1.5 có thể tự động lồng tiếng cho video tĩnh... Nói thật, công nghệ này thực sự có thể, nhưng để thương mại hóa có thành công hay không còn phải xem
Lại là đội ngũ Đức, nền tảng AI của châu Âu thì chắc chắn rồi, chỉ không rõ sau này định giá sẽ phình to như thế nào
Mirello huy động vốn 59.1 tỷ… Sử dụng AI để thêm âm thanh trống vào video tắt tiếng
Nguồn: TokenPost Tiêu đề gốc: 미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다 Liên kết gốc: Start-up AI tạo âm thanh có trụ sở tại Đức, Mirelo(Mirelo), gần đây đã huy động được 41 triệu USD(khoảng 591 tỷ đồng) trong vòng gọi vốn seed, thu hút sự chú ý. Các quỹ Index Ventures và Andreessen Horowitz đã đồng dẫn đầu, cùng với Atlantic Ventures và TriplePoint Capital cũng đã hỗ trợ tài chính.
Mirelo tập trung vào chức năng tạo âm thanh phù hợp với video, trong đó mô hình chủ lực của họ, ‘SFX 1.5’, đã thành công trong việc nhận diện cảnh chơi trống trong video bị im lặng và tạo ra âm thanh chính xác như tiếng trống thực tế. Theo đánh giá của các giám khảo độc lập bên ngoài, mô hình này ghi nhận hiệu suất vượt trội rõ rệt so với các mô hình tạo âm thanh thương mại hiện có. Đặc biệt, khả năng giảm tiếng ồn không mong muốn và chính xác trong việc đồng bộ âm thanh với cảnh quay chuyển động nhanh đã tạo nên lợi thế cạnh tranh nổi bật.
Mô hình này được cung cấp qua ứng dụng ‘Mirelo Studio’, dễ sử dụng cho cả API lẫn người dùng phổ thông. Người dùng có thể tạo nhiều phiên bản âm thanh bằng cách nhập lệnh văn bản và chọn kết quả tối ưu để chỉnh sửa thêm. Nền tảng này được thiết kế để các người không chuyên về công nghệ cũng dễ dàng tiếp cận tạo âm thanh AI.
Dựa trên khoản đầu tư này, Mirelo đã bắt đầu phát triển các mô hình thế hệ tiếp theo vượt xa SFX 1.5. Thuật toán mới dự kiến sẽ tăng cường hơn nữa sự nhất quán và kết nối tự nhiên giữa các âm thanh, hướng tới mở rộng sang các lĩnh vực sản xuất nội dung chất lượng cao như phim ảnh hoặc trò chơi điện tử.
Công ty cũng đang sử dụng các cụm GPU cao cấp dựa trên NVIDIA H100 và H200 để huấn luyện mô hình, các cụm này hoạt động qua hệ thống xử lý phân tán Slurm(Slurm). Framework AI sử dụng PyTorch(PyTorch) của Meta và tích cực khai thác chức năng FSDP(Fully Sharded Data Parallel) tối ưu cho huấn luyện phân tán các mô hình lớn.
Hiện tại, Mirelo đang tuyển dụng các nhà nghiên cứu AI có chuyên môn về diffusion(diffusion) và cấu trúc autoregressive(autoregressive). Trong đó, phần autoregressive bao gồm kiến trúc transformer, vốn là công nghệ cốt lõi trong các mô hình ngôn ngữ và cũng ngày càng nổi bật trong lĩnh vực AI âm thanh như tạo nhạc.
Dựa trên nguồn vốn huy động, Mirelo dự định tăng cường nhân lực nghiên cứu, đa dạng hóa sản phẩm và đẩy nhanh mở rộng thị trường toàn cầu, nhằm giữ vững vị thế hàng đầu trong thị trường AI tạo âm thanh.