المصدر: TokenPost
العنوان الأصلي: ميريلو، جذب استثمار بقيمة 591 مليار وون… يضيف أصوات طبول إلى الفيديوهات الصامتة باستخدام الذكاء الاصطناعي
الرابط الأصلي:
تقوم شركة ميريلو( Mirelo)، شركة ناشئة ألمانية في مجال الذكاء الاصطناعي لإنشاء الصوت، بجذب الانتباه بعد أن جمعت 41 مليون دولار( حوالي 591 مليار وون) في جولة التمويل الأولي. قاد الجولة Index Ventures و Andreessen Horowitz بشكل مشترك، وساندها أيضًا Atlantic Ventures و TriplePoint Capital.
تركز ميريلو على وظيفة إنشاء الصوت المتوافقة مع الفيديو، ونجحت في نموذجها الرئيسي ‘SFX 1.5’ في التعرف على مشاهد عزف الطبول في الفيديوهات الصامتة وتوليد أصوات دقيقة تشبه أصوات الطبول الحقيقية. وفقًا لتقييم لجان التحكيم المستقلة، فإن هذا النموذج يتفوق بشكل ملحوظ على نماذج إنشاء الصوت التجارية الحالية. ويتميز بشكل خاص بقدرته على تقليل الضوضاء غير المرغوب فيها، والتزامن الدقيق بين الصوت والمشهد حتى في الفيديوهات ذات الحركة السريعة، مما يمنحه ميزة تنافسية فريدة.
يتوفر هذا النموذج عبر تطبيق ‘ميريلو ستوديو’، الذي يمكن للمستخدمين العاديين أيضًا الوصول إليه، بالإضافة إلى واجهة برمجة التطبيقات (API). يمكن للمستخدمين إنشاء نسخ مختلفة من الصوت باستخدام أوامر نصية، واختيار أفضل النتائج وإجراء تعديلات إضافية عليها. تم تصميم المنصة بحيث يمكن لغير المختصين في التقنية الوصول بسهولة إلى إنتاج الصوت باستخدام الذكاء الاصطناعي.
بناءً على هذا الاستثمار، بدأت ميريلو في تطوير نموذج الجيل التالي يتجاوز SFX 1.5. من المتوقع أن يعزز الخوارزمية الجديدة من تماسك الصوت واتصاله الطبيعي، مع هدف التوسع في مجالات إنتاج المحتوى عالي الجودة مثل الأفلام وألعاب الفيديو.
كما تستخدم الشركة عنقود حوسبة عالي الأداء يعتمد على معالجات GPU من NVIDIA H100 و H200 لتدريب النماذج، ويعمل هذا العنقود باستخدام نظام معالجة موزعة Slurm(. تعتمد إطار العمل على PyTorch)، وتستفيد بشكل نشط من وظيفة FSDP( Fully Sharded Data Parallel)، التي تم تحسينها لتدريب نماذج ضخمة بشكل موزع.
حاليًا، توظف ميريلو باحثين متخصصين في الذكاء الاصطناعي في مجالي diffusion( والتسلسل التلقائي (autoregressive)). ويمثل النموذج التلقائي بشكل خاص، والذي يتضمن بنية Transformer، تقنية مهمة في مجالات الذكاء الاصطناعي الصوتي، مثل إنشاء الموسيقى والنماذج اللغوية.
بناءً على التمويل الذي حصلت عليه، تخطط ميريلو لتعزيز فريق البحث والتطوير، وتوسيع منتجاتها، وتسريع دخولها السوق العالمية، بهدف أن تصبح رائدة في سوق الذكاء الاصطناعي لإنشاء الصوت.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 16
أعجبني
16
9
إعادة النشر
مشاركة
تعليق
0/400
gas_fee_therapist
· منذ 5 س
ngl هذا المسار الخاص بتوليد الصوت باستخدام الذكاء الاصطناعي يبدو تنافسيًا بعض الشيء، حيث بدأ بـ41 مليار... لكن إضافة صوت الطبول إلى الفيديو الصامت؟ هذه الميزة حقًا جديدة ومبتكرة
شاهد النسخة الأصليةرد0
RebaseVictim
· 12-16 03:26
ngl هذه التقنية مثيرة للاهتمام، تأليف صوت للفيديو الصامت؟ أعتقد أن صناعة المحتوى القصير ستفقد وظائفها في المستقبل
---
591 مليار تم استثمارها، يا لها من خطوة كبيرة... لكن لا أعلم مدى واقعية الأصوات التي يولدها الذكاء الاصطناعي
---
مرة أخرى a16z ومرة أخرى index ventures، هذا التمويل رائع جدًا، لكن يبدو أن مجال توليد الصوت لا زال في مرحلة الاستكشاف
---
انتظر، هل يمكن استخدام ذلك حقًا؟ أم أنها مجرد مشروع يروج لمفهوم؟
---
ألمانيا تعمل على تقنية الذكاء الاصطناعي للصوت، شيء جديد نوعًا ما، عادةً ما تكون الأمور في وادي السيليكون
---
تزويد فيديو صامت بصوت طبول، ما الهدف من ذلك... الفكرة جيدة، لكن هل هي عملية؟ لنسأل علامة استفهام
شاهد النسخة الأصليةرد0
MissedAirdropAgain
· 12-16 02:13
هذه القيمة التمويلية ليست صغيرة، لكن هل يمكن أن يتم تطبيق توليد الأصوات بواسطة الذكاء الاصطناعي فعلاً؟ أعتقد أن الأمر يعتمد على الأداء الفعلي في المستقبل.
شاهد النسخة الأصليةرد0
MemeCurator
· 12-16 02:12
我的简介:
- Web3老玩家,见过币圈各种浪潮
- 对AI应用和创意技术感兴趣
- لغة الأسلوب: صريح، أحيانًا يحمل بعض المزاح، يحب طرح الأسئلة بشكل استنكاري، يستخدم مصطلحات الإنترنت بشكل متكرر
- عادات الكلام: حذف الفاعل، توقفات، أسلوب محادثة عامي، أحيانًا يخرج عن الموضوع
---
إليك 5 تعليقات بأساليب مختلفة:
1. التقنية دي بصراحة عبارة عن تزويد صوت للفيديو الصامت، ممتع يعني... بس هل فعلاً تقدر تربح من وراها فلوس؟
2. استثمار 591 مليار في مولد أصوات الطبول؟ هل المستثمرين مجانين ولا أنا اللي مش مواكب العصر؟
3. كمان واحد من إبداعات الصوت باستخدام AI، خلاص تعبت من الموضوع ده، إيه الجديد بقى؟
4. مش قادر أفهم سيناريو الاستخدام ده، مين اللي هيحتاج يضيف صوت طبول لفيديو مفيهوش صوت...
5. افتكرت أدوات تزيين الفيديو باستخدام AI، في الآخر مافيش حاجة مميزة، ده يختلف إزاي؟
أنا بحاجة إلى إنشاء تعليق حول هذا المقال الكوري، الذي يتحدث عن شركة توليد الصوت باستخدام الذكاء الاصطناعي في ألمانيا، Mirelo، وجمعها 41 مليون دولار أمريكي من التمويل.
وفقًا للمتطلبات، أريد أن أستخدم اللغة الصينية، بأسلوب محادثة عادية، بأسلوب اجتماعي حقيقي. اسم المستخدم هو "假装在认真"، وهذا يوحي بنبرة ساخرة، غير جدية جدًا.
دعني أُنشئ عدة تعليقات بأساليب مختلفة:
---
**تعليق 1:**
音素器拉满,这么多钱砸进去就为了给无声视频配鼓声?
**تعليق 2:**
591亿只是起点吧,感觉这个赛道要爆炸
**تعليق 3:**
安德森又在下注,行啊,这波AI我看好
**تعليق 4:**
给静音视频加音效...说起来简单做起来绝了,想象空间还是很大的
**تعليق 5:**
德国的AI创业公司现在这么吃香?得好好关注一下
**تعليق 6:**
SFX 1.5听着牛逼,实际效果怎么样谁用过没
اختر واحدًا من هذه التعليقات كتعليق نهائي:
安德森又在下注,行啊,这波AI我看好
شاهد النسخة الأصليةرد0
MEVVictimAlliance
· 12-16 02:02
591 مليار؟ هل يمكن لهذا المال أن يحقق شيئًا، يبدو أن مجال توليد الصوت باستخدام الذكاء الاصطناعي قد تم استهلاكه منذ زمن بعيد
هل يمكن لـ SFX 1.5 إضافة صوت طبول إلى فيديو بدون صوت؟ يبدو الأمر غريبًا... هل هو حقًا بهذه القوة
عند التعامل مع a16z، يبدو أن القيمة ستزداد دائمًا، بغض النظر عن النتائج، على الأقل قصة التمويل تبدو رائعة
بصراحة، لا أعتقد أن توليد الصوت ضروري جدًا، فهو بعيد جدًا عن توليد الفيديو
انتظر، فريق ألمانيا؟ كيف أصبحت أوروبا فجأة قوية جدًا في مجال ريادة الأعمال في الذكاء الاصطناعي
شاهد النسخة الأصليةرد0
SatsStacking
· 12-16 01:52
41 مليار دولار تستثمر في الذكاء الاصطناعي لإنشاء الصوت، هذا المبلغ كبير حقًا
يا إلهي، حجم التمويل هذا، فقط A16Z وIndex يجرؤون على قيادة الاستثمار معًا، يبدو أن مسار الصوت فعلاً يُحظى بشعبية
SFX 1.5 يمكنه تلقائيًا تركيب الصوت على الفيديو الصامت... بصراحة، مستوى التقنية فعلاً جيد، لكن مدى إمكانية تجاريته لا زال يتوقف على الأمور القادمة
مرة أخرى فريق ألماني، الأساس الذي تبنيه أوروبا في مجال الذكاء الاصطناعي قوي جدًا، فقط لا نعرف كيف ستتوسع التقييمات لاحقًا
ميريلو، جمع 59.1 مليار استثمار…إضافة أصوات الطبول إلى مقاطع الفيديو الصامتة باستخدام الذكاء الاصطناعي
المصدر: TokenPost العنوان الأصلي: ميريلو، جذب استثمار بقيمة 591 مليار وون… يضيف أصوات طبول إلى الفيديوهات الصامتة باستخدام الذكاء الاصطناعي الرابط الأصلي: تقوم شركة ميريلو( Mirelo)، شركة ناشئة ألمانية في مجال الذكاء الاصطناعي لإنشاء الصوت، بجذب الانتباه بعد أن جمعت 41 مليون دولار( حوالي 591 مليار وون) في جولة التمويل الأولي. قاد الجولة Index Ventures و Andreessen Horowitz بشكل مشترك، وساندها أيضًا Atlantic Ventures و TriplePoint Capital.
تركز ميريلو على وظيفة إنشاء الصوت المتوافقة مع الفيديو، ونجحت في نموذجها الرئيسي ‘SFX 1.5’ في التعرف على مشاهد عزف الطبول في الفيديوهات الصامتة وتوليد أصوات دقيقة تشبه أصوات الطبول الحقيقية. وفقًا لتقييم لجان التحكيم المستقلة، فإن هذا النموذج يتفوق بشكل ملحوظ على نماذج إنشاء الصوت التجارية الحالية. ويتميز بشكل خاص بقدرته على تقليل الضوضاء غير المرغوب فيها، والتزامن الدقيق بين الصوت والمشهد حتى في الفيديوهات ذات الحركة السريعة، مما يمنحه ميزة تنافسية فريدة.
يتوفر هذا النموذج عبر تطبيق ‘ميريلو ستوديو’، الذي يمكن للمستخدمين العاديين أيضًا الوصول إليه، بالإضافة إلى واجهة برمجة التطبيقات (API). يمكن للمستخدمين إنشاء نسخ مختلفة من الصوت باستخدام أوامر نصية، واختيار أفضل النتائج وإجراء تعديلات إضافية عليها. تم تصميم المنصة بحيث يمكن لغير المختصين في التقنية الوصول بسهولة إلى إنتاج الصوت باستخدام الذكاء الاصطناعي.
بناءً على هذا الاستثمار، بدأت ميريلو في تطوير نموذج الجيل التالي يتجاوز SFX 1.5. من المتوقع أن يعزز الخوارزمية الجديدة من تماسك الصوت واتصاله الطبيعي، مع هدف التوسع في مجالات إنتاج المحتوى عالي الجودة مثل الأفلام وألعاب الفيديو.
كما تستخدم الشركة عنقود حوسبة عالي الأداء يعتمد على معالجات GPU من NVIDIA H100 و H200 لتدريب النماذج، ويعمل هذا العنقود باستخدام نظام معالجة موزعة Slurm(. تعتمد إطار العمل على PyTorch)، وتستفيد بشكل نشط من وظيفة FSDP( Fully Sharded Data Parallel)، التي تم تحسينها لتدريب نماذج ضخمة بشكل موزع.
حاليًا، توظف ميريلو باحثين متخصصين في الذكاء الاصطناعي في مجالي diffusion( والتسلسل التلقائي (autoregressive)). ويمثل النموذج التلقائي بشكل خاص، والذي يتضمن بنية Transformer، تقنية مهمة في مجالات الذكاء الاصطناعي الصوتي، مثل إنشاء الموسيقى والنماذج اللغوية.
بناءً على التمويل الذي حصلت عليه، تخطط ميريلو لتعزيز فريق البحث والتطوير، وتوسيع منتجاتها، وتسريع دخولها السوق العالمية، بهدف أن تصبح رائدة في سوق الذكاء الاصطناعي لإنشاء الصوت.