Perceptron перетворює невикористану пропускну здатність на дані для навчання ШІ.

Сектор штучного інтелекту наразі стикається з серйозним вузьким місцем у навчальних даних, особливо тому, що централізовані технологічні монополії блокують доступ ранніх розробників до високоякісних інформаційних каналів. Децентралізована платформа інфраструктури даних Perceptron намагається вирішити це структурне вузьке місце, розгортаючи децентралізований інфраструктурний шар, який збирає веб-інформацію через повсякденні пристрої користувачів.

Підсумок

  • Perceptron використовує невикористану пропускну здатність споживачів для збору загальнодоступних веб-даних і надання дешевших наборів даних для навчання ШІ.
  • Платформа стверджує, що її мережа охоплює понад 150 країн і винагороджує учасників, перевіряючи якість даних перед тим, як постачати їх корпоративним клієнтам.
  • Perceptron запустив фонд даних для ШІ на 10 мільйонів доларів, щоб допомогти розробникам отримати доступ до інфраструктури даних і прискорити розробку моделей ШІ.

Сучасні медіа повністю зосереджені на висвітленні того, як провідні імена в галузі штучного інтелекту постійно розгортають новітні апаратні системи для нарощування своєї обчислювальної потужності. Але одним із найменш обговорюваних операційних обмежень є якість навчальних даних, які становлять основу будь-якої функціональної моделі ШІ.

Проблема в тому, що оскільки переважна більшість відкритого веб-контенту вже ретельно зібрана, агресивний корпоративний контроль над загальнодоступними інтерфейсами прикладного програмування заблокував решту основ збору наборів даних за непомірно дорогими багатомільйонними платними стінами. Це фактично стало надзвичайно дорогим ексклюзивним привілеєм для кількох величезних технологічних монополій.

Для технологічних гігантів, які зараз лідирують у перегонах ШІ, забезпечення цих дорогих інформаційних каналів не є великим фінансовим викликом, але як щодо недофінансованих новаторів? Без необхідних бюджетів стартапи на ранніх стадіях залишаються безпорадними у спробах створювати конкурентоспроможні продукти.

«OpenAI платить приблизно від 60 до 100 мільйонів доларів на рік таким компаніям, як Reddit і Twitter, щоб мати доступ до даних через API», — розповів crypto.news під час нещодавнього інтерв’ю співзасновник і генеральний директор Perceptron Пітер Ентоні.

«Багато нових проектів ШІ не мають бюджетів, щоб витратити від 60 до 100 мільйонів доларів на доступ до даних. Якщо ви побудуєте найкращу модель у світі, вона буде марною, якщо не матиме доступу до якісних даних. Ви можете бути найрозумнішою дитиною в школі, але якщо ви не маєте доступу до книжок, у вас насправді не так багато інформації для представлення.»

Ентоні зрозумів, що ця ринкова асиметрія залишає місце для альтернативної інфраструктури, яка б обслуговувала незалежний сегмент ринку, що зрештою привело його до співзаснування Perceptron, платформи, яка планує використовувати невикористану пропускну здатність споживачів для вирішення «проблеми вузького місця даних», від якої зараз страждає ШІ.

«Більшість даних у світі вже отримано та зібрано, але багато даних ховаються в різних місцях, які ще не доступні, тому ми збираємо дані та позиціонуємо себе, щоб мати можливість надавати дані компаніям ШІ за зниженою ціною», — пояснив Ентоні.

Збір невикористаної пропускної здатності

Але що це за невикористана пропускна здатність, яку планує використовувати Perceptron? Ентоні пояснив, що це невизнаний економічний актив, який звичайні користувачі постійно створюють у процесі звичайного цифрового перегляду, а потім спостерігають, як великі корпорації його експлуатують і отримують прибуток.

«Зараз щоразу, коли ви і я використовуємо Інтернет на наших телефонах, комп’ютерах, ми генеруємо дані. Ці дані збираються, упаковуються у величезні набори даних такими компаніями, як Google, і продаються за мільйони, іноді мільярди доларів. Проте ви і я ніколи не бачимо ні цента цієї цінності.»

Perceptron повністю перевернув цю експлуатаційну модель. Вони побудували мережу, яка охоплює понад 150 країн і налічує приблизно 800 000 вузлів, і ці вузли живляться окремими користувачами, які просто запускають розширення браузера в Chrome або додаток на своїх пристроях Android.

Хоча ці кінцеві установки не збирають приватні цифрові файли та не надають компанії конфіденційні особисті телеметричні дані, вони натомість забезпечують локалізовані географічні перспективи, які Ентоні описав як «різні точки зору» на відкритий веб, які потім можна витягувати невеликими частинами та об’єднувати в один значущий набір даних.

«Дуже важливо зосередитися на тому, що ми не використовуємо особисті дані людей, ми не отримуємо доступ до ваших особистих даних та інформації, але, скажімо, ви зараз у Малаві. Коли ви переглядаєте певний веб-сайт, я можу піти та подивитися той самий сайт, але, швидше за все, оскільки я в Дубаї, ми побачимо різний набір результатів. Усе, що ми отримуємо з цієї ситуації, — це можливість використовувати ваш комп’ютер, щоб подивитися на щось, як-от звичайна веб-сторінка, або щось інше.»

Для ілюстрації Ентоні зазначив, що якщо корпоративному клієнту потрібен набір даних публікацій у соціальних мережах, пов’язаних із охороною здоров’я, зі США, Perceptron може координувати роботу своєї глобальної сітки вузлів, щоб витягувати окремі публічні публікації, не взаємодіючи з обмежувальними корпоративними API.

Оскільки ці дані вже вільно доступні широкій публіці через будь-який стандартний веб-браузер, маршрутизація збору через окремі кінцеві вузли юридично обходить комерційні платні стіни. Як тільки ці невеликі пакети даних отримані, мережа передає необроблені дані назад на централізований сервер, де спеціалізовані моделі штучного інтелекту очищають і перевіряють інформацію на контроль якості.

«Роблячи це, ми можемо значно знизити витрати, які зараз стягують багато великих централізованих компаній, як-от Google.»

Завдяки економічному циклу, який стимулює якісних учасників мережі

Наступне питання: чому хтось добровільно надасть своє обладнання такій мережі? Відповідь проста — спільний цикл цінності, який гарантує, що ці вузли отримують бали за свою пасивну підключеність, які згодом планується конвертувати в нативні крипто-токени.

За словами Ентоні, ця розподілена модель «дозволить їм заробляти бали», які є прямим показником їхнього внеску в мережу, і тому «щоразу, коли компанія генерує дохід, токени будуть повертатися в екосистему», щоб підтримувати циклічний економічний цикл.

«Також будуть виділені токени, які використовуватимуться для викупу токенів», — додав він.

Однак не всі, хто запускає вузол, отримують постійні винагороди, оскільки існує постійна проблема контролю якості, яка може поставити під загрозу цілісність набору даних, якщо її не контролювати.

Perceptron вирішує це, повертаючи зібрані пакети на централізований сервер, де автоматизовані алгоритми систематично оцінюють вхідні дані на відповідність цільовим показникам, перш ніж виплачувати будь-яку компенсацію.

Крім того, Ентоні сказав, що стартап нещодавно придбав компанію, яка спеціалізується на програмному забезпеченні для верифікації транзакцій та платежів, щоб структурно автоматизувати цей процес перевірки.

Щоб ще більше залучити учасників мережі та водночас стимулювати створення наборів даних, Perceptron також планує запустити структуровану платформу даних під назвою Data Questing, яка дозволить учасникам перетворювати активні людські зусилля на унікальні навчальні вхідні дані.

«Ми прагнемо ефективно будувати набори даних і створювати набори даних, які наразі недоступні через централізовані процеси», — додав Ентоні.

Кінцева мета

У довгостроковій перспективі Ентоні сказав, що хотів би бачити перехід мережі до моделі, орієнтованої на бізнес-аналітику, здатної надавати глибокий рівень аналітики для корпоративних клієнтів.

«Різниця в тому, що традиційні набори даних статичні, вони збираються один раз і швидко застарівають. Але величезна кількість даних генерується щоразу, коли ви взаємодієте з чимось онлайн, і зараз більша частина з них просто витрачається даремно», — сказав Ентоні.

«Один сервер, який намагається відстежувати всіх цих різних користувачів, не може зібрати значущу аналітику в такому масштабі. Нам потрібен перехід до розподіленої бізнес-аналітики, щоб ми могли фактично покращувати послуги в таких сферах, як електронна комерція, торгівля та багато іншого.»

Perceptron також запустив фонд даних для ШІ на 10 мільйонів доларів, через який платформа планує фінансувати незалежних розробників та підтримувати розгортання «фактичних проектів, які надають реальні послуги». За умовами програми, відібрані інженерні команди отримують п'ять тижнів спеціалізованої допомоги з інфраструктури даних і до 5 ТБ реальних даних безкоштовно для прискорення оптимізації моделей ШІ на ранніх стадіях.

«Мета — підтримувати проекти, коли вони ростуть і їхні потреби в даних збільшуються. Ми можемо стати одним із їхніх постачальників, це як інвестиція в ширшу екосистему, так і спосіб для нас побудувати стабільний довгостроковий дохід», — зазначив Ентоні.

На момент публікації Ентоні сказав, що Perceptron вже активно постачає різноманітні продукти даних різним комерційним підприємствам. Мережа надає великі набори зображень платформам генерації тексту у відео, включаючи компанію під назвою Everlyn AI, для навчання моделей точному синтезу візуального контенту.

Крім того, проект виходить за рамки стандартного збору зображень, оскільки платформа увійшла в сектор аналізу настроїв, відстежуючи публічні дискусії на Twitter, YouTube і ринках цифрових активів. Аналіз цих публічних настроїв допомагає крипто-фірмам і біржам створювати інструменти відстеження, які дають ранні сигнали для запобігання раптовим коливанням цін.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріплено