«Інтернет помре, і тільки ми можемо його врятувати»

Перше джерело: Silicon Star People

Джерело зображення: створено Unbounded AI‌

**Скільки часу минуло з тих пір, як ви чули, як нова компанія каже, що вона збирається врятувати Інтернет? **

Здається, що сьогоднішні підприємці або мовчки заробляють гроші, або обговорюють використання ШІ для порятунку (або знищення) всього людства. В Інтернеті, в якому ми живемо щодня, здається, що його життя і смерть нікого не хвилюють.

І для Крі здавалося, що воно помре.

Коли я почув, як він сказав мені це під яскравим сонячним світлом Сан-Хосе, це здалося трохи сенсаційним. Але коли ви надовго перебуваєте з цим німцем із волоссям, як лев, його логічна та німецька англійська легко змусить вас подумати, що це справді велика проблема.

Крі Безенбрух є співзасновником і генеральним директором Deep Render. Простіше кажучи, те, що робить його компанія, це «використовує ШІ для стиснення розміру відеофайлів до дуже маленьких розмірів».

Він стверджує, що алгоритм у п’ять разів «кращий» за галузевий стандартний кодек HVEC, хоча він не уточнив, за яким показником, і може працювати в режимі реального часу на сучасних чіпсетах Qualcomm, Apple і Nvidia. «Кодек» означає програмне забезпечення, а іноді й апаратне забезпечення, яке може кодувати та декодувати дані, зазвичай для аудіо- чи відеоданих.

Деякі люди, які знайомі з Силіконовою долиною, можуть збентежитись, коли почують це, подумавши, що я переказую сценарій «Кремнієвої долини».У цій американській драмі, яка описується як ідеальний показ підприємницької екосистеми Кремнієвої долини, усі фарс тому, що головний герой розробив дивовижний алгоритм стиснення.

«Так, багато людей казали мені це. Ми дуже схожі на сопілкарів». Ця людина зі складним минулим, яка виросла в Німеччині, вивчала математику на бакалавраті, поїхала до Швейцарії навчатися в художній школі, а потім поїхала до у Великій Британії, щоб вивчати інформатику, і " Головний герой Річард у "Силіконовій долині" також має сильну ботанічну атмосферу, але на відміну від безглуздого процесу прориву алгоритму стиснення в телесеріалі та відсутності ділового здорового глузду в телесеріалі, Річард часто вагається. Його підприємливість така ж сувора, як розв’язування математичних завдань, і він дуже серйозно ставиться до компанії. Бізнес-модель також чітко продумана.

На його думку, Інтернет йде до знищення, і це найбільша проблема. Він хотів вирішити цю найбільшу проблему. Після аналізу вони вважали, що основна причина полягає в тому, що стара технологія не адаптувалася до нового світу:

*Після того, як відео стало популярним і стало основною формою спілкування в Інтернеті, ми фактично увійшли в новий світ. Світ, де масштаби даних стають дедалі жахливішими, і дороги назад немає. *

*Старі технології більше не підходять для цього нового світу. Продовження впроваджувати незначні інновації та вдосконалення тим самим старим шляхом призведе лише до глухого кута та, зрештою, до колапсу Інтернету. *

«Ми збираємося врятувати Інтернет, винайшовши нові алгоритми стиснення. І те, що робить це можливим, — це ШІ».

У цьому ключі Кріс заснував Deep Render у 2018 році разом зі своїми колегами-аспірантами у Великій Британії — він не належав до тих стартапів, які переслідували хвилю ChatGPT.

«Загалом, ми мало пов’язані з LLM. Це може бути пов’язано з дифузійною моделлю, але це більше стосується потенційних можливостей у майбутньому», — сказав він мені. «Ми почали з перших принципів і хотіли зрозуміти, для чого придатний штучний інтелект і суть стиснення. Зрештою, ми вважали, що метод, який повністю покладається на штучний інтелект, має бути новим технічним шляхом».

Однак «непосидючість» LLM насправді допомогла його компанії. «Тоді ми насправді грали в азартні ігри, тому що для досягнення наших цілей, окрім моїх власних алгоритмів, нам також потрібен був значний прогрес у програмному та апаратному забезпеченні. Тоді ми зробили прогноз, припускаючи, що всі ці основні технології можуть робити стрибки та І сьогодні все це сталося зараз, — сказав він мені, його тон був сповнений хвилювання.

— Може, нам просто пощастило.

**Виглядає дуже скромно, але він не сказав, що якщо його прогнози справдяться, його компанія може стати однією з найважливіших компаній у галузі Інтернет-технологій у людстві в найближчі кілька десятиліть. **Їхні технології будуть надаватися великим компаніям у формі ліцензії. Вирішуючи проблему пропускної здатності Інтернету, вони також стануть типом компаній, які збирають рахунки за комунальні послуги та податки.

Насправді все почало змінюватися.

З цього року ця компанія, яку ігнорували, увійшла до бачення Силіконової долини та відомих інвестиційних установ у всьому світі.Після завершення фінансування в березні Кріс почав зміщувати свою увагу на Кремнієву долину, де є гроші та люди які в них зацікавлені Великі клієнти.

Згідно з його заявою, їх нинішня невелика команда вже перевантажена, коли стикається з інтересом і попитом з боку «великих компаній, які неможливо назвати, але вони дуже важливі».

І він розповів мені, що якщо зараз усе піде добре, його технологія буде використана у дуже відомому сервісі додатків у другому кварталі 2024 року.

«Десятки мільйонів користувачів матимуть до нього доступ».

Китайський ринок, який має величезний попит на відео та стиснення даних, також почав з’являтися в різних формах перед цим генеральним директором, який не був у Китаї.

«У нас є багато друзів-інвесторів, які мають міцні зв’язки з Китаєм і допомагають деяким китайським компаніям зв’язатися з нами. Ми вже підтримуємо контакти з кількома найбільшими китайськими інтернет-компаніями», – сказав він. Ці вимоги виникли настільки раптово й бурхливо, що він провів півдня, ставлячи мені елементарні запитання про те, «як це — працювати з китайськими інтернет-компаніями?»

«Здається, якщо ви хочете врятувати Інтернет, ви не можете зробити це без китайського ринку», — сказав я йому напівжартома після того, як розповів цьому технологічному підприємцю, який провів більшу частину свого життя в Європі, історії про Схід, а також можливо.

«Ти маєш рацію», — відповів він з усмішкою. Але перш ніж думати про китайський ринок, він спочатку мав підкорити Кремнієву долину.

Наприкінці американської драми «Кремнієва долина» після шести років злетів і падінь компанію Річарда оцінили у 8 мільярдів доларів, однак лише за кілька днів до офіційного випуску продукту виявилося, що алгоритм стиснення був іншим. Штучний інтелект, який покращував мережу, покращував один одного і перетворювався на «монстра», якого вони не могли зрозуміти, але міг зламати всі системи. Зваживши це, вони нарешті вирішили «врятувати світ» - за допомогою чудового дурня, щоб змусити всіх зупинитися. У мене є думки щодо цього технічного шляху.

Це невдалий кінець для стартапу. Коли я підняв цю тему Крісу, якому наступного року буде шостий рік, як він відкриває бізнес, він трохи подумав, а потім лише посміхнувся і сказав:

«Сподіваюся, наш кінець буде кращим».

Нижче наведено стенограму розмови

З: Коротко представте себе та свою компанію.

A: Звичайно. Я Кріс Безенбрух, генеральний директор і співзасновник Deep Render. Те, що робить Deep Render, в основному стискає розмір відеофайлів і так далі до дуже, дуже маленького розміру. Нам потрібно це зробити тому, що дані в Інтернеті зростають експоненціально, і 90% даних було згенеровано за останні два роки. Їм потрібно подорожувати волоконно-оптичними мережами по всьому світу, що є дуже дорогою інфраструктурою в такому масштабі. Вся світова волоконно-оптична інфраструктура коштує 5 трильйонів доларів. Це незручно, тому що якщо дані подвоюються кожні два роки, що це означає для інфраструктури, вони також повинні подвоїтися. Але це трильйонне подвоєння. Це неможливо. Це причина, чому я це роблю.

Ідея полягає в тому, що якщо ми не можемо зробити конвеєр більшим і швидшим, ми зробимо дані в конвеєрі меншими. Отже, це вказувало на стиснення. Це наш фундамент і бачення.

З: Отже, ви спочатку зробили висновок про одну з головних проблем, з якими сьогодні стикається Інтернет, знайшли її вирішення, а потім використали його, щоб визначити свій підприємницький напрямок.

A: Так, це все. Тому що без набагато кращого методу стиснення весь Інтернет незабаром зазнає краху. І я люблю Інтернет, і я хочу його продовжувати.

З: Тож у чому різниця між вашою технологією, оскільки стиснення — це не нова річ, вона існує вже давно, і люди навіть звикли до неї та забули про її існування. Можливо, ви могли б описати свою технологію термінами, зрозумілими дурню.

A: Ха-ха-ха, я докладу всіх зусиль. Нам потрібно поглянути на всю галузь за останні 60 років. Коли з’явилася традиційна технологія стиснення, це був величезний прорив. Усе ґрунтувалося на DCT* (DCT означає дискретне косинусне перетворення, яке ділить зображення на компоненти, що складаються з різних частоти. Невеликі блоки. Під час процесу квантування високочастотні компоненти відкидаються, а решта низькочастотних компонентів зберігаються та використовуються для подальшої реконструкції зображення. Примітка редактора)*, цей метод, який робить можливою сучасну технологію стиснення відео, був винайдений у у 1970-х і 1980-х роках або близько того, і після цього він домінував у галузі. **Але з тих пір ця технологія лише трохи вдосконалювалася кожні 10 років, і це завжди була та сама технічна ідея. Ми не можемо очікувати, що технологія досягне реального стрибка, просто повторюючи одну і ту ж ідею сотні разів. **Це чудова технологія, але її інноваційний цикл закінчився або закінчується.

Тому нам потрібно щось нове. І це «нове» — ШІ. Оскільки штучний інтелект може дуже добре обробляти зображення та відео, це не є немислимим шляхом. Тож технологія ШІ та технологія стиснення почали поєднуватися. Після цього було дві хвилі.Перша відбулася в 2017 році, коли з’явилася супер-роздільна здатність і її винайшли Magic Pony.Їхня ідея полягала в тому, щоб зберегти традиційний метод стиснення в середині конвеєра та додати AI спереду та ззаду.

**Deep Render не вважає, що це правильний підхід. Тому що в ньому залишилася традиційна технологія стиснення, яка, на нашу думку, повністю зруйнована. Це не дуже змінилося в порівнянні з тим, що було раніше, і воно все ще малокорисне. **

Ми перебуваємо на другій хвилі, повністю відмовляючись від традиційної технології стиснення та використовуємо лише нейронні мережі. Це також означає заново винайти стиснення. Заново винайдено стиснення навколо технології машинного навчання має найвищий ефект. Нейронна мережа отримує дані та стискає файл. Надішліть його в Інтернет, і мережа отримає стиснений файл і поверне відео вам. Це рішення лише для ШІ. Ми лідируємо, і фактично ми єдина компанія, яка цим займається.

П: Отже, по суті, ви використовуєте ШІ, щоб замінити частину, за яку відповідає традиційна технологія, тож чому ШІ може зробити це краще?

A: Дві причини. Відео або стиснення відео – це, по суті, компроміс між розміром файлу та якістю зображення. У вас або дуже великі файли та гарне відео, або дуже маленькі файли з поганою чіткістю. Отже, гарне стиснення – це хороші компроміси. З точки зору розміру файлу, ключовим моментом є надмірність. Якщо ви можете передбачити, яким буде наступний піксель, вам не потрібно надсилати зайві дані, що зберігає розмір файлу. Саме тут штучний інтелект може робити кращі прогнози. Якщо прогноз правильний, надлишковість можна видалити й отримати менше даних. І штучний інтелект принципово сильніший, тому що він реагує на дані.

Друге стосується якості відео. Будь-який алгоритм стиснення створює помилки у відеовиході, це визначення стиснення з втратами, приймаючи деякі помилки заради менших розмірів файлів. Але що дійсно важливо для людей, так це розподіл цих помилок. Ми більш чутливі до одних і можемо бути добре з іншими. **Тож наш ШІ імітує зорову систему людини, щоб ці помилки були приховані від людей. **

Чудовим прикладом є те, що люди ненавидять, коли лінії стають розмитими.Люди почуваються нещасними, коли гостра лінія стає розмитою, оскільки це біологічно зумовлено. Наприклад, коли тигр починає рухатися з-за скелі, ми повинні мати можливість його побачити, і ми будемо дивитися на нього. Точність кольору не гарантується, і ніхто насправді не помічає, якщо є втрата. Таким чином, ви можете віддати певну точність кольору без розмивання країв. Люди віддають перевагу цій якості відео.

Наша ідея полягає в тому, щоб завжди починати з перших принципів, що є розумним, які математичні принципи лежать в основі цього та які інструменти можна використовувати для вирішення реальних проблем. AI є найбільш підходящим інструментом для цього.

З: Це дуже цікаво, тож це найпростіша ідея, а наступним кроком є реалізація. Чи вплинули на вас, як на компанію п’ятирічної давності, сьогоднішні зміни ШІ?

A: На рівні програмного забезпечення ми фактично завжди були вкорінені в науковому колі, і наші програмні продукти походять із дослідницького кола. Сьогоднішні зміни в штучному інтелекті мало впливають на нас. Я беру участь у цих дослідницьких колах з 2015 року, коли почалася революція ШІ.

Навпаки, апаратний рівень насправді свіжіший. У нас є чудова технологія стиснення на рівні програмного забезпечення, але раніше вона працювала лише в хмарі, тому це була хороша тема дослідження, а не продукт. **Тільки коли він потрапляє в кожен термінал, щоб мільйони людей могли використовувати його на своїх власних пристроях, він стає продуктом. **

Тому ми фактично зробили ставку на майбутні технологічні зміни.Крім того, що штучний інтелект буде ефективним, ми також зробили ставку на те, що з’явиться необхідне обладнання, спеціальне обладнання для прискорення штучного інтелекту, таке як NPU, і різні апаратні мікросхеми від Apple, Qualcomm. , і Google. **Ми зробили ставку на 2018 рік, а сьогодні маємо на 2023 рік. **

**Або у нас був хороший краєвид, або нам просто пощастило. **

З: І ці великі виробники апаратного забезпечення також зацікавлені вами.

A: **Так, оскільки вони мають це обладнання, вони почали шукати програми-вбивці. Ми підійшли до них і сказали: привіт, усі дивляться відео, це вбивча програма, яку ви хочете. Цей час також дуже підходить. **

З: Окрім алгоритмів, коли ми раніше спілкувалися, ви згадали, що дані також є порогом, але, очевидно, великі компанії мають більше даних, чи буде це проблемою?

A: Дуже цікаве запитання. (Споглядання) Я думаю, що зі стисненням штучного інтелекту зрештою буде виявлено, що алгоритм є важливішим. Тому що я не думаю, що галузь у цілому достатньо зріла, щоб вимагати рішень щодо якості даних.

З: Отже, це запитання другої фази.

A: Так, це все ще на першому етапі. Ми не можемо сказати, що у нас ідеальний алгоритм. Наш алгоритм робить великий прогрес щомісяця та змінюється дуже, дуже швидко. Коли алгоритм сильний, це дані. Але ми також накопичуємо, тому що дані мають меншу віддачу. Зараз у нас є один-два мільйони відеопослідовних даних, які ми отримуємо з відкритих джерел і перевірених каналів або купуємо на веб-сайтах із відео. На даний момент вони досить відкриті, але кожен бачить що ChatGPT змінює ступінь відкритості, нам пощастило, що ми придбали ці дані раніше Це також є перевагою, але це не справді вирішальна перевага на даному етапі.

З: Чи привносять LLM і дифузійні моделі щось нове у ваш алгоритм?

A: Їх відносно небагато. Є деякі ідеї, які можна використати для довідки. Проблема в тому, що ці моделі, здається, можуть увійти в наш процес і принести нам покращення. Наприклад, Stable Diffusion може допомогти мені покращити можливості стиснення, але все ще є компроміси - наприклад, SD обробляється раз на 10 секунд, але нам потрібно обробити його 300 разів за 10 секунд. Як вибрати між реальним часом і ефектами, є проблемою. Вони мають потенціал вплинути в майбутньому.

П: Якщо поглянути на це з конкурентної точки зору, звідки виникають ваші поточні виклики?

A: Алгоритм, а потім люди, які за ним стоять. Ми самі вивчаємо багато основних алгоритмів, тому що не так багато паперів для читання. Найважливішим завданням є сформувати хорошу команду,** тому що на ринку багато людей вивчають штучний інтелект, не так багато людей, які вивчають теорію інформації, і майже нуль людей, які вивчають те й інше одночасно. Тож нам потрібно об’єднатися та навчити їх, що займає багато часу**, оскільки вони не мають багато спільного одне з одним. Отже, спочатку потрібно навчити групу людей, а потім дозволити їм керувати людьми, які знаходяться нижче. Це пірамідальна структура.

З: Ви вже побудували цю піраміду?

A: у нас є понад 30 суперзірок досліджень ШІ. Але ми витратили на це дуже багато часу.

З: Отже, з вами тут лише 30 людей у світі.

A: Я б так сказав. Також є кілька лабораторій, які займаються цими темами, і в них є хороші люди, але Deep Render є найбільшою організацією в цій галузі з точки зору масштабу.

З: Я бачив, що ви згадали про використання нещодавнього нового фінансування для розширення свого бізнесу та присутності в Кремнієвій долині.

A: Це трохи дивно, ми британська компанія, але найбільше інтернет-ресурсів використовують компанії Китаю та США. Крім того, Європа справді не є дружнім місцем для технологічного розвитку. У нас великий попит з боку Сполучених Штатів, тому природно потрапити в США, і те саме стосується Китаю.

З: чи зверталися до вас китайські клієнти?

A: Я не можу назвати ім’я, я підписав довгу-довгу угоду, тому мушу бути обережним, ха-ха. Але коли я зв’язався з цими компаніями, я виявив, що Китай справді має вищі вимоги до пропускної здатності, ніж Сполучені Штати.

З: Ви вже спілкуєтеся з клієнтами. Якщо судити з PMF, який люди люблять обговорювати, на якому етапі ви зараз?

A: Це завжди важко визначити. Я б вважав, що ми досягли PMF, тому що у нас більше попиту, ніж ми можемо впоратися. Ми справді відмовляємо багатьом великим компаніям, тому що наших власних ресурсів пропускної здатності недостатньо. Багато компаній замовили нас, і ми можемо обслуговувати потреби лише 4-5 великих компаній одночасно. Коли технологія стане більш зрілою, комерціалізація стане легшою. Ми пройшли етап підтвердження концепції. Якщо все піде добре, у другому кварталі 2024 року ви побачите, як наша технологія буде застосована до дуже відомого Інтернет-сервісу, і до того часу нею будуть користуватися десятки мільйонів користувачів.

З: Зіштовхнувшись із шаленим попитом, обмеженою робочою силою та вашим власним технічним станом, ви, як генеральний директор, зобов’язані приймати зважений вибір.

З: Ха-ха, це виклик моєї роботи. Я спробую прийняти рішення. Занадто швидкий рух завжди споживає ресурси, а підбір персоналу спричиняє труднощі.Нашим співробітникам зазвичай потрібно 4 місяці навчання, перш ніж вони зможуть працювати продуктивно. Отже, ви маєте рацію, це проблема оптимізації. Звичайно, я можу заплатити за когось, хто використовує ШІ для розробки інструменту.

З: Ха-ха, можливо, LLM може взяти участь тут.

В: Так, ха-ха-ха.

З: Здається, все йде добре. Яку бізнес-модель ви розробили для цього бізнесу?

A: Зараз ми працюємо у формі B2B. Ми надаємо клієнтам авторизацію продуктів. Клієнти можуть заощадити багато грошей, і частину їх можна передати нам. Це бізнес-модель, заснована на ліцензуванні. Якщо ви подивитеся на дані тут, це справді божевілля.До 2030 року вартість передачі контенту в усьому світі сягне 125 мільярдів доларів. **Якщо ви хочете знищити Netflix, використовуйте 4K і дивіться Netflix 24 години на добу протягом місяця. **

З: Краще цього не робити.

A: Ха-ха-ха, але якщо ви зможете зменшити розмір файлу, скажімо, на 90%, то виходячи з 125 мільярдів доларів, компанії зможуть заощадити багато грошей.

З: Це ваш шанс заробити гроші.

A: Це бізнес, від якого виграють усі. Переміг я, виграла компанія, виграли користувачі, виграли великі інтернет-компанії. Ніхто нічого не втрачає.

З: А як щодо збереження Інтернету? Чи уявляли ви коли-небудь, як виглядатиме Інтернет майбутнього, який ваша компанія допоможе побудувати?

З: Звичайно, я мрію про це щодня, ха-ха-ха. **Наше бачення полягає в тому, щоб перетворити пропускну спроможність на необмежений товар, щоб усім більше не доводилося турбуватися про швидкість мережі. Кожен може насолоджуватися відео надзвичайно високої якості вдома, а для компаній – дуже дешево або навіть безкоштовні Інтернет-ресурси Інформація може надходити, навіть дані, які сьогодні вважаються важкими, можуть надходити вільно. Це майбутнє, яке мало бути в Інтернеті. **

З: Я впевнений, що багато людей задавали вам це останнє запитання. Розмова про це ще більше викликала у мене відчуття, що історія в американському серіалі «Кремнієва долина» здається такою ж, як ваша.

A: Правильно, правильно. Це майже моє улюблене шоу. Але що насправді цікаво, це те, що ми з моїми співзасновниками не знали про Deep Render лише через півтора року після того, як ми його заснували, тому що HBO не був таким популярним у Великобританії. Але що цікаво, наша бізнес-модель і етапи, через які ми пройшли, майже такі ж, як історія в цій виставі. Тим паче, що ми побачили це пізніше, ми обоє сказали, зачекай, це як ми.

З: Ви також знаєте закінчення цієї драми.

A:... Ха-ха-ха, я сподіваюся, що наш кінець кращий.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити