“A Internet vai morrer e só nós podemos salvá-la”

Fonte original: Silicon Star People

Fonte da imagem: gerada por Unbounded AI‌

**Há quanto tempo você não ouve uma empresa iniciante dizer que vai salvar a Internet? **

Os empreendedores de hoje parecem estar a ganhar dinheiro silenciosamente ou a discutir a utilização da IA para salvar (ou destruir) toda a humanidade. Na Internet em que vivemos todos os dias, parece que ninguém se preocupa com a sua vida ou morte.

E para Chris, parecia que ia morrer.

Quando o ouvi dizer isso para mim sob o sol forte de San José, pareceu um pouco sensacional. Mas quando você fica muito tempo com esse alemão com cabelo de leão, seu inglês lógico e de estilo alemão facilmente fará você pensar que isso é realmente um grande problema.

Chri Besenbruch é cofundador e CEO da Deep Render. Simplificando, o que sua empresa está fazendo é “usar IA para compactar o tamanho dos arquivos de vídeo em tamanhos muito pequenos”.

Ele afirma que o algoritmo é até cinco vezes “melhor” que o codec padrão da indústria HVEC, embora não tenha especificado qual métrica, e pode ser executado em tempo real em chipsets modernos da Qualcomm, Apple e Nvidia. Um "codec" refere-se a software e, às vezes, hardware que pode codificar e decodificar dados, geralmente para dados de áudio ou vídeo.

Algumas pessoas que conhecem o Vale do Silício podem ficar confusas ao ouvir isso, pensando que estou recontando o roteiro do "Vale do Silício".Neste drama americano, que é descrito como uma exibição perfeita do ecossistema empreendedor do Vale do Silício, todos a farsa é porque o protagonista desenvolveu um algoritmo de compressão incrível.

"Sim, muitas pessoas me disseram isso. Nós nos parecemos muito com flautistas." Essa pessoa com uma formação complexa que cresceu na Alemanha, estudou matemática na graduação, foi para a Suíça para estudar arte e depois foi para o Reino Unido para estudar ciência da computação, e " O protagonista Richard em "Silicon Valley" também tem uma forte atmosfera nerd, mas ao contrário do ridículo processo de descoberta do algoritmo de compressão na série de TV e da falta de bom senso comercial na série de TV, Richard é muitas vezes hesitante. Seu empreendedorismo é tão rigoroso quanto a resolução de problemas matemáticos e ele leva a empresa muito a sério. O modelo de negócios também é claramente pensado.

Na sua opinião, a Internet caminha para a destruição e esse é o maior problema. Ele queria resolver este maior problema. Após uma análise, eles acreditaram que a causa raiz era que a tecnologia antiga não se adaptava ao novo mundo:

*Depois que o vídeo se tornou popular e se tornou a principal forma de comunicação na Internet, entramos em um novo mundo. Um mundo onde a escala dos dados está se tornando cada vez mais assustadora e não há como voltar atrás. *

*As tecnologias antigas já não são adequadas para este novo mundo. Continuar a fazer pequenas inovações e melhorias ao longo do mesmo velho caminho só levará a um beco sem saída e, em última análise, ao colapso da Internet. *

“Vamos salvar a Internet inventando novos algoritmos de compressão. E o que torna isso possível é a IA.”

Nessa linha, Chris fundou a Deep Render em 2018 com seus colegas estudantes de pós-graduação no Reino Unido – ele não era uma daquelas startups que perseguiam a onda ChatGPT.

"Basicamente, temos pouco a ver com o LLM. Pode estar relacionado ao modelo de difusão, mas tem mais a ver com possibilidades potenciais no futuro", ele me disse. "Começamos com os primeiros princípios e queríamos entender para que a IA é adequada e a essência da compressão. Em última análise, acreditamos que um método que depende inteiramente da IA deve ser um novo caminho técnico."

No entanto, a “inquietação” da LLM na verdade ajudou a sua empresa. “Na verdade, estávamos jogando na época, porque para atingir nossos objetivos, além dos meus próprios algoritmos, também precisávamos de um progresso significativo em software e hardware. Fizemos uma previsão na época, assumindo que todas essas tecnologias básicas poderiam dar saltos e limites. E hoje tudo isso aconteceu agora." Ele me disse, seu tom cheio de entusiasmo.

"Talvez tenhamos apenas sorte."

**Parece muito humilde, mas o que ele não disse é que se suas previsões se concretizarem, sua empresa poderá ser uma das mais importantes empresas de tecnologia de Internet da humanidade nas próximas décadas. **Sua tecnologia será fornecida a grandes empresas sob forma licenciada. Ao mesmo tempo em que resolverão o problema da largura de banda da Internet, eles também se tornarão o tipo de empresa que arrecada contas de serviços públicos e impostos.

Na verdade, tudo começou a mudar.

Desde este ano, esta empresa que tem sido ignorada entrou na visão do Vale do Silício e de instituições de investimento conhecidas em todo o mundo.Depois de concluir um financiamento em março, Chris começou a mudar seu foco para o Vale do Silício, onde há dinheiro e pessoas que estão interessados neles. Grandes clientes.

Segundo seu depoimento, sua atual pequena equipe já está sobrecarregada diante do interesse e da demanda de “grandes empresas que não podem ser nomeadas, mas são muito importantes”.

E ele me revelou que se tudo correr bem agora, sua tecnologia será utilizada em um serviço de aplicação muito conhecido no segundo trimestre de 2024.

"Dezenas de milhões de usuários terão acesso a ele."

O mercado chinês, que tem uma enorme procura por compressão de vídeo e dados, também começou a aparecer de diversas formas diante deste CEO que não esteve na China.

"Temos muitos amigos investidores que têm fortes laços com a China e estão ajudando algumas empresas chinesas a entrar em contato conosco. Já estamos em contato com várias das maiores empresas de Internet da China", disse ele. Essas demandas surgiram de forma tão repentina e violenta que ele passou meio dia me fazendo perguntas básicas sobre "como é trabalhar com empresas chinesas de Internet?"

“Parece que se você quiser salvar a Internet, não poderá fazê-lo sem o mercado chinês.” Eu disse a ele, meio brincando, depois de contar a esse empresário de tecnologia que passou a maior parte de sua vida na Europa histórias sobre o Oriente, tanto quanto possível.

“Você está certo.” Ele respondeu com um sorriso. Mas antes de pensar no mercado chinês, ele primeiro teve que conquistar o Vale do Silício.

No final do drama americano "Silicon Valley", a empresa de Richard foi avaliada em US$ 8 bilhões após seis anos de altos e baixos, mas poucos dias antes do lançamento oficial do produto, eles descobriram que o algoritmo de compressão era diferente daquele que eles desenvolveram. A IA que melhorou a rede melhorou-se mutuamente e se transformou em um "monstro" que eles não conseguiam entender, mas que poderia romper todos os sistemas. Depois de pesar, eles finalmente decidiram "salvar o mundo" - usando um tolo lindo para fazer todo mundo parar. Tenho ideias sobre essa rota técnica.

Este não é um bom final para uma startup. Quando levantei esse assunto para Chris, que completará seu sexto ano de abertura de empresa no próximo ano, ele pensou um pouco, depois apenas sorriu e disse:

"Espero que nosso final seja melhor."

A seguir está uma transcrição da conversa

P: Apresente-se brevemente e apresente sua empresa.

R: Claro. Sou Chris Besenbruch, CEO e cofundador da Deep Render. O que o Deep Render está fazendo é basicamente compactar o tamanho dos arquivos de vídeo e assim por diante para um tamanho muito, muito pequeno. A razão pela qual precisamos de fazer isto é porque os dados na Internet estão a crescer exponencialmente e 90% dos dados foram gerados nos últimos dois anos. Eles precisam viajar através de redes de fibra óptica ao redor do mundo, o que é uma infra-estrutura muito cara nesta escala. Toda a infra-estrutura de fibra óptica do mundo custa 5 biliões de dólares. Isso não é confortável porque se os dados duplicarem a cada dois anos, o que isso significa para a infra-estrutura, também precisam de duplicar. Mas esta é uma duplicação do nível de um trilhão. Isto é impossível. Esta é a razão pela qual faço isso.

**A ideia é que, se não conseguirmos tornar o pipeline maior e mais rápido, tornaremos os dados no pipeline menores. Então apontou para compressão **. Esta é a nossa base e visão.

P: Então você primeiro deduziu um dos principais problemas enfrentados pela Internet hoje, descobriu sua solução e depois a usou para determinar sua direção empreendedora.

R: Sim, é isso. Porque sem um método de compressão muito melhor, toda a Internet entrará em colapso em breve. E adoro a Internet e quero continuar com ela.

P: Qual é a diferença entre a sua tecnologia, porque a compressão não é uma coisa nova, ela já existe há muito tempo e as pessoas até se acostumaram e esqueceram que ela existe. Talvez você possa descrever sua tecnologia em termos que um tolo possa entender.

A: Hahaha, vou tentar o meu melhor. Precisamos olhar para toda a indústria dos últimos 60 anos. Quando a tecnologia de compressão tradicional foi lançada, foi um grande avanço. Tudo foi baseado em DCT* (DCT significa Discrete Cosine Transform, que divide a imagem em componentes compostos de diferentes frequências. Pequenos blocos. Durante o processo de quantização, os componentes de alta frequência são descartados e os componentes de baixa frequência restantes são salvos e usados para posterior reconstrução da imagem. Nota do editor)*, este método que torna possível a tecnologia atual de compressão de vídeo foi inventado em nas décadas de 1970 e 1980 ou mais, e dominou a indústria a partir de então. **Mas desde então, esta tecnologia só melhorou um pouco a cada 10 anos e sempre foi a mesma ideia técnica. Não podemos esperar que uma tecnologia alcance um salto apenas repetindo a mesma ideia centenas de vezes. **É uma ótima tecnologia, mas seu ciclo de inovação terminou ou está terminando.

Então precisamos de algo novo. E esse “novo” é a IA. Como a IA pode lidar muito bem com imagens e vídeos, esse não é um caminho impensável. Assim, a tecnologia de IA e a tecnologia de compressão começaram a ser combinadas. Houve duas ondas depois disso. A primeira aconteceu em 2017, quando a super-resolução apareceu e a Magic Pony a inventou. A ideia deles era manter o método tradicional de compressão no meio do pipeline e adicionar IA na frente e atrás.

**Deep Render não acredita que esta seja a abordagem correta. Porque o que resta é a tecnologia de compressão tradicional que acreditamos ter entrado em colapso total. Não muda muito em relação ao que veio antes e ainda é pouco útil. **

Somos a segunda onda, abandonando completamente a tecnologia de compressão tradicional e usando apenas redes neurais. Isso também significa reinventar a compressão. A compressão reinventada em torno da tecnologia de aprendizado de máquina tem o maior efeito. A rede neural obtém os dados e compacta o arquivo. Enviar para a Internet, e a rede recebe o arquivo compactado e devolve o vídeo para você. Esta é uma solução apenas de IA. Estamos liderando o ataque e, na verdade, somos a única empresa que faz isso.

P: Então, basicamente, você está usando IA para substituir a parte pela qual a tecnologia tradicional é responsável. Então, por que a IA pode fazer isso melhor?

R: Dois motivos. A compactação de vídeo ou vídeo é essencialmente uma compensação entre o tamanho do arquivo e a qualidade da imagem. Você tem arquivos muito grandes e vídeos de ótima aparência ou arquivos muito pequenos com definição ruim. Portanto, uma boa compressão envolve boas compensações. Em termos de tamanho de arquivo, a chave é a redundância. Se você puder prever qual será o próximo pixel, não será necessário enviar dados redundantes, o que economiza o tamanho do arquivo. É aqui que a IA pode fazer melhores previsões. Se a previsão for boa, a redundância pode ser removida e menos dados podem ser recebidos. E a IA é fundamentalmente mais forte porque reage aos dados.

A segunda é sobre a qualidade do vídeo. Qualquer algoritmo de compactação irá introduzir erros na saída de vídeo, esta é a definição de compactação com perdas, aceitando alguns erros em prol de tamanhos de arquivo menores. Mas o que realmente importa para o ser humano é a distribuição desses erros: somos mais sensíveis a alguns e podemos ficar bem com outros. **Portanto, nossa IA imita o sistema visual humano para que esses erros fiquem ocultos dos humanos. **

Um ótimo exemplo é que as pessoas odeiam quando as linhas ficam borradas. As pessoas se sentem infelizes se uma linha nítida fica borrada porque isso é determinado biologicamente. Por exemplo, quando um tigre começa a se mover por trás de uma pedra, precisamos ser capazes de vê-lo e ficar olhando para ele. A precisão da cor não é garantida e ninguém percebe se há perda. Assim, você pode fornecer alguma precisão de cores sem desfocar as bordas. As pessoas preferem essa qualidade de vídeo.

Nossa ideia é sempre partir dos primeiros princípios, o que é razoável, quais são os princípios matemáticos por trás disso e quais ferramentas podem ser usadas para resolver problemas reais. Acontece que a IA é a ferramenta mais adequada para isso.

P: É muito interessante, então esta é a ideia mais básica, e o próximo passo é a execução. Como uma empresa com cinco anos de existência, as mudanças atuais na IA têm algum impacto sobre você?

R: No nível de software, sempre estivemos enraizados no círculo de pesquisa, e nossos produtos de software vêm do círculo de pesquisa. As mudanças atuais na IA têm pouco impacto sobre nós. Estou envolvido nesses círculos de pesquisa desde 2015, quando começou a revolução da IA.

Pelo contrário, o nível de hardware é realmente mais recente. Temos uma ótima tecnologia de compressão em nível de software, mas no passado ela só funcionava na nuvem, então era um bom tópico de pesquisa, não um produto. ** Somente quando entra em todos os terminais para que milhões de pessoas possam utilizá-lo em seus próprios dispositivos, ele se torna um produto. **

Portanto, na verdade apostamos nas mudanças tecnológicas futuras. Além de apostar que a IA seria eficaz, também apostamos que apareceria o hardware que precisamos, hardware específico de aceleração de IA, como NPU, e vários chips de hardware da Apple, Qualcomm , e Google serão feitos. **Fizemos uma aposta em 2018 e hoje temos em 2023. **

**Ou tivemos uma boa visão ou tivemos sorte. **

P: E esses grandes fabricantes de hardware também estão interessados em você.

R: **Sim, porque eles têm esse hardware, eles começaram a procurar aplicativos matadores. Fomos até eles e dissemos: ei, todo mundo assiste ao vídeo, esse é o aplicativo matador que vocês querem. Desta vez também é muito adequado. **

P: Além dos algoritmos, quando conversamos antes, você mencionou que os dados também são um limite, mas obviamente as grandes empresas têm mais dados. Isso será um problema?

R: Pergunta muito interessante. (Contemplação) Acho que com a compressão de IA, acabará por descobrir que o algoritmo é mais importante. Porque não creio que o campo como um todo esteja maduro o suficiente para exigir decisões sobre qualidade de dados.

P: Essa é a pergunta da segunda fase.

R: Sim, ainda está no primeiro estágio. Não podemos dizer que temos um algoritmo perfeito. Nosso algoritmo está progredindo muito a cada mês e mudando muito, muito rápido. Quando o algoritmo é forte, são os dados. Mas também estamos acumulando, porque os dados têm retornos decrescentes. Agora temos de um a dois milhões de dados de sequências de vídeo, que obtemos de canais confiáveis e de código aberto ou compramos em sites de vídeo. Neste ponto, eles são bastante abertos, mas todos estão vendo que o ChatGPT está mudando o grau de abertura, temos sorte de ter adquirido esses dados antes. Isso também é uma vantagem, mas não é uma vantagem verdadeiramente decisiva nesta fase.

P: Os modelos LLM e de difusão trazem algo novo para seu algoritmo?

R: São relativamente poucas. Existem algumas ideias que podem ser usadas como referência. O problema é que esses modelos parecem ser capazes de entrar em nosso processo e nos trazer melhorias. Por exemplo, a Difusão Estável pode me ajudar a melhorar capacidades de compressão, mas ainda existem compensações - por exemplo, o SD é processado uma vez a cada 10 segundos, mas precisamos processá-lo 300 vezes em 10 segundos.Como escolher entre tempo real e efeitos é um problema. Eles têm potencial para causar impacto no futuro.

P: Se olharmos para isso de uma perspectiva competitiva, de onde vêm seus desafios atuais?

R: O algoritmo e as pessoas por trás dele. Nós mesmos estudamos muitos algoritmos básicos porque não há muitos artigos para ler. O desafio mais crítico é formar uma boa equipe,** porque há muitas pessoas no mercado estudando IA, poucas pessoas estudando teoria da informação e há quase nenhuma pessoa estudando ambas ao mesmo tempo. Então precisamos nos unir e treiná-los, o que leva muito tempo** porque eles não têm muito a ver um com o outro. Portanto, você precisa primeiro treinar um grupo de pessoas e depois deixá-los liderar as pessoas abaixo. Esta é uma estrutura piramidal.

P: Você já construiu essa pirâmide?

R: Temos mais de 30 estrelas da pesquisa em IA. Mas passamos muito, muito tempo nisso.

P: Então, as únicas 30 pessoas no mundo estão aqui com você.

R: Eu diria isso. Existem também alguns laboratórios que analisam esses tópicos e têm boas pessoas, mas de longe a Deep Render é a maior organização nesta área em termos de escala.

P: Vi que você mencionou o uso do novo financiamento recente para expandir seus negócios e presença no Vale do Silício.

R: Isso é um pouco estranho, somos uma empresa britânica, mas as empresas que mais utilizam recursos da Internet estão na China e nos Estados Unidos. Além disso, a Europa não é, de facto, um local favorável ao desenvolvimento tecnológico. Temos muita procura por parte dos Estados Unidos, por isso é natural entrar nos Estados Unidos, e o mesmo acontece com a China.

P: Algum cliente chinês entrou em contato com você?

R: Não posso dizer o nome, assinei um contrato longo, longo, então tenho que ter cuidado haha. Mas quando contactei estas empresas, descobri que a China tem, de facto, requisitos de largura de banda mais elevados do que os Estados Unidos.

P: Você já está em contato com os clientes. Se julgarmos pelo PMF que as pessoas gostam de discutir, em que estágio você se encontra agora?

R: Isso é sempre difícil de definir. Eu consideraria que chegamos ao PMF porque temos mais demanda do que podemos atender. Na verdade, estamos rejeitando muitas grandes empresas porque nossos próprios recursos de largura de banda não são suficientes.Muitas empresas nos contrataram e só podemos atender às necessidades de 4 a 5 grandes empresas ao mesmo tempo. Quando a tecnologia estiver mais madura, a comercialização será mais fácil. Já passamos da fase de prova de conceito. Se tudo correr bem, você poderá ver nossa tecnologia sendo aplicada a um serviço de Internet muito conhecido no segundo trimestre de 2024, e dezenas de milhões de usuários a utilizarão até então.

P: Diante de uma demanda absurda, mão de obra limitada e seu próprio status técnico, é sua responsabilidade como CEO fazer escolhas equilibradas.

P: Haha, esse é o desafio do meu trabalho. Vou tentar tomar uma decisão. Avançar demasiado rápido consome sempre recursos e o recrutamento trará desafios. Os nossos funcionários geralmente precisam de 4 meses de formação antes de poderem ser produtivos. Então você está certo, este é um problema de otimização. Claro, posso estar disposto a pagar por alguém que usa IA para desenvolver uma ferramenta.

P: Haha, talvez o LLM possa participar aqui.

R: Sim hahaha.

P: Tudo parece estar indo bem, qual é o modelo de negócio que você desenhou para este negócio?

R: Atualmente estamos na forma de B2B. Fornecemos autorização de produto aos clientes. Os clientes podem economizar muito dinheiro e parte dele pode ser doada para nós. Este é um modelo de negócio baseado em licenciamento. Se você olhar para os dados aqui, é realmente uma loucura: em 2030, o custo de transmissão de conteúdo em todo o mundo chegará a US$ 125 bilhões. **Se você quiser destruir o Netflix, use 4K e assista ao Netflix 24 horas por dia durante um mês. **

P: É melhor não fazer isso.

R: Hahaha, mas se você puder reduzir o tamanho do arquivo em, digamos, 90%, então, com base em US$ 125 bilhões, as empresas poderão economizar muito dinheiro.

P: Esta é sua chance de ganhar dinheiro.

R: Este é um negócio onde todos se beneficiam. Eu ganhei, a empresa ganhou, os usuários ganharam e as grandes empresas de Internet ganharam. Ninguém perde nada.

P: E quanto a salvar a Internet? Você já imaginou como será a Internet do futuro que sua empresa ajudará a construir?

P: Claro, eu sonho com isso todos os dias hahaha. **Nossa visão é transformar a largura de banda em uma mercadoria ilimitada, para que todos não precisem mais se preocupar com a velocidade da rede. Para todos, eles podem desfrutar de vídeos de altíssima qualidade em casa, e para as empresas, podem ser muito baratos ou até mesmo recursos gratuitos da Internet. As informações poderiam fluir, mesmo os dados que hoje seriam considerados pesados poderiam fluir livremente. Este é o futuro que a Internet deveria ter. **

P: Tenho certeza de que muitas pessoas já fizeram essa última pergunta. Falar sobre isso me fez sentir ainda mais que a história da série de TV americana “Vale do Silício” parece ser a mesma que a sua.

R: Certo, certo. Este é praticamente meu programa favorito. Mas o que é realmente interessante é que meus cofundadores e eu não sabíamos sobre o Deep Render até um ano e meio depois de fundá-lo, porque a HBO não era tão popular no Reino Unido. Mas o interessante é que nosso modelo de negócio e as etapas pelas quais passamos são quase iguais à história desta peça. Principalmente porque vimos isso mais tarde, nós dois dissemos, espere um minuto, isso é igual a nós.

P: Você também sabe o final deste drama.

A:... Hahaha, espero que nosso final seja melhor.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Faça trade de criptomoedas em qualquer lugar e a qualquer hora
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)