**Depuis combien de temps n'avez-vous pas entendu une start-up dire qu'elle allait sauver Internet ? **
Les entrepreneurs d’aujourd’hui semblent soit gagner de l’argent en silence, soit discuter de l’utilisation de l’IA pour sauver (ou détruire) toute l’humanité. Sur Internet dans lequel nous vivons tous les jours, il semble que personne ne se soucie de sa vie ou de sa mort.
Et pour Chri, il semblait qu'il allait mourir.
Quand je l’ai entendu me dire cela sous le soleil radieux de San Jose, cela m’a semblé un peu sensationnel. Mais quand on reste longtemps avec cet Allemand aux cheveux de lion, son anglais logique et à l'allemande vous fera facilement penser qu'il s'agit effectivement d'un gros problème.
Chri Besenbruch est le co-fondateur et PDG de Deep Render. En termes simples, son entreprise « utilise l'IA pour compresser la taille des fichiers vidéo à de très petites tailles ».
Il affirme que l'algorithme est jusqu'à cinq fois « meilleur » que le codec standard de l'industrie HVEC, bien qu'il n'ait pas précisé selon quelle métrique, et qu'il peut fonctionner en temps réel sur les chipsets modernes de Qualcomm, Apple et Nvidia. Un « codec » fait référence à un logiciel et parfois à du matériel capable de coder et de décoder des données, généralement des données audio ou vidéo.
Certains qui connaissent la Silicon Valley peuvent être confus en entendant cela, pensant que je raconte le scénario de la "Silicon Valley". Dans ce drame américain, décrit comme une représentation parfaite de l'écosystème entrepreneurial de la Silicon Valley, tous la farce vient du fait que le protagoniste a développé un algorithme de compression étonnant.
"Oui, beaucoup de gens me l'ont dit. Nous ressemblons beaucoup à des joueurs de flûte. " Cette personne au parcours complexe qui a grandi en Allemagne, a étudié les mathématiques au premier cycle, est allée en Suisse pour étudier une école d'art, puis est allée à au Royaume-Uni pour étudier l'informatique, et " Le protagoniste Richard dans "Silicon Valley" a également une forte atmosphère de nerd, mais contrairement au processus ridicule de percée de l'algorithme de compression dans la série télévisée et au manque de bon sens commercial dans la série télévisée, Richard est souvent hésitant. Son esprit d'entreprise est aussi rigoureux que la résolution de problèmes mathématiques, il prend l'entreprise très au sérieux et son modèle économique est également clairement pensé.
Selon lui, Internet est en voie de destruction, et c'est là le plus gros problème. Il voulait résoudre ce plus gros problème. Après une analyse, ils ont estimé que la cause profonde était que l'ancienne technologie ne s'adaptait pas au nouveau monde :
*Après que la vidéo soit devenue populaire et soit devenue la principale forme de communication sur Internet, nous sommes entrés dans un nouveau monde. Un monde où l’ampleur des données devient de plus en plus terrifiante et où il n’y a pas de retour en arrière possible. *
*Les anciennes technologies ne sont plus adaptées à ce nouveau monde. Continuer à apporter des innovations et des améliorations mineures sur le même chemin ne mènera qu’à une impasse, et finalement à l’effondrement d’Internet. *
"Nous allons sauver Internet en inventant de nouveaux algorithmes de compression. Et ce qui rend cela possible, c'est l'IA."
Dans cette optique, Chris a fondé Deep Render en 2018 avec ses camarades étudiants diplômés au Royaume-Uni : il ne faisait pas partie de ces startups qui poursuivaient la vague ChatGPT.
"Au fond, nous n'avons pas grand-chose à voir avec le LLM. Cela peut être lié au modèle de diffusion, mais il s'agit plutôt de possibilités potentielles dans le futur", m'a-t-il dit. "Nous sommes partis des premiers principes et voulions comprendre à quoi sert l'IA et l'essence de la compression. En fin de compte, nous pensions qu'une méthode qui repose entièrement sur l'IA doit être une nouvelle voie technique."
Cependant, « l’agitation » de LLM a en fait aidé son entreprise. "Nous jouions en fait à l'époque, car pour atteindre nos objectifs, en plus de mes propres algorithmes, nous avions également besoin de progrès significatifs en matière de logiciels et de matériel. Nous avions fait une prédiction à l'époque, en supposant que ces technologies de base pourraient toutes faire des bonds en avant et limites. Et aujourd'hui, tout cela s'est produit. Maintenant." M'a-t-il dit, son ton plein d'enthousiasme.
"Peut-être que nous avons juste de la chance."
** Cela semble très humble, mais ce qu'il n'a pas dit, c'est que si ses prédictions se réalisent, son entreprise pourrait devenir l'une des sociétés de technologie Internet les plus importantes de l'humanité au cours des prochaines décennies. **Leur technologie sera fournie aux grandes entreprises sous forme de licence. Tout en résolvant le problème de la bande passante Internet, elles deviendront également le type d'entreprise qui collecte les factures de services publics et les taxes.
En fait, tout a commencé à changer.
Depuis cette année, cette entreprise ignorée est entrée dans la vision de la Silicon Valley et d'institutions d'investissement de renom dans le monde entier. Après avoir finalisé un financement en mars, Chris a commencé à se concentrer sur la Silicon Valley, où il y a de l'argent et des gens. qui s'y intéressent, de gros clients.
Selon sa déclaration, leur petite équipe actuelle est déjà débordée face à l'intérêt et à la demande de "grandes entreprises qu'on ne peut pas nommer mais qui sont très importantes".
Et il m'a révélé que si tout se passe bien maintenant, sa technologie sera utilisée dans un service applicatif très connu au deuxième trimestre 2024.
"Des dizaines de millions d'utilisateurs y auront accès."
Le marché chinois, qui a une énorme demande en matière de compression vidéo et de données, a également commencé à apparaître sous diverses formes devant ce PDG qui n'est pas allé en Chine.
"Nous avons de nombreux amis investisseurs qui entretiennent des liens étroits avec la Chine et qui aident certaines entreprises chinoises à nous contacter. Nous sommes déjà en contact avec plusieurs des plus grandes sociétés Internet chinoises", a-t-il déclaré. Ces demandes sont venues si soudainement et si violemment qu'il a passé une demi-journée à me poser des questions de base sur « qu'est-ce que ça fait de travailler avec des sociétés Internet chinoises ? »
"Il semble que si vous voulez sauver Internet, vous ne pouvez pas le faire sans le marché chinois", lui ai-je dit en plaisantant après avoir raconté à cet entrepreneur technologique qui a passé la majeure partie de sa vie en Europe des histoires sur l'Est et sur l'Europe. possible.
« Tu as raison. » Répondit-il avec un sourire. Mais avant de penser au marché chinois, il lui fallait d’abord conquérir la Silicon Valley.
À la fin du drame américain "Silicon Valley", la société de Richard était évaluée à 8 milliards de dollars après six années de hauts et de bas. Cependant, quelques jours seulement avant la sortie officielle du produit, ils ont découvert que l'algorithme de compression était différent de celui qu'ils ont développé. Les IA qui ont amélioré le réseau se sont améliorées et se sont transformées en un "monstre" qu'ils ne pouvaient pas comprendre mais qui pouvait percer tous les systèmes. Après l'avoir pesé, ils ont finalement décidé de "sauver le monde". - en utilisant un magnifique imbécile pour faire arrêter tout le monde. J'ai une réflexion sur cette voie technique.
Ce n’est pas une bonne fin pour une startup. Lorsque j'ai abordé ce sujet avec Chris, qui en sera à sa sixième année de création d'entreprise l'année prochaine, il a réfléchi un moment, puis a simplement souri et a dit :
"J'espère que notre fin sera meilleure."
Ce qui suit est une transcription de la conversation
Q : Présentez-vous brièvement ainsi que votre entreprise.
A : Bien sûr. Je m'appelle Chris Besenbruch, PDG et co-fondateur de Deep Render. Ce que fait Deep Render, c'est essentiellement compresser la taille des fichiers vidéo, etc., à une très, très petite taille. La raison pour laquelle nous devons procéder ainsi est que les données sur Internet connaissent une croissance exponentielle et que 90 % des données ont été générées au cours des deux dernières années. Ils doivent voyager via des réseaux de fibre optique à travers le monde, ce qui représente une infrastructure très coûteuse à cette échelle. L’ensemble de l’infrastructure mondiale de fibre optique coûte 5 000 milliards de dollars. Ce n'est pas confortable, car si les données doublent tous les deux ans, qu'est-ce que cela signifie pour l'infrastructure, elles doivent également doubler. Mais il s’agit d’un doublement d’un billion. C'est impossible. C'est la raison pour laquelle je fais cela.
L'idée est que si nous ne parvenons pas à agrandir et à accélérer le pipeline, nous réduirons la taille des données contenues dans le pipeline. Cela indiquait donc une compression. C'est notre fondement et notre vision.
Q : Vous avez donc d'abord déduit l'un des principaux problèmes auxquels Internet est confronté aujourd'hui, trouvé sa solution, puis l'avez utilisé pour déterminer votre orientation entrepreneuriale.
A : Oui, c'est tout. Car sans une méthode de compression bien meilleure, l’ensemble d’Internet s’effondrera bientôt. Et j’aime Internet et je veux que ça continue.
Q : Alors, quelle est la différence entre votre technologie, car la compression n'est pas une nouveauté, elle existe depuis longtemps et les gens s'y sont même habitués et ont oublié qu'elle existe. Peut-être pourriez-vous décrire votre technologie dans des termes qu’un imbécile peut comprendre.
A : Hahaha, je ferai de mon mieux. Il faut regarder l'ensemble de l'industrie des 60 dernières années. Lorsque la technologie de compression traditionnelle est apparue, cela a constitué une énorme avancée. Tout était basé sur la DCT* (DCT signifie Discrete Cosine Transform, qui divise l'image en composants composés de différents fréquences. Petits blocs. Au cours du processus de quantification, les composantes haute fréquence sont éliminées et les composantes basse fréquence restantes sont enregistrées et utilisées pour la reconstruction ultérieure de l'image. Note de l'éditeur)*, cette méthode qui rend possible la technologie de compression vidéo actuelle a été inventée en dans les années 1970 et 1980 environ, et il a dominé l'industrie par la suite. **Mais depuis, cette technologie ne s'est que légèrement améliorée tous les 10 ans, et c'est toujours la même idée technique. Nous ne pouvons pas nous attendre à ce qu’une technologie réalise un bond en avant simplement en répétant la même idée des centaines de fois. **C'est une excellente technologie, mais son cycle d'innovation est terminé ou est sur le point de se terminer.
Nous avons donc besoin de quelque chose de nouveau. Et cette « nouveauté », c’est l’IA. Étant donné que l’IA peut très bien gérer les images et les vidéos, ce n’est pas une voie impensable. La technologie de l’IA et la technologie de compression ont donc commencé à être combinées. Il y a eu ensuite deux vagues : la première s'est produite en 2017, lorsque la super-résolution est apparue et que Magic Pony l'a inventée. Leur idée était de conserver la méthode de compression traditionnelle au milieu du pipeline et d'ajouter l'IA à l'avant et à l'arrière.
**Deep Render ne pense pas que ce soit la bonne approche. Car ce qui reste, c’est la technologie de compression traditionnelle qui, selon nous, s’est complètement effondrée. Cela ne change pas grand-chose par rapport à ce qu’il était avant, et ce n’est toujours pas utile. **
Nous sommes dans la deuxième vague, abandonnant complètement la technologie de compression traditionnelle et utilisant uniquement des réseaux de neurones. Cela signifie également réinventer la compression. La compression réinventée autour de la technologie d'apprentissage automatique a le plus grand effet. Le réseau de neurones récupère les données et compresse le fichier. Envoyez-le sur Internet et le réseau reçoit le fichier compressé et vous renvoie la vidéo. Il s'agit d'une solution uniquement basée sur l'IA. Nous menons la charge et nous sommes en fait la seule entreprise à le faire.
Q : Donc, fondamentalement, vous utilisez l'IA pour remplacer la partie dont la technologie traditionnelle est responsable, alors pourquoi l'IA peut-elle faire mieux ?
A : Deux raisons. La vidéo ou la compression vidéo est essentiellement un compromis entre la taille du fichier et la qualité de l'image. Soit vous avez des fichiers très volumineux et une superbe vidéo, soit de très petits fichiers avec une définition de mauvaise qualité. Une bonne compression nécessite donc de bons compromis. En termes de taille de fichier, la clé est la redondance. Si vous pouvez prédire quel sera le prochain pixel, vous n'avez pas besoin d'envoyer des données redondantes, ce qui permet d'économiser la taille du fichier. C'est là que l'IA peut faire de meilleures prédictions. Si la prédiction est bonne, la redondance peut être supprimée et moins de données peuvent être reçues. Et l’IA est fondamentalement plus forte car elle réagit aux données.
La seconde concerne la qualité vidéo. Tout algorithme de compression introduira des erreurs dans la sortie vidéo, c'est la définition de la compression avec perte, acceptant certaines erreurs au profit de fichiers de plus petite taille. Mais ce qui compte vraiment pour les humains, c’est la répartition de ces erreurs : nous sommes plus sensibles à certaines et pouvons être satisfaits d’autres. **Notre IA imite donc le système visuel humain afin que ces erreurs soient cachées aux humains. **
Un bon exemple est que les gens détestent quand les lignes deviennent floues. Les gens se sentent malheureux si une ligne nette devient floue parce que cela est biologiquement déterminé. Par exemple, lorsqu’un tigre commence à se déplacer derrière un rocher, nous devons pouvoir le voir et nous le fixerons. L’exactitude de la couleur n’est pas garantie et personne ne remarque vraiment s’il y a une perte. Vous pouvez ainsi donner une certaine précision des couleurs sans flouter les bords. Les gens préfèrent cette qualité vidéo.
Notre idée est toujours de partir des premiers principes : ce qui est raisonnable, quels sont les principes mathématiques qui le sous-tendent et quels outils peuvent être utilisés pour résoudre des problèmes réels. L’IA s’avère être l’outil le plus approprié pour cela.
Q : C'est très intéressant, c'est donc l'idée la plus basique, et la prochaine étape est l'exécution. En tant qu’entreprise créée il y a cinq ans, les changements actuels en matière d’IA ont-ils un impact sur vous ?
A : Au niveau logiciel, nous avons en fait toujours été enracinés dans le cercle de la recherche, et nos produits logiciels proviennent du cercle de la recherche. Les évolutions actuelles de l'IA ont peu d'impact sur nous. Je suis impliqué dans ces cercles de recherche depuis 2015, année où a commencé la révolution de l'IA.
Au contraire, le niveau matériel est en réalité plus récent. Nous disposons d'une excellente technologie de compression au niveau logiciel, mais dans le passé, elle ne fonctionnait que dans le cloud. C'était donc un bon sujet de recherche, pas un produit. **Ce n'est que lorsqu'il entre dans tous les terminaux afin que des millions de personnes puissent l'utiliser sur leurs propres appareils qu'il devient un produit. **
Par conséquent, nous avons en fait parié sur les changements technologiques futurs. En plus de parier que l'IA serait efficace, nous parions également que le matériel dont nous avons besoin apparaîtrait, du matériel spécifique d'accélération de l'IA, comme le NPU, et diverses puces matérielles d'Apple, Qualcomm. , et Google. sera fait. **Nous avons fait un pari en 2018, et aujourd'hui nous l'avons en 2023. **
**Soit nous avions une bonne vue, soit nous avons simplement eu de la chance. **
Q : Et ces grands fabricants de matériel s'intéressent également à vous.
R : **Oui, parce qu'ils disposent de ce matériel, ils ont commencé à rechercher des applications géniales. Nous sommes allés vers eux et leur avons dit : « Hé, tout le monde regarde la vidéo, c'est l'application qui tue que vous voulez. Cette période est également très appropriée. **
Q : En plus des algorithmes, lorsque nous avons discuté précédemment, vous avez mentionné que les données sont également un seuil, mais évidemment les grandes entreprises ont plus de données, est-ce que cela posera un problème ?
A : Question très intéressante. (Contemplation) Je pense qu'avec la compression de l'IA, on découvrira finalement que l'algorithme est plus important. Parce que je ne pense pas que le domaine dans son ensemble soit suffisamment mature pour nécessiter des décisions sur la qualité des données.
Q : Voilà donc la question de la deuxième phase.
R : Oui, nous en sommes encore à la première étape. Nous ne pouvons pas dire que nous avons un algorithme parfait. Notre algorithme fait de grands progrès chaque mois et évolue très, très rapidement. Lorsque l’algorithme est fort, ce sont les données. Mais nous accumulons également, car les données ont des rendements décroissants. Nous disposons désormais d'un à deux millions de données de séquences vidéo, que nous obtenons auprès de canaux open source et fiables ou que nous achetons sur des sites Web de vidéo. À l'heure actuelle, elles sont assez ouvertes, mais tout le monde voit que ChatGPT change le degré d'ouverture, nous avons la chance d'avoir acheté ces données plus tôt, c'est aussi un avantage, mais ce n'est pas un avantage vraiment décisif à ce stade.
Q : Les modèles LLM et de diffusion apportent-ils quelque chose de nouveau à votre algorithme ?
A : Il y en a relativement peu. Certaines idées peuvent être utilisées à titre de référence. Le problème est que ces modèles semblent pouvoir entrer dans notre processus et nous apporter des améliorations. Par exemple, la diffusion stable peut m'aider à améliorer capacités de compression, mais il y a encore des compromis - par exemple, la SD est traitée une fois toutes les 10 secondes, mais nous devons la traiter 300 fois en 10 secondes. Comment choisir entre le temps réel et les effets est un problème. Ils ont le potentiel d’avoir un impact à l’avenir.
Q : Si nous l'examinons d'un point de vue concurrentiel, d'où viennent vos défis actuels ?
A : L'algorithme, puis les personnes derrière lui. Nous étudions nous-mêmes de nombreux algorithmes de base car il n’y a pas beaucoup d’articles à lire. Le défi le plus important est de former une bonne équipe**, car il y a beaucoup de personnes sur le marché qui étudient l’IA, peu de personnes étudient la théorie de l’information, et il n’y a presque aucune personne qui étudie les deux en même temps. Il faut donc les regrouper et les former, ce qui prend beaucoup de temps** car ils n'ont pas grand-chose à voir les uns avec les autres. Vous devez donc d'abord former un groupe de personnes, puis les laisser diriger les personnes en dessous. Il s'agit d'une structure pyramidale.
Q : Avez-vous déjà construit cette pyramide ?
A : Nous comptons plus de 30 superstars de la recherche en IA. Mais nous avons passé très, très longtemps là-dessus.
Q : Donc les 30 seules personnes au monde sont ici avec vous.
A : Je dirais ça. Il existe également des laboratoires qui étudient ces sujets, et ils disposent de bonnes personnes, mais Deep Render est de loin la plus grande organisation dans ce domaine en termes d'échelle.
Q : J'ai vu que vous avez mentionné l'utilisation du nouveau financement récent pour développer votre entreprise et votre présence dans la Silicon Valley.
A : C'est un peu étrange, nous sommes une entreprise britannique, mais les entreprises qui utilisent le plus les ressources Internet se trouvent en Chine et aux États-Unis. De plus, l’Europe n’est en effet pas un lieu propice au développement technologique. Nous avons une forte demande de la part des États-Unis, il est donc naturel d’entrer aux États-Unis, et il en va de même pour la Chine.
Q : Des clients chinois vous ont-ils contacté ?
A : Je ne peux pas dire le nom, j'ai signé un très, très long accord donc je dois faire attention haha. Mais lorsque j’ai contacté ces sociétés, j’ai découvert que la Chine avait effectivement des besoins en bande passante plus élevés que les États-Unis.
Q : Vous êtes déjà en contact avec des clients, si l'on juge par le PMF que les gens aiment discuter, à quel stade en êtes-vous actuellement ?
A : C'est toujours difficile à définir. Je considérerais que nous avons atteint PMF car nous avons plus de demande que ce que nous pouvons gérer. Nous rejetons vraiment de nombreuses grandes entreprises parce que nos propres ressources en bande passante ne suffisent pas, de nombreuses entreprises nous ont réservé et nous ne pouvons répondre aux besoins que de 4 à 5 grandes entreprises en même temps. Une fois la technologie plus mature, la commercialisation sera plus facile. Nous avons dépassé le stade de la validation de principe. Si tout se passe bien, vous pourrez voir notre technologie être appliquée à un service Internet très connu au deuxième trimestre 2024, et des dizaines de millions d'utilisateurs l'utiliseront d'ici là.
Q : Face à une demande folle, une main d'œuvre limitée et votre propre statut technique, il est de votre responsabilité en tant que PDG de faire des choix équilibrés.
Q : Haha, c'est le défi de mon travail. Je vais essayer de prendre une décision. Aller trop vite consomme toujours des ressources et le recrutement posera des défis.Nos employés ont généralement besoin de 4 mois de formation avant de pouvoir être productifs. Vous avez donc raison, c'est un problème d'optimisation. Bien sûr, je serai peut-être prêt à payer pour quelqu'un qui utilise l'IA pour développer un outil.
Q : Haha, peut-être que LLM peut participer ici.
R : Oui hahaha.
Q : Tout semble bien se passer, quel est le modèle économique que vous avez conçu pour cette entreprise ?
A : Nous sommes actuellement sous forme de B2B. Nous fournissons une autorisation de produit aux clients. Les clients peuvent économiser beaucoup d'argent, et une partie peut nous être reversée. Il s’agit d’un modèle économique basé sur les licences. Si vous regardez les données ici, c'est vraiment fou : d'ici 2030, le coût de la transmission de contenu dans le monde atteindra 125 milliards de dollars. **Si vous voulez détruire Netflix, utilisez la 4K et regardez Netflix 24 heures sur 24 pendant un mois. **
Q : Il est préférable de ne pas faire cela.
A : Hahaha, mais si vous pouvez réduire la taille du fichier de, disons, 90 %, alors sur la base de 125 milliards de dollars, les entreprises peuvent économiser beaucoup d'argent.
Q : C'est votre chance de gagner de l'argent.
A : Il s'agit d'une entreprise dont tout le monde profite. J’ai gagné, l’entreprise a gagné, les utilisateurs ont gagné et les grandes sociétés Internet ont gagné. Personne ne perd rien.
Q : Et si vous sauviez Internet ? Avez-vous déjà imaginé à quoi ressemblera le futur Internet que votre entreprise contribuera à construire ?
Q : Bien sûr, j'en rêve tous les jours hahaha. **Notre vision est de transformer la bande passante en un bien illimité, afin que chacun n'ait plus à se soucier de la vitesse du réseau. Pour tout le monde, ils peuvent profiter de vidéos de très haute qualité à la maison, et pour les entreprises, elles peuvent obtenir des vidéos très bon marché, voire même des ressources Internet gratuites. L’information pouvait circuler, même les données qui seraient aujourd’hui considérées comme lourdes pourraient circuler librement. C’est l’avenir qu’Internet était censé avoir. **
Q : Je suis sûr que beaucoup de gens vous ont posé cette dernière question. En parler m'a fait encore plus sentir que l'histoire de la série télévisée américaine "Silicon Valley" semble être la même que la vôtre.
A : C'est vrai, c'est vrai. C'est à peu près mon émission préférée. Mais ce qui est vraiment intéressant, c’est que mes cofondateurs et moi-même n’avons connu Deep Render qu’un an et demi après sa création, car HBO n’était pas très populaire au Royaume-Uni. Mais ce qui est intéressant, c’est que notre modèle économique et les étapes que nous avons traversées sont presque les mêmes que l’histoire de cette pièce. D'autant plus qu'on l'a vu plus tard, on s'est dit tous les deux, attends une minute, c'est comme nous.
Q : Vous connaissez également la fin de ce drame.
A :... Hahaha, j'espère que notre fin est meilleure.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
"Internet va mourir et nous seuls pouvons le sauver"
Source originale : Silicon Star People
**Depuis combien de temps n'avez-vous pas entendu une start-up dire qu'elle allait sauver Internet ? **
Les entrepreneurs d’aujourd’hui semblent soit gagner de l’argent en silence, soit discuter de l’utilisation de l’IA pour sauver (ou détruire) toute l’humanité. Sur Internet dans lequel nous vivons tous les jours, il semble que personne ne se soucie de sa vie ou de sa mort.
Et pour Chri, il semblait qu'il allait mourir.
Quand je l’ai entendu me dire cela sous le soleil radieux de San Jose, cela m’a semblé un peu sensationnel. Mais quand on reste longtemps avec cet Allemand aux cheveux de lion, son anglais logique et à l'allemande vous fera facilement penser qu'il s'agit effectivement d'un gros problème.
Chri Besenbruch est le co-fondateur et PDG de Deep Render. En termes simples, son entreprise « utilise l'IA pour compresser la taille des fichiers vidéo à de très petites tailles ».
Il affirme que l'algorithme est jusqu'à cinq fois « meilleur » que le codec standard de l'industrie HVEC, bien qu'il n'ait pas précisé selon quelle métrique, et qu'il peut fonctionner en temps réel sur les chipsets modernes de Qualcomm, Apple et Nvidia. Un « codec » fait référence à un logiciel et parfois à du matériel capable de coder et de décoder des données, généralement des données audio ou vidéo.
Certains qui connaissent la Silicon Valley peuvent être confus en entendant cela, pensant que je raconte le scénario de la "Silicon Valley". Dans ce drame américain, décrit comme une représentation parfaite de l'écosystème entrepreneurial de la Silicon Valley, tous la farce vient du fait que le protagoniste a développé un algorithme de compression étonnant.
"Oui, beaucoup de gens me l'ont dit. Nous ressemblons beaucoup à des joueurs de flûte. " Cette personne au parcours complexe qui a grandi en Allemagne, a étudié les mathématiques au premier cycle, est allée en Suisse pour étudier une école d'art, puis est allée à au Royaume-Uni pour étudier l'informatique, et " Le protagoniste Richard dans "Silicon Valley" a également une forte atmosphère de nerd, mais contrairement au processus ridicule de percée de l'algorithme de compression dans la série télévisée et au manque de bon sens commercial dans la série télévisée, Richard est souvent hésitant. Son esprit d'entreprise est aussi rigoureux que la résolution de problèmes mathématiques, il prend l'entreprise très au sérieux et son modèle économique est également clairement pensé.
Selon lui, Internet est en voie de destruction, et c'est là le plus gros problème. Il voulait résoudre ce plus gros problème. Après une analyse, ils ont estimé que la cause profonde était que l'ancienne technologie ne s'adaptait pas au nouveau monde :
*Après que la vidéo soit devenue populaire et soit devenue la principale forme de communication sur Internet, nous sommes entrés dans un nouveau monde. Un monde où l’ampleur des données devient de plus en plus terrifiante et où il n’y a pas de retour en arrière possible. *
*Les anciennes technologies ne sont plus adaptées à ce nouveau monde. Continuer à apporter des innovations et des améliorations mineures sur le même chemin ne mènera qu’à une impasse, et finalement à l’effondrement d’Internet. *
"Nous allons sauver Internet en inventant de nouveaux algorithmes de compression. Et ce qui rend cela possible, c'est l'IA."
Dans cette optique, Chris a fondé Deep Render en 2018 avec ses camarades étudiants diplômés au Royaume-Uni : il ne faisait pas partie de ces startups qui poursuivaient la vague ChatGPT.
"Au fond, nous n'avons pas grand-chose à voir avec le LLM. Cela peut être lié au modèle de diffusion, mais il s'agit plutôt de possibilités potentielles dans le futur", m'a-t-il dit. "Nous sommes partis des premiers principes et voulions comprendre à quoi sert l'IA et l'essence de la compression. En fin de compte, nous pensions qu'une méthode qui repose entièrement sur l'IA doit être une nouvelle voie technique."
Cependant, « l’agitation » de LLM a en fait aidé son entreprise. "Nous jouions en fait à l'époque, car pour atteindre nos objectifs, en plus de mes propres algorithmes, nous avions également besoin de progrès significatifs en matière de logiciels et de matériel. Nous avions fait une prédiction à l'époque, en supposant que ces technologies de base pourraient toutes faire des bonds en avant et limites. Et aujourd'hui, tout cela s'est produit. Maintenant." M'a-t-il dit, son ton plein d'enthousiasme.
"Peut-être que nous avons juste de la chance."
** Cela semble très humble, mais ce qu'il n'a pas dit, c'est que si ses prédictions se réalisent, son entreprise pourrait devenir l'une des sociétés de technologie Internet les plus importantes de l'humanité au cours des prochaines décennies. **Leur technologie sera fournie aux grandes entreprises sous forme de licence. Tout en résolvant le problème de la bande passante Internet, elles deviendront également le type d'entreprise qui collecte les factures de services publics et les taxes.
En fait, tout a commencé à changer.
Depuis cette année, cette entreprise ignorée est entrée dans la vision de la Silicon Valley et d'institutions d'investissement de renom dans le monde entier. Après avoir finalisé un financement en mars, Chris a commencé à se concentrer sur la Silicon Valley, où il y a de l'argent et des gens. qui s'y intéressent, de gros clients.
Selon sa déclaration, leur petite équipe actuelle est déjà débordée face à l'intérêt et à la demande de "grandes entreprises qu'on ne peut pas nommer mais qui sont très importantes".
Et il m'a révélé que si tout se passe bien maintenant, sa technologie sera utilisée dans un service applicatif très connu au deuxième trimestre 2024.
"Des dizaines de millions d'utilisateurs y auront accès."
Le marché chinois, qui a une énorme demande en matière de compression vidéo et de données, a également commencé à apparaître sous diverses formes devant ce PDG qui n'est pas allé en Chine.
"Nous avons de nombreux amis investisseurs qui entretiennent des liens étroits avec la Chine et qui aident certaines entreprises chinoises à nous contacter. Nous sommes déjà en contact avec plusieurs des plus grandes sociétés Internet chinoises", a-t-il déclaré. Ces demandes sont venues si soudainement et si violemment qu'il a passé une demi-journée à me poser des questions de base sur « qu'est-ce que ça fait de travailler avec des sociétés Internet chinoises ? »
"Il semble que si vous voulez sauver Internet, vous ne pouvez pas le faire sans le marché chinois", lui ai-je dit en plaisantant après avoir raconté à cet entrepreneur technologique qui a passé la majeure partie de sa vie en Europe des histoires sur l'Est et sur l'Europe. possible.
« Tu as raison. » Répondit-il avec un sourire. Mais avant de penser au marché chinois, il lui fallait d’abord conquérir la Silicon Valley.
À la fin du drame américain "Silicon Valley", la société de Richard était évaluée à 8 milliards de dollars après six années de hauts et de bas. Cependant, quelques jours seulement avant la sortie officielle du produit, ils ont découvert que l'algorithme de compression était différent de celui qu'ils ont développé. Les IA qui ont amélioré le réseau se sont améliorées et se sont transformées en un "monstre" qu'ils ne pouvaient pas comprendre mais qui pouvait percer tous les systèmes. Après l'avoir pesé, ils ont finalement décidé de "sauver le monde". - en utilisant un magnifique imbécile pour faire arrêter tout le monde. J'ai une réflexion sur cette voie technique.
Ce n’est pas une bonne fin pour une startup. Lorsque j'ai abordé ce sujet avec Chris, qui en sera à sa sixième année de création d'entreprise l'année prochaine, il a réfléchi un moment, puis a simplement souri et a dit :
"J'espère que notre fin sera meilleure."
Ce qui suit est une transcription de la conversation
Q : Présentez-vous brièvement ainsi que votre entreprise.
A : Bien sûr. Je m'appelle Chris Besenbruch, PDG et co-fondateur de Deep Render. Ce que fait Deep Render, c'est essentiellement compresser la taille des fichiers vidéo, etc., à une très, très petite taille. La raison pour laquelle nous devons procéder ainsi est que les données sur Internet connaissent une croissance exponentielle et que 90 % des données ont été générées au cours des deux dernières années. Ils doivent voyager via des réseaux de fibre optique à travers le monde, ce qui représente une infrastructure très coûteuse à cette échelle. L’ensemble de l’infrastructure mondiale de fibre optique coûte 5 000 milliards de dollars. Ce n'est pas confortable, car si les données doublent tous les deux ans, qu'est-ce que cela signifie pour l'infrastructure, elles doivent également doubler. Mais il s’agit d’un doublement d’un billion. C'est impossible. C'est la raison pour laquelle je fais cela.
Q : Vous avez donc d'abord déduit l'un des principaux problèmes auxquels Internet est confronté aujourd'hui, trouvé sa solution, puis l'avez utilisé pour déterminer votre orientation entrepreneuriale.
A : Oui, c'est tout. Car sans une méthode de compression bien meilleure, l’ensemble d’Internet s’effondrera bientôt. Et j’aime Internet et je veux que ça continue.
Q : Alors, quelle est la différence entre votre technologie, car la compression n'est pas une nouveauté, elle existe depuis longtemps et les gens s'y sont même habitués et ont oublié qu'elle existe. Peut-être pourriez-vous décrire votre technologie dans des termes qu’un imbécile peut comprendre.
A : Hahaha, je ferai de mon mieux. Il faut regarder l'ensemble de l'industrie des 60 dernières années. Lorsque la technologie de compression traditionnelle est apparue, cela a constitué une énorme avancée. Tout était basé sur la DCT* (DCT signifie Discrete Cosine Transform, qui divise l'image en composants composés de différents fréquences. Petits blocs. Au cours du processus de quantification, les composantes haute fréquence sont éliminées et les composantes basse fréquence restantes sont enregistrées et utilisées pour la reconstruction ultérieure de l'image. Note de l'éditeur)*, cette méthode qui rend possible la technologie de compression vidéo actuelle a été inventée en dans les années 1970 et 1980 environ, et il a dominé l'industrie par la suite. **Mais depuis, cette technologie ne s'est que légèrement améliorée tous les 10 ans, et c'est toujours la même idée technique. Nous ne pouvons pas nous attendre à ce qu’une technologie réalise un bond en avant simplement en répétant la même idée des centaines de fois. **C'est une excellente technologie, mais son cycle d'innovation est terminé ou est sur le point de se terminer.
Nous avons donc besoin de quelque chose de nouveau. Et cette « nouveauté », c’est l’IA. Étant donné que l’IA peut très bien gérer les images et les vidéos, ce n’est pas une voie impensable. La technologie de l’IA et la technologie de compression ont donc commencé à être combinées. Il y a eu ensuite deux vagues : la première s'est produite en 2017, lorsque la super-résolution est apparue et que Magic Pony l'a inventée. Leur idée était de conserver la méthode de compression traditionnelle au milieu du pipeline et d'ajouter l'IA à l'avant et à l'arrière.
**Deep Render ne pense pas que ce soit la bonne approche. Car ce qui reste, c’est la technologie de compression traditionnelle qui, selon nous, s’est complètement effondrée. Cela ne change pas grand-chose par rapport à ce qu’il était avant, et ce n’est toujours pas utile. **
Nous sommes dans la deuxième vague, abandonnant complètement la technologie de compression traditionnelle et utilisant uniquement des réseaux de neurones. Cela signifie également réinventer la compression. La compression réinventée autour de la technologie d'apprentissage automatique a le plus grand effet. Le réseau de neurones récupère les données et compresse le fichier. Envoyez-le sur Internet et le réseau reçoit le fichier compressé et vous renvoie la vidéo. Il s'agit d'une solution uniquement basée sur l'IA. Nous menons la charge et nous sommes en fait la seule entreprise à le faire.
Q : Donc, fondamentalement, vous utilisez l'IA pour remplacer la partie dont la technologie traditionnelle est responsable, alors pourquoi l'IA peut-elle faire mieux ?
A : Deux raisons. La vidéo ou la compression vidéo est essentiellement un compromis entre la taille du fichier et la qualité de l'image. Soit vous avez des fichiers très volumineux et une superbe vidéo, soit de très petits fichiers avec une définition de mauvaise qualité. Une bonne compression nécessite donc de bons compromis. En termes de taille de fichier, la clé est la redondance. Si vous pouvez prédire quel sera le prochain pixel, vous n'avez pas besoin d'envoyer des données redondantes, ce qui permet d'économiser la taille du fichier. C'est là que l'IA peut faire de meilleures prédictions. Si la prédiction est bonne, la redondance peut être supprimée et moins de données peuvent être reçues. Et l’IA est fondamentalement plus forte car elle réagit aux données.
La seconde concerne la qualité vidéo. Tout algorithme de compression introduira des erreurs dans la sortie vidéo, c'est la définition de la compression avec perte, acceptant certaines erreurs au profit de fichiers de plus petite taille. Mais ce qui compte vraiment pour les humains, c’est la répartition de ces erreurs : nous sommes plus sensibles à certaines et pouvons être satisfaits d’autres. **Notre IA imite donc le système visuel humain afin que ces erreurs soient cachées aux humains. **
Un bon exemple est que les gens détestent quand les lignes deviennent floues. Les gens se sentent malheureux si une ligne nette devient floue parce que cela est biologiquement déterminé. Par exemple, lorsqu’un tigre commence à se déplacer derrière un rocher, nous devons pouvoir le voir et nous le fixerons. L’exactitude de la couleur n’est pas garantie et personne ne remarque vraiment s’il y a une perte. Vous pouvez ainsi donner une certaine précision des couleurs sans flouter les bords. Les gens préfèrent cette qualité vidéo.
Notre idée est toujours de partir des premiers principes : ce qui est raisonnable, quels sont les principes mathématiques qui le sous-tendent et quels outils peuvent être utilisés pour résoudre des problèmes réels. L’IA s’avère être l’outil le plus approprié pour cela.
Q : C'est très intéressant, c'est donc l'idée la plus basique, et la prochaine étape est l'exécution. En tant qu’entreprise créée il y a cinq ans, les changements actuels en matière d’IA ont-ils un impact sur vous ?
A : Au niveau logiciel, nous avons en fait toujours été enracinés dans le cercle de la recherche, et nos produits logiciels proviennent du cercle de la recherche. Les évolutions actuelles de l'IA ont peu d'impact sur nous. Je suis impliqué dans ces cercles de recherche depuis 2015, année où a commencé la révolution de l'IA.
Au contraire, le niveau matériel est en réalité plus récent. Nous disposons d'une excellente technologie de compression au niveau logiciel, mais dans le passé, elle ne fonctionnait que dans le cloud. C'était donc un bon sujet de recherche, pas un produit. **Ce n'est que lorsqu'il entre dans tous les terminaux afin que des millions de personnes puissent l'utiliser sur leurs propres appareils qu'il devient un produit. **
Par conséquent, nous avons en fait parié sur les changements technologiques futurs. En plus de parier que l'IA serait efficace, nous parions également que le matériel dont nous avons besoin apparaîtrait, du matériel spécifique d'accélération de l'IA, comme le NPU, et diverses puces matérielles d'Apple, Qualcomm. , et Google. sera fait. **Nous avons fait un pari en 2018, et aujourd'hui nous l'avons en 2023. **
**Soit nous avions une bonne vue, soit nous avons simplement eu de la chance. **
Q : Et ces grands fabricants de matériel s'intéressent également à vous.
R : **Oui, parce qu'ils disposent de ce matériel, ils ont commencé à rechercher des applications géniales. Nous sommes allés vers eux et leur avons dit : « Hé, tout le monde regarde la vidéo, c'est l'application qui tue que vous voulez. Cette période est également très appropriée. **
Q : En plus des algorithmes, lorsque nous avons discuté précédemment, vous avez mentionné que les données sont également un seuil, mais évidemment les grandes entreprises ont plus de données, est-ce que cela posera un problème ?
A : Question très intéressante. (Contemplation) Je pense qu'avec la compression de l'IA, on découvrira finalement que l'algorithme est plus important. Parce que je ne pense pas que le domaine dans son ensemble soit suffisamment mature pour nécessiter des décisions sur la qualité des données.
Q : Voilà donc la question de la deuxième phase.
R : Oui, nous en sommes encore à la première étape. Nous ne pouvons pas dire que nous avons un algorithme parfait. Notre algorithme fait de grands progrès chaque mois et évolue très, très rapidement. Lorsque l’algorithme est fort, ce sont les données. Mais nous accumulons également, car les données ont des rendements décroissants. Nous disposons désormais d'un à deux millions de données de séquences vidéo, que nous obtenons auprès de canaux open source et fiables ou que nous achetons sur des sites Web de vidéo. À l'heure actuelle, elles sont assez ouvertes, mais tout le monde voit que ChatGPT change le degré d'ouverture, nous avons la chance d'avoir acheté ces données plus tôt, c'est aussi un avantage, mais ce n'est pas un avantage vraiment décisif à ce stade.
Q : Les modèles LLM et de diffusion apportent-ils quelque chose de nouveau à votre algorithme ?
A : Il y en a relativement peu. Certaines idées peuvent être utilisées à titre de référence. Le problème est que ces modèles semblent pouvoir entrer dans notre processus et nous apporter des améliorations. Par exemple, la diffusion stable peut m'aider à améliorer capacités de compression, mais il y a encore des compromis - par exemple, la SD est traitée une fois toutes les 10 secondes, mais nous devons la traiter 300 fois en 10 secondes. Comment choisir entre le temps réel et les effets est un problème. Ils ont le potentiel d’avoir un impact à l’avenir.
Q : Si nous l'examinons d'un point de vue concurrentiel, d'où viennent vos défis actuels ?
A : L'algorithme, puis les personnes derrière lui. Nous étudions nous-mêmes de nombreux algorithmes de base car il n’y a pas beaucoup d’articles à lire. Le défi le plus important est de former une bonne équipe**, car il y a beaucoup de personnes sur le marché qui étudient l’IA, peu de personnes étudient la théorie de l’information, et il n’y a presque aucune personne qui étudie les deux en même temps. Il faut donc les regrouper et les former, ce qui prend beaucoup de temps** car ils n'ont pas grand-chose à voir les uns avec les autres. Vous devez donc d'abord former un groupe de personnes, puis les laisser diriger les personnes en dessous. Il s'agit d'une structure pyramidale.
Q : Avez-vous déjà construit cette pyramide ?
A : Nous comptons plus de 30 superstars de la recherche en IA. Mais nous avons passé très, très longtemps là-dessus.
Q : Donc les 30 seules personnes au monde sont ici avec vous.
A : Je dirais ça. Il existe également des laboratoires qui étudient ces sujets, et ils disposent de bonnes personnes, mais Deep Render est de loin la plus grande organisation dans ce domaine en termes d'échelle.
Q : J'ai vu que vous avez mentionné l'utilisation du nouveau financement récent pour développer votre entreprise et votre présence dans la Silicon Valley.
A : C'est un peu étrange, nous sommes une entreprise britannique, mais les entreprises qui utilisent le plus les ressources Internet se trouvent en Chine et aux États-Unis. De plus, l’Europe n’est en effet pas un lieu propice au développement technologique. Nous avons une forte demande de la part des États-Unis, il est donc naturel d’entrer aux États-Unis, et il en va de même pour la Chine.
Q : Des clients chinois vous ont-ils contacté ?
A : Je ne peux pas dire le nom, j'ai signé un très, très long accord donc je dois faire attention haha. Mais lorsque j’ai contacté ces sociétés, j’ai découvert que la Chine avait effectivement des besoins en bande passante plus élevés que les États-Unis.
Q : Vous êtes déjà en contact avec des clients, si l'on juge par le PMF que les gens aiment discuter, à quel stade en êtes-vous actuellement ?
A : C'est toujours difficile à définir. Je considérerais que nous avons atteint PMF car nous avons plus de demande que ce que nous pouvons gérer. Nous rejetons vraiment de nombreuses grandes entreprises parce que nos propres ressources en bande passante ne suffisent pas, de nombreuses entreprises nous ont réservé et nous ne pouvons répondre aux besoins que de 4 à 5 grandes entreprises en même temps. Une fois la technologie plus mature, la commercialisation sera plus facile. Nous avons dépassé le stade de la validation de principe. Si tout se passe bien, vous pourrez voir notre technologie être appliquée à un service Internet très connu au deuxième trimestre 2024, et des dizaines de millions d'utilisateurs l'utiliseront d'ici là.
Q : Face à une demande folle, une main d'œuvre limitée et votre propre statut technique, il est de votre responsabilité en tant que PDG de faire des choix équilibrés.
Q : Haha, c'est le défi de mon travail. Je vais essayer de prendre une décision. Aller trop vite consomme toujours des ressources et le recrutement posera des défis.Nos employés ont généralement besoin de 4 mois de formation avant de pouvoir être productifs. Vous avez donc raison, c'est un problème d'optimisation. Bien sûr, je serai peut-être prêt à payer pour quelqu'un qui utilise l'IA pour développer un outil.
Q : Haha, peut-être que LLM peut participer ici.
R : Oui hahaha.
Q : Tout semble bien se passer, quel est le modèle économique que vous avez conçu pour cette entreprise ?
A : Nous sommes actuellement sous forme de B2B. Nous fournissons une autorisation de produit aux clients. Les clients peuvent économiser beaucoup d'argent, et une partie peut nous être reversée. Il s’agit d’un modèle économique basé sur les licences. Si vous regardez les données ici, c'est vraiment fou : d'ici 2030, le coût de la transmission de contenu dans le monde atteindra 125 milliards de dollars. **Si vous voulez détruire Netflix, utilisez la 4K et regardez Netflix 24 heures sur 24 pendant un mois. **
Q : Il est préférable de ne pas faire cela.
A : Hahaha, mais si vous pouvez réduire la taille du fichier de, disons, 90 %, alors sur la base de 125 milliards de dollars, les entreprises peuvent économiser beaucoup d'argent.
Q : C'est votre chance de gagner de l'argent.
A : Il s'agit d'une entreprise dont tout le monde profite. J’ai gagné, l’entreprise a gagné, les utilisateurs ont gagné et les grandes sociétés Internet ont gagné. Personne ne perd rien.
Q : Et si vous sauviez Internet ? Avez-vous déjà imaginé à quoi ressemblera le futur Internet que votre entreprise contribuera à construire ?
Q : Bien sûr, j'en rêve tous les jours hahaha. **Notre vision est de transformer la bande passante en un bien illimité, afin que chacun n'ait plus à se soucier de la vitesse du réseau. Pour tout le monde, ils peuvent profiter de vidéos de très haute qualité à la maison, et pour les entreprises, elles peuvent obtenir des vidéos très bon marché, voire même des ressources Internet gratuites. L’information pouvait circuler, même les données qui seraient aujourd’hui considérées comme lourdes pourraient circuler librement. C’est l’avenir qu’Internet était censé avoir. **
A : C'est vrai, c'est vrai. C'est à peu près mon émission préférée. Mais ce qui est vraiment intéressant, c’est que mes cofondateurs et moi-même n’avons connu Deep Render qu’un an et demi après sa création, car HBO n’était pas très populaire au Royaume-Uni. Mais ce qui est intéressant, c’est que notre modèle économique et les étapes que nous avons traversées sont presque les mêmes que l’histoire de cette pièce. D'autant plus qu'on l'a vu plus tard, on s'est dit tous les deux, attends une minute, c'est comme nous.
Q : Vous connaissez également la fin de ce drame.
A :... Hahaha, j'espère que notre fin est meilleure.