Babbitt丨Daily must-read: Boston Dynamics usa ChatGPT e outros para desenvolver cães-robô guiados; OpenAI forma uma nova equipa

2023-10-27 09:42:59

A Boston Dynamics apresentou um novo estudo em seu site que desenvolveu um cão-robô guiado por guia falante combinando ChatGPT, Spot e outros modelos de IA. A Smartspectrum AI lançou hoje o modelo grande de pedestal de terceira geração auto-desenvolvido ChatGLM3, que realizou várias novas atualizações iterativas funcionais, entre as quais a capacidade de compreensão multimodal CogVLM-look gráfico de reconhecimento semântico alcançou o efeito SOTA em mais de 10 conjuntos de dados de avaliação gráfica padrão internacional, e a capacidade semântica e lógica foram muito melhoradas, o que é 2-3 vezes mais rápido do que a melhor implementação de código aberto atual vLLM; A OpenAI anunciou que está a criar uma nova equipa, a Preparedness, para avaliar e mitigar "riscos catastróficos" associados à IA. A principal missão da equipa é "rastrear, avaliar, prever e proteger" problemas potencialmente significativos causados pela IA, incluindo ameaças nucleares.

Fonte da imagem: Gerado por Unbounded AI

Notícias quentes:

Zhipu AI lançou o modelo grande de pedestal de terceira geração auto-desenvolvido ChatGLM3

Em 27 de outubro, a Zhipu AI lançou hoje o modelo de pedestal de terceira geração ChatGLM3. Zhang Peng, AICEO da Wisdom Spectrum, introduziu que o ChatGLM3 alcançou várias atualizações iterativas de novas funções, entre as quais o CogVLM de capacidade de compreensão multimodal alcançou o efeito SOTA em mais de 10 conjuntos de dados de avaliação gráfica padrão internacional, e a capacidade semântica e lógica foram grandemente aprimoradas, o que é 2-3 vezes mais rápido do que o atual melhor vLLM de implementação de código aberto.

Galeria site Shutterstock NOVO: Usuários podem recriar fotos existentes através de IA

Conforme relatado em 27 de outubro, o site de galerias Shutterstock anunciou a adição de um novo recurso baseado em IA "edição criativa" para melhorar e refinar as imagens na biblioteca da empresa de mais de 700 milhões de imagens de alta qualidade.

De acordo com relatos, o recurso ainda está em fase beta, aproveitando o acesso prioritário da empresa à mais recente tecnologia OpenAI, os usuários podem usar IA para gerar novos conteúdos, ou simplesmente editar e converter qualquer imagem na biblioteca da Shutterstock. O recurso de "edição criativa", que tem 6 categorias, bem como uma série de funções auxiliares, como assistente de design de IA e uma série de funções, como o chamado filtro "mais avançado" da indústria, será oficialmente demonstrado ao vivo na vitrine em 9 de novembro.

A Microsoft apresenta um novo complemento para o Excel: IA para ajudar as empresas a obter informações sobre dados e prever tendências futuras

Relatado em 27 de outubro, a Microsoft introduziu um novo suplemento do Office para o Excel Business Assist–Forecast, que pode ajudar as empresas a obter informações sobre dados históricos e prever o desenvolvimento futuro com base em dados relevantes por meio de inteligência artificial e aprendizado de máquina, economizando tempo das empresas na previsão e análise de dados.

AI sistema de síntese de música Loop Copilot lançado, gerando música a partir de várias rodadas de diálogo

Conforme relatado em 27 de outubro, a página Arxiv mostra que uma equipe de pesquisadores da Yamaha e da Queen Mary University of London e da Mohammed Bin Zayed University of Artificial Intelligence lançou recentemente um sistema de síntese de música chamado Loop Copilot. De acordo com o artigo, o Loop Copilot permite que os usuários gerem música através de edição iterativa através de uma interface de diálogo multi-round. De acordo com a equipe de pesquisa, o Loop Copilot atende às diferentes necessidades de diferentes subsistemas usando grandes modelos de linguagem para interpretar a intenção do usuário e selecionando modelos de IA apropriados para executar tarefas. Para garantir a coerência da música, os atributos principais são mantidos em uma tabela centralizada. A pesquisa mostra que o Loop Copilot tem um grande potencial para promover a criação musical.

Digital China lança plataforma Big Model "China Inquiry"

Em 26 de outubro, o presidente e CEO da Digital China, Guo Wei, disse na Reunião Anual de 2023 da Digital China que a Digital China implantará firmemente a IA generativa e está disposta a se tornar um parceiro em todo o ciclo de vida da transformação digital das empresas. Na reunião, a Digital China lançou a plataforma "China Inquiry" e, ao mesmo tempo, lançou o "Generative AI Enterprise Landing White Paper" da indústria com o Xinbai Research Institute.

É relatado que a China Inquiry Platform é uma plataforma única de integração de grandes modelos empresariais e uma grande plataforma de operação de modelo para empresas, que visa ajudar os clientes da indústria a construir rapidamente recursos nos quatro níveis de modelo, poder de computação, dados e cenários, e efetivamente abrir o canal da tecnologia de IA generativa para cenários de negócios na empresa.

Boston Dynamics usou o ChatGPT para treinar robôs quadrúpedes e desenvolver um cão-robô guiado

Conforme relatado em 27 de outubro, o desenvolvedor de robôs Boston Dynamics mostrou um novo estudo em seu site oficial para desenvolver um cão-robô guiado por guia falante, combinando ChatGPT, Spot e outros modelos de IA. É relatado que o cão robô pode falar com os seres humanos de acordo com prompts de texto e voz, e fornece uma função visual de perguntas e respostas, que pode analisar a imagem tirada pela câmera e gerar automaticamente descrições de imagem.

Google Maps anuncia atualização: novos recursos de IA com suporte para "visão imersiva"

Notícias em 26 de outubro, o Google anunciou que o Google Maps App vai inaugurar uma série de atualizações de recursos, incluindo novos recursos de inteligência artificial, melhorias de navegação e muito mais. Diz-se que a nova versão do Google Maps vai combinar IA para trazer resultados de pesquisa mais precisos para os usuários. Ele também exibirá resultados de fotos com base em imagens compartilhadas por outros usuários. Por exemplo, pesquisar por "latte animal", "encontrar a melhor arte de latte animal" ou "levar o cão para o campo de abóbora" obterá os resultados prioritários mais imediatos. O Google diz que os resultados são baseados em bilhões de fotos analisadas pela comunidade do Google Maps. O novo recurso estará disponível esta semana na França, Alemanha, Japão, Reino Unido e Estados Unidos, com uma expansão gradual para mais países e regiões.

OpenAI está formando uma nova equipe, Preparedness, para avaliar os "riscos catastróficos" da IA

Em 27 de outubro, a OpenAI anunciou que estava criando uma nova equipe, Preparedness, para avaliar e mitigar "riscos catastróficos" associados à IA. A principal missão da equipa é "rastrear, avaliar, prever e proteger" problemas potencialmente significativos causados pela IA, incluindo ameaças nucleares. Além disso, a equipe trabalhará para mitigar "ameaças químicas, biológicas e radiológicas", bem como o comportamento de "replicação autônoma" da IA. A equipa está também encarregada de desenvolver e manter uma política de desenvolvimento informada sobre os riscos (PDR). O PDR irá detalhar a sua abordagem para desenvolver uma avaliação e monitorização rigorosas da capacidade de modelos de ponta, criando um conjunto de ações de conservação e estabelecendo estruturas de governação de responsabilização e supervisão ao longo do processo de desenvolvimento.

CEO da Amazon: Acredite que a IA generativa gerará dezenas de bilhões de dólares em receita para os serviços de nuvem da AWS nos próximos anos

Em 27 de outubro, a Amazon divulgou seu relatório financeiro do terceiro trimestre de 2023, com receita no terceiro trimestre de US$ 143,08 bilhões, em comparação com US$ 127,1 bilhões no mesmo período do ano passado, e o mercado esperava US$ 141,4 bilhões. A Amazon espera vendas líquidas no quarto trimestre de US$ 160 bilhões a US$ 167 bilhões, contra expectativas do mercado de US$ 166,57 bilhões.

Yonyou Dayi TRM baseado no modelo de serviço empresarial YonGPT. AI2.0 está online

Yonyou Dayi TRM. AI2.0 foi recentemente anunciado oficialmente. Segundo relatos, Yonyou Dayi TRM. O AI2.0 conta com o modelo de serviço empresarial de grande porte da YonGPT para implementar a tecnologia de IA em vários cenários de aplicação de recrutamento, como descoberta de talentos, entrevistas inteligentes e perguntas e respostas de consultoria.

Honor Magic 6 será equipado com a plataforma móvel Snapdragon 8 Gen 3 e suportará 7 bilhões de modelos grandes de extremidade de IA de parâmetro

Em 25 de outubro, o CEO da Honor, Zhao Ming, anunciou no Qualcomm Snapdragon Technology Summit que o próximo Magic6 da Honor será equipado com a plataforma móvel Qualcomm Snapdragon 8 Gen3 e suportará 7 bilhões de parâmetros de modelos grandes finais de IA. Atualmente, o modelo grande de IA do lado do dispositivo Honor pode fornecer aos usuários serviços personalizados com base na compreensão e perceção das preferências do usuário, combinado com interação natural multimodal, Honor Magic6 pode entender as intenções do usuário com mais precisão e tridimensionalmente, e também pode aprender cognitivamente imagens, textos e semânticas complexas.

Xiaomi O Paper OS implanta modelos grandes de IA no sistema e é o primeiro a suportar a implantação da NPU

relatou em 26 de outubro que na conferência de novos produtos Xiaomi Surging OS e Xiaomi 14 series, o chefe da Xiaomi MIUI, Jin Fan, apresentou o novo Xiaomi Surging OS. Diz-se que a Xiaomi implanta modelos grandes de IA no sistema, e o Xiaoai Input Assistant suporta IA para criar texto, que é diretamente acessível com um clique.

Kingsoft Office Official Wei também anunciou que na pesquisa e desenvolvimento de novos produtos, Xiaomi e WPS chegaram a uma cooperação aprofundada, convidando os usuários a se candidatarem para experimentar o escritório inteligente móvel, e os usuários de telefones celulares da série Xiaomi 14 podem baixar a versão exclusiva do WPS com função WPS AI através da comunidade Xiaomi. Além disso, Xiaomi The Paper OS também suporta AI Miaohua e pesquisa de imagens AI, os usuários podem procurar imagens através de linguagem natural, sem a necessidade de expressão precisa.

Apple e Universidade de Illinois lançam o modelo de visão unificada SAM-CLIP

De acordo com a página Arxiv, pesquisadores da Apple e da Universidade de Illinois em Urbana-Champaign publicaram recentemente em conjunto um artigo apresentando um modelo de base visual unificado chamado SAM-CLIP. O SAM-CLIP unifica os dois modelos visuais fundamentais do CLIP e do Segment Anything Model, e combina as vantagens de ambos os modelos em um modelo unificado usando tecnologias como aprendizagem multitarefa e aprendizagem contínua. Além disso, o SAM-CLIP introduz recursos de colaboração.

Investimento e financiamento:

AI Startup Credal.ai completa US$ 4,8 milhões em rodada semente, liderada pela Spark Capital

A startup apoiada pela Y Combinator, Credal.ai fechou uma rodada seed de US$ 4,8 milhões liderada pela Spark Capital, que visa fornecer uma maneira para as empresas conectarem seus dados internos a modelos de IA gerados por texto e hospedados na nuvem, conforme relatado em 26 de outubro.

A Cranium, uma empresa de IA incubada pela KPMG, levantou US$ 25 milhões, liderada pela Telstra Ventures

Foi relatado em 26 de outubro que a Cranium, uma empresa de IA incubada pela KPMG, anunciou um financiamento Série A de US$ 25 milhões. A rodada foi liderada pela Telstra Ventures com participação da KPMG LLP e SYN Ventures, elevando o financiamento total da Cranium para US$ 32 milhões.

O Cranium's Connectors é um software de segurança que ajuda a monitorar e avaliar o uso de IA em organizações de clientes em tempo real, suportando a maioria dos principais ambientes, modelos e estruturas de desenvolvimento de IA, incluindo Azure, Azure OpenAI, AWS Sagemaker, Google VertexAI, Databricks, MLflow, Dataiku e DataRobot. Outro produto, o AI Card, lançado no verão de 2023, permite que os clientes da Cranium conectem seus aplicativos de IA à ferramenta segura de avaliação de software da Cranium e gerem arquivos discretos contendo informações sobre valor, finalidade, dados e governança.

Boa recomendação de artigo:

"Cercado por gigantes, técnica de sobrevivência de site de pintura de IA"

Recentemente, a OpenAI anunciou que o DALL-E 3 foi lançado oficialmente no ChatGPT Plus e Enterprise Edition, o que significa que a pintura AI não é mais apenas um brinquedo novo para a OpenAI, mas começou a ganhar dinheiro real.

Do ponto de vista da indústria, isso parece ser uma necessidade. Quanto maior a qualidade e melhor o desempenho da pintura de IA, maiores as barreiras técnicas, e a "parede paga" construída com base nisso se tornou uma coisa lógica. Mas o problema é que na atual trilha de pintura de IA, além das Três Grandes, ainda há um grande número de pinturas de IA de código aberto.

No estado de força absoluta relativamente fraca e código aberto, como esses diferentes tipos de pinturas de IA encontram sua própria diferenciação e alcançam lucratividade?

Combinando ChatGPT com robôs físicos, a Boston Dynamics desenvolveu um monstro! 》

Em 27 de outubro, a Boston Dynamics, maior desenvolvedora de robótica do mundo, mostrou um novo estudo em seu site que desenvolveu um cão-robô guiado por guia falante combinando ChatGPT, Spot e outros modelos de IA.

É relatado que o cão robô pode falar com os seres humanos de acordo com prompts de texto e voz, e fornece uma função visual de perguntas e respostas, que pode analisar a imagem tirada pela câmera e gerar automaticamente descrições de imagem.

"Competindo pelo grande modelo de Wenshengtu, Baidu, Kuaishou, NetEase "Batalha aberta e escura"

A pintura de IA é simplesmente "Wen Sheng Tu", que se refere à entrada de alguma linguagem descritiva, que a IA pode usar para gerar pinturas criativas. O rápido desenvolvimento da tecnologia AIGC fez com que o modelo "Wensheng Graph" continuasse a alcançar melhores resultados de geração, graças a isso, seja um gigante da Internet como Baidu e NetEase, ou uma empresa de ponta como a Kuaishou correram para entrar no jogo, tentando explorar mais novas possibilidades nos negócios com a ajuda da nova coisa de "Wensheng Graph".

Ver original

Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.

2 gostos

Recompensa
2
Comentar
Partilhar

Comentar

0/400

Nenhum comentário

Tópico
1/3
1Show My Alpha Points
12k Popularidade
2Crypto Market Rebound
165k Popularidade
3SEC Crypto Project
20k Popularidade
4CandyDrop Airdrop Event 6.0
99k Popularidade
5White House Crypto Report
82k Popularidade

Pino