Resumo do Nvidia Fall GTC 2020: GPU A6000, Omniverse, mais

“A era da IA. começou”, declarou o CEO da Nvidia, Jensen Huang, no GTC deste ano. Em sua Conferência de Tecnologia de GPU deste ano, a Nvidia apresentou sua inovação para promover a IA, observando como a tecnologia poderia ajudar a resolver os problemas do mundo 10 vezes melhor e mais rápido.

Conteúdo

  • Mais um pedido de desculpas pelo lançamento do RTX 3080/3090
  • Nvidia Omniverse é um campo de treinamento para robôs
  • Nvidia RTX A6000: Ray tracing para profissionais
  • A ascensão da IA robôs
  • IA para o futuro do trabalho em casa
  • Trazendo um data center para um chip ARM
  • Mecanismos de recomendação personalizados
  • IA para toda a IoT
  • Avançando ARM

Embora a Nvidia seja mais conhecida por seu placas gráficas - e mais recentemente associado a tempo real rastreamento de raios — a empresa também está impulsionando a inovação nos bastidores que traz inteligência artificial para nossas vidas diárias, a partir de robôs de armazém que embalam nossos pedidos de remessa, até carros autônomos e bots de linguagem natural que fornecem notícias, pesquisas e informações com pouca latência ou atraso.

“Adoramos trabalhar em problemas de computação extremamente difíceis que têm grande impacto no mundo”, disse Huang, observando que a empresa agora tem 110 SDKs direcionados a mais de 1 bilhão de GPUs compatíveis com CUDA que foram enviado. A empresa afirma que mais de 6.500 startups estão construindo aplicativos na Nvidia, juntando-se ao total de 2 milhões de desenvolvedores da Nvidia. “Isso está bem na nossa casa do leme. Estamos todos aqui para avançar e democratizar esta nova forma de computação para a era da IA. A Nvidia está dedicada ao avanço da computação acelerada.”

Relacionado

  • A Nvidia está trazendo IA estilo ChatGPT para videogames, e já estou preocupado
  • Apresentei minha ideia ridícula de startup para um robô VC
  • IA analógica? Parece loucura, mas pode ser o futuro

Mais um pedido de desculpas pelo lançamento do RTX 3080/3090

Huang começou com outro rápido pedido de desculpas sobre o difícil lançamento das placas de vídeo Nvidia RTX 3080 e 3090. Leia mais aqui.

Vídeos recomendados

Nvidia Omniverse é um campo de treinamento para robôs

Para jogadores, rastreamento de raios ajuda a renderizar detalhes vívidos em cenas de videogames usando a propriedade da luz. A Nvidia está usando os mesmos princípios para construir o Nvidia Omniverse, que a empresa afirma ser “um lugar onde os robôs podem aprender a ser robôs, assim como fariam no mundo real”.

Disponível agora em beta aberto, o Nvidia Omniverse é uma plataforma aberta para colaboração e simulação onde os robôs podem aprender com simulações realistas do mundo real. Usando o Omniverse, os veículos autônomos podem aprender rapidamente a dirigir e interagir com cenários reais. motoristas humanos podem encontrar, sem o risco de colocar os transeuntes em perigo se o experimento for lateralmente. Omniverse também permite testes em uma escala muito mais ampla, já que um veículo ou robô autônomo não precisa ser implantado fisicamente para testá-lo.

Para mostrar como o Nvidia Omniverse pode afetar a todos nós, a Nvidia destacou como o Omniverse pode funcionar na descoberta de medicamentos, que é uma área de pesquisa ainda mais vital devido à pandemia global. Embora a descoberta de medicamentos normalmente leve mais de uma década para ser desenvolvida e exija mais de meio bilhão de dólares em financiamento de pesquisa e desenvolvimento, 90% desses esforços falham, disse Huang. Para piorar a situação, a cada nove anos, o custo da descoberta de novos medicamentos duplica.

O Omniverse da Nvidia pode ajudar os cientistas a identificar as proteínas que podem causar doenças, bem como acelerar os testes de medicamentos potenciais usando IA. e análise de dados. Tudo isso se aplica à nova plataforma Clara Discovery da Nvidia. E no Reino Unido, a Nvidia apresentou seu novo data center Cambridge One, que a empresa afirma ser o mais rápido da região e um dos 30 melhores do mundo, com 400 petaflops de IA. desempenho.

A empresa também introduziu sua nova arquitetura DGX Super Pod, para permitir que outros pesquisadores construam seus próprios supercomputadores escaláveis ​​que conectam entre 20 e 140 Sistemas DGX.

Nvidia RTX A6000: Ray tracing para profissionais

Expandindo as recentemente anunciadas GeForce RTX 3070, RTX 3080 e RTX 3090 placas gráficas, a Nvidia anunciou uma nova geração de GPUs baseadas em Ampere para profissionais. O novo placas gráficas não são marcados sob Guarda-chuva Quadro da Nvidia, mas as GPUs RTX A6000 e Nvidia A40 são direcionadas ao mesmo público criativo e de cientistas de dados que compram as GPUs Quadro.

“As GPUs fornecem velocidade e desempenho para permitir que engenheiros desenvolvam produtos inovadores, designers criem edifícios de última geração e cientistas descubram inovações em em qualquer lugar do mundo”, afirmou a empresa em uma postagem no blog, observando que os novos A6000 e A40 apresentam novos núcleos RT, núcleos Tensor e núcleos CUDA que são “significativamente mais rápidos que os anteriores gerações.”

A empresa não forneceu detalhes específicos sobre o hardware. No entanto, a Nvidia afirmou que os núcleos RT de segunda geração oferecem 2x o rendimento das placas da geração anterior, ao mesmo tempo que fornecem desempenho simultâneo. rastreamento de raios, sombreamento e recursos de computação, enquanto os núcleos Tensor de terceira geração fornecem até 5x o rendimento da geração anterior.

As placas vêm com 48 GB de memória GPU que pode ser expandida até 96 GB com NVLink quando duas GPUs estão conectadas. Isso se compara a apenas 24 GB de memória no RTX3090. Considerando que o RTX 3090 é comercializado como uma GPU capaz de renderizar jogos em 8K a 60 quadros por segundo (fps), o a memória expandida nas RTX A6000 e A40 profissionais ajuda a processar imagens Blackmagic RAW 8K e 12K para vídeo edição. Assim como as placas Ampere de consumo, as GPUs A6000 e A40 são baseadas em PCIe Gen 4, que oferece o dobro da largura de banda da geração anterior.

Os servidores baseados em A40 estarão disponíveis em sistemas da Cisco, Dell, Fujitsu, Hewlett Packard Enterprise e Lenovo. As GPUs A6000 chegarão aos parceiros de canal e ambas as GPUs estarão disponíveis no início do próximo ano. Os detalhes de preços não estavam disponíveis imediatamente e não está claro se os cartões profissionais terão o mesmo oferta limitada e grandes carências que a Nvidia experimentou com o lançamento de seus cartões de consumo.

A ascensão da IA robôs

A Nvidia também destacou como seu trabalho em GPUs está ajudando a acelerar a IA. desenvolvimento e adoção. Facebooké IA pesquisadores desenvolveram um chatbot com conhecimento e empatia que metade dos usuários da rede social realmente preferia. Pesquisadores do Instituto de Tecnologia da Califórnia treinaram um drone usando aprendizado por reforço para controlar o sistema de voo para voar suavemente em meio a turbulências e mudanças no terreno.

IA da Nvidia é baseado em três pilares: nós únicos a multi-GPU em qualquer estrutura ou modelo, o uso de inferência e a aplicação de modelos pré-treinados, disse Huang.

A Nvidia também anunciou que fez parceria com a Microsoft para trazer a Nvidia A.I. ao Azure para ajudar a tornar o Office mais inteligente.

“Hoje, estamos anunciando que a Microsoft está adotando a Nvidia A.I. no Azure, para potencializar experiências inteligentes no Microsoft Office”, disse Huang durante a palestra. “O aplicativo de produtividade mais popular do mundo, usado por centenas de milhões de pessoas, agora será assistido por IA. Os primeiros recursos incluirão correção gramatical inteligente, perguntas e respostas e previsão de texto. Devido ao volume de usuários e à resposta instantânea necessária para uma boa experiência, o Office estará conectado às GPUs Nvidia, e o Azure com GPUs Nvidia as respostas levam menos de 200 milissegundos. Nosso rendimento permite que a Microsoft alcance milhões de usuários simultâneos.”

A American Express também está usando IA. para combater a fraude, enquanto o Twitter aproveita a inteligência artificial para ajudá-lo a compreender e contextualizar a grande quantidade de vídeos enviados para a plataforma.

Com IA conversacional, os resultados de consultas de voz realizadas na plataforma GPU da Nvidia têm metade do latência em comparação com consultas processadas pela CPU e também conversão de texto em fala mais realista e com som humano motores. A Nvidia também anunciou uma versão beta aberta do Jarvis para os desenvolvedores experimentarem a IA. com habilidades de conversação.

IA para o futuro do trabalho em casa

IA também pode ser integrado a aplicativos como soluções de videoconferência e bate-papo que ajudam os funcionários a colaborar remotamente. Com o Video Maxene da Nvidia, Huang disse que A.I. pode fazer mágica para videochamadas.

Maxene pode identificar as características importantes de um rosto, enviar apenas as alterações das características pela internet e depois reanimar o rosto no receptor. Isso economiza largura de banda, proporcionando uma melhor experiência de vídeo em áreas com baixa conectividade à Internet. Huang afirmou que a largura de banda é reduzida por um fator de 10.

IA no entanto, torne as chamadas melhores mesmo em áreas com alta largura de banda. No exemplo mais extremo, A.I. pode ser usado para reorientar seu rosto para que você faça contato visual com todas as pessoas em uma chamada, mesmo quando seu rosto estiver ligeiramente inclinado para longe da câmera. IA também pode reduzir o ruído de fundo, iluminar seu rosto, substituir o fundo e melhorar a qualidade do vídeo em condições de iluminação insuficiente. Combinado com Jarvis A.I. discurso, Maxene também pode fornecer texto de legenda oculta.

“Temos a oportunidade de revolucionar a videoconferência de hoje e inventar a presença virtual de amanhã”, disse Huang. “E o vídeo A.I. aplicações de inferência estão vindo de todos os setores.”

Trazendo um data center para um chip ARM

Destacando seu investimento em chips ARM, a Nvidia anunciou os novos DPUs BlueField, que trazem o poder de uma infraestrutura de data center em um chip e são suportados pelo DOCA, que é o arquitetura.

As novas DPUs BlueField 2 descarregam componentes críticos – como rede e armazenamento – bem como tarefas de segurança da CPU para ajudar a prevenir ataques cibernéticos.

“Uma única DPU BlueField-2 pode fornecer os mesmos serviços de data center que podem consumir até 125 núcleos de CPU”, afirmou a Nvidia em um comunicado preparado. “Isso libera núcleos de CPU valiosos para executar uma ampla gama de outros aplicativos empresariais.” A empresa disse que pelo menos 30% da CPU estava anteriormente consumidos pela execução da infraestrutura do data center, e esses núcleos agora são liberados à medida que a tarefa é transferida para o BlueField DPU.

Um segundo DPU Bluefield 2X também vem com Nvidia Ampéretecnologia GPU baseada em GPU. Ampere traz IA ao BlueField 2X para fornecer análises de segurança em tempo real e identificar atividades maliciosas.

Mecanismos de recomendação personalizados

IA pode ser usado para fornecer recomendações personalizadas de produtos digitais e físicos em plataformas, veiculando anúncios digitais, notícias e filmes relevantes. A Nvidia afirmou que mesmo uma melhoria de 1% na precisão das recomendações pode significar bilhões a mais em vendas e maior retenção de clientes.

Para ajudar as empresas a melhorar seu mecanismo de recomendação, a Nvidia lançou o Merlin, que é alimentado pela plataforma Nvidia Rapids. Embora as soluções baseadas em CPU possam levar dias para serem aprendidas, o Merlin é considerado super-rápido e superescalável, com tempos de ciclo que vão de um dia a apenas três horas. Merlin está agora em beta aberto, disse Huang.

Rapids é usado pela Adobe para marketing inteligente, enquanto Capital One está usando a plataforma para análise de fraudes e para alimentar o chatbot Eno da empresa.

IA para toda a IoT

A plataforma EGX da Nvidia é usada para trazer IA. para dispositivos de ponta para tornar a I.A. mais responsivo para aplicativos de Internet das Coisas, ou IoT. O EGX está disponível no NGC da Nvidia e é usado por hospitais como o Northwestern Memorial Hospital para transferir para computadores algumas tarefas que são executadas rotineiramente por enfermeiras. Os pacientes, por exemplo, podem usar consultas em linguagem natural para perguntar a um bot qual procedimento eles estão realizando.

“O EGX IA. O computador integra uma GPU Mellanox Bluefield 2 e uma GPU Ampere em uma única placa PCI Express, transformando qualquer servidor OEM padrão em um servidor de IA acelerado e seguro. data center”, disse Huang.

A plataforma pode ser aproveitada em saúde, fabricação, logística, entrega, varejo e transporte.

Avançando ARM

"Hoje. estamos anunciando uma grande iniciativa para avançar a plataforma ARM”, disse Huang sobre a anunciada aquisição da ARM pela empresa, nada que esteja fazendo investimentos em três dimensões.

“Primeiro, estamos complementando os parceiros ARM com tecnologias de GPU, rede, armazenamento e segurança para criar plataformas completas e aceleradas. Em segundo lugar, estamos trabalhando com nossos parceiros para criar plataformas para NPC de borda de nuvem HPC. Isso requer sistemas de chips e software de sistema. E terceiro, estamos portando o Nvidia A.I. e motores Nvidia RTX para ARM.”

Atualmente, isso está disponível apenas na plataforma x86. No entanto, o investimento da Nvidia em ARm irá transformá-lo na vanguarda e acelerá-lo em IA. computação, disse Huang, enquanto busca posicionar a ARM como um concorrente da Intel no espaço de servidores.

Recomendações dos Editores

  • O supercomputador da Nvidia pode trazer uma nova era de ChatGPT
  • GPUs Nvidia apresentam grande aumento de preços e grande demanda de IA
  • IA do Zoom tecnologia para detectar emoções durante ligações incomoda críticos
  • Nvidia revela a primeira CPU e GPU Hopper no GTC 2022
  • Como a Nvidia está usando IA para ajudar a Domino’s a entregar pizzas mais rapidamente