Nicolás Cánovas, gerente-geral da AMD para a América Latina, descreve como os conceitos de Machine Learning e Deep Learning evoluíram
Atualmente, a Inteligência Artificial (IA) tornou-se um fenômeno altamente popular, posicionando-se como uma tecnologia-chave para impulsionar o progresso em diversos campos, como saúde, automotivo, logística, atendimento ao cliente, análise de dados, cibersegurança e muitos outros.
A IA é principalmente usada como um termo genérico para todas as formas de inteligência baseada em computação. Em geral, aplica-se a qualquer sistema que imite processos humanos de aprendizado e tomada de decisão em resposta a informações, análise de dados, reconhecimento de padrões ou desenvolvimento de estratégias.
Os termos Aprendizado de Máquina (Machine Learning – ML) e Aprendizado Profundo (Deep Learning – DL) descrevem melhor a realidade dos sistemas computacionais inteligentes atuais e os problemas que eles podem resolver para desenvolvedores e usuários finais.
A conscientização pública sobre a IA aumentou significativamente com o lançamento do ChatGPT, Microsoft Bing Chat e Google Bard no final de 2022. Desde então, o volume de notícias aumentou em quase 500%, por exemplo, passando de 4.700 artigos em outubro nos meios de comunicação dos EUA para quase 22 mil em abril.
No entanto, a IA faz muito mais do que aprimorar modelos de linguagem generativos. Na verdade, na AMD, temos impulsionado seu uso para personalizar o desempenho dos processadores Ryzen, oferecendo a eficiência necessária e se adaptando às necessidades modernas de nossos usuários.
Foco na inovação
Nosso papel nesse círculo virtuoso de inovação se traduz em fornecer tecnologia de computação de alto desempenho para suportar a vasta quantidade de informações exigida por qualquer aplicativo de IA, por mais simples que seja.
Trabalhamos para promover e expandir as capacidades e otimizações do Aprendizado de Máquina (ML). Após adquirir a Xilinx, a AMD lançou a ferramenta Vitis AI, fornecendo assim uma plataforma abrangente para o desenvolvimento de inferência de IA em aceleradores de data center Alveo e SoCs adaptáveis da AMD.
O Vitis AI se integra a ferramentas comuns de desenvolvimento de software e utiliza uma ampla gama de bibliotecas de código aberto otimizadas para capacitar os desenvolvedores com aceleração de aprendizado de máquina.
Da mesma forma, os processadores da série AMD Ryzen 7040 com a tecnologia Ryzen AI possuem um chip especificamente projetado para executar todo tipo de atividade de acordo com as necessidades de cada cliente. O desempenho do hardware AMD e do software associado também oferece benefícios significativos para o processo de desenvolvimento e teste de sistemas de Inteligência Artificial.
Atualmente, uma plataforma de computação baseada nas últimas tecnologias da AMD (CPU AMD EPYC e GPU Radeon Instinct) pode desenvolver e testar um novo aplicativo inteligente em dias ou semanas, um processo que costumava levar anos.
Entendendo Machine Learning e Deep Learning
Os sistemas de inteligência computacional de última geração em Aprendizado de Máquina (ML) e Aprendizado Profundo (DL) são capazes de ajustar suas operações após uma exposição contínua a dados e outros tipos de informações. Embora sejam relacionados em natureza, existem diferenças sutis que os distinguem dentro da ciência da computação.
O ML refere-se a um sistema que pode aprender ativamente por si só, em vez de apenas receber e processar informações passivamente. O sistema computacional é programado para responder às informações fornecidas como se fosse um ser humano, utilizando algoritmos que analisam os dados em busca de padrões ou estruturas. Os algoritmos de ML são projetados para melhorar o desempenho ao longo do tempo à medida que são expostos a mais dados.
Quando um ser humano reconhece algo, esse reconhecimento acontece instantaneamente. Para imitar esse processo, os algoritmos de ML utilizam redes neurais. Assim como o processo de aprendizado humano, o cálculo nas redes neurais classifica os dados com base em elementos reconhecidos na imagem.
A taxa de sucesso da classificação correta pode melhorar ao longo do tempo com o feedback fornecido por humanos “especialistas”, ajudando o sistema a aprender e distinguir decisões corretas das incorretas, visando a máxima eficiência e maior precisão. O algoritmo da rede neural ajusta todas as decisões futuras com base no feedback recebido. Esse processo imita o reconhecimento humano, treinando a rede para produzir o resultado desejado.
Uma rede neural pode fazer uma declaração e, em seguida, o algoritmo aplica esse aprendizado aos dados, procurando e categorizando os elementos definidos. Esse processo pode melhorar ao longo do tempo com a ajuda das informações fornecidas por indivíduos. O algoritmo da rede neural ajusta todas as decisões futuras com base nas informações recebidas, resultando em uma coleta de dados mais precisa.
Por exemplo, se a informação fornecida fosse que “cada forma possui várias variações”, o algoritmo poderia organizar os resultados da seguinte forma: o Google contratou fotógrafos profissionais e especialistas em documentários para fornecer diretrizes técnicas para treinar o algoritmo baseado em rede neural por trás de sua câmera inteligente, Clips.
As informações fornecidas ajudaram a câmera a se tornar mais intuitiva, não apenas nos aspectos técnicos da fotografia digital, mas também em antecipar qualidades mais abstratas na captura de momentos memoráveis.
O DL concentra-se em um subconjunto de ML que vai ainda mais longe para resolver problemas, inspirado em como o cérebro humano reconhece e lembra informações sem entrada externa de especialistas para direcionar o processo.
Aplicações de DL devem acessar vastas quantidades de dados a partir dos quais aprendem. Os algoritmos de DL utilizam redes neurais profundas para acessar conjuntos extensos de informações, explorá-los e analisá-los, por exemplo, todos os arquivos de música no Spotify ou Pandora para fazer sugestões contínuas de músicas com base nas preferências específicas de um usuário.
O principal fator distintivo entre o Aprendizado Profundo (DL) e o Aprendizado de Máquina (ML) é a representação dos dados. Por exemplo, no exemplo mencionado da câmera inteligente Clips do Google, foi necessária a entrada de fotógrafos profissionais para treinar o sistema.
No entanto, em sistemas de DL, não são necessários especialistas para identificar características precisas. Os dados, sejam eles uma imagem, um artigo de notícias ou uma música, são avaliados em sua forma natural, sem processamento prévio, com transformações mínimas. Esse processo de treinamento não supervisionado é às vezes chamado de aprendizado de representação. Durante o treinamento, o algoritmo de DL aprende progressivamente com os dados para melhorar a precisão de suas conclusões (também conhecidas como inferências).