Inteligência artificial, ou IA, é um termo muito utilizado atualmente. Seja em um smartphone Android, em um serviço de streaming que recomenda seu próximo filme ou em uma plataforma de música com curadoria de uma playlist, a IA parece estar em toda parte. Mas como evoluiu a definição de IA e o que realmente significam alguns dos termos mais técnicos de IA? Abaixo, mergulhamos nos principais termos e conceitos que definem a IA moderna, ajudando você a navegar neste campo complexo e em rápida evolução.
O que é realmente IA?
Historicamente, a IA referia-se à inteligência de nível humano alcançada artificialmente através de máquinas. No entanto, o termo foi diluído ao longo dos anos e agora é frequentemente usado como um termo amplo de marketing. Hoje, tudo o que apresenta características de inteligência, desde recomendações de comércio eletrónico a sistemas de reconhecimento de voz, é rotulado como IA.
Para compreender melhor as nuances, devemos explorar termos específicos de IA que distinguem entre marketing exagerado e avanços tecnológicos.
Aprendizado de máquina (ML)
O aprendizado de máquina é uma subcategoria da IA na qual os sistemas aprendem com dados e experiências para tomar decisões ou realizar ações. Por exemplo, se você alimentar um algoritmo com milhares de fotos de gatos, ele aprende a identificar um gato. Você pode então fornecer fotos de gatos, cachorros e outros animais. O sistema deverá então ser capaz de selecionar as imagens de gatos com base no que “aprendeu”.
Este processo de aprendizagem envolve duas fases principais: treinamento e inferência.
Treinamento
A fase de treinamento é um longo estágio de aprendizado de máquina em que o sistema recebe grandes quantidades de dados para aprender – por exemplo, imagens de gatos. Porém, os dados utilizados podem ser itens específicos, como flores, ou incluir amostras maiores, como a internet como um todo. O treinamento de sistemas modernos de IA como o ChatGPT pode custar milhões e exigir imensos recursos computacionais.
Inferência
Calvin Wankhede / Autoridade Android
Após o treinamento, o sistema aplica o conhecimento aprendido a novos dados. Esta fase é onde entra o usuário final, permitindo-nos interagir com aplicações de IA. Por exemplo, agora que o sistema sabe o que é um gato, podemos alimentá-lo com uma imagem e ele o identificará. Pergunte ao Google Gemini ou ao Microsoft Copilot qual é a capital da Inglaterra e eles responderão. Nesta fase, o sistema baseia-se nas aprendizagens estabelecidas. Esta fase requer significativamente menos poder de computação.
Inteligência Geral Artificial (AGI)
AGI refere-se a máquinas com inteligência de nível humano, capazes de tomar decisões, planejar e compreender o mundo em um contexto mais amplo. Ao contrário dos atuais sistemas de IA, a AGI possuiria uma compreensão e consciência mais profundas, semelhante ao que vemos na ficção científica. Embora estejamos longe de alcançar a AGI, já que decifrar esse código exigiria muitas questões técnicas, filosóficas e morais, é uma área significativa de pesquisa.
No vídeo acima, cobrimos as implicações da AGI, incluindo as noções de inteligência artificial “fraca” e “forte”. É um tópico amplo e vale a pena se aprofundar.
IA generativa
Andy Walker / Autoridade Android
Tradicionalmente, a IA tem sido excelente na classificação e reconhecimento, mas a IA generativa vai além destas ideias para criar novos conteúdos, como texto, imagens e música. Este avanço revolucionário abriu novas possibilidades na IA, permitindo que os sistemas gerem resultados criativos com base em dados de entrada. Esse também é o lado da IA que produz os benefícios mais tangíveis para os usuários comuns, especialmente se você já usou o ChatGPT para redigir um e-mail ou usou o Midjourney para gerar a imagem de um gato.
Redes Neurais
As redes neurais são os blocos de construção fundamentais e a espinha dorsal da IA moderna. Eles existem há décadas e são modelados no cérebro humano. Eles consistem em neurônios interconectados que processam dados através de várias camadas, produzindo, em última análise, uma saída. Treinar uma rede neural envolve ajustar as conexões entre os neurônios para melhorar a precisão.
Redes de transformadores
Calvin Wankhede / Autoridade Android
Um tipo especial de rede neural, redes transformadoras, permitiu o desenvolvimento de grandes modelos de linguagem (LLMs) como ChatGPT. Essas redes são excelentes na compreensão do contexto e dos relacionamentos dentro dos dados, tornando-as ideais para tarefas de processamento de linguagem.
Grandes Modelos de Linguagem (LLMs)
Quando redes neurais, transformadores e treinamento para uma rede neural muito grande são combinados, nascem grandes modelos de linguagem.
Os LLMs são treinados em grandes quantidades de dados de texto, permitindo-lhes gerar respostas semelhantes às humanas. Pense em ChatGPT, Claude, LLaMA e Grok. Eles funcionam prevendo a próxima palavra em uma sequência, criando resultados coerentes e contextualmente relevantes. No entanto, esta natureza preditiva pode levar a problemas como alucinações, onde o modelo gera informações plausíveis, mas incorretas. Abordaremos isso na próxima seção.
Alucinações
C. Scott Brown / Autoridade Android
As alucinações ocorrem quando a IA gera informações incorretas devido à sua dependência de modelos preditivos. Este é um desafio significativo para os LLMs, pois podem produzir resultados convincentes, mas falsos.
Um exemplo clássico de alucinação foi a resposta ao resultado de pesquisa do Google: “Como evitar que o queijo escorregue da sua pizza?” que incluía a resposta aprimorada por IA: “Bem, você deveria usar supercola. Cole na sua pizza. O LLM pegou a resposta de uma postagem do Reddit e acreditou que estava correta.
Parâmetros e tamanho do modelo
A eficácia dos modelos de IA é frequentemente medida pelos seus parâmetros totais, representando as conexões dentro da rede neural. Modelos maiores com mais parâmetros geralmente apresentam melhor desempenho, mas requerem mais recursos. Modelos menores são teoricamente menos precisos, mas podem funcionar em hardware mais econômico.
Por exemplo, o enorme modelo baseado em nuvem LLaMA 3.1 tem 405 bilhões de parâmetros, enquanto os modelos que rodam nativamente em smartphones consistem apenas em alguns bilhões de parâmetros.
Modelos de difusão
Rita El Khoury / Autoridade Android
Usados para geração de imagens, os modelos de difusão revertem o processo de adição de ruído às imagens durante o treinamento. Isto permite-lhes criar novas imagens a partir de ruído aleatório, guiadas por padrões aprendidos.
Geração Aumentada de Recuperação (RAG)
RAG combina IA generativa com fontes de dados externas para produzir resultados precisos e contextualmente relevantes. Ao recuperar dados adicionais, estes modelos podem melhorar os seus resultados, tornando-os mais fiáveis e úteis.
Compreender os termos e conceitos da IA pode ser particularmente complicado. Mas à medida que o campo evolui, manter-se informado irá ajudá-lo a navegar no mundo emocionante e por vezes desafiador da inteligência artificial. Quer você seja um entusiasta de tecnologia ou um profissional da área, este guia fornece uma base sólida para explorar o futuro da IA.