Anúncio fechado

Inteligência artificial, ou IA, é um termo muito utilizado atualmente. Seja em um smartphone com Androidem, um serviço de streaming que recomenda seu próximo filme ou uma plataforma de música que cria automaticamente uma lista de reprodução – parece que a IA está simplesmente em toda parte. Mas como evoluiu a definição de IA e o que realmente significam alguns dos termos técnicos de IA?

O que exatamente é IA?

Historicamente, a IA referia-se à inteligência de nível humano alcançada artificialmente através de máquinas. No entanto, o termo mudou ligeiramente o seu significado original ao longo dos anos e agora é frequentemente usado como um termo amplo de marketing, entre outras coisas. Hoje, quase tudo que mostra sinais de inteligência, desde recomendações de comércio eletrônico até sistemas de reconhecimento de voz, é chamado de IA. No entanto, vários outros termos e abreviações estão associados à inteligência artificial. Vamos esclarecer os mais comuns.

Aprendizado de máquina (ML – aprendizado de máquina)

O aprendizado de máquina é uma subcategoria da IA ​​na qual os sistemas aprendem com dados e experiência para tomar decisões ou realizar diversas ações – por exemplo, se você alimentar um algoritmo com milhares de fotos de gatos, ele aprenderá a identificar um gato. Você pode então fornecer fotos de gatos, cachorros e outros animais. O sistema deverá então ser capaz de selecionar fotos de gatos com base no que “aprendeu”. Esse processo de aprendizagem envolve duas fases principais: treinamento e derivação, o que nos leva aos próximos termos.

Treinamento

A fase de treinamento é um longo estágio de aprendizado de máquina em que o sistema recebe grandes quantidades de dados para aprender – as já mencionadas imagens de gatos, por exemplo. Porém, os dados utilizados podem ser itens específicos, como flores, ou incluir amostras maiores, como toda a Internet. O treinamento de sistemas modernos de IA como o ChatGPT pode custar milhões e exigir enormes recursos computacionais.

Derivação

Após o treinamento, o sistema aplica o conhecimento adquirido a novos dados. Esta fase é onde ocorre a entrada do usuário final e a integração direta com a IA. Por exemplo, agora que o sistema sabe o que é um gato, podemos dar-lhe uma fotografia e ele irá identificá-lo. Pergunte aos chatbots Google Gemini ou Microsoft Copilot qual é a capital da Inglaterra e eles lhe darão uma resposta. Nesta fase, o sistema baseia-se no conhecimento estabelecido. Este estágio requer significativamente menos poder de computação.

Inteligência Geral Artificial (AGI)

AGI refere-se a máquinas com inteligência de nível humano, capazes de tomar decisões, planejar e compreender o mundo em um contexto mais amplo. Ao contrário dos atuais sistemas de IA, a AGI teria uma compreensão e consciência mais profundas, semelhante ao que vemos na ficção científica. Embora AGI ainda seja a música de um futuro distante, já que decifrar esse código exigiria muitas questões técnicas, filosóficas e morais, é uma área significativa de pesquisa.

IA generativa

Tradicionalmente, a IA tem-se destacado na classificação e reconhecimento, mas a IA generativa vai além destas ideias e cria novos conteúdos, como texto, imagens e música. Este avanço revolucionário abriu novas possibilidades na IA, permitindo que os sistemas gerassem resultados criativos com base em dados de entrada. Essa forma de IA também traz benefícios mais tangíveis para os usuários comuns, especialmente se você já usou o ChatGPT para criar um e-mail ou o Midjourney para gerar a imagem de um gato.

Redes Neurais

As redes neurais são os blocos de construção básicos e a espinha dorsal da IA ​​moderna. Eles existem há décadas e são modelados a partir do cérebro humano. Eles consistem em neurônios interconectados que processam dados através de diferentes camadas, o que, em última análise, produz uma saída. Treinar uma rede neural envolve ajustar as conexões entre os neurônios para melhorar a precisão.

Redes de transformação

Um tipo especial de rede neural, uma rede de transformação, permitiu o desenvolvimento de grandes modelos de linguagem (LLMs), como o ChatGPT. Essas redes são excelentes na compreensão do contexto e dos relacionamentos nos dados, tornando-as ideais para tarefas de processamento de linguagem.

Modelos de Grandes Linguagens (LLM)

Quando redes neurais, transformadores e treinamento para uma rede neural muito grande são combinados, nascem grandes modelos de linguagem. Os chamados LLMs são treinados em grandes quantidades de dados de texto, permitindo-lhes gerar respostas semelhantes às humanas. Exemplos incluem ChatGPT, Claude, LLaMA e Grok. Esses modelos funcionam prevendo a próxima palavra na sequência e produzindo resultados coerentes e contextualmente relevantes. No entanto, esta natureza preditiva pode levar a problemas como alucinações, onde o modelo gera informações plausíveis, mas incorretas. E o que exatamente são essas alucinações?

Alucinação

As chamadas alucinações ocorrem quando a IA gera informações incorretas devido à sua dependência de modelos preditivos. Este é um desafio significativo para os LLMs, pois podem produzir resultados convincentes, mas falsos. Um exemplo clássico de alucinação pode ser recomendar supercola ou uma pistola de derretimento quente quando questionado sobre como evitar que o queijo escorregue da pizza.

Parâmetros e tamanho do modelo

A eficácia dos modelos de IA é frequentemente medida pelos seus parâmetros globais, que representam conexões numa rede neural. Modelos maiores com mais parâmetros geralmente apresentam melhor desempenho, mas requerem mais recursos. Modelos menores são teoricamente menos precisos, mas podem funcionar em hardware mais econômico. Por exemplo, o enorme modelo de nuvem LLaMA 3.1 possui 405 bilhões de parâmetros, enquanto os modelos que rodam nativamente em smartphones consistem em apenas alguns bilhões de parâmetros.

Modelos de difusão

Modelos de difusão são modelos usados ​​para gerar imagens, modelos de difusão invertem o processo de adição de ruído às imagens durante o treinamento. Isto permite-lhes criar novas imagens a partir de ruído aleatório, guiadas por padrões aprendidos.

Geração Aumentada de Recuperação (RAG)

RAG combina IA generativa com fontes de dados externas para produzir resultados precisos e contextualmente relevantes. Ao baixar dados adicionais, esses modelos podem melhorar seus resultados, tornando-os mais confiáveis ​​e úteis.

O mais lido de hoje

.