Algoritmos
Qualquer regra ou conjunto de regras que possa ser usado para resolver problemas. Exemplos incluem recomendações automatizadas de produtos, divisão longa ou uma receita de bolo de chocolate.
Inteligência Geral Artificial (AGI)
Um termo geral (em grande parte hipotético), referindo-se a um sistema artificial que pode executar uma ampla gama de tarefas no mesmo nível ou superior que um humano.
Inteligência Artificial (IA)
"Inteligência" demonstrada por máquinas, muitas vezes implementada e exibida de forma diferente da inteligência humana. Além disso, subcampo da ciência da computação preocupado em pesquisar e desenvolver ferramentas que permitam aos computadores agir "inteligentemente".
Big Data
Dados que permanecem difíceis de analisar com ferramentas tradicionais de análise de dados. As características importantes dos grandes conjuntos de dados, como insights, tendências ou diferenças significativas, ficam claras apenas ao analisar todo o conjunto de dados. Frequentemente usado em análise ou aprendizado de máquina.
Chain-of-Thought Prompting
Um método de prompting que encoraja (ou força) um modelo de IA a produzir as etapas intermediárias de uma tarefa, muitas vezes melhorando a qualidade da resposta.
Compute
Um termo geral para a quantidade de poder computacional necessária para completar uma determinada tarefa.
Dataset
Uma coleção de dados, que podem ser documentos, arquivos, números, imagens ou qualquer outro tipo de dados.
Fine-Tuning
Alterações em um modelo que já foi treinado, a fim de afetar sua saída.
IA generativa (genAI)
Modelos de IA que aprendem padrões existentes em dados de treinamento e geram exemplos que se encaixam em um padrão específico solicitado no prompt. Os exemplos de treinamento podem ser multimodais (por exemplo, podem incluir uma imagem e um texto que a descreva).
Transformador Generativo Pré-treinado (GPT)
Um tipo de LLM que é construído sobre um tipo especial de arquitetura de aprendizado profundo chamado arquitetura de transformador. Essa arquitetura permite tempos de treinamento rápidos e aproveita as informações fornecidas pelo contexto em que as palavras (ou tokens) aparecem no prompt e no conjunto de treinamento.
Unidade de Processamento Gráfico (GPU)
Um tipo de arquitetura de computador que permite os cálculos rápidos e paralelos necessários para gráficos, renderização de vídeo, bem como o treinamento de modelos de Inteligência Artificial.
Alucinação
Um resultado de um modelo de IA (normalmente um modelo de linguagem) que é enganoso ou incorreto, mas apresentado com confiança como verdade.
Modelo de Linguagem
Modelo probabilístico que gera e compreende texto por meio da aprendizagem de associações entre documentos textuais durante o treinamento.
Modelo de linguagem grande (LLM)
Um modelo de linguagem que utiliza grandes quantidades de dados de treinamento baseados em texto para criar associações entre diferentes trechos de texto.
Aprendizado de Máquina
Uma categoria de algoritmos que se concentram em identificar e incorporar tendências a partir de dados de treinamento e fazer previsões para novos dados. Dito de outra forma, os algoritmos de aprendizado de máquina efetivamente generalizam a partir de exemplos que são fornecidos. Eles geralmente não usam instruções explícitas, em vez disso, confiam em soluções probabilísticas e de inferência.
Modelo
Uma representação aproximativa de um fenômeno ou conceito natural. Dois tipos notáveis de modelos são matemáticos ou baseados em software. Os modelos são usados para descrever comportamentos ou eventos.
Multimodal
Refere-se a várias modalidades, incluindo texto, áudio, vídeo ou outros tipos de dados.
Solicitação de várias disparas (Prompt de poucas tomadas)
Prompts que fornecem várias saídas de exemplo para orientar um modelo na produção de saídas com uma estrutura específica. Estes são contrastados com prompts one-shot ou zero-shot.
Processamento de Linguagem Natural (PLN)
Um subcampo da ciência da computação dedicado ao desenvolvimento de algoritmos e sistemas que possam entender e gerar linguagem humana.
Redes Neurais
Uma classe de algoritmos de aprendizado de máquina que imitam aspectos do sistema nervoso biológico, como memória ou conectividade dirigida. Uma rede neural consiste em uma ou mais camadas de nós computacionais interconectados.
Sobremontagem
Um modelo que foi treinado tão de perto de seu conjunto de dados de treinamento que é incapaz de generalizar significativamente para novas instruções ou dados de teste.
Parâmetro
Um número que influencia algum aspecto de um sistema.
Modelo Probabilístico
Um modelo que funciona observando partes anteriores de uma resposta e, em seguida, amostrando uma probabilidade para gerar a parte mais provável de dados a seguir. Um modelo probabilístico é não-determinístico: para um dado input, ele pode prever diferentes resultados em diferentes momentos. O modelo lança um "conjunto de dados" para cada novo dado gerado.
Prompt
Uma entrada (geralmente texto) que um modelo generativo usa para gerar uma saída ou resposta. Os prompts podem ser na forma de perguntas, histórias, código, imagens ou gravações de áudio, dependendo do modelo que está sendo usado. Os prompts são usados para ajustar os modelos para alterar suas saídas.
Geração aumentada de recuperação
Uma abordagem usada por sistemas de IA para lembrar informações, usando um sistema secundário de armazenamento e recuperação.
Single-Shot Prompting
Usando um prompt que contém um único exemplo da resposta desejada. Com o prompt de disparo único, o modelo depende de seus dados de treinamento e do exemplo único para fornecer uma resposta correta ao prompt.
Modelo de Linguagem Pequena (SLM)
Uma categoria de modelos de linguagem que possuem parâmetros numéricos menores sem afetar severamente o desempenho. Os SLMs geralmente são desenvolvidos para implantação em dispositivos locais, como laptops ou smartphones, ou para contextos que exigem tempos de resposta rápidos.
Aprendizagem Supervisionada
Um método de treinamento de modelos com dados categorizados, como pares de perguntas/respostas, ou figuras com rótulos descritivos.
SycophancyCasos em que um modelo de IA adapta as respostas para se alinharem com a opinião do usuário, mesmo que a opinião não seja objetivamente verdadeira. Esse comportamento é geralmente indesejável.
Dados sintéticos
Uma unidade atômica de dados com a qual um grande modelo de entrada trabalhará. Os dados de entrada e treinamento são convertidos em tokens e, em seguida, processados pelo LLM. A saída do modelo também será um conjunto de tokens que são posteriormente decodificados e apresentados em uma modalidade compreensível por humanos (por exemplo, texto). Para dados de texto, um token pode ser um caractere, uma sílaba ou uma palavra.
Dados de treinamento
Um teste desenvolvido em 1950 por Alan Turing para avaliar a capacidade de um sistema artificial de retratar um comportamento indistinguível de um humano.
Aprendizagem não supervisionada
Usando um prompt que não contém exemplos da resposta desejada. Com o prompt de disparo zero, o modelo depende de seus dados de treinamento para fornecer uma resposta correta ao prompt.