Skip to content

Deep Learning Book

  • Início
  • Capítulos
  • Cursos Online
  • Contato

Deep Learning Book

Em Português, Online e Gratuito

Tag: Processamento de Linguagem Natural

Machine Learning Guia Definitivo

Capítulo 92 – Machine Learning – Guia Definitivo – Parte 2

by

Nos 10 capítulos finais deste livro online vamos trazer um grande resumo sobre Machine Learning. O objetivo é fornecer uma visão clara do que é e como Machine Learning está sendo usado no dia a dia, um pouco de matemática, as principais regras e princípios. Queremos ainda que esses capítulos finais possam servir de material …

Continue Reading
Deep Learning Book

Capítulo 90 – Como Funcionam os Transformadores em Processamento de Linguagem Natural – Parte 5

by

Vamos prosseguir estudando os transformadores. Este capítulo considera que você leu os capítulos anteriores. Vamos começar esta capítulo com um resumo do Transformer. Para processar uma frase, precisamos destes 3 passos: 1- Embeddings de palavras da sentença de entrada são computados simultaneamente. 2- Codificações posicionais são então aplicadas a cada Embeddings, resultando em vetores de palavras …

Continue Reading
Deep Learning Book

Capítulo 88 – Como Funcionam os Transformadores em Processamento de Linguagem Natural – Parte 3

by

Vamos seguir nossa discussão sobre os Transformadores com a parte mais importante, a Auto-Atenção. Este capítulo considera que você leu os capítulos anteriores. Auto-Atenção: O Encoder do Transformer O que é Auto-Atenção? “A Auto-Atenção, às vezes chamada de Intra-Atenção, é um mecanismo de atenção que relaciona diferentes posições de uma única sequência para computar uma …

Continue Reading
Deep Learning Book

Capítulo 87 – Como Funcionam os Transformadores em Processamento de Linguagem Natural – Parte 2

by

Vamos seguir com a continuação do capítulo anterior. Este capítulo fornece algumas informações básicas necessárias para compreender o conceito por trás da autoatenção que veremos no capítulo seguinte. Atenção Baseada em Recursos: Chave, Valor e Consulta Os conceitos de consulta de chave-valor vêm de sistemas de recuperação de informações. É extremamente útil esclarecer esses conceitos …

Continue Reading
Deep Learning Book

Capítulo 86 – Como Funcionam os Transformadores em Processamento de Linguagem Natural – Parte 1

by

A partir de agora e nos próximos capítulos vamos compreender o funcionamento dos Transformadores, uma das técnicas mais avançadas da atualidade em Inteligência Artificial, especialmente no Processamento de Linguagem Natural. Os Transformadores não são tão difíceis de entender. É a combinação de todos os conceitos que pode tornar a compreensão complexa, incluindo a atenção. É …

Continue Reading
Deep Learning Book

Capítulo 82 – GPT-3 – Características e Limitações

by

Em sua busca para construir modelos de linguagem muito fortes e poderosos que não precisariam de nenhum ajuste fino e apenas de algumas demonstrações para entender as tarefas e executá-las, a Open AI construiu o modelo GPT-3 com 175 bilhões de parâmetros. Este modelo tem 10 vezes mais parâmetros do que o poderoso modelo de …

Continue Reading
Deep Learning Book

Capítulo 81 – Modelos de Linguagem Como Tarefas Não Supervisionadas (GPT-2)

by

Vamos seguir estudando o modelo GPT, agora com a sua segunda versão. Estamos considerando que você leu o capítulo anterior. Os desenvolvimentos no modelo GPT-2 foram principalmente em termos de usar um conjunto de dados maior e adicionar mais parâmetros ao modelo para aprender um modelo de linguagem ainda mais forte. Vejamos os desenvolvimentos significativos …

Continue Reading
Deep Learning Book

Capítulo 80 – Melhorando a Compreensão da Linguagem Por Meio do Pré-treinamento Generativo (GPT-1)

by

Para compreender o GPT-3, seu estado atual e seu uso futuro, é importante dar alguns passos atrás e compreender os modelos predecessores, o GPT-1 e o GPT-2. Começamos pela versão 1. Aqui está o paper original do modelo GPT-1: Improving Language Understanding by Generative Pre-Training. Antes dos modelos GPT, a maioria dos modelos de Processamento …

Continue Reading
Deep Learning Book

Capítulo 78 – Modelo BERT – Previsão da Próxima Frase

by

Vamos complementar o capítulo anterior e compreender alguns detalhes do funcionamento do BERT para Processamento de Linguagem Natural. Antes de alimentar as sequências de palavras no BERT, 15% das palavras em cada sequência são substituídas por um token [MASK]. O modelo então tenta prever o valor original das palavras mascaradas, com base no contexto fornecido …

Continue Reading
Deep Learning Book

Capítulo 77 – Modelo BERT Para Processamento de Linguagem Natural

by

BERT (Bidirectional Encoder Representations from Transformers) é um modelo de Deep Learning criado por pesquisadores do Google AI Language. O BERT causou um rebuliço na comunidade de aprendizado de máquina ao apresentar resultados de última geração em uma ampla variedade de tarefas de PLN (Processamento de Linguagem Natural), incluindo respostas automáticas ao banco de dados …

Continue Reading
Deep Learning Book

Capítulo 76 – O Que é BERT (Bidirectional Encoder Representations from Transformers)?

by

BERT (Bidirectional Encoder Representations from Transformers) é o algoritmo de aprendizado profundo (Deep Learning) do Google para PLN (Processamento de Linguagem Natural). Ajuda computadores e máquinas a entender a linguagem como nós, humanos, fazemos. Simplificando, o BERT pode ajudar o Google a entender melhor o significado das palavras nas consultas no mecanismo de busca. Por …

Continue Reading

Capítulos Recentes

  • Capítulo 35 – A Matemática do Problema de Dissipação do Gradiente em Deep Learning
  • Capítulo 34 – O Problema da Dissipação do Gradiente
  • Capítulo 33 – Por que as Redes Neurais Profundas São Difíceis de Treinar?
  • Capítulo 32 – Como Uma Rede Neural Artificial Encontra a Aproximação de Uma Função
  • Capítulo 31 – As Redes Neurais Artificiais Podem Computar Qualquer Função?
  • Capítulo 30 – Variações do Stochastic Gradient Descent – Hessian Optimization e Momentum
  • Capítulo 29 – Definindo o Tamanho do Mini-Batch
  • Capítulo 28 – Usando Early Stopping Para Definir o Número de Épocas de Treinamento
  • Capítulo 27 – A Taxa de Aprendizado de Uma Rede Neural
  • Capítulo 26 – Como Escolher os Hiperparâmetros de Uma Rede Neural

Buscar

Podcast DSA

© 2025 Data Science Academy - www.datascienceacademy.com.br