Em posts anteriores explorámos a origem dos sistemas inteligentes e a sua evolução ao longo da história. Nesta nova entrada tentaremos compreender o que a Inteligência Artificial traz hoje ao mundo, compreendendo os principais blocos em que esta disciplina funciona.
Como em qualquer disciplina científica, as subdivisões que podem ser propostas para fins de classificação são, na sua maioria, infinitas e subjetivas. Contudo, no campo da IA existe um certo consenso sobre as principais categorias, aquelas das quais todas as outras são extraídas.
Atualmente, a grande maioria das soluções de IA funciona numa destas categorias principais: visão informática, processamento de linguagem natural, e finalmente geração de discurso e texto.
Visão artificial
A visão artificial tem como objetivo permitir aos computadores compreendam a informação visual que recebem. A visão de um ser humano não só capta imagens, como uma câmara digital, mas também as processa, compreende-as e toma decisões com base no que é observado.
Para fazer uma máquina compreender a informação contida numa imagem ou num vídeo, são utilizados algoritmos baseados em redes neurais. Especificamente, o modelo mais utilizado atualmente é o das Redes Neurais Convolucionais (CNN). Uma rede neural convolucional é um programa informático que realiza numerosas operações matemáticas em cada pixel da imagem que recebe, de modo a cumprir um objetivo específico. A grande vantagem é que estas operações, como discutido na introdução à IA, são decididas pela própria rede neural.
Os objetivos que uma Convolutional Neural Network (CNN) pode perseguir são muito numerosos, mas entre os mais importantes encontram-se:
1. Classificação de objetos. O sistema inteligente recebe uma imagem e tenta compreender o objeto apresentado no mesmo. Por exemplo, a identificação das espécies de uma planta através de uma fotografia, ou a diferenciação entre diferentes tipos de veículos num sistema automático de portagem. Neste tipo de objectivo, a localização espacial dos objectos não é relevante, mas simplesmente associar-lhe uma classe. Uma das principais limitações das técnicas de classificação é que só podem processar um único conceito por imagem.
2. Deteção de objetos. Neste caso, o sistema de IA tenta localizar espacialmente os objetos, bem como classificá-los. Isto significa ser capaz de enquadrar cada objeto de interesse nas imagens ou vídeos fornecidos à rede neural. Este tipo de tecnologia é utilizado em automóveis autónomos para detetar sinais de trânsito e depois classificá-los para conhecer o tipo de sinal que está a ser observado.
3. Rastreamento de objetos. Finalmente, quando soubermos onde está cada objeto e que tipo é, pode ser interessante saber para onde se deslocam. Com esta tecnologia, podemos saber, entre outras coisas, como os clientes se movimentam num supermercado e, portanto, identificar as rotas mais movimentadas e os pontos quentes.
Processamento de Linguagem Natural (PNL)
O objetivo do processamento da linguagem natural é permitir que os computadores compreendam a linguagem humana. Para este fim, foram desenvolvidas várias técnicas de inteligência artificial, tais como Redes Neurais Recorrentes, com memória de longo e curto prazo (LSTM).
Análise de texto
A análise de texto permite a um computador processar um texto escrito por um ser humano e extrair dele a informação mais relevante. Permite que a IA reconheça sintáctica e semanticamente entidades, relações entre elas, ou conceitos chave. Pode ser utilizado para analisar a reputação de uma marca nas redes sociais, a popularidade de um político ou para resumir artigos de imprensa.
Análise dos sentimentos
Graças a esta tecnologia, a IA vai um passo mais além no processamento da linguagem natural. Não só reconhece conceitos ou tópicos, mas também deteta a intenção do remetente. Desta forma, podemos detetar clientes incomodados com o seu tratamento, apoiantes elogiados por um discurso político, ou críticas de produtos em linha decepcionantes.
Tradução automática
A tarefa de tradução automática avançou enormemente desde o advento da Deep Learning, permitindo aos computadores compreender o contexto e a intenção de uma frase numa língua antes de a traduzir para qualquer outra. Desta forma, não é uma tradução estruturada, mas sim uma tentativa de manter a mensagem e conotação originais. Um exemplo de tradução utilizando redes neurais profundas, para além do conhecido Google Translate, é o tradutor em linha DeepL, que se autodenomina o melhor tradutor do mundo.
Classificação do texto
Finalmente, a classificação de textos permite-nos associar etiquetas a todo o conteúdo para melhorar a classificação de livros, textos e artigos. Neste caso, a IA processa todo um texto e tenta agrupá-lo por categorias, tal como a tecnologia de classificação de objectos faz, mas processando palavras em vez de imagens.
Discurso e geração de texto
Embora possa parecer um campo semelhante ao processamento da linguagem natural, neste caso a tarefa não é compreender a informação gerada pelo homem, mas gerar informação que pode parecer ter sido gerada pelo homem ou converter um tipo de informação em outro (escrita para falada ou vice-versa).
Síntese da fala
A síntese da fala visa poder ler em voz alta e com entonação natural qualquer texto escrito fornecido como entrada. Desta forma, as aplicações podem ser realizadas como assistentes de conversação ou apoio a deficientes visuais ou idosos que possam necessitar de apoio auditivo para compreender textos escritos.
Síntese de texto
Neste caso, a IA tenta fazer exactamente o oposto. Partindo de um ficheiro de som no qual um humano fala numa língua predeterminada, as redes neurais tentam transcrever o seu discurso em texto. Esta tecnologia também ajuda pessoas com dificuldades de digitação em teclados de computador ou telemóveis, mas também pode ajudar a gerar automaticamente legendas em vídeos para ajudar os deficientes auditivos.