A IBM, líder em inteligência artificial para as empresas, está anunciando novas tecnologias de IBM Watson desenvolvidas para ajudar as organizações a começar a identificar, entender e analisar alguns dos maiores desafios da linguagem humana com mais clareza, para obter melhores insights.
As novas tecnologias representam a primeira comercialização de capacidades essenciais de Processamento de Linguagem Natural (Natural Language Processing – NLP) presentes no projeto de pesquisa Project Debater, de IBM Research, o único sistema de Inteligência Artificial (IA) capaz de debater com humanos sobre tópicos complexos. Por exemplo, um novo recurso avançado de análise de sentimentos é definido para identificar e analisar expressões idiomáticas e coloquialismos pela primeira vez.
Frases como ‘hot under the collar’, que em português seria algo como ‘subir o sangue’, têm desafiado os sistemas de IA porque são difíceis de detectar pelos algoritmos. Com a análise avançada de sentimentos, as empresas podem começar a analisar esses dados de linguagem com as APIs de Watson para obter um entendimento mais holístico de suas operações. Além disso, a IBM está trazendo tecnologia de sua divisão de pesquisa, IBM Research, para entender documentos de negócios, como PDFs e contratos, para também adicionar aos seus modelos de IA.
“A linguagem é uma ferramenta para expressar pensamentos e opiniões, tanto quanto uma ferramenta para obter informações”, comenta Rob Thomas, Gerente Geral de IBM Data and AI. “É por isso que estamos coletando tecnologia do Project Debater e integrando-a ao Watson – para permitir que as empresas capturem, analisem e entendam mais da linguagem humana e comecem a transformar a maneira como utilizam o capital intelectual que está codificado nos dados”.
Hoje a IBM está anunciando os planos de integrar ao Watson as tecnologias do projeto de pesquisa Project Debater ao longo deste ano, para aprimorar a capacidade dos clientes de explorar a linguagem natural:
A. Análise – Advanced Sentiment Analysis (análise avançada de sentimentos):
A IBM aprimorou a análise de sentimentos para poder identificar e entender melhor construções complicadas de palavras, como frases e expressões idiomáticas e os chamados shifters de sentimentos, que são combinações de palavras que, juntas, assumem um novo significado, como a expressão em inglês “hardly helpful”, na qual ‘hard’ não tem sentido de ‘difícil’ mas sim de ‘pouco’.
Essa tecnologia será integrada ao Watson Natural Language Understanding neste mês, em inglês, e até o final do ano em português. Além disso, estamos anunciando uma nova tecnologia de classificação que possibilitará aos clientes criar modelos de IA para classificar com mais facilidade as cláusulas em documentos comerciais, como contratos de compras.
Com base na tecnologia de classificação com deep learning do Project Debater, os novos recursos podem aprender com algumas centenas de amostras para fazer novas classificações de maneira rápida e fácil. A tecnologia deverá ser adicionada ao Watson Discovery até o final deste ano.
B. Briefs – Summarization (resumo):
Essa tecnologia extrai dados textuais de várias fontes para fornecer aos usuários um resumo do que está sendo dito e escrito sobre um tópico específico. Uma versão inicial do Summarization foi utilizada no The GRAMMYS deste ano para analisar mais de 18 milhões de artigos, blogs e biografias para produzir insights sobre centenas de artistas e celebridades do GRAMMY.
Os dados foram usados na transmissão ao vivo do tapete vermelho, fotos e vídeos sob demanda para oferecer aos fãs um contexto mais amplo sobre os principais tópicos da noite. A tecnologia deverá ser adicionada ao IBM Watson Natural Language Understanding até o final do ano.
C. Clustering – Advanced Topic Clustering (agrupamento de tópicos avançados):
Com base nos insights obtidos com o Project Debater, as novas técnicas de agrupamento de tópicos permitirão aos usuários “agrupar” os dados recebidos para criar “tópicos” de informações relacionadas que façam sentido, para poderem ser analisadas. A técnica, que deverá ser integrada ao Watson Discovery até o final deste ano, também permitirá que especialistas personalizem e ajustem os tópicos para refletir a linguagem de empresas ou setores específicos, como seguros, saúde e manufatura.
A IBM é líder de longa data em NLP, desenvolvendo tecnologias que permitem aos sistemas de computador aprender, analisar e entender a linguagem humana – incluindo sentimentos, dialetos, entonações, entre outros, com maior precisão e velocidade.
Através do Watson, a IBM trouxe para o mercado sua tecnologia NLP – da qual grande parte nasceu na divisão de pesquisa, IBM Research. Produtos como: o Watson Discovery, para compreensão de documentos; o IBM Watson Assistant, para assistentes virtuais; e o Watson Natural Language Understanding para análise avançada de sentimento, todos têm NLP.
O ESPN Fantasy Football usa Watson Discovery e Watson Knowledge Studio para analisar milhões de fontes de dados de futebol americano todos os dias durante a temporada para oferecer insights em tempo real a milhões de jogadores de Fantasy Footbal.