Pular para o conteúdo

Como usar a análise avançada de dados do ChatGPT para criar gráficos e tabelas de qualidade

Tempo de leitura: 8 minutos

abstractdaata2gettyimages-2161500491

Imagens nopparit/Getty

Sabe o que faz meu barco flutuar? Tabelas e gráficos. Dê-me um gráfico legal para examinar e ficarei extremamente feliz. Isso é estranho? Eu não acho.

Acontece que o ChatGPT faz um ótimo trabalho criando gráficos e tabelas. E dado que este chatbot de IA generativo onipresente pode sintetizar uma tonelada de informações em algo digno de gráfico, o que o ChatGPT desiste em uma apresentação bonita é mais do que compensado em valor informativo.

Como usar ChatGPT para fazer gráficos e tabelas

Anteriormente, falamos sobre quais ferramentas de gráficos estão disponíveis em quais versões do ChatGPT. Mas há mais do que simplesmente ferramentas de gráficos. Se quiser usar o ChatGPT de forma produtiva, você precisa entender o que as várias edições podem fazer.

Não deveria ser surpresa para ninguém que os conjuntos de recursos dos chatbots de IA estão mudando constantemente. No momento desta atualização (novembro de 2024), a OpenAI acaba de lançar uma versão inicial de seu aplicativo Windows (apenas para clientes pagantes) e introduziu seus modelos o1-preview e o1-mini LLM – também apenas para clientes pagantes. A versão GPT-4o já está disponível para usuários gratuitos. O recurso Análise Avançada de Dados sobre o qual falaremos aqui está disponível para clientes gratuitos e pagantes.

Historicamente, a OpenAI introduziu novos recursos importantes em sua versão Plus (US$ 20/mês) e depois de um tempo, distribuí-los para usuários gratuitos. Como tal, muitas vezes é um desafio – semana após semana – informar quais recursos existem na versão gratuita versus na versão Plus.

Aqui está uma orientação geral, especialmente no que se refere ao restante deste artigo. A versão gratuita é geralmente mais limitada que a versão Plus. Isso significa menos consultas por sessão, menos dados para analisar, possivelmente uma versão LLM um pouco mais antiga disponível, tempos de espera mais longos para respostas e assim por diante. Basicamente, você estará em lugares baratos se usar a versão gratuita e terá uma experiência mais premium se pagar pela versão Plus.

Agora pago pela versão Plus porque descobri que muitas vezes era impedido de fazer perguntas antes de terminar o que estava fazendo. Isso (principalmente) não acontece mais agora que pago pela versão Plus.

Além disso: o momento em que percebi que o ChatGPT Plus foi uma virada de jogo para o meu negócio

Durante grande parte deste artigo, usaremos a Análise Avançada de Dados que agora está incorporada nas versões gratuita e Plus. Esta ferramenta importará tabelas de dados em uma ampla variedade de formatos de arquivo. Embora não especifique um limite de tamanho para dados importados, ele pode lidar com arquivos bastante grandes, mas será interrompido se os arquivos excederem algum nível indefinido de complexidade.

Por enquanto, meu conselho é experimentar essas coisas na versão gratuita e, se precisar de uma experiência mais responsiva, atualize para a versão Plus.

Vamos começar com um exemplo. Para a demonstração a seguir, trabalharemos com as cinco principais cidades em termos de população.

Liste as cinco principais cidades do mundo por população. Incluir país.

Fiz esta pergunta ao ChatGPT e aqui está o que recebi de volta:

lista básica de cidades

Captura de tela de David Gewirtz/ZDNET

Transformar esses dados em uma tabela é simples. Basta dizer ao ChatGPT que você quer uma mesa:

Faça uma tabela com as cinco principais cidades do mundo em população. Incluir país.

tabela-cidade-básica

Captura de tela de David Gewirtz/ZDNET

Observe que ele também me forneceu dados populacionais, embora eu não tenha solicitado explicitamente uma coluna populacional.

Você pode manipular e personalizar uma tabela fornecendo instruções mais detalhadas ao ChatGPT. Novamente, usando a versão gratuita, adicionaremos um campo de contagem populacional. Claro, esses dados estão desatualizados, mas são apresentados de qualquer maneira:

Você pode especificar determinados detalhes para a tabela, como ordem dos campos e unidades. Aqui, estou movendo primeiro o país e comprimindo os números da população.

Faça uma tabela com as cinco principais cidades do mundo em população. Inclui o país e um campo populacional. Exiba os campos na ordem de classificação, país, cidade, população. Exiba a população em milhões (com uma vírgula decimal), então 37.833.000 seriam exibidos como 37,8 milhões.

Observe que dei à IA um exemplo de como queria que os números fossem exibidos.

manipulação de tabela de cidade

Captura de tela de David Gewirtz/ZDNET

ChatGPT pode criar gráficos de linhas, gráficos de barras, histogramas, gráficos de pizza, gráficos de dispersão, mapas de calor, gráficos de caixas, gráficos de áreas, gráficos de bolhas, gráficos de Gantt, gráficos de Pareto, diagramas de rede, diagramas de Sankey, mapas coropléticos, gráficos de radar, nuvens de palavras, mapas de árvores e gráficos 3D.

Neste exemplo, vamos fazer um gráfico de barras simples.

Faça um gráfico de barras das cinco principais cidades do mundo por população

gráfico de barras

Captura de tela de David Gewirtz/ZDNET

Um dos superpoderes do Advanced Data Analytics é a capacidade de fazer upload de um conjunto de dados. Para nosso exemplo, baixei o conjunto de dados Popular Baby Names de Data.gov. Este é um arquivo separado por vírgula com nomes de bebês da cidade de Nova York de 2011-2014. Mesmo que esteja uma década desatualizado, é divertido brincar com ele.

O conjunto de dados que escolhi para este artigo está prontamente disponível em um site do governo, então você pode replicar esse experimento por conta própria. Há muitos conjuntos de dados excelentes disponíveis no Data.gov, mas descobri que muitos são grandes demais para serem usados ​​pelo ChatGPT.

Além disso: Como usar ChatGPT para criar um aplicativo

Depois de baixar este, percebi que ele também incluía informações sobre etnia, para que pudéssemos executar vários gráficos diferentes a partir do mesmo conjunto de dados.

Clique no pequeno botão de upload e informe o arquivo de dados que deseja importar.

importação de nome de bebê

Captura de tela de David Gewirtz/ZDNET

Pedi que me mostrasse as cinco primeiras linhas do arquivo para que eu soubesse mais sobre o formato do arquivo.

Fiquei curioso para saber como o conjunto de dados distribuía os nomes dos gêneros. Aqui está meu primeiro prompt:

Crie um gráfico de pizza mostrando o gênero como uma porcentagem do conjunto de dados geral

E aqui está o resultado. Observe as opções de cores para cada fatia da torta. Essa foi a escolha do ChatGPT.

torta de gênero verde

Captura de tela de David Gewirtz/ZDNET

Além disso: o aplicativo ChatGPT para Windows agora está disponível para usuários de nível gratuito – aqui está o que ele pode fazer

Você pode instruir o Advanced Data Analytics a usar cores diferentes. Tive o cuidado de escolher cores que não reforçassem estereótipos de género nem redefinissem cores comuns relacionadas com o género.

Crie um gráfico de pizza mostrando o gênero como uma porcentagem do conjunto de dados geral. Use verde claro para machos e amarelo médio para fêmeas.

torta de gênero amarelo-verde

Captura de tela de David Gewirtz/ZDNET

Observe a resposta do ChatGPT com atenção. É aqui que vemos imprecisões em sua resposta. Pedi que a cunha masculina fosse verde e a cunha feminina fosse amarela. No gráfico a IA reverteu isso, mas no texto descritivo acertou. Não tenha medo de corrigir a IA.

As cores do gráfico não correspondem ao texto. Por favor, faça isso de novo.

gráfico verde corrigido

Captura de tela de David Gewirtz/ZDNET

Como vimos anteriormente, os dados recolhidos incluem a etnia. Veja como ver a distribuição das várias etnias registradas em Nova York no início de 2010:

Mostre a distribuição da etnia no conjunto de dados usando um gráfico de pizza. Use apenas cores claras.

E aqui está o resultado. Notou alguma coisa?

gráfico de etnia bruta

Captura de tela de David Gewirtz/ZDNET

Além disso: ChatGPT vs. ChatGPT Plus: uma assinatura paga ainda vale a pena?

Aparentemente, Nova Iorque não normalizou adequadamente os seus dados. Usou “WHITE NON HISPANIC” e “WHITE NON HISP” juntos, “BLACK NON HISPANIC” e “BLACK NON HISP” juntos, e “ASIAN AND PACIFIC ISLANDER” e “ASIAN AND PACI” juntos. Isso resultou em representações imprecisas dos dados.

Um benefício do ChatGPT é que ele lembra as instruções durante uma sessão. Então eu pude dar esta instrução:

Para todas as solicitações a seguir, agrupe “WHITE NON HISPANIC” e “WHITE NON HISP”. Agrupe “BLACK NON HISPANIC” e “BLACK NON HISP” juntos. Grupo “ASIAN AND PACIFIC ISLANDER” e “ASIAN AND PACI”. Use o nome de etnia mais longo ao exibir a etnia.

E respondeu:

normal de grupo

Captura de tela de David Gewirtz/ZDNET

Vamos tentar o gráfico novamente, usando o mesmo prompt.

Mostre a distribuição da etnia no conjunto de dados usando um gráfico de pizza. Use apenas cores claras.

Assim é melhor:

fixo em grupo

Captura de tela de David Gewirtz/ZDNET

Além disso: como usar a IA para pesquisa da maneira certa – de forma responsável e eficaz

Você precisa ser diligente ao observar os resultados. Por exemplo, em uma solicitação de nomes principais de bebês, a IA separou “Madison” e “MADISON” como dois nomes diferentes:

nomes de bebês com distinção entre maiúsculas e minúsculas

Captura de tela de David Gewirtz/ZDNET

Para todas as solicitações a seguir, os nomes dos bebês não devem diferenciar maiúsculas de minúsculas.

Vamos encerrar com um gráfico complexo de um prompt. Aqui está nosso prompt:

Para cada etnia, apresente dois gráficos circulares lado a lado, um para cada género. Cada gráfico de pizza deve listar os cinco principais nomes de bebês para aquele gênero e etnia. Use apenas cores claras. Não dê um título a cada gráfico. Remova a frase “Matplotlib Chart” de cada gráfico.

A IA me deu quatro gráficos como os seguintes, um para cada etnia que estava rastreando. Observe a frase “Matplotlib Chart” na parte superior do gráfico. Como você pode ver, tentei muito fazer com que o ChatGPT removesse ele e outros títulos malucos que ele escolheu usar das paradas – sem sucesso. Às vezes, você precisa desistir e usar algo como o Photoshop para editar o estúpido de uma resposta de IA.

extravagância de gráfico de pizza

Captura de tela de David Gewirtz/ZDNET

Observe também que Sofia e Sophia são muito populares, mas são mostradas como dois nomes diferentes. Mas é isso que torna os gráficos tão fascinantes.

Perguntas frequentes

Os dados carregados no ChatGPT para gráficos são mantidos em sigilo ou há risco de exposição dos dados?

Suponha que sempre haja um risco de privacidade.

Fiz esta pergunta ao ChatGPT e foi isso que ele me disse:

A privacidade dos dados é uma prioridade para ChatGPT. Os dados enviados são usados ​​exclusivamente para a sessão atual do usuário e não são armazenados por longo prazo nem usados ​​para quaisquer outros fins. No entanto, para dados altamente confidenciais, os usuários devem sempre ter cautela e considerar o uso da versão Enterprise do ChatGPT, que oferece maior confidencialidade dos dados.

Além disso: a IA generativa traz novos riscos para todos. Veja como você pode ficar seguro

Minha recomendação: não confie no ChatGPT ou em qualquer ferramenta de IA generativa. Supõe-se que a versão Enterprise tenha mais controles de privacidade, mas eu recomendo que você carregue apenas dados que não se importe em obter visibilidade pública.

A análise avançada de dados do ChatGPT pode lidar com dados em tempo real ou é mais adequada para conjuntos de dados estáticos?

É possível, mas existem algumas limitações práticas. Primeiro, a conta Plus irá limitar o número de solicitações que você pode fazer em um determinado período de tempo. Segundo, você deve fazer upload de cada arquivo individualmente. Existe a possibilidade de você usar uma API ChatGPT licenciada para fazer análises em tempo real. Mas para o chatbot em si, você está analisando dados em repouso.


Você pode acompanhar as atualizações diárias do meu projeto nas redes sociais. Certifique-se de assinar meu boletim informativo semanal de atualização no Substack e siga-me no Twitter em @DavidGewirtzno Facebook em Facebook.com/DavidGewirtz, no Instagram em Instagram.com/DavidGewirtz e no YouTube em YouTube.com/DavidGewirtzTV.