10 aplicativos fascinantes para explorar com o novo GPT-Vision: descubra o lançamento revolucionário!
A fusão da tecnologia de processamento de linguagem natural e visão computacional
O lançamento conjunto do ChatGPT e do GPT-Vision marca um grande avanço no campo da inteligência artificial. Esta fusão entre tecnologia de processamento de linguagem natural e visão computacional abre novas perspectivas e oferece aplicações variadas e profundas. Descubra como essas tecnologias estão transformando a forma como interagimos com dados visuais e textuais.
Explorando aplicativos
A sinergia entre ChatGPT e GPT-Vision permite desbloquear novos recursos. Aqui estão alguns exemplos cativantes que ilustram a diversidade de aplicações possíveis.
- Modelagem a partir de uma imagem
Uma imagem simples pode ser transformada em um modelo 3D impressionante usando estas tecnologias, como mostrado neste exemplo:
ChatGPT Vision começando a escrever Gcode (para um Haas) a partir de impressões pic.twitter.com/IgXeMEAS8e
– Aaron Slodov (@aphysicist) 10 de outubro de 2023
- Programa de treinamento de força personalizado de acordo com seu equipamento
Graças ao ChatGPT Vision, é possível obter um programa de treinamento de força personalizado com base no equipamento disponível, como mostra este exemplo:
ChatGPT Vision transformou uma foto do meu equipamento de ginástica doméstico em um programa completo de exercícios de 8 semanas.
Isso é melhor do que 99% de todos os programas que já comprei. pic.twitter.com/ToACYgzTyf
-Rowan Cheung (@rowancheung) 11 de outubro de 2023
Você também pode encontrar outras ideias de programas aqui:
Visão do ChatGPT:
Ideias de planos de condicionamento físico com base em equipamentos limitados.
Ajuste o prompt, caso veja erros no reconhecimento. pic.twitter.com/LslHBeDFlX
-Borriss (@_Borriss_) 12 de outubro de 2023
- Análise e decodificação de documentos borrados
Graças ao ChatGPT-4V Multimodal, é possível revelar os segredos de um documento desfocado através de uma análise aprofundada, como mostra este exemplo:
ChatGPT-4V Multimodal decodifica um documento governamental redigido sobre um avistamento de OVNI divulgado pela NASA.
Eu testei isso em centenas de documentos editados e posso dizer que estamos em um novo mundo. pic.twitter.com/aCKOm577TO
-Brian Roemmele (@BrianRoemmele) 6 de outubro de 2023
- Convertendo fotos em texto para uma carta complexa
Essas tecnologias permitem transformar a imagem de uma carta em texto editável, como mostra este exemplo:
???? ChatGPT Vision é uma loucura haha pic.twitter.com/Ccsl7tFgkD
– soltar pum! ???? (@pwang_szn) 4 de outubro de 2023
- Recuperando objetos complexos em uma imagem
A tecnologia permite identificar e recuperar objetos complexos em uma imagem, como mostra este exemplo:
Poder da capacidade de visão ChatGPT ???? pic.twitter.com/cr1izVP9df
— Kashan Ahmed????????????? (@KashanAhmed) 6 de outubro de 2023
- Detecção de imagens do Google Street View ou satélites
Graças ao ChatGPT Vision, é possível detectar com precisão imagens do Google Street View ou de satélites, como mostra este exemplo:
Visão ChatGPT pic.twitter.com/X619nlCdBW
-Anu Aakash (@anukaakash) 11 de outubro de 2023
- Análise detalhada de um raio-x
Graças ao ChatGPT, é possível analisar uma radiografia com rapidez e precisão, conforme mostrado neste exemplo:
ChatGPT: O médico no seu bolso ????
O ChatGPT agora pode consultar radiografias, prescrições ou relatórios médicos e responder a qualquer pergunta em questão de segundos.
Conversa sobre o futuro da saúde – simples, ágil e IA! pic.twitter.com/nXgEfEvEsn
-Shubham Saboo (@Saboo_Shubham_) 6 de outubro de 2023
- Análise complexa de imagens
Mergulhe na análise de uma imagem altamente complexa usando essas tecnologias, conforme mostrado neste exemplo:
ChatGPT-4V Multimodal, decodifique isso.
Obrigado. pic.twitter.com/seOuma96QO
-Brian Roemmele (@BrianRoemmele) 2 de outubro de 2023
- Criação de cenários a partir da análise de diversas imagens
Usando essas tecnologias, quatro imagens separadas podem ser transformadas em um enredo coerente, conforme mostrado neste exemplo:
Dei ao GPT-4V quatro “fotos de filme” que gerei com Midjourney e pedi para construir um enredo unindo-os.
Um bom exemplo de como a IA é mais “criativa” e surpreendente quando sujeita a restrições, assim como os humanos. Não é tão criativo quanto as melhores pessoas, mas é interessante. pic.twitter.com/tzYJmMChsn
-Ethan Mollick (@emollick) 2 de outubro de 2023
- Análise de um motor de carro
Graças ao ChatGPT, é possível analisar minuciosamente o motor de um carro. Porém, é recomendável consultar um profissional para qualquer reparo:
6. Manutenção do carro
Prompt: “Analise o problema mostrado nesta foto do carro, explique as causas prováveis e forneça reparos DIY acionáveis ou recomendações de manutenção profissional.” pic.twitter.com/mSfUTp0j5n
-Bryan Marley (@_bryanmarley) 9 de outubro de 2023
- Otimização de código
O ChatGPT também pode ser utilizado para otimizar código, oferecendo sugestões para melhoria de desempenho, eficiência e conformidade com as melhores práticas, conforme mostrado neste exemplo:
8. Otimização de código
Prompt: “Analise este código e sugira maneiras de melhorar o desempenho, a eficiência, a concisão e a adesão às práticas recomendadas.” pic.twitter.com/4leeDoVf53
-Bryan Marley (@_bryanmarley) 9 de outubro de 2023
Limitações notáveis
Apesar dos progressos alcançados, certas limitações devem ser tidas em conta. É importante notar que a leitura de QR Codes e o compartilhamento de conversas atualmente continua impossível com essas tecnologias.
Se você não vir novos recursos, talvez seja necessário atualizar a página ou sair/fazer login novamente. Se o problema persistir, você pode tentar limpar o cache relacionado ao openai.com.
Aqui está uma captura de tela mostrando uma das interfaces de usuário para esses novos recursos:
Vídeo GPT-Vision
Gostaria de dar crédito ao canal de Emile Dev no YouTube (siga para se manter informado sobre as novidades da inteligência artificial) que inspirou este artigo. Aqui está o vídeo de apresentação: