
功能介绍
AI图像识别与问答功能,集成了OpenAI和Anthropic两大服务商的GPT-4V和Claude 3模型的Opus和Sonnet版本,可对输入的图像进行深入的识别和理解,进而提供详尽的问答服务。
模型介绍
GPT-4V
GPT-4V(GPT-4 Turbo with Version)是OpenAI最受瞩目的带有视觉能力的模型,它使得用户可以通过图像与GPT-4进行交互,标志着GPT-4正式成为一个多模态模型,具备对于图像的理解能。
Claude 3
Claude 3 擅长复杂视觉功能,可以处理各种视觉格式,包括照片、图表、图形和技术图表等,推理能力更强,它回复的解题水平和准确率变高很多,并能在一些细节描述上比GPT-4更胜一筹。
如何使用
1 在集简云流程中作为步骤节点使用
将“AI图像生成与识别”添加到您的业务流程中,作为步骤节点使用,实现自动通过提问内容识别图像信息自动化流程,满足自定义场景需求。

2 在语聚AI应用助手中作为工具使用
您可以在应用助手中,将AI图像生成与识别作为一个应用工具使用,在对话时,应用助手将自动在需要的使用调用此工具完成指定任务。
例如:帮我查询图片中的相关信息,并将数据整理成表格。

3 集简云数据表中作为“集成字段” 使用
您可以在集简云的数据表中,添加一个按钮,当点击此按钮时,自动执行AI图像生成与识别,表格中的各个字段均可作为图像识别的输入参数使用,通过按钮,即可实现在数据表内一键将查询到的数据发送给相关人员。

AI图像识别与问答是集简云的一款内置应用,集成了GPT-4V、Claude 3的多模态模型,用户可通过这些AI模型对输入的图像内容进行识别,此应用支持多个不同AI模型的选择。