智谱AI实现图片识别分析及文案内容生成对话
在当今快速发展的人工智能领域,智能技术正在为我们的日常生活带来越来越多的便利与创新。其中,智谱AI作为一款先进的人工智能服务平台,不仅仅能够进行文本生成和对话处理,更能结合先进的视觉识别技术,实现对图片的深度分析与内容生成。本文将探讨智谱AI如何利用其强大的技术实现图片识别分析,...
扫码分享二维码
在当今快速发展的人工智能领域,智能技术正在为我们的日常生活带来越来越多的便利与创新。其中,智谱AI作为一款先进的人工智能服务平台,不仅仅能够进行文本生成和对话处理,更能结合先进的视觉识别技术,实现对图片的深度分析与内容生成。本文将探讨智谱AI如何利用其强大的技术实现图片识别分析,...
扫码分享二维码
在当今快速发展的人工智能领域,智能技术正在为我们的日常生活带来越来越多的便利与创新。其中,智谱AI作为一款先进的人工智能服务平台,不仅仅能够进行文本生成和对话处理,更能结合先进的视觉识别技术,实现对图片的深度分析与内容生成。本文将探讨智谱AI如何利用其强大的技术实现图片识别分析,并结合文本生成功能,为用户带来全新的智能交互体验。
智谱AI通过结合先进的自然语言处理和计算机视觉技术,能够实现对复杂场景中图片内容的准确识别和分析。当用户向智谱AI提出带有图片的问题时,它不仅能理解用户的文字描述,还能从图片中提取关键信息,进而生成相关的语义内容。这一过程背后涵盖了深度学习模型和大数据处理技术的应用,使得智谱AI在处理复杂多变的实际场景时表现出色。
通过智谱AI的技术,用户可以通过简单的对话界面上传图片并提出问题,比如“这张图片中的主要物体是什么?”或者“基于这张图片,能否生成一个相关的广告文案?”智谱AI会综合分析图片内容,结合语义理解能力生成相应的答案或文本。这种结合视觉识别和文本生成的综合能力,不仅提升了用户的交互体验,还在商业应用中展现了广泛的潜力。
下面我们来看一下在工作里面如何接入智谱AI来满足两个方面的工作:智谱AI实现图片识别分析 及 文案内容生成对话
第一步、注册智谱AI账号
打开智谱AI开放平台:智谱AI开放平台 (bigmodel.cn),然后进行注册;

第二步、并完成实名认证
进入实名认证中心完成认证,领取大模型赠送额度:实名认证中心_智谱AI开放平台 (bigmodel.cn)

第三步、获取智谱API keys
直接打开网址进入API管理中心:API管理_智谱AI开放平台 (bigmodel.cn)

在上述截图里面有默认的API,可以直接复制使用,也可以新创建API使用,都没有问题;
第四步、图片识别PYTHON测试代码
直接复制以下代码创建PYTHON执行文件,或者影刀客户端使用:
from zhipuai import ZhipuAI
def query_zhipuai(question, image_url):
"""
用问题和图片链接地址查询智能拍AI。
:param question: 您想要提问的文本问题。
:param image_url: 与您问题相关的图片的URL。
:return: 智能拍AI的响应。
"""
# 在此处填入您的 API 密钥
api_key = "9978ce7165d35eee9********a9682e.R2aFaKAh4PqiZPMZ"
client = ZhipuAI(api_key=api_key)
response = client.chat.completions.create(
model="glm-4v", # 模型名称
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": question},
{"type": "image_url", "image_url": {"url": image_url}} # 更新后的图片链接
]
}
]
)
return response.choices[0].message.content
# 更新后的图片链接地址
image_url = "https://i0.hdslb.com/bfs/face/49155e68a6271ee9f2129ae4318a59454841ca5b.jpg"
question = "基于这张图片的色调风格,请生成一个相关的广告文案?"
# 调用函数并获取智能拍AI的响应
response_content = query_zhipuai(question, image_url)
# 输出响应内容(示例)
print(response_content)上述代码说明:
1、api_key:即为从平台里面复制出来的API;
2、image_url:这里默认为网络远程图片,支持HTTP与HTTPS;
3、question:即为需要对图片进行分析的文本提示词;
实施效果图如下:

第五步、智谱AI大模型文字对话内容生成
直接复制以下代码创建PYTHON执行文件,或者影刀客户端使用:
from zhipuai import ZhipuAI
# 在此处填入您的 API 密钥
api_key = "9978ce7165d35eee9********a9682e.R2aFaKAh4PqiZPMZ"
def ask_glm4(question):
# 创建 ZhipuAI 客户端
client = ZhipuAI(api_key=api_key)
# 构造用户的输入消息
messages = [{"role": "user", "content": question}]
# 向 Zhipu AI 发送请求并获取回复
response = client.chat.completions.create(
model="glm-4",
messages=messages,
stream=False
)
# 提取回复的内容并返回
return response.choices[0].message.content
# 示例:用户输入问题并获取回复
user_question = "你是谁"
answer = ask_glm4(user_question)
print("智谱AI的回答:", answer)上述代码说明:
1、api_key:即为从平台里面复制出来的API;
2、user_question:这里即为用户输入提问的提示词;
3、question:即为需要对图片进行分析的文本提示词;
实施效果图如下:

关于智谱AI调用常见问题:
问、运行中如果出现 cannot import name 'Literal' from 'typing' 报错?
答:当前电脑PY环境中所部署的PYTHON版本低于3.8,检测电脑PY版本指令如下:
import sys print(sys.version)
问:API 使用受到并发数(在途请求任务数量)的限制?
答:关API 使用受到并发数(在途请求任务数量)的限制。下面为您当前各个模型的速率限制情况,您可以访问 速率限制指南 了解更多详情。https://open.bigmodel.cn/usercenter/rate-limits
问:安装模块成功之后还显示no modle named cached property?
答:请通过以下指令进行安装:
pip install cached-property
问:智谱AI目前的价格比较贵吧?
答:具体关于接口API价格可以查阅一下:API产品价_格智谱AI开放平台 (bigmodel.cn)
Copyright Notice
当前文章由【付涛】本人原创开发与文案内容写作,内容版权归当前平台所有,如需转载,请务必注明来源及链接,谢谢合作!
本文最后更新发布于【2024-07-03】,某些文章具有时效性,若有错误或已失效,请联系客服
争议处理:针对本站内容若有异义,亦可直接与【法律顾问:易兴俊,律师联系电话:13825799821】直接联系沟通