您当前位置:首页>项目技能>技能技巧

智谱AI实现图片识别分析及文案内容生成对话

发布时间:2024-07-03 阅读量:6147 超级管理员

在当今快速发展的人工智能领域,智能技术正在为我们的日常生活带来越来越多的便利与创新。其中,智谱AI作为一款先进的人工智能服务平台,不仅仅能够进行文本生成和对话处理,更能结合先进的视觉识别技术,实现对图片的深度分析与内容生成。本文将探讨智谱AI如何利用其强大的技术实现图片识别分析,...

扫码分享二维码

二维码

详细介绍

    在当今快速发展的人工智能领域,智能技术正在为我们的日常生活带来越来越多的便利与创新。其中,智谱AI作为一款先进的人工智能服务平台,不仅仅能够进行文本生成和对话处理,更能结合先进的视觉识别技术,实现对图片的深度分析与内容生成。本文将探讨智谱AI如何利用其强大的技术实现图片识别分析,并结合文本生成功能,为用户带来全新的智能交互体验。

智谱AI通过结合先进的自然语言处理和计算机视觉技术,能够实现对复杂场景中图片内容的准确识别和分析。当用户向智谱AI提出带有图片的问题时,它不仅能理解用户的文字描述,还能从图片中提取关键信息,进而生成相关的语义内容。这一过程背后涵盖了深度学习模型和大数据处理技术的应用,使得智谱AI在处理复杂多变的实际场景时表现出色。

通过智谱AI的技术,用户可以通过简单的对话界面上传图片并提出问题,比如“这张图片中的主要物体是什么?”或者“基于这张图片,能否生成一个相关的广告文案?”智谱AI会综合分析图片内容,结合语义理解能力生成相应的答案或文本。这种结合视觉识别和文本生成的综合能力,不仅提升了用户的交互体验,还在商业应用中展现了广泛的潜力。

下面我们来看一下在工作里面如何接入智谱AI来满足两个方面的工作:智谱AI实现图片识别分析      及     文案内容生成对话


第一步、注册智谱AI账号

打开智谱AI开放平台:智谱AI开放平台 (bigmodel.cn),然后进行注册;

微信截图_20240703101046 (1).png

第二步、并完成实名认证

进入实名认证中心完成认证,领取大模型赠送额度:实名认证中心_智谱AI开放平台 (bigmodel.cn)

微信截图_20240703101046 (1) (1).png


第三步、获取智谱API keys

直接打开网址进入API管理中心:API管理_智谱AI开放平台 (bigmodel.cn)

微信截图_20240703101046 (1).png

在上述截图里面有默认的API,可以直接复制使用,也可以新创建API使用,都没有问题;


第四步、图片识别PYTHON测试代码

直接复制以下代码创建PYTHON执行文件,或者影刀客户端使用:

from zhipuai import ZhipuAI
def query_zhipuai(question, image_url):
    """
    用问题和图片链接地址查询智能拍AI。
    :param question: 您想要提问的文本问题。
    :param image_url: 与您问题相关的图片的URL。
    :return: 智能拍AI的响应。
    """
    # 在此处填入您的 API 密钥
    api_key = "9978ce7165d35eee9********a9682e.R2aFaKAh4PqiZPMZ"
    client = ZhipuAI(api_key=api_key)
    response = client.chat.completions.create(
        model="glm-4v",  # 模型名称
        messages=[
            {
                "role": "user",
                "content": [
                    {"type": "text", "text": question},
                    {"type": "image_url", "image_url": {"url": image_url}}  # 更新后的图片链接
                ]
            }
        ]
    )
    return response.choices[0].message.content
# 更新后的图片链接地址
image_url = "https://i0.hdslb.com/bfs/face/49155e68a6271ee9f2129ae4318a59454841ca5b.jpg"
question = "基于这张图片的色调风格,请生成一个相关的广告文案?"
# 调用函数并获取智能拍AI的响应
response_content = query_zhipuai(question, image_url)
# 输出响应内容(示例)
print(response_content)


上述代码说明:

1、api_key:即为从平台里面复制出来的API;

2、image_url:这里默认为网络远程图片,支持HTTP与HTTPS;

3、question:即为需要对图片进行分析的文本提示词;

实施效果图如下:

微信截图_20240703101046 (2).png

第五步、智谱AI大模型文字对话内容生成

直接复制以下代码创建PYTHON执行文件,或者影刀客户端使用:

from zhipuai import ZhipuAI
# 在此处填入您的 API 密钥
api_key = "9978ce7165d35eee9********a9682e.R2aFaKAh4PqiZPMZ"
def ask_glm4(question):
    # 创建 ZhipuAI 客户端
    client = ZhipuAI(api_key=api_key)    
    # 构造用户的输入消息
    messages = [{"role": "user", "content": question}]    
    # 向 Zhipu AI 发送请求并获取回复
    response = client.chat.completions.create(
        model="glm-4",
        messages=messages,
        stream=False
    )
    # 提取回复的内容并返回
    return response.choices[0].message.content
# 示例:用户输入问题并获取回复
user_question = "你是谁"
answer = ask_glm4(user_question)
print("智谱AI的回答:", answer)

上述代码说明:

1、api_key:即为从平台里面复制出来的API;

2、user_question:这里即为用户输入提问的提示词;

3、question:即为需要对图片进行分析的文本提示词;

实施效果图如下:

微信截图_20240703101046 (1).png


关于智谱AI调用常见问题:

问、运行中如果出现 cannot import name 'Literal' from 'typing' 报错?

答:当前电脑PY环境中所部署的PYTHON版本低于3.8,检测电脑PY版本指令如下:

import sys
print(sys.version)

问:API 使用受到并发数(在途请求任务数量)的限制?

答:关API 使用受到并发数(在途请求任务数量)的限制。下面为您当前各个模型的速率限制情况,您可以访问 速率限制指南 了解更多详情。https://open.bigmodel.cn/usercenter/rate-limits

问:安装模块成功之后还显示no modle named cached property?

答:请通过以下指令进行安装:

pip install cached-property

问:智谱AI目前的价格比较贵吧?

答:具体关于接口API价格可以查阅一下:API产品价_格智谱AI开放平台 (bigmodel.cn)

上一篇 PYTHON使用ITCHAT库操作微信行为时出现AttributeError: 'HTMLParser' object has no attribute 'unescap
下一篇 EasyBR极简指纹浏览器(ebrower)如何使用影刀RPA来实现流程自动化操作

内容版权声明

Copyright Notice

内容链接: https://www.diezanrpa.com/jinengjiqiao/768.html
内容标题: 智谱AI实现图片识别分析及文案内容生成对话

当前文章由【付涛】本人原创开发与文案内容写作,内容版权归当前平台所有,如需转载,请务必注明来源及链接,谢谢合作!

本文最后更新发布于【2024-07-03】,某些文章具有时效性,若有错误或已失效,请联系客服

争议处理:针对本站内容若有异义,亦可直接与【法律顾问:易兴俊,律师联系电话:13825799821】直接联系沟通

GEO