APIPro
网站首页
网站首页
  1. Gemini 接口
  • (必读)使用说明
  • API Base URL地址
  • 列出模型
    • Models(列出模型)
      GET
  • OpenAI 接口 (兼容各大原厂模型)
    • OpenAI SDK使用指南
    • Responses API 接口使用指南
    • 对话(openai, gemini, claude, deepseek...)
      • 聊天(chat)
      • 流式返回(chat)
      • 思考模式(chat)
      • 结构化输出(chat)
      • 工具调用(chat)
      • MCP调用(chat)
      • web search(chat)
      • 聊天(responses)
      • 流式返回(responses)
      • 思考模式(responses)
      • web search(responses)
    • 图像(gpt, dalle, banana, jimeng,doubao)
      • 文生图(chat)
      • 图生图(chat)
      • 分析图片(chat)
      • 文生图(images)
      • 图生图(images)
    • 视频(sora, veo, 可灵)
      • VEO, SORA 接口参数信息说明
      • 文生视频-异步 (veo)
      • 图生视频-异步 (veo)
      • 首尾帧视频-异步 (veo)
      • 查询视频状态 (veo)
      • 获取视频内容 (veo)
      • 分镜模式-异步 (sora)
      • 角色创建-异步 (sora)
      • 文生视频-同步 (veo)
      • 图生视频-同步 (veo)
      • 首尾帧视频-同步 (veo)
      • 文生视频-异步 (可灵, 通义万象)
      • 图生视频-异步 (可灵, 通义万象)
      • 首尾帧生视频-异步 (可灵, 通义万象)
      • 查询视频状态 (可灵, 通义万象)
    • 语音
      • 语音回复(chat)
      • 语音识别(audio)
      • 语音合成(audio)
    • 向量化
      • 文本向量化
    • 音乐(suno接口)
      • 生成歌词lyrics接口
      • 生成音乐suno接口
      • 上传音乐接口
      • 歌曲拼接接口
      • 查询歌词/音乐任务
  • Anthropic 接口
    • Anthropic SDK使用指南
    • 聊天
      POST
    • 聊天(prompt cache)
      POST
    • 流式返回
      POST
    • 聊天(深度思考)
      POST
    • 工具调用(function call)
      POST
    • 分析图片
      POST
  • Gemini 接口
    • Gemini SDK使用指南
    • 聊天
      POST
    • 流式返回
      POST
    • 联网搜索
      POST
    • 文生图
      POST
    • 图生图(传file)
      POST
    • 图生图(传url)
      POST
    • 分析图片(传base64)
      POST
    • 分析图片(传url)
      POST
  • Midjourney 接口
    • 接口使用示例 (局部重绘)
    • 任务查询接口
    • 获取种子(Seed)
    • 文生图(Imagine)
    • 图片融合(Blend)
    • 图生文(Describe)
    • 换脸(FaceSwap)
    • 上传(upload)
    • 任务批量查询接口
    • 按钮点击(Action)
    • 窗口执行(Modal)
    • 刷新链接(Refresh)
    • 编辑图片(Edit)
  • 第三方接入
    • 问问接入各编程平台指南
    • OpenClaw接入APIPro
  • 数据模型
    • 示例数据模型
      • Pet
      • Category
      • Tag
  1. Gemini 接口

分析图片(传base64)

POST
/v1beta/models/{model-name}:generateContent
gemini API的使用方式和openai的不同,模型名字要在url中传递,比如:https://api.wenwen-ai.com/v1beta/models/gemini-3-flash-preview:generateContent

请求参数

Path 参数

Header 参数

Body 参数application/json

示例
{
  "contents": [
    {
      "parts": [
        {
          "text": "分析图片内容"
        },
        {
          "inline_data": {
            "mime_type": "image/png",
            "data": "base64 data"
          }
        }
      ]
    }
  ]
}

请求示例代码

Shell
JavaScript
Java
Swift
Go
PHP
Python
HTTP
C
C#
Objective-C
Ruby
OCaml
Dart
R
请求示例请求示例
Shell
JavaScript
Java
Swift
curl --location --request POST 'https://api.wenwen-ai.com/v1beta/models/:generateContent' \
--header 'x-goog-api-key: sk-xxx' \
--header 'Content-Type: application/json' \
--data-raw '{
  "contents": [
    {
      "parts": [
        {
          "text": "分析图片内容"
        },
        {
          "inline_data": {
            "mime_type": "image/png",
            "data": "base64 data"
          }
        }
      ]
    }
  ]
}'

返回响应

🟢200成功
application/json
Body

示例
{'candidates': [
        {'content': {'parts': [
                    {'text': '这份图片是一张关于名为**“零一万象”**的**多智能体(Multi-Agent)驱动智能股票分析系统**的产品宣传海报。\n\n以下是对图片内容的详细分析:\n\n### 1. 产品定位与核心理念\n*   **产品名称**:零一万象。\n*   **核心定位**:多智能体驱动的智能股票分析系统。\n*   **核心口号**:“投资,不再是一个人的单打独斗。” 强调从“个人决策”转向“AI集群辅助决策”。\n*   **解决的痛点**:针对传统研究报告太长读不完、单一视角存在偏见、信息过载抓不住重点等问题,提供24小时在线的“专属投研委员会”。\n\n### 2. 核心功能:四大AI智能体协作\n该系统通过模拟不同背景的专家进行协作,主要包含四个角色:\n1.  **宏观策略分析师**:负责全球流动性、政策风向和汇率波动,把握大势。\n2.  **基本面挖掘专家**:利用大模型(LLM)深度解读财报,识别财务造假风险,评估企业护城河。\n3.  **技术面操盘手**:结合K线形态与量化因子,识别阻力位与支撑位,寻找买卖点。\n4.  **舆情风控官**:全网扫描新闻、社交媒体情绪,预警黑天鹅事件。\n\n### 3. 独家优势:AI研判流程\n这是该产品的技术亮点,展示了从数据到决策的四个步骤:\n1.  **全维扫描**:自动化获取海量数据。\n2.  **内部辩论(核心特色)**:让看多和看空的AI智能体进行“圆桌辩论”,互找逻辑漏洞,以保证结论的客观性。\n3.  **综合决策**:去除干扰,输出加权后的置信度评分。\n4.  **人话报告**:将晦涩的金融术语转化为清晰、易读的决策建议。\n\n### 4. 营销策略与用户证言\n*   **用户证言**:通过“资深股民老张”的评价,强调了“看AI吵架”能让风险点一目了然,增强了产品的趣味性和实用感。\n*   **行动导向**:海报底部设有强烈的呼吁(CTA),提供“免费生成第一份全维诊股报告”的优惠,引导转化。\n*   **合规提示**:底部小字提醒“投资有风险,AI建议仅供参考”,符合金融产品的合规要求。\n\n### 5. 总结\n**“零一万象”** 试图利用当前大模型领域最前沿的 **Multi-Agent(多智能体)** 技术来重构投研流程。其最大的卖点在于**“客观性”**(通过AI对等辩论消除偏见)和**“高效性”**(一人指挥一个专家团队)。这种形式对于看不懂专业研报、缺乏系统分析能力的个人投资者具有较强的吸引力。'
                    }
                ], 'role': 'model'
            }, 'finishReason': 'STOP'
        }
    ], 'modelVersion': 'gemini-3-flash', 'responseId': 'g2-BacbiJN2bjMcP67v7yAw', 'usageMetadata': {'candidatesTokenCount': 686, 'promptTokenCount': 1255, 'thoughtsTokenCount': 897, 'totalTokenCount': 2838
    }
}
修改于 2026-03-31 15:12:04
上一页
图生图(传url)
下一页
分析图片(传url)
Built with