DEV Community

GuGuData
GuGuData

Posted on

获取任意链接正文图片

获取任意链接正文图片

智能分析链接正文中的图片集合,解析任意链接,支持图片大小筛选。

gugudata_api_cover

1. 产品功能

  • 根据提供的文章链接智能分析出文章正文中包含的图片列表;
  • 支持传递图片大小以及图片分辨率条件对返回图片列表进行筛选;
  • 接口可同时返回原始 HTML 内容,供您二次解析使用;
  • 图片解析与标签处理基于机器学习;
  • 全接口支持 HTTPS(TLS v1.0 / v1.1 / v1.2 / v1.3);
  • 全面兼容 Apple ATS;
  • 全国多节点 CDN 部署;
  • 接口极速响应,多台服务器构建 API 接口负载均衡;

2. API 文档

API 详情地址: https://www.gugudata.com/api/details/fetchcontentimages

接口请求地址: https://api.gugudata.com/news/fetchcontentimages

返回格式: application/json; charset=utf-8

请求方式: POST

请求协议: HTTPS

请求示例: https://api.gugudata.com/news/fetchcontentimages

接口预览: https://www.gugudata.com/preview/fetchcontentimages

接口测试: https://api.gugudata.com/news/fetchcontentimages/demo

3. 请求参数

参数名 参数类型 是否必须 默认值 备注
appkey string YOUR_APPKEY 付费后获取的 APPKEY
url string YOUR_VALUE 需要抓取正文的文章链接
limittype string YOUR_VALUE 对图片大小进行筛选条件类型,参数值为 size 或 ratio。size:按照图片大小 (KB) 进行筛选,ratio:按照图片分辨率 [宽,高] 进行筛选
limitvalue float / [int,int] YOUR_VALUE 对图片大小进行筛选条件值,如果类型为 size,参数值格式为 float 类型的图片最小限制值(单位为 KB),如果类型为 ratio,参数值格式为 int 数组 [宽,高],分别限制最小宽与高(单位为像素)
imagewithtag bool false 是否返回获取到的图片原始 img HTML 标签
htmlsourcecontent bool false 是否返回文章页面原始 HTML 内容,供您二次解析或分析正文图片列表失败时使用,需要注意接口的性能问题

4. 返回参数

参数名 参数类型 备注
DataStatus.StatusCode int 接口返回状态码
DataStatus.StatusDescription string 接口返回状态说明
DataStatus.ResponseDateTime string 接口数据返回时间
DataStatus.DataTotalCount int 符合条件的图片集合数量
Data.Url string 文章 Url
Data.ImagesUrl string[] 文章正文中符合筛选条件的图片 Url 集合
Data.ImagesTag string[] 当传递 imagewithtag 参数值为 true 时,返回获取到的图片原始 img HTML 标签
Data.HTMLSourceContent string 文章的原始 HTML 内容(HTML 标签为 Unicode 编码)

Top comments (0)