互联网数据查询同步接口
更新时间:2026-03-20 11:10:36
API测试
申请API调用
基本信息
接口描述:互联网数据的检索接口,支持自定义返回结果字段,比如正文等字段。互动数默认都返回
请求方式:post,get
请求地址:
resource/doc/searchSync
请求参数格式:application/x-www-form-urlencoded
输入参数
参数名称
类型
是否必填
描述
startPubTime
string
是
开始时间,格式yyyyMMdd或yyyyMMddHHmmss
endPubTime
string
是
结束时间,格式yyyyMMdd或yyyyMMddHHmmss
startLoadTime
string
否
入库开始时间,格式yyyyMMdd或yyyyMMddHHmmss
endLoadTime
string
否
入库结束时间,格式yyyyMMdd或yyyyMMddHHmmss
searchWord
string
否
检索词,从标题或正文中查询,多值;分隔
title
string
否
标题检索词
content
string
否
正文检索词
siteName
string
否
站点名称,多值;分隔
channel
string
否
频道名称,多值;分隔
mediaUnitName
string
否
集团名称,多值;分隔
language
string
否
语种【ZH_CN:中文、en_GB:英文、it_IT:意大利文、ja_JP:日文】,多值使用”;”分隔
mediaQualification
string
否
可选值:新闻转载网站、新闻资质网站,多值是or的关系,用;间隔
sameType
string
否
全库排重类型,content-全库内容排重;title-全库标题排重;url-全库url排重;channel-频道内标题排重;siteNameTitle-站点内标题排重,unitTitle-集团内标题排重
sorts
string
否
排序字段,支持相关度排序,示例+RELEVANCE表示按照相关度排序, 示例-pubTime表示按照发布时间倒叙,支持多字段一起排序,比如【-loadTime;-pubTime】
resultColumn
string
否
指定返回的结果集字段,默认值DOC_BASE_COLUMN表示稿件的基础信息,如果需要返回其他信息则需要指定,比如DOC_BASE_COLUMN;content则表示在基础信息的基础上增加正文信息的返回
pageNum
string
否
页码,从0开始
pageSize
string
否
每页展示条数,默认值20,不可超过100
medium
string
否
渠道类型编码,多值使用“,”分隔或使用“;”分隔,多值是or的关系,网站-website、微博-weibo、微信weixin、数字报-szb、公众平台-gzpt、短视频-svideo等,不输入则全库查询
resultSameType
string
否
返回结果稿件的排重方式:content-内容排重;title-标题排重;url-url排重,多值使用”;”分隔。
注意:输入这个排重类型后分页参数pageNum不生效,默认返回的是前10条的数据
startUpdateTime
string
否
开始更新时间,格式yyyyMMdd或yyyyMMddHHmmss
endUpdateTime
string
否
结束更新时间,格式yyyyMMdd或yyyyMMddHHmmss
输出参数
参数名称
类型
描述
id
string
稿件id,唯一值,与热点线索的相关稿件id对应
docId
string
件id,唯一值,查询传播力时使用这个id
title
string
稿件标题
siteName
string
发布站点
channel
string
发布频道/栏目
pubTime
string
发布时间,格式yyyy-MM-dd HH:mm:ss
author
string
作者
srcName
string
稿件来源
md5
string
稿件的md5
keyWords
string
抽取的关键词
url
string
原文链接
infoType
string
所属渠道类型
language
string
语种
mediaUnitName
string
集团名称
mediaArea
string
媒体地域
readCount
string
阅读数
commentCount
string
评论数
approveCount
string
点赞数
lookedCount
string
再看数
playCount
string
播放量
rttCount
string
转发数
updateTime
string
更新时间
loadTime
string
入库时间,格式yyyy-MM-dd HH:mm:ss,这个字段及下面的字段默认不返回,如果需要返回则通过resultColumn参数指定,示例如果要增加返回封面图和正文,则输入:resultColumn=DOC_BASE_COLUMN;content;coverpic
coverpic
string
封面图
pictures
string
正文中的所有图片链接,多值;分隔
videos
string
正文中的所有视频链接,多值;分隔
audios
string
正文中的所有音频链接,多值;分隔
docAbstract
string
摘要
content
string
稿件正文,过滤标签后的正文
htmlContent
string
稿件原始正文
调用示例
http://[域名]/opens/api/base/doc/search?startPubTime=20201229&endPubTime=20201229
输入示例
startPubTime=20201229&endPubTime=20201229
输出示例
{
"code": 200,
"msg": null,
"data": {
"pageItems": [
{
"keyWords": "报销;好消息;财政电子票据;相关单位;社会公众;档案管理;财务;入账;事业单位;财政票据",
"srcName": "人民网",
"docId": "14679161466652567948",
"author": "",
"pubTime": "2020-12-29 00:00:00",
"channel": "资讯",
"siteName": "嘉兴人网",
"language": "ZH_CN",
"title": "好消息!明年起财政电子票据可直接报销",
"url": "http://www.jiaxingren.com/folder22/folder286/2020-12-29/751632.html",
"infoType": "1",
"mediaUnitName": "嘉兴市广播电视集团",
"id": "329597_1655834442802897250_0",
"md5": "81c4c17930a837a8"
}
],
"pageIndex": 0,
"pageSize": 1,
"totalItemCount": 215705,
"thisPageTotal": 1,
"pageTotal": 215705,
"prevPage": 0,
"nextPage": 1,
"step": 10,
"startPage": 0,
"endPage": 10,
"groupByResult": null,
"totalPageCount": 215705,
"lastPage": false,
"firstPageNo": 0,
"lastPageNo": 215704,
"firstPage": true
}
}
接口说明
互联网数据的检索接口
在线测试
请求方式:
GET
POST
*startPubTime:
*endPubTime:
startLoadTime:
endLoadTime:
searchWord:
title:
content:
siteName:
channel:
mediaUnitName:
language:
mediaQualification:
sameType:
sorts:
resultColumn:
pageNum:
pageSize:
medium:
resultSameType:
startUpdateTime:
endUpdateTime:
确定
重置
请求结果
错误码
其他错误码详见
公共错误码。