搜狐号文章数据查询接口
更新时间:2026-03-20 11:10:36
API测试
申请API调用
基本信息
接口描述:查询文章数据的服务接口,支持稿件基本属性及关键词的查询。
请求方式:post
请求地址:
resource/souhu/search
请求参数格式:application/x-www-form-urlencoded
输入参数
参数名称
类型
是否必填
描述
startPubTime
string
是
文章发布时间,表示查询这个时间之后的文章,格式yyyyMMdd或yyyyMMddHHmmss
endPubTime
string
是
文章发布时间,表示查询这个时间之前的文章,格式yyyyMMdd或yyyyMMddHHmmss
startLoadTime
string
否
文章入库时间,如果输入了则查询这个时间之后入库的文章,用于增量数据同步的场景,格式yyyyMMdd或yyyyMMddHHmmss
endLoadTime
string
否
文章入库时间,如果输入了则查询这个时间之前入库的文章,用于增量数据同步的场景,格式yyyyMMdd或yyyyMMddHHmmss
searchWord
string
否
搜索的关键字,标题或正文中任何一个字段匹配成功都会返回结果,多个关键字使用“,”分隔或使用“;”分隔,多个关键字必须同时包含才会返回,输入的关键词总长度100个字符以内。注意关键词不能包含{、}、“ 等特殊字符
title
string
否
标题搜索的关键词,只查询标题字段,参数说明和查询逻辑同searchWord
content
string
否
正文搜索的关键词,只查询正文字段,参数说明和查询逻辑同searchWord
siteName
string
否
站点名称,多个名称使用“,”分隔或使用“;”分隔。参数限制:多个参数时数量不超过10个;参数值总长度50个字符以内
uid
string
否
账号id,多个id使用“,”分隔或使用“;”分隔。参数限制:多个参数时数量不超过10个
mediaUnitName
string
否
微信所属的集团名称,多个集团名称使用“,”分隔或使用“;”分隔。参数限制:多个参数时数量不超过10个;参数值总长度50个字符以内
mediaLevel
string
否
媒体等级:核心、一级、二级
pageNum
integer
否
返回结果集页码,首页及默认值均为0
pageSize
integer
否
每页返回结果集数量,默认值20,最大值不可超过100
sortOrder
string
否
结果集排序方式,通过“+”、“-”和数据字段来控制正序或倒序,示例-pubTime表示按照文章发布时间倒叙,支持多字段一起排序,比如【-loadTime,+pubTime】表示先根据入库时间倒序排列,如果时间一致时在根据发布时间正序排序。接口支持的排序字段如下:pubTime(文章发布时间)、loadTime(文章入库时间)、relevance(相关度,只有输入检索词时此参数才有意义,相关度只支持倒序,不支持正序)、readCount(阅读数)
输出参数
参数名称
类型
描述
code
String
接口状态码,200为正常,其他为错误码
msg
String
接口的错误描述信息
errorMsg
String
出现错误时的详细描述,方便开发人员排重问题
requestid
String
当前请求的唯一ID,反馈问题时直接提交此信息
data
Object
接口内的具体返回信息
docid
String
文章id,唯一值,查询详情时使用
sid
String
文章id,唯一值,查询传播服务时使用这个id
urlKey
String
通过url计算的key,常用于采集互动等服务
title
String
稿件标题
siteName
String
站点名称
uid
String
微信id
pubTime
String
发布时间,格式yyyy-MM-dd HH:mm:ss
source
String
稿件来源
keywords
String
抽取的关键词
url
String
文章链接
mediaUnitName
String
集团名称
loadTime
String
入库时间,格式yyyy-MM-dd HH:mm:ss
abstracts
String
摘要
pictureUrls
String
文章正文中的图片连接地址
readCount
String
阅读数
调用示例
http://[域名]/opens/api/resource/souhu/search
输入示例
startPubTime=20210922&endPubTime=20210922
输出示例
{
"code": 200,
"msg": "请求成功",
"data": {
"content": [
{
"readCount": null,
"uid": null,
"docid": "408861_12057910398181336726_0",
"sid": "15397394026463416974",
"urlKey": "12057910398181336726",
"title": "走近冬奥|北京冬奥海报发布",
"siteName": "新华社",
"pubTime": "2021-09-22 08:22:00",
"keywords": "冬奥;海报;北京;冬奥会;设计;冬奥海报;鲁迅美术学院;委文化活动部;海报发布;宣传",
"url": "https://www.sohu.com/a/491354996_267106",
"mediaUnitName": "新华社",
"loadTime": "2021-09-22 08:31:06",
"abstracts": "22日,在2021北京国际设计周开幕式上,北京2022年冬奥会和冬残奥会海报发布。北京冬奥海报包括官方海报和宣传海报,官方海报已于2020年7月由北京冬奥组委设计完成,共三组六幅。她说:“北京冬奥海报征集得到了鲁迅美术学院师生的热烈响应,我们组建了师生创作团队,从多角度挖掘设计灵感,这个过程使师生充分感受到,中华文化是我们的灵感源泉,我们作为艺术工作者,要与时代同行,为弘扬中华文化而努力。",
"pictureUrls": "https://p7.itc.cn/q_70/images03/20210922/c6ede880671343058ed658cf2482681b.jpeg;https://p7.itc.cn/q_70/images03/20210922/1fa009ec2eb5481abd5391b99da00e28.jpeg;https://p9.itc.cn/q_70/images03/20210922/63201837b5d144c487c0e77545740101.jpeg;https://p2.itc.cn/q_70/images03/20210922/e6f02578f14c4912a14688a2927912e1.jpeg"
}
],
"totalElements": 2772,
"totalPages": 28,
"number": 0,
"size": 100,
"numberOfElements": 100
},
"requestid": null
}
接口说明
无
在线测试
请求方式:
POST
*startPubTime:
*endPubTime:
startLoadTime:
endLoadTime:
searchWord:
title:
content:
siteName:
uid:
mediaUnitName:
mediaType:
mediaLevel:
mediaAdministrationType:
mediaIndustryCatalog:
mediaAreaCatalog:
contentAreaCatalog:
contentIndustryCatalog:
pageNum:
pageSize:
sortOrder:
确定
重置
请求结果
错误码
其他错误码详见
公共错误码。