优酷评论爬虫
之前抓取的是页面数据,没有具体去看评论接口的参数,昨天发现优酷web版上面的评论模块没了(我猜是要更新评论数据的加载策略,之前页面加载太慢了)
然后我就开始调试接口的sign参数,走接口拿数据。
这篇文章说下优酷评论sign的生成方法。
[具体过程不做太多介绍,文章末尾放代码]
一个电视剧的链接:
https://v.youku.com/v_show/id_XNDIyMjY5NDcyMA==.html
评论数据的接口:
接口 :https://p.comments.youku.com/ycp/comment/pc/commentList
请求方式: Get
参数:
currentPage=1
objectType=1
app=