玩小红书还在手动找数据?0基础爬虫找到对标笔记

做小红书的,希望能爬下来对标笔记和图片,但是对编程一窍不通,写爬虫太难了怎办。

之前听说过八爪鱼和后羿采集器之类的工具,然后我也试了下后裔采集器这个工具,发现它确实很有用的,尤其是在抓取网页信息方面。它还有一个自动下载图片的功能。虽然我昨天尝试下载图片当时没成功,但是在表格里的图片URL找到。

我还尝试用它来爬取小红书上热门标签下的内容,结果是一分钟就爬取了200多篇文章。

今天就来手把手带大家玩玩这个。

一、工具下载

打开网站:https://www.houyicaiji.com 点击“立即下载”。

图片[1]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

双击下载的压缩包,在弹出的窗口选择“同意”,只需要三四秒左右,后羿采集器就下载完成了。

图片[2]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

二、确定关键词

你想采集某个领域的爆款笔记,需要先确定一个关键词。

举个例子,假如你是一位AI绘画博主。

那么首先打开小红书,找一篇AI绘画的爆款笔记,打开笔记,拉到笔记结尾处,一般都能看到对应领域的话题。

图片[3]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

比如我们选“AI绘画”这个话题,点击蓝字会进入一个新的页面,这里的笔记都是“AI”这个话题名下的。

图片[4]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

然后我们复制这个链接

https://www.xiaohongshu.com/page/topics/5f2f8a57ed406a000176137d?fullscreen=true&naviHidden=yes&xhsshare=CopyLink&appuid=63671ea3000000001f016749&apptime=1701101165

三、工具操作

打开后羿采集器,直接把上面的网址复制到采集框里就可以。

图片[5]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂
图片[6]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

这边就已经自动采集了。我们可以添加一些字段

图片[7]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

但是目前改采集的都采集的,这个视不同情况添加或者删除字段。

然后点击开始采集

图片[8]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

不需要修改,直接选择启动,

图片[9]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

一个关键词,我们大概搜个200-300条就足够了,条数差不多了就可以直接点击“停止”按钮。

图片[10]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

然后导出数据

图片[11]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

四、数据处理

打开excel,接下来我们给点赞数排个序,点赞数是reds-note-like-text

图片[12]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

看到小黄点,然后转化成数字

图片[13]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

然后按数据-排序,排个序

图片[14]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂
图片[15]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂

好的,这就是最近的爆款了,大家根据自己的需求进行调整。

最后给会员分享一个我的模板,经过修改的,拿来就用

下载以后直接解压即可

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容