做小红书的,希望能爬下来对标笔记和图片,但是对编程一窍不通,写爬虫太难了怎办。
之前听说过八爪鱼和后羿采集器之类的工具,然后我也试了下后裔采集器这个工具,发现它确实很有用的,尤其是在抓取网页信息方面。它还有一个自动下载图片的功能。虽然我昨天尝试下载图片当时没成功,但是在表格里的图片URL找到。
我还尝试用它来爬取小红书上热门标签下的内容,结果是一分钟就爬取了200多篇文章。
今天就来手把手带大家玩玩这个。
一、工具下载
打开网站:https://www.houyicaiji.com 点击“立即下载”。
![图片[1]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127155917429.png)
双击下载的压缩包,在弹出的窗口选择“同意”,只需要三四秒左右,后羿采集器就下载完成了。
![图片[2]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127155927757.png)
二、确定关键词
你想采集某个领域的爆款笔记,需要先确定一个关键词。
举个例子,假如你是一位AI绘画博主。
那么首先打开小红书,找一篇AI绘画的爆款笔记,打开笔记,拉到笔记结尾处,一般都能看到对应领域的话题。
![图片[3]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127160436977.png)
比如我们选“AI绘画”这个话题,点击蓝字会进入一个新的页面,这里的笔记都是“AI”这个话题名下的。
![图片[4]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127160512296.png)
然后我们复制这个链接
https://www.xiaohongshu.com/page/topics/5f2f8a57ed406a000176137d?fullscreen=true&naviHidden=yes&xhsshare=CopyLink&appuid=63671ea3000000001f016749&apptime=1701101165
三、工具操作
打开后羿采集器,直接把上面的网址复制到采集框里就可以。
![图片[5]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127160802619.png)
![图片[6]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127160828652.png)
这边就已经自动采集了。我们可以添加一些字段
![图片[7]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127161243716.png)
但是目前改采集的都采集的,这个视不同情况添加或者删除字段。
然后点击开始采集
![图片[8]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127161353536.png)
不需要修改,直接选择启动,
![图片[9]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127161414571.png)
一个关键词,我们大概搜个200-300条就足够了,条数差不多了就可以直接点击“停止”按钮。
![图片[10]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127161456696.png)
然后导出数据
![图片[11]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127161553216.png)
四、数据处理
打开excel,接下来我们给点赞数排个序,点赞数是reds-note-like-text
![图片[12]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127162803619.png)
看到小黄点,然后转化成数字
![图片[13]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127162854987.png)
然后按数据-排序,排个序
![图片[14]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127162944577.png)
![图片[15]-玩小红书还在手动找数据?0基础爬虫找到对标笔记 - 李又懂-李又懂](https://liyoudong-1305671160.cos.ap-beijing.myqcloud.com/2023/11/20231127163022247.png)
好的,这就是最近的爆款了,大家根据自己的需求进行调整。
最后给会员分享一个我的模板,经过修改的,拿来就用
下载以后直接解压即可
暂无评论内容