[小程序]小程序破千之笔顺图片采集篇（2） - 代码天地

[小程序]小程序破千之笔顺图片采集篇（2）

其他 2021-03-27 15:32:22 阅读次数: 0

又是一个周末，外面的天气灰蒙蒙的，接着上次的任务，制定下今天的目标

采集百度或者搜狗汉语的gif图片 *****
格式化后入库 *****
前端资源引用变更

爬去 gif笔画图片

这里主要的知识点就一个

BeautifulSoup python爬虫，应该都会用到；
puppeteer nodejs版

文档地址：https://www.crummy.com/software/BeautifulSoup/bs4/doc/index.zh.html#id17

如果不用python，用nodejs 推荐使用 puppeteer；

我这里用的是python 记录下代码，主要的方法，

font = sys.argv[1]

def start():
	r = rqs.get(url = url,headers=headers)
	time.sleep(random.randint(1,4))
	# print(r.content)
	soup = BeautifulSoup(r.content, 'html.parser')
	bh = soup.find('li',{
    
    "id": "stroke_count"})
	bh_num = 0
	if(bh):
		bh_num = bh.contents[3].contents[0]
		img_www = tit.get('data-gif')
		r2 = rqs.get(img_www)
		filename = str(ord(font))
		# print(charcode)
		fpath = os.path.join('/pyproject/spider/gifs/', filename)
		# print(fpath)
		with open(fpath+'.gif','wb+')as f : 
			f.write(r2.content)
			r2.close()
	r.close()
	return bh_num

if __name__ == '__main__':
	start()

保存的时候就设置好文件名称规则，这样一次性就到位，和文字一一对应关系，

格式化入库

其实这里主要是新图片和旧图片的命名规则，我用的 charCodeAt ， fromCharCode 方式；因为前面的 jpg 也是这样的命名方式，这样可以减少很大的更改成本；不管数据增加，修改，最终都可以找到图片所对应的文字。

数据库 mongodb $set, upsert 方式，

前端新增引用资源

这里就不一一说明了，直接上图了，
在这里插入图片描述

在这里插入图片描述
今天的目标已经完成，打完收工~~~~

猜你喜欢

转载自blog.csdn.net/uk_51/article/details/113145914

[小程序]小程序破千之笔顺图片采集篇（2）

[小程序]小程序破千重拾起来（1）

小程序之图片上传

小程序篇-小程序

微信小程序之小程序图片压缩

小程序体积优化(2)--优化图片

微信小程序之图片上传

小程序之如何让图片显示隐藏

微信小程序之图片裁剪

微信小程序之滚动图片

小程序之封装图片处理方法

小程序之批量上传图片

微信小程序之图片处理

微信小程序之图片轮播

微信小程序之图片压缩

小程序图片处理

小程序————图片预览

小程序图片适配

小程序图片轮播

小程序保存图片

小程序图片上传

#小程序#图片上传

小程序预览图片

【小程序】学习笔记四 - 小程序指南篇之小程序登录流程

小程序之入门篇（一）

微信小程序之UI篇

小程序之入门篇

小程序路由篇

小程序笔记篇

小程序样式篇

今日推荐

零基础入门鸿蒙开发 HarmonyOS NEXT星河版开发学习

豆包MarsCode帮我2小时完成Go语言系统从开发、测试到部署全流程最佳实践，云IDE迁移PHP企业级项目最佳实践

内幕！smardaten无代码平台全方位测评，这些细节你绝对想不到！

idea安装及激活配置流程---2024旗舰版(需激活码)

Elastic 创始人：热爱开源，希望合作 OSI 创建新许可证

工业互联网标识解析体系开放开源下载服务中心发布

IDEA取消自动选择光标所在行

828华为云征文 | 使用Flexus X实例搭建Dubbo-Admin服务

Programmer&AI—AI辅助编程学习指南

【Linux】虚拟机安装 openEuler 24.03 X86_64

o1 发布后 Sam Altman 最新访谈：AI 发展不仅没有放缓，而且我们对未来几年已经胜券在握

AI芯片国产化率100%！运营商最大单集群智算中心投产

周排行

【后端】 Spring Cloud 服务间调用

Git 学习教程

Salesforce集成(三). 获取数据02_获取Object和Field信息

Oracle执行计划的稳定（使用MANUAL类型的SQL PROFILE）

js跨域请求之jsonp原理和运用

ios -解决view遮挡按钮问题

【PAT天梯赛】L2-003 月饼（25 分)（贪心思想）

hive 存储格式的生产应用

【Python实践-6】将不规范的英文名字，变为首字母大写，其他小写的规范名字

容器学习点点滴滴（二）

每日归档

更多

2024-10-03(2)

2024-10-02(60)

2024-10-01(0)

2024-09-30(0)

2024-09-29(0)

2024-09-28(4)

2024-09-27(60)

2024-09-26(0)

2024-09-25(0)

2024-09-24(0)