什么是异步加载,说白了,就是你在网址上看到的东西,它的源代码并没有那些东西,就例如以下网站http://exercise.kingname.info/exercise_ajax_1.html此地址来自Python爬虫开发 从入门到实战这本书中的
这就是典型的异步加载
我们查询一下它的源码
看看,并没有包含文本信息,如果我们简单的用爬虫爬取,会怎么样呢?
看,你根本看不到它的文本信息,那么,我们应该如何抓取呢?
我们先打开开发者工具,切换到Network
我们刷新一下试试
你会发现,多出来了一点东西,我们先点开ajax_1_backend
诶,你会发现这里面居然包含了你想要的文本信息
我们再点开ajax_1_postbackend
这里也有文本信息。
我们再打开ajax_1_backend里的Headers、
看看这一段,既然请求是这个地址的,那我们打开这一段地址看看
看看,数据就出来了,我们用Python代码写一下
就是这么简单.
我们再看到第二条信息
诶,我们可以看到,这个是以POST方式向这个http://exercise.kingname.info/ajax_1_postbackend发的信息,并以JSON格式提交数据,那我们接着写代码
我们以JSON的方式向它传递了两个信息,一个是name,一个是age