var http = require('http');
var fs = require('fs'); // 文件系统模块
var cheerio = require('cheerio'); // 抓取网页数据模块,需要安装,npm install cheerio
var url = 'http://localhost/icon'; // 我要爬取的网站
http.get(url, function(res) {
var html = '';
res.on('data', function(data) {
html += data;
});
res.on('end', function(){
// console.log(html); // 获取到的网页源码
filterChapters(html);
})
}).on('error', function() {
console.log('获取网页源码失败....');
})
function filterChapters(html) {
var $ = cheerio.load(html);
// 找元素,自己去网页检查元素
var lis = $('.fa-hover');
var sql = "";
for (var i = 0; i < lis.length; i++) {
var ielement = $(lis[i]).children("i");
sql += 'insert into sys_icons(iconName) values(\''+$(ielement).attr("class")+'\'); \n';
}
// 将所有的sql信息生成sql语句
var out = fs.createWriteStream('./sql.txt')
out.write(sql);
console.log(sql);
}
1、如下图:
2、安装node.js , 去下载, 然后傻瓜式安装,一直 ‘next’, 安装完成。
创建一个空文件夹, 然后在这个空文件夹上面直接cmd, 然后安装npm install cheerio模块。
然后在这个文件创建一个test.js, 把代码拷进去,然后cmd直接运行 node test.js