GoogleHacking——web信息挖掘
指从大量的训练样本中获得数据之间的内在特征
1.Googlehacking
Google常用语法
指令 | 意义 |
---|---|
Site | 指定域名 |
Inurl | URL中存在关键字的网页 |
Intext | 网页中正文的关键字 |
Filetype | 指定文件类型,支持ppt,xls,doc,rtf,pdf,txt |
Intitle | 网页标题中的文字 |
Link | Link: baidu.com表示返回有baidu.com做了链接的URL |
Info | 查找指定站点的一些基本信息 |
Cache | 搜索Google里关于某些内容的缓存 |
Whois——标准的互联网协议
查询已注册的域名的所有者信息:
域名登记人信息、联系方式、域名注册时间和更新时间、权威DNS的IP地址
Kali中使用whois:
指令: whois 域名
在线查询:
爱站网: https://whois.aizhan.com/
站长之家: https://whois.chinaz.com/
网站备案:
天眼查: https://www.tianyancha.com/
指纹识别
识别网站、操作系统等的特征码
网站CMS识别、计算机操作系统及web容器的指纹识别
CMS(Content Management System)文章系统或整站系统;
CMS指纹是应用程序在html、JS、CSS中包含的一些特征码
常见:
Dedecms(织梦)、Discuz、PHPwind、PHPWeb等
常见工具:
Web指纹识别、Whatweb、WebRobo、轻量WEB指纹识别
在线CMS指纹识别:
Bugscaner: http://whatweb.bugscaner.com/look/
云悉指纹: http://www.yunsee.cn/finger.html