大数据统计地市级党委书记数据库2000-2010的数据
数据见文末下载!
声明:该数据库并非楼主本人,所有权属复旦大学经济学院陈硕副教授及团队,帖子仅仅是数据分享,希望大家在使用过程中,仔细按照官方数据库说明进行。
以下是数据建立方法:
1. 查阅各省(及自治区)年鉴整理出 2000-2010 年间各地市级行政区划党委书记名单
2. 通过人民网、新华网、各地方ZF网站及百度百科查询各党委书记简历
3. 对简历进行电子化整理获得现有数据库
4. 当某市某年有超过 1 位党委书记任职时,我们以最后上任书记信息为准
陈硕,2015,从治理到制度:央地关系下的中国政治精英选拔,1368-2010。复旦大学经济系工作论文
这里我们根据这个xls文件得出01.xlsx,然后再整理得出01.txt文件,再进行分析得出如下图:
数据挖掘步骤大概分为以下:1、数据采集2、数据清洗3、数据分析4、显示数据
//1、将xls文件转为txt文件
我们获得的xls数据先转为txt文件,方便操作
String filePath = "C:\\Users\\admin\\Desktop\\01.xlsx";
String filePath2 = "C:\\Users\\admin\\Desktop\\01.txt";
String data = _excelUtils.readFile(filePath);
_txtUtils.writeTxtFile(filePath2, data);
//2、数据清洗
int[] len = {12,1};
String result = _txtUtils.getBigDataTxt(filePath2, len);
List<Map<String,Object>> list = new ArrayList<Map<String,Object>>();
List<Map<String,Object>> totalList = new ArrayList<Map<String,Object>>();
Map<String,Object> map = null;
Map<String,Object> map2 = null;
String[] results = result.split(",");
for(String str : results){
String[] strs = str.split("-");
map = new HashMap<String,Object>();
map2 = new HashMap<String,Object>();
map2.put("province", strs[1]);
totalList.add(map2);
map.put("province", strs[1]);
map.put("sex", strs[0]);
list.add(map);
}
totalList = _listUtils.getNoList(totalList); //去除重复
List<Person> list2 = getListInArray(totalList,list);
_listUtils.sort(list2, false, "fmaleCount");
for(Person str : list2){
System.out.print(str.getFmaleCount()+", ");
}
//3、数据统计分析
// Integer male = _listUtils.getNumInArray("男", results);
// Integer fmale = _listUtils.getNumInArray("女", results);
// Integer total = results.length;
// String malePer = _stringUtils.getNumberPercent(male+"", total+"");
// String fmalePer = _stringUtils.getNumberPercent(fmale+"", total+"");
//
// System.out.println("总样本量:"+total+"\r\n"
// + "男性样本量:"+male+" \r\n"
// + "女性样本量:"+fmale+"\r\n"
// + "男性比例:"+malePer+"\r\n"
// + "女性比例:"+fmalePer+"\r\n"
// + "");
//4、制作成图表
<script type="text/javascript">
var dom = document.getElementById("container");
var myChart = echarts.init(dom);
var app = {};
option = null;
app.title = '环形图';
option = {
tooltip: {
trigger: 'item',
formatter: "{a} <br/>{b}: {c} ({d}%)"
},
legend: {
orient: 'vertical',
x: 'left',
data:['男','女']
},
series: [
{
name:'男女占比',
type:'pie',
radius: ['50%', '70%'],
avoidLabelOverlap: false,
label: {
normal: {
show: false,
position: 'center'
},
emphasis: {
show: true,
textStyle: {
fontSize: '30',
fontWeight: 'bold'
}
}
},
labelLine: {
normal: {
show: false
}
},
data:[
{value:2633, name:'男'},
{value:75, name:'女'}
]
}
]
};
;
if (option && typeof option === "object") {
myChart.setOption(option, true);
}
</script>
需要源码学习,下载地址:http://47.98.237.162/detail/1/173
扫描二维码关注公众号,回复:
2854152 查看本文章