最近在做一个项目,是对INFORMIX数据库的数据进行大数据分析,INFORMIX数据库数据有上亿条,没有linux的Root权限和informix数据的生产权限,只能读取。客户要求结果显示在内网windows WEB服务器上,终端通过浏览器来阅读。
我采用python+django+pandas+matplotlib。
首先要做的是:连接数据库并获取数据,其次要创建内网WEB服务,然后实现实时数据分析。
在做第一步时,就遇到INFORMIX的数据汉字编码问题。
现数据采用8859-1字符集,819编码。通过取数据分析,所有汉字为GBK编码的十六进制字符输出。
原生输出肯定为乱码,解决方案:网上能查到的唯一能解决的就是采用JDBC加连接输出控制实现。
我们既然知道出现乱码原因,就可以编程来实现。以下是我在HTML中和Django模板中解决乱码的方法。
一、
......(如何上传附件)
二、
.........