判断中文文本编码格式是gbk还是utf-8的一种简单方式 - 代码天地

判断中文文本编码格式是gbk还是utf-8的一种简单方式

其他 2018-10-18 15:04:39 阅读次数: 0

import java.io.*;

public class charsetTest {
   public static String charsetType(String fileName) throws IOException {
      BufferedReader reader = new BufferedReader(new InputStreamReader(new FileInputStream(fileName), "utf-8"));
      String str=reader.readLine();
      int len1=str.length();
      
      reader = new BufferedReader(new InputStreamReader(new FileInputStream(fileName), "gbk"));
      str=reader.readLine();
      int len2=str.length();
      if(len1<=len2){
         return "utf-8";
      }
      else{
         return "gbk";
      }
      
   }

   public static void main(String[] args) throws IOException {
      System.out.println("gbk.txt："+charsetType("gbk.txt"));
      System.out.println("utf.txt："+charsetType("utf.txt"));
   }
}

在日常处理中文文本的过程中发现的一种有趣现象，实际运行可准确判断中文字符编码类型，但有无例外情况尚不可知

猜你喜欢

转载自blog.csdn.net/capricio/article/details/83023828

判断中文文本编码格式是gbk还是utf-8的一种简单方式

如何判断一个文本文件内容的编码格式 UTF-8 ? ANSI(GBK)

Latex中文utf-8编码的三种方式

pandas外部数据的读取构造数据框-文本文件读取（一种utf-8中文编码乱码处理经验）

【GBK、UTF-8、ISO8859-1】三种编码方式总结

UTF-8和GBK等编码格式转换问题

NUICODE UTF-8 GBK 等编码方式来龙去脉

编码方式ASCII、GBK、Unicode、UTF-8比较

java自动识别文件编码格式UTF-8,UTF-8无BOM，GBK

判断URL中的中文参数是GB2312还是Utf-8编码

SecureCRT 设置编码格式UTF-8后还是中文乱码

一文读懂所有的编码方式(UTF-8、GBK、Unicode、宽字节...)

windows API实现中文中字符串与GBK、Unicode、UTF-8三种编码互转

MAVEN编码从GBK改为UTF-8

java 编码转换（GBK>>UTF-8）

GBK、ANSI、Unicode、UTF-8编码

ascii、unicode、utf-8、gbk编码

ASCII GBK UTF-8 编码

Python编程，设置utf-8为默认编码的一种方法

ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式比较分析

ASCII、GB2312、GBK、Unicode、UTF-8、UTF-16 编码方式详解

UTF-8、GB2312、GBK编码格式详解和编码示例

【笔记】如何把GBK的文本格式转换为UTF-8格式

gbk与utf-8

Qt读取TXT文件时，GBK与UTF-8编码判断

中文字符：中国的unicode/UTF-8/GBK编码

C++ 中文字符编码转换 GBK/UTF-8

中文字符编码：GB2312、GBK、ANSI、Unicode、UTF-8

python3 unicod,utf-8,gbk的编码和解码中文显示问题

彻底解决Qt中文乱码以及汉字编码的问题(UTF-8/GBK)

今日推荐

周排行

vue + echart +map中国地图，省市地图，区县地图

spring boot2 (31)-cors跨域请求

『学习资料推荐』299元买的微信营销资料打包

个人学习卷积神经网络的疑惑解答

网络工程师-软考

模拟人生4 春夏秋冬、星梦起飞版更新下载方法以及常见问题

python关于对象的字符串显示str和repr以及

奇怪的session混乱问题

【3】分治法（divide-and-conquer）

Java项目开发成绩管理系统（九）各模块实现信息修改

每日归档

更多

2024-08-07(0)

2024-08-06(0)

2024-08-05(0)

2024-08-04(0)

2024-08-03(0)

2024-08-02(0)

2024-08-01(0)

2024-07-31(0)

2024-07-30(0)

2024-07-29(0)