Base4 应用及设计

  在对Base64、Base32、Base16进行了原理分析和应用示例后,突然想起,有没有一种不可见的编码,在一般文本查看器时,无法直观的查看文本中的内容,从而达到隐藏原文的目的。当然这只是一种编码,并不会保证数据的安全性。

  · ASCII 编码

  首先,在进行编码设计之前,我们需要先了解一下ASCII编码表中,每个编码的表现形式,写一个测试类,把ASCII全部输出:

package com.arhorchin.securitit.codec.ascii;

public class AsciiTester {

    public static void main(String[] args) throws Exception {
        for (int i = 0; i < 128; i++) {
            System.out.println((char) i);
        }
    }

}

  输出结果:
在这里插入图片描述
  从输出结果可以看出,ASCII码中0-32和127属不可见字符,在不可见字符串中,不会产生占位的共4个字符:28、29、30、31,这4个字符在一般文本编辑器查看时,不会显示,当然,功能强大的编辑器会显示其本来面目。

  · Base4 编码

  使用ASCII码中28、29、30、31四个字符对字节数组进行分解,每个字节是8位,利用已有的四个字符将每个字节拆分为4个字节,工具类如下:

package com.arhorchin.securitit.codec.base;

import java.io.ByteArrayOutputStream;
import java.io.DataOutputStream;
import java.io.IOException;
import java.nio.charset.Charset;

public class Base4 {

    /**
     * 编码码位集合.
     */
    private static final String Base4Tb = new String(new char[] { (char) 28, (char) 29, (char) 30, (char) 31 });

    private Base4() {
    }

    /**
     * Base4编码.
     * @param strData 待编码字符串.
     * @param charset 字符集.
     * @return 已编码字符串.
     */
    public static String encodeBase4String(String strData, Charset charset) {
        return new String(encodeBase4(strData.getBytes(charset)), charset);
    }

    /**
     * Base4编码.
     * @param strData 待编码字节数组.
     * @param charset 字符集.
     * @return 已编码字符串.
     */
    public static String encodeBase4String(byte[] binaryData, Charset charset) {
        return new String(encodeBase4(binaryData), charset);
    }

    /**
     * Base4编码.
     * @param strData 待编码字节数组.
     * @param charset 字符集.
     * @return 已编码字节数组.
     */
    public static byte[] encodeBase4(byte[] binaryData) {
        ByteArrayOutputStream os = new ByteArrayOutputStream();

        for (byte item : binaryData) {
            short value = (short) (item & 0xFF);

            byte first = (byte) (value >> 6);
            byte second = (byte) (((value << 2) & 0xFF) >> 6);
            byte third = (byte) (((value << 4) & 0xFF) >> 6);
            byte fourth = (byte) (((value << 6) & 0xFF) >> 6);

            os.write(Base4Tb.charAt(first));
            os.write(Base4Tb.charAt(second));
            os.write(Base4Tb.charAt(third));
            os.write(Base4Tb.charAt(fourth));
        }
        return os.toByteArray();
    }

    /**
     * Base4解码.
     * @param strData 待解码字符串.
     * @param charset 字符集.
     * @return 已解码字符串.
     */
    public static String decodeBase4String(String strData, Charset charset) {
        return new String(decodeBase4(strData.getBytes(charset)), charset);
    }

    /**
     * Base4解码.
     * @param strData 待解码字节数组.
     * @param charset 字符集.
     * @return 已解码字符串.
     */
    public static String decodeBase4String(byte[] binaryData, Charset charset) {
        return new String(decodeBase4(binaryData), charset);
    }

    /**
     * Base4解码.
     * @param strData 待解码字节数组.
     * @param charset 字符集.
     * @return 已解码字节数组.
     */
    public static byte[] decodeBase4(byte[] binaryData) {
        ByteArrayOutputStream bs = new ByteArrayOutputStream();
        byte[] raw = binaryData;
        for (int i = 0; i < raw.length; i++) {
            bs.write(raw[i]);
        }
        byte[] in = bs.toByteArray();
        if (in.length % 4 != 0) {
            return null;
        }

        bs.reset();
        DataOutputStream ds = new DataOutputStream(bs);

        for (int i = 0; i < in.length; i += 4) {
            byte first = (byte) Base4Tb.indexOf((char) in[i]);
            byte second = (byte) Base4Tb.indexOf((char) in[i + 1]);
            byte third = (byte) Base4Tb.indexOf((char) in[i + 2]);
            byte fourth = (byte) Base4Tb.indexOf((char) in[i + 3]);

            try {
                ds.writeByte((first << 6) + (second << 4) + (third << 2) + fourth);
            } catch (IOException e) {
            }
        }
        return bs.toByteArray();
    }

}

​ 测试类如下:

package com.arhorchin.securitit.codec.base;

import java.nio.charset.Charset;

public class Base4Tester {

    public static void main(String[] args) throws Exception {
        String plain = "我们将使用Base4编码格式对数据进行编码,查看编码后数据.";
        String codec = "";
        // Base4 编码.
        codec = Base4.encodeBase4String(plain, Charset.forName("UTF-8"));
        System.out.println("编码后数据:" + codec);
        System.out.println("编码后数据长度:" + codec.length());
        // Base4 解码.
        plain = Base4.decodeBase4String(codec, Charset.forName("UTF-8"));
        System.out.println("解码后数据:" + plain);
        System.out.println("解码后数据长度:" + plain.length());
    }

}

  测试类输入结果:
在这里插入图片描述
  从输出结果中可以看出,编码后的数据在IDE的Console中是不占位的,但是长度是依然存在的。

  · Base4 文件中表现

  我们同样可以把内容输出到文件中。在不同的文本编辑器下,显示的效果略有不同,示例如下:

package com.arhorchin.securitit.codec.base;

import java.io.File;
import java.nio.charset.Charset;

import org.apache.commons.io.FileUtils;

public class Base4FileTester {

    public static void main(String[] args) throws Exception {
        String plain = "我们将使用Base4编码格式对数据进行编码,查看编码后数据.";
        String codec = "";
        // Base4 编码.
        codec = Base4.encodeBase4String(plain, Charset.forName("UTF-8"));
        System.out.println("编码后数据:" + codec);
        System.out.println("编码后数据长度:" + codec.length());
        // 内容写入文件.
        FileUtils.writeStringToFile(new File("C:/Users/Administrator/Downloads/个人文件/Base4.txt"), codec);
    }

}

  文件在记事本中显示:
在这里插入图片描述
  文件在EditPlus中显示:
在这里插入图片描述
  文件在UltraEdit中显示:
在这里插入图片描述
  文件在Notepad++中显示:
在这里插入图片描述
  从上面这些图片可以看出,Notepad、EditPlus、UltraEdit不会显示编码后内容,Notepad++会显示编码后内容。

  · 总结

  · Base4是纯属娱乐开发的小玩意。

  · Base4会使当前数据膨胀为原数据的4倍。

  · Base4在某些文本编辑器中不会显示内容,但是文本大小实际是有原文内容大小决定的。

  · Base4只是编码算法,并非秘钥算法,所以并不能在数据安全性等方面给予保证。

猜你喜欢

转载自blog.csdn.net/securitit/article/details/107481919