####乱码原因分析
一般我们使用的Windows系统外部文件默认都是GBK编码方式,Mac系统默认的好像是UTF-8(同事的电脑就是,不知道其他人的是不是),Linux的没验证过,这里我讨论的是Windows下打包的zip文件。
Java中自带的ZipEntry解压缩的编码方式是UTF-8,而且没有可以自定义编码方式的接口,所以当我们使用UTF-8编码去解压缩GBK编码的文件的时,解压缩出来的中文部分当然是乱码,所以Mac上打包的zip用Java的自带解压缩接口解压出来是没有问题的。
####解决方式
找到了问题所在,解决方式也就比较简单了,既然是编码方式不同导致的,那我们保证编码方式统一即可,压缩zip时系统编码很难改变,那我们就从解压缩的编码方式入手,自定义解压缩的编码。
Apache中是有完整的替代解决方式的,但是Apache的包相对于Android说有点偏大不适合于Android环境,我们只需要找到解压缩的那部分代码进行改造即可,我这里找到了一个改造好的解压缩替代包,测试可行。示例代码如下:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38
| import com.file.zip.ZipEntry; import com.file.zip.ZipFile;
public void unzip(File file, String dir) throws IOException { ZipFile zipFile = new ZipFile(file, "GBK"); Enumeration<ZipEntry> entris = zipFile.getEntries(); ZipEntry zipEntry = null; File tmpFile = null; BufferedOutputStream bos = null; InputStream is = null; byte[] buf = new byte[1024]; int len = 0; while (entris.hasMoreElements()) { zipEntry = entris.nextElement(); tmpFile = new File(dir + zipEntry.getName()); if (zipEntry.isDirectory()) { if (!tmpFile.exists()) { tmpFile.mkdir(); } } else { if (!tmpFile.exists()) { tmpFile.createNewFile(); } is = zipFile.getInputStream(zipEntry); bos = new BufferedOutputStream(new FileOutputStream(tmpFile)); while ((len = is.read(buf)) > 0) { bos.write(buf, 0, len); } bos.flush(); bos.close(); } } }
|
改造后的ZipEntry.jar包的下载地址:http://download.csdn.net/detail/huyongl1989/9120755
write by laohu
2015-09-26 21:34:09
原创文章,转载请出处注明。
下面是我的个人公众号,欢迎关注交流
