linux下文件编码的查看与转换
来源:互联网 发布:淘宝联盟转淘口令 编辑:程序博客网 时间:2024/06/09 20:20
通常来说,Windows中默认的文件格式是GBK(gb2312),而Linux一般都是UTF-8,所以Linux下打开windows的文件会有乱码的情况。另外,有时要将文件进行编码转换,如将简体中文转换为繁体中文。
基于以上情况,本文将就在linux下查看和转换文件的编码进行说明。
1.查看文件的编码
1)在Vim中可以直接查看文件编码
:set fileencoding 即可显示文件编码格式。
2)enca查看文件编码
# enca filename 直接用enca加文件名查看
# enca -L zh_CN filename
注:enca对某些GBK编码的文件识别不是很好,识别时会出现:unrecognized encoding.
2.转换文件的编码
1)在Vim中直接进行转换文件编码,比如将一个文件转换成utf-8格式
:set fileencoding=utf-8
2)enconv 转换文件编码,比如要将一个GBK编码的文件转换成UTF-8编码,如:
# enconv -L zh_CN -x UTF-8 filename
# enca -L zh_CN -x UTF-8 < file1 > file2 不覆盖原文件
3)iconv 转换,iconv的命令格式如下:
# iconv -f encoding -t encoding inputfile
# iconv -l 查询可用编码
# for i in `find ./ -name *.html`;do echo $i;iconv -f gb2312 -t big5 $i -o /tmp/iconv.tmp;mv /tmp/iconv.tmp $i;done
批量转换文件编码实例之一
3.文件名编码转换
Linux与windows间拷贝文件,有时文件名会出现乱码,是因为Windows的文件名中文编码默认为GBK,而Linux默认的文件名为UTF8。在Linux中有个工具,convmv,可以对文件名进行GBK和UTF的相互转换。
用法:
Convmv -f 源编码 -t 新编码 [option] filename
安装enca
下载相关rpm包。地址(http://rpmfind.net/linux/RPM/dag/redhat/el5/i386/ )
我下载的是:enca-1.10-1.el5.rf.i386.rpm和enca-devel-1.10-1.el5.rf.i386.rpm
安装:
# rpm -ivh enca-1.10-1.el5.rf.i386.rpm
# rpm -ivh enca-devel-1.10-1.el5.rf.i386.rpm
- linux下文件编码的查看与转换
- LINUX下文件字符集编码查看与编码转换
- ubuntu下文件编码查看与转换
- LINUX下文件字符集编码查看与转换并文件名编码转换
- Linux下文件编码转换
- linux下文件编码查看及修改
- Ubuntu Linux系统下文件编码转换的技巧
- linux系统下文件编码格式的转换
- Gnu Linux下文件的字符编码及转换工具
- LINUX下文件字符集编码转换
- Linux下文件字符集编码转换
- linux下文件转换编码格式
- LINUX下文件字符集编码转换
- linux下文件编码批量转换
- Linux下文件编码格式转换
- Linux下文件字符集编码转换
- linux下文件编码格式转换方法
- Linux下文件字符集编码转换
- windows服务器下杀死ORACLE进程
- WCF 一步一步从入门到精通 建立一个简单入门的例子(适合一点不会的朋友阅读)
- 1433恢复,删除xp_cmdshell及修补sa弱口令命令
- Debian ipv6 教育网 源
- 学期开始前。。。
- linux下文件编码的查看与转换
- 基站的发射功率
- 寻找最快的debian系linux(ubuntu etc.)源sources.list
- 堆内存与栈内存的理解
- 学习动易SF标签:XSLT基本语法
- 编译Linux内核数
- 构造内核源码树
- 目前
- HP WebOS TouchPad 发布现场视频回顾