8月 06, 2013

Linux系統:轉換正體中文與簡體中文文字編碼!

寫這篇文章最主要的,是怕自己忘掉後每次花很長的時間找資料。

、網際網路四通八達,許多取自網路的中文資料,除很大一部份是簡體編碼,造成台灣使用者的困擾,因此轉換編碼的需求應運而生,首先僅就曾用過的中文內碼,簡介其編碼系統:
(一)1.大五碼(Big5)
1983年由台灣地區電腦廠商推出的中文系統編碼業界標準,使用在DOS、Windows 3.1、 Windows 95及Windows98等正體中文作業系統作為內碼。
(二)簡體中文(GB2312)
1981年由中國大陸發布的政府標準,全稱為信息交換用漢字編碼字符集.基本集,使用於簡體中文系統作為內碼。
(三)統一碼(UTF8)
1993年正式在美國USENIX會議正式推介,以容納世界上大多數字符的編碼。

二、Linux系統轉換簡體中文為正體中文編碼

請於文字終端輸入下列指令,只轉換檔案內容文字符號的編碼,但檔名編碼並不會跟著更改(gbfile.txt為簡體中文檔,outputfile.txt為輸出正體中文編碼)

iconv gbfile.txt -f gb2312 -t big5 | iconv -f big5 -t utf8 -o outputfile.txt

三、Linux系統轉換正體中文編碼簡體中文

請於文字終端輸入下列指令

 iconv big5file.txt -f big5 -t utf8 | iconv -f utf8 -t gb2312 -o outputfile.txt


 請參考!

沒有留言:

張貼留言