המרת קידודי תווים
מתוך הויקי של ג'נטו.
מאמר זה מסביר כיצד להמיר קידוד תווים של קבצים (שמות ותוכן).
תוכן העניינים |
[עריכה] המרה של שמות קבצים
בשביל שתוכל להמיר קידוד של שמות קבצים ישנה תוכנה בשם app-text/convmv.
| קוד: דוגמא להתקנה ושימוש של convmv |
# emerge --ask app-text/convmv (מבנה כללי של הפקודה) # convmv -f <current-encoding> -t utf-8 <filename> (החלפה של iso-8859-1 לקידוד utf8) # convmv -f iso-8859-1 -t utf-8 filename |
[עריכה] המרה של תוכן קבצים
[עריכה] המרת תוכן בעזרת iconv
כדי להמיר את תוכן הקבצים עצמם תוכל להשתמש בכלי iconv, שכלולה ב-glibc:
| קוד: דוגמא לשימוש ב-iconv |
(החלפת קידוד iso-8859-1 בקידוד utf-8) (בדוק אם הפלט יוצא בסדר) # iconv -f iso-8859-1 -t utf-8 filename (אם תרצה תוכל לבצע את ההמרה לקובץ אחר) # iconv -f iso-8859-1 -t utf-8 filename -o newfile |
[עריכה] זיהוי תוכן של קובץ באופן אוטומטי
אם תרצה לדעת את הקידוד של קובץ, תוכל להשתמש בכלי utrac. כלי זה יכול גם להמיר קידוד, בלי הצורך לדעת את הקידוד הנוכחי של קובץ.
| קוד: זיהוי והמרת תוכן של קובץ |
|
זיהוי הקידוד של תוכן הקובץ: $ utrac filename -p ISO-8859-8 לשם המרת הקובץ לקידוד אחר: $ utrac filename -t utf8 >> newfilename |
לכלי זה יש אפשרויות נוספות למקרים חריגים, כמו מספר קידודים לאותו קובץ. ראה את המדריך של פקודה זו (man utrac) או בקר באתר הבית של כלי זה.
