你在Windows/MacOS的登录Linux的SSH终端上很容易输入中文并且获得中文输出,比如下面这样:
但是却几乎不可能将中文显示在Linux自身的虚拟终端上:
- [root@localhost font]# echo 皮鞋 >/dev/tty2
-
显示了两个问号,显然Linux内核并不能识别中文。
为什么说是Linux内核不能识别中文呢?这里需要理清一个关系:
比如,我在MacOS用iTerm SSH连接到了一个远程CentOS Linux,iTerm上的所有的键盘输入,显示器输出行为都是iTerm的这台MacOS宿主机完成的。
相反,如果你直接在这台CentOS Linux的虚拟终端上输入并且企图获得输出,那么这个输入输出则必须由Linux内核自身来处理。
基本上就这些。至于说为什么Linux内核不支持中文,那要了解Linux内核处理虚拟终端输入输出时是如何对待unicode的逻辑,这要涉及一大堆的理论知识,非常烦人。
反正我这里就是无法输出中文,我也不是做这个的,显然这不是一个必然要完成的工作任务,所以,我只是玩玩。
本文的目标就是要让Linux的虚拟终端可以输出中文。
仅仅是输出中文,哪怕是一个中文汉字也好。具体来讲,就是当我在键盘敲入’A’字符时,显示器回显出来的是一个汉字。
所以说,本文并不打算让Linux内核大规模完备地支持中文,这种事已经有很多人和社区做了,但是可玩性并不高,毕竟这种事是可以当私活儿赚钱的,只要是赚钱的活儿,可玩性就不高,因为要快嘛。
不需要懂冗长枯燥的unicode编码,不需要懂枯燥的font字体格式,看看怎么玩。
先展示效果吧,下面是一个8 × 16 8\times 168×16的点阵例子:
不是很好看,于是就做了下面一个28 × 16 28\times 1628×16的点阵:
下面说一下这是如何实现的。
从你敲键盘的某个按键开始,到某个字符最终显示在虚拟终端的显示器上,这期间其实有两个映射:
Linux的console并不能识别超过0x00ff的字符集码字,因此就不能处理码字超过0x00ff的unicode,如果希望它能做到,这就要改内核代码了。
刚才说了,修改内核代码大规模全面支持中文,这是可以赚钱的事,不但没意思,也没人会分享。
所以我尝试去修改上面的两个映射来解决问题。由于只是显示,所以我不会去修改键盘和字符集的映射,因为那样仍然会碰到字符集码字超过0x00ff的处理问题。
这意味着要想显示中文,只剩下一条路,那就是修改字符集和字体的映射!
这个映射肯定是保存在内核内存或者文件系统的某个地方。我可以在当前内核的config文件里找到如下的信息:
- [root@localhost font]# cat /boot/config-3.10.0-862.11.6.el7.x86_64 |grep FONT
- # CONFIG_FONTS is not set
- CONFIG_FONT_8x8=y
- CONFIG_FONT_8x16=y
-
再去看/proc/kallsyms里有什么:
- [root@localhost font]# cat /proc/kallsyms |grep font.*8x
- ffffffffb006a3e0 R font_vga_8x8
- ffffffffb006a420 r fontdata_8x8
- ffffffffb006ac20 R font_vga_8x16
- ffffffffb006ac60 r fontdata_8x16
- ffffffffb0307a10 r __ksymtab_font_vga_8x16
- ffffffffb03234b8 r __kcrctab_font_vga_8x16
- ffffffffb034246e r __kstrtab_font_vga_8x16
-
嗯,这就是内核里保存的字体:
- [root@localhost rh]# ll ./drivers/video/console/font_8x*
- -rw-r--r--. 1 root root 95976 Sep 17 2018 ./drivers/video/console/font_8x16.c
- -rw-r--r--. 1 root root 50858 Sep 17 2018 ./drivers/video/console/font_8x8.c
-
这里不再分析这两个文件。这里仅仅是确认了一个事实,内核在初始化的时候会使用自己的字体,这个时候毕竟除了内核本身,什么都没有。
问题是到了用户态,这个字体是可以被改变的,可以被改的花里胡哨的,这些个字体可不是仅仅两个8x8和8x16就能hold住的…
这个时候就需要找我们安装在发行版里面的字体文件了。我们要找到它,然后改掉里面的某个字体的形状,将其变成中文!就这么简单。
不必去搜这个字体文件安装保存在什么地方,通过执行strace setfont命令就能找到它。
- [root@localhost ~]# strace -F -e trace=open setfont
- ...
- strace: Process 6276 attached
- [pid 6276] open("/etc/ld.so.cache", O_RDONLY|O_CLOEXEC) = 4
- ...
- [pid 6276] open("/lib/kbd/consolefonts/default8x16.psfu.gz", O_RDONLY|O_NOCTTY|O_NONBLOCK) = 4
- [pid 6276] +++ exited with 0 +++
- --- SIGCHLD {si_signo=SIGCHLD, si_code=CLD_EXITED, si_pid=6276, si_uid=0, si_status=0, si_utime=0, si_stime=0} ---
- +++ exited with 0 +++
-
就是它了,/lib/kbd/consolefonts/default8x16.psfu.gz
也不必去搜psfu格式的字体的format,通过模式识别就能找到特定的字符。
我准备先找到 ‘A’,然后把它后面的’B’和’C’改成我的名字“赵”和“亚”。
首先我要把“赵”和“亚”字做出来,形成一个点阵。以下是我的作品“赵”:
- 00000000
- 00000000
- 00100000
- 11111000
- 00100101
- 00100101
- 11111010
- 00100011
- 00111010
- 01100101
- 01100000
- 10011000
- 10000111
- 00000000
- 00000000
- 00000000
-
下面就要用这个点阵替换’B’的点阵,同时制作一个“亚”字,替换’C’的点阵,
在下面的站点可以找到该default font的对应点阵图解:
我们就可以得到该’A’字符的点阵数组,然后在default8x16.psfu文件里匹配这个数组就可以了。代码如下:
- #include <stdio.h>
- #include <stdlib.h>
- #include <fcntl.h>
- #include <linux/fb.h>
- #include <string.h>
-
- unsigned char zhaoya[32] = {
- // 第一行为“赵”
- 0x00, 0x00, 0x20, 0xf8, 0x25, 0x25, 0xfa, 0x23, 0x3a, 0x65, 0x60, 0x98, 0x87, 0x00, 0x00, 0x00,
- // 第二行为亚
- 0x00, 0x00, 0x00, 0x7e, 0x24, 0x24, 0x24, 0xa5, 0xa5, 0x66, 0x24, 0x24, 0x7e, 0x00, 0x00, 0x00
- };
-
-
- int main(int argc, char **argv)
- {
- int i = 0;
- unsigned char buf[16];
- off_t offset = 0;
- int s = 0;
-
- int fd = open("default8x16.psfu", O_RDWR);
- i = pread(fd, buf, 8, offset);
- while (1) {
- i = pread(fd, buf, 16, offset);
- if (s == 2) { // 替换'C'
- memcpy (buf, &zhaoya[16], 16);
- i = pwrite(fd, buf, 16, offset);
- break;
- }
- if (s == 1) { // 替换'B'
- memcpy (buf, &zhaoya[0], 16);
- pwrite(fd, buf, 16, offset);
- s = 2;
- }
- // 简易的方法识别到'A'
- if (buf[0] == 0x00 && buf[1] == 0x00 &&
- buf[2] == 0x10 && buf[3] == 0x38) {
- printf("A found at %d !\n", offset);
- s = 1;
- }
- offset += 16;
- }
- }
-
直接编译执行,然后将这个default8x16.psfu作为参数set到内核即可:
- [root@localhost font]# setfont ./default8x16.psfu
-
此时进入Linux的虚拟终端tty2,当敲键盘的大写’B’时,就会出现一个“赵”字。
虽然16 × 8 16\times 816×8甚至8 × 8 8\times 88×8也能做出复杂的中文点阵,但是这也太难看了。
于是我要找一个更高分辨率的font。我在Ubuntu上找到了一个高分辨率的28 × 16 28\times 1628×16点阵Arabic-VGA28x16.psf.gz。修改它的方法和前面这个完全一样,它的点阵图如下:
我不需要自己做28 × 16 28\times 1628×16的点阵了,我只要用GNU uifont的现成的即可。直接在unifont_sample-12.1.01.hex里面按照“赵”和“亚”的unicode码字就能索引到点阵。关于任意字符的unicode码字的查询,可以参见:
替换font的代码如下:
- #include <stdio.h>
- #include <stdlib.h>
- #include <fcntl.h>
- #include <string.h>
- #include "zhao"
-
- #define L 28*2
- int fd;
-
- int main(int argc, char **argv)
- {
- unsigned char buf[L];
- off_t offset = 0;
- // 这个0x0e60 就是模式匹配获得的偏移。
- offset += 0x0e60;
-
- fd = open("Lat7-VGA28x16.psf", O_RDWR);
- pread(fd, buf, L, offset);
- memset(buf, 0, L);
- memcpy(buf+8, &code[0], 32);
- pwrite(fd, buf, L, offset);
-
- offset += L;
- pread(fd, buf, L, offset);
- memset(buf, 0, L);
- memcpy(buf+8, &code[32], 32);
- pwrite(fd, buf, L, offset);
-
- offset += L;
- pread(fd, buf, L, offset);
- memset(buf, 0, L);
- memcpy(buf+8, &code[64], 32);
- pwrite(fd, buf, L, offset);
- }
-
然后它的效果就是:
还不错。
其实本文的内容仅仅就是:
嗯,其实第三点和第四点是最重要的。
最后,如果你想知道你当前的虚拟终端支持那些字体,输入:
- [root@localhost font]# showconsolefont
-
就会显示: