第四九五章 大明式的计算机底层概念(4 / 5)

大明1805 王子虚 3039 字 2023-09-20

后世的通用计算机字节长度是八位,因为IBM设计的第一套通用计算机,在七位的基础上增加了一位校验码。

后来随着技术提升,校验码被省略,八位编码的容量就增加到了二百五十六个了。

相比最初的计算机,字节长度已经翻倍了。

这还只是英文,如果要记录汉字的话,难度就进一步飙升了。

现在大明通行的《通用标准汉字表》就有八千个字。

一个字卦长度至少要增加到十三爻,有八千一百九十二的容量才能容纳。

字卦长度要增加到十五爻,有三万两千七百六十八的容量,才能整个《大明标准汉字总表》的所有汉字。

现在的生产工艺级别较低,还要参考IBM的做法,价格校验位。

这样字节长度就增加到了十六爻。

与此同时,三万多个十六位字卦,编码总容量已经达到了65536爻,折合前世的65KB。

这对于早期的计算机而言,是一个非常大的数字。

更关键的是,这只是汉字编号。

如果把汉字当做是一个个的人,这个表格相当于所有他们所有人的地址表。

要让汉字在屏幕上显示,还要把汉字做成点阵图像。

按照前世的经验,要让汉字显示的相对自然,要用十六乘以十六的点阵。

一个点阵的开关也要用一个字卦控制。

十六乘以十六就是256个字卦,32768个汉字合计8388608字卦,折合前世的16MB。

当时的大部分硬盘都装不下,更别说内存了。

要让汉字勉强完整显示,不缺少笔画,也要十二乘以十二的点阵。

这样总共也要9MB。

就算是只记录通用汉字表,也需要2.25MB。

七十年代以前的电脑,装下这个东西是非常吃力的。

再次基础上,这也还只是点阵字库。

要通过键盘把汉字打出来,输入到电脑里面去,还需要一个输入法程序。

用于按照人类能够理解的逻辑,通过特定的按键组合,把想要的汉字从字库中筛选出来。

这个过程跟英文打单词是一样的,区别只是一个字母一个字母的显示,最后组合起来形成命令。

还是依次打完特定的组合的按键,组合形成成命令的同时显示出目标汉字。

如果不涉及到高级的联想功能,用高度机械死板的输入法,限定死只能用哪些汉字,就是这样的逻辑。

不过,点阵数据还可以放在硬盘上,字表和输入法就要载入内存了。

当时的超级计算机内存也只有100KB出头的样子。

这对当时的计算机而言是一个巨大的挑战。

要先运行输入法程序,从字表中筛查出要输入的汉字,再去硬盘查点阵图输出到屏幕。

就算是不惜成本,将字库输入法都所有功能都实现出来了。

这台电脑多半也会出现打一个字就要等好几秒的状态。

所以,朱靖垣现在看到电脑屏幕上有汉字,就知道工部绝对没有把汉字全做进计算机。

因为现在的电脑也不需要将所有汉字输入进去。

这时候的计算机就不是用来处理文字的。

英文编程也不会把addition打完整,那这一个单词就需要64B的空间来容纳。

一段代码打上几十个单词,就要占用KB级别的内存了,英文系统同样撑不住。

肯定要能省就省的,直接写个ADD就行了。

反正电脑不是处理文字的,当时的命令也只有几十个,单词都用简写也不会认错。

汉字肯定是这么处理的,也只能这么处理。

朱靖垣怀疑,这台电脑只能显示一两百,甚至几十个汉字。

很可能是一个按键固定出一个字,一个对应一个固定的程序命令,剩下的就都是标点符号和数字了。

符号系统也不会存在什么全角半角的区别,输入过程也不需要转换输入法。

如果是这样的话,汉字汇编反而比英文更简单。

因为单个汉字就有英文单词的作用,特别是在传统文言文仍然盛行的时代。

朱靖垣眼前屏幕上的程序中的命令,确实全都是一个一个的单字。

英文环境下单个字母很少有实际意义,至少要用两个到三个字母,才能让程序员产生有实际含义的联想。

同时,眼前这个屏幕肯定是非常“高级”的功能。

低级型号的电脑,很可能根本没有屏幕。

因为屏幕上显示汉字和字母,哪怕是只有几十个,也非常浪费存储空间。

早期的英文电脑同样是没有屏幕的。